重要通知
由于接口更改,v1.4.2版本以前无法运行,请更新。
简单的听书音频生成
这是一个为阅读3制作的生成章节音频的程序。
由于作者能力,仅仅是CLI工具。
安装
拥有python环境和基础
- 克隆当前存储库
- 安装依赖:
pip install -r requirment.txt
- 下载ffmpeg.exe并保存在当前程序相同文件夹,或在
path
中设置.
没有python环境
windows
- 在最新的Release中下载
main.exe
- 下载ffmpeg.exe并保存在当前程序相同文件夹,或在
path
中设置.
安卓
- 下载termux软件(网盘,网盘可能不是最新,可以自行搜索下载)
- 下载最新的Release中下载
{版本号}_android
(如果没有这个文件,请在Issue处提醒作者 - 将文件导入到termux中,并
chmod +x {文件名}
加执行权限 ./{文件名}
运行即可
用法
- 在阅读app中打开
Web 服务
, 并且记录显示的ip地址。
- 运行这个程序, 并输入
1
.
- 输入记录的ip地址
- 输入书籍id
- 输入开始和结束的页面id,您可以在开始处留空,这意味着选择当前章节。提示格式:
(<id>: <标题>)
. id有时会由于书源造成误差, 您可以根据开始章节的id数据计算这个误差。
- 接着等待程序运行结束即可!
菜单
1. Basic
基础模式,您可以根据交互提示和上述内容使用。
2. Fix
如果你看见 Retry (for fix mode)
, 那么你便需要运行这个模式。这意味着某个章节的音频合成失败了太多次.(你可以通过MAX_RETRY
修改这个数据) 你可以复制 Retry (for fix mode)
后的数据并输入在提示中, 然后程序便会像标准模式运行。
3. Concat
如果你的程序意外退出, 那么文件夹中便会出现像 340_第xxx章xxx (1).mp3
这样的文件。如果你遇到了这个情况,你可以运行这个模式自动修复这个错误。注意: 如果某个章节下载了部分,那么可能出现未知情况(通常出现于最后几个)
4. Delete temporary files
如果你在输出文件夹中发现340_第xxx章xxx (1).mp3
或者控制台中有ERROR: _merge: Permission denied!
,这是一个已知bug(还没调试明白,如果谁有思路,请麻烦提一下Issue). 你可以通过运行这个模式来修复。<sup>3</sup>
配置
你可以运行一次主程序,便会生成config.json
,并附有默认配置。你可以修改,或者使用自定义json,这个json必须是原json的子集。程序会自动检查类型和key,在软件更新过程中,部分参数有删除或改动,软件会自动更新到最新参数。如果您确定您的json在老版可用但新版不可用,请在Github上提Issue。
MAX_TASK
<sup>1</sup>false
true
false
true
zh
语言
目前已制作两种语言的语言数据,默认为中文,可以在config.json
中的修改LANG_FILE
。
目前已有lang_chk.py
检验语言文件,但是运行方式过于草率,可能会出现安全问题,请仅用于已知来源文件!
运行模式
对于模式1:基础模式;对于模式2:角色模式。角色模式通过引号等常用符号标记角色语言内容,将该部分内容换为另一角色合成。
识别的符号
- “文本”
- "文本"
- 【文本】
- '文本'
自动回退
注:对于文章中出现以下情况,角色模式将自动回退到基础模式(将提示错误)。
- 文章中出现引号不匹配。如
文本“对话内容<b><font color=red>“</font></b>
- 文本中存在引号不配对的情况。如
文本<b><font color=red>“</font></b>对话内容。
其余内容“对话内容”
Notes
- 如果音频合成失败,程序会重试
MAX_RETRY
次。在重试后,同时运行的任务会除被以RETRY_SUB
,并且等待WAIT_TIME
秒。 - 我使用了
aspeak
模块来合成音频,但是只有一些限制。其中还有一个没有被记录的限制:不能短时间内合成多次。如果合成失败率大于LIMIT_429
,并且完成(失败)了FAIL_429
个音频,程序会等待正在运行的所有任务结束,然后等待9+3*stop_cnt
。其中,变量stop_cnt
是总失败次数,并且等待时间不会超过MAX_WAIT
。如果超过,便会将等待时间固定为15s。 - 最后一个文件好像会被ffmpeg或者python进程占用,这似乎不是我的代码的问题,因为只有在windows平台上出现。
- 运行模式见上
FAQ
Q: Showe text like "\033****" and so on
A: use cmder to run it, the console should support ANSI colorful output.
Q: Find file like <TiTle>(1)
A: Start main program again and run mode 4
Q: The program interrupted unexpectedly, but there are many <title>(1)
in output folder
A: Start main program again and run mode 3
Changelog
v1.4.3
- 修复config的覆盖
- 修复
<voice>
项超过数目
v1.4.2
- 修复
reConcat
中的bug - 更新config
- 更新
mytts
版本. 对于可执行文件版本,旧版本无法运行
v1.4.1
- 添加章节404检测
- 使得识别的引号可以在config中修改(
bracket
) - 修复
<voice>
tag超出数量限制的bug - 修改log的实现方式
1.4.0
支持对话特别朗读模式
v1.3.1
修复软件无法在没有lang_zh.json
的情况下运行的bug
v1.3.0
- 使用
mytts
作为tts实现 - 使用
rich
库而不是alive-progress
库实现进度条 - 优化命令行界面
v1.2.4-alpha
将较为主要的字符串转为中文