Fish-TTS / Fish-Speech 配音渠道
这是什么?
Fish-Speech 是一个开源的语音合成项目,支持声音克隆,可以通过参考音频生成类似音色的语音。适合需要特定音色配音的用户。
前提条件:
- 需要部署并启动 Fish-Speech 的 API 服务
- pyvideotrans v3.63+ 版本
- Fish-Speech 版本不低于 1.5.0
重要:pyvideotrans 从 v3.63 版本起,必须确保 fish-speech 端版本不低于 1.5.0,否则不可使用。
第一步:部署 Fish-Speech
获取项目
启动 API 服务
- 按照 Fish-Speech 文档完成部署
- 必须启动 API 服务(只启动 WebUI 是不够的)
- 默认 API 地址:
http://127.0.0.1:8080/v1/tts
注意:确保 API 服务正常运行后,再进行后续配置。
第二步:在视频翻译软件中配置 API
- 打开视频翻译软件
- 进入 菜单 → 设置 → Fish TTS
- 在 API 地址 中填写 Fish TTS 的 API 地址
- 默认地址为:
http://127.0.0.1:8080/v1/tts
第三步:配置参考音频
Fish-Speech 使用参考音频来克隆音色。你需要提供参考音频文件和对应的文字。
格式说明
音频文件路径#对应文本内容示例
示例1:单个参考音频
假设你有一个 1.wav 文件,放在 sp.exe 或 sp.py 所在文件夹内,对应的文本是"你好啊,我亲爱的朋友们",那么填写:
1.wav#你好啊,我亲爱的朋友们示例2:多个参考音频
如果你想使用多个参考音频,可以创建一个文件夹(如 wavs)放在 sp.exe 所在目录内,然后这样填写:
1.wav#你好啊,我亲爱的朋友们
wavs/2.wav#今天天气不错哦,我们去游泳吧参考音频要求
- 格式:WAV 格式
- 时长:最佳为 10-20 秒
- 质量:清晰无背景噪声
- 位置:放在
sp.exe或sp.py所在文件夹内 - 命名:使用简单的英文或数字命名,不要含空格
提示:参考文本如果非常长,保持自然换行即可,不要手动加回车换行。
第四步:使用 Fish-TTS 配音
- 保存设置后,回到主界面
- 在 配音渠道 中选择
FishTTS - 在 配音角色 里可以看到添加的参考音频
- 选择角色后开始配音

注意事项
- 文件命名:参考音频和文件夹名称请使用简单的英文或数字,不要含空格
- 语言支持:Fish-Speech 支持的语言有限,请确保文字在支持范围内
- 角色不显示:如果在设置中添加了参考音频但主界面未显示对应角色,请先将配音渠道切换到
edgeTTS,再切换回FishTTS - API 必须启动:只打开浏览器界面是不够的,必须确保 API 服务正在运行
常见错误
| 错误信息 | 原因 | 解决方案 |
|---|---|---|
| This channel needs deployed and started | Fish-Speech 未启动 | 确保 API 服务正在运行 |
| Connection refused | API 地址错误 | 检查 API 地址和端口 |
| 角色不显示 | 缓存问题 | 切换到其他渠道再切换回来 |
| 生成的语音不像参考音频 | 参考音频质量差 | 使用更清晰、更长的参考音频 |
