Skip to content

Fish-TTS / Fish-Speech 配音渠道

这是什么?

Fish-Speech 是一个开源的语音合成项目,支持声音克隆,可以通过参考音频生成类似音色的语音。适合需要特定音色配音的用户。

前提条件:

  • 需要部署并启动 Fish-Speech 的 API 服务
  • pyvideotrans v3.63+ 版本
  • Fish-Speech 版本不低于 1.5.0

重要:pyvideotrans 从 v3.63 版本起,必须确保 fish-speech 端版本不低于 1.5.0,否则不可使用。

第一步:部署 Fish-Speech

获取项目

启动 API 服务

  1. 按照 Fish-Speech 文档完成部署
  2. 必须启动 API 服务(只启动 WebUI 是不够的)
  3. 默认 API 地址:http://127.0.0.1:8080/v1/tts

注意:确保 API 服务正常运行后,再进行后续配置。

第二步:在视频翻译软件中配置 API

  1. 打开视频翻译软件
  2. 进入 菜单 → 设置 → Fish TTS
  3. API 地址 中填写 Fish TTS 的 API 地址
  4. 默认地址为:http://127.0.0.1:8080/v1/tts

第三步:配置参考音频

Fish-Speech 使用参考音频来克隆音色。你需要提供参考音频文件和对应的文字。

格式说明

音频文件路径#对应文本内容

示例

示例1:单个参考音频

假设你有一个 1.wav 文件,放在 sp.exesp.py 所在文件夹内,对应的文本是"你好啊,我亲爱的朋友们",那么填写:

1.wav#你好啊,我亲爱的朋友们

示例2:多个参考音频

如果你想使用多个参考音频,可以创建一个文件夹(如 wavs)放在 sp.exe 所在目录内,然后这样填写:

1.wav#你好啊,我亲爱的朋友们
wavs/2.wav#今天天气不错哦,我们去游泳吧

参考音频要求

  • 格式:WAV 格式
  • 时长:最佳为 10-20 秒
  • 质量:清晰无背景噪声
  • 位置:放在 sp.exesp.py 所在文件夹内
  • 命名:使用简单的英文或数字命名,不要含空格

提示:参考文本如果非常长,保持自然换行即可,不要手动加回车换行。

第四步:使用 Fish-TTS 配音

  1. 保存设置后,回到主界面
  2. 配音渠道 中选择 FishTTS
  3. 配音角色 里可以看到添加的参考音频
  4. 选择角色后开始配音

选择 FishTTS 角色

注意事项

  1. 文件命名:参考音频和文件夹名称请使用简单的英文或数字,不要含空格
  2. 语言支持:Fish-Speech 支持的语言有限,请确保文字在支持范围内
  3. 角色不显示:如果在设置中添加了参考音频但主界面未显示对应角色,请先将配音渠道切换到 edgeTTS,再切换回 FishTTS
  4. API 必须启动:只打开浏览器界面是不够的,必须确保 API 服务正在运行

常见错误

错误信息原因解决方案
This channel needs deployed and startedFish-Speech 未启动确保 API 服务正在运行
Connection refusedAPI 地址错误检查 API 地址和端口
角色不显示缓存问题切换到其他渠道再切换回来
生成的语音不像参考音频参考音频质量差使用更清晰、更长的参考音频