Skip to content

配音渠道:F5-TTS

F5-TTS 是上海交通大学开源的 TTS 服务,默认支持中英文语音合成和声音克隆。

从 v4.04 版本起,F5-TTS 改为软件内置开箱可用,无需额外部署

除默认中英外,增加日、法、德、俄、意、西班牙、印地、阿拉伯语模型,这些模型均为社区维护(非F5-TTS官方) 更多语言模型地址查看F5-TTS官方分享

模型下载地址

第一次使用时自动下载模型,可能需要很长时间,有可能下载失败,若失败请点击下列地址,将看到的 .pt、.safetensors、.txt 文件下载后放入对应模型存放文件夹内(若不存在则新建)

模型存放文件夹: 软件sp.exe所在目录/models/models--SWivid--F5-TTS/F5TTS_v1_Base

模型存放文件夹: 软件sp.exe所在目录/models/models--Jmica--F5TTS/JA_21999120

模型存放文件夹: 软件sp.exe所在目录/models/models--RASPIAUDIO--F5-French-MixedSpeakers-reduced

模型存放文件夹: 软件sp.exe所在目录/models/models--hvoss-techfak--F5-TTS-German

模型存放文件夹: 软件sp.exe所在目录/models/models--hotstone228--F5-TTS-Russian

模型存放文件夹: 软件sp.exe所在目录/models/models--alien79--F5-TTS-italian

模型存放文件夹: 软件sp.exe所在目录/models/models--jpgallegoar--F5-Spanish

模型存放文件夹: 软件sp.exe所在目录/models/models--SPRINGLab/F5-Hindi-24KHz

模型存放文件夹: 软件sp.exe所在目录/models/models--silma-ai--silma-tts

配置参考音频

参考音频统一在菜单 → TTS设置 → 设置参考音频中处理。

操作步骤

  1. 打开「参考音频」设置界面
  2. 在「参考音频」文本框中填写以下格式的内容:
音频文件名#该音频文件中对应的文字
  1. 将参考音频文件放置在 pyVideoTrans 项目根目录下的 f5-tts 文件夹内(如该文件夹不存在请手动创建)

示例

假设你有一个音频文件 nverguo.wav,音频内容是「女儿国王说话」,则填写:

nverguo.wav#女儿国王说话

参考音频放到pyVideotrans软件内的f5-tts文件夹内,别搞错

参考音频和参考音频内文字

参考音频要求

项目要求
格式WAV 格式(推荐),MP3 等格式也可
时长3~10 秒
内容发音清晰,无背景噪音
文字必须与音频内容一致