配音渠道

配音（TTS）是视频翻译的第三步，将翻译后的字幕文本转换为语音音频。pyVideoTrans 支持 30+ 种配音渠道。

开箱即用（免费）

无需复杂配置，非常适合新手。

渠道	说明	推荐度
Edge-TTS(免费)	微软免费接口，声音自然，支持所有语种	⭐⭐⭐ 默认推荐
gTTS(免费)	Google TTS，基础质量，国内需科学上网	⭐⭐

⚠️ Edge-TTS 短时间内大量使用可能触发限流，建议在高级选项中将并发数设为 1，暂停秒数设为 5-10。

首次使用时自动下载模型。

渠道	说明	GPU 加速	支持克隆	推荐度	模型下载地址
Qwen3-TTS(本地内置)	支持中英日韩10+语言	✅	✅	⭐⭐⭐ 推荐	https://huggingface.co/collections/Qwen/qwen3-tts
F5-TTS(本地内置)	中英日法德俄意、西班牙、印地、阿拉伯语	✅	✅	⭐⭐⭐	https://huggingface.co/rhasspy/piper-voices
MOSS-TTS-Nano(本地内置)	20种语言	❌	✅	⭐⭐	https://huggingface.co/OpenMOSS-Team/MOSS-TTS-Nano-100M
ZipVoice(本地内置)	中英语言	✅	✅	⭐⭐⭐ 推荐	https://modelscope.cn/models/himyworld/videotrans/files
Piper(本地内置)	轻量级，支持20种语言	❌	❌	⭐⭐	https://huggingface.co/rhasspy/piper-voices
ChatterBox(本地内置)	22种语言	✅	✅	⭐⭐⭐ 推荐	https://huggingface.co/ResembleAI/chatterbox
Supertonic3(本地内置)	英韩西法配音	❌	❌	⭐⭐	https://huggingface.co/Supertone/supertonic-3
VITS(本地内置)	中英配音	❌	❌	⭐⭐	https://modelscope.cn/models/himyworld/videotrans/files

参考音频统一在菜单 → TTS设置 → 设置参考音频中处理。

音频文件名#该音频文件中对应的文字

假设你有一个音频文件 nverguo.wav，音频内容是「女儿国王说话」，则填写：

nverguo.wav#女儿国王说话

参考音频放到pyVideotrans软件内的f5-tts文件夹内，别搞错

参考音频和参考音频内文字