在 自定义 TTS API 接口中接入 Minimaxi 配音
自从 edge-tts 不那么好用后,配音麻烦了很多,免费的只能自己本地部署 GPT-SoVITS/CosyVoice/F5-TTS/Kokoro/ChatTTS 等。
在线的 OpenAI TTS 在合成中文时严重大舌头,目前在线中文效果最好的是 AzureTTS/字节语音合成/302.AI
在 v3.62 补丁包后,为 自定义TTS API接口
内置了 Minimaxi(海螺AI的母公司)
的文字合成语音,支持几十个角色以及15种语言,还可设置情绪、音调等。算是比较可用。
介绍下接入方法
共有2种接入方法, 一是从 302.AI 接入,比较简单,注册即用,无需实名,限制较少,推荐使用。 二是从 Minimaxi.com 原生接入,略微复杂且请求频率限制较低(1分钟3次),还需要填写银行卡和预留手机号实名认证。
一:从 302.AI接入
本质上也是接入的 Minimaxi 的配音,只不过是经过 302.AI 中转,使用稍微方便一点。 302.AI 注册地址(从该地址注册赠送1美元额度) https://share.302.ai/pyvideo
- 首先升级pyVideoTrans 到 v3.62(升级地址: https://pvt9.com/downpackage)
- 然后找到
菜单--TTS设置--自定义TTS API
,按下图所示,在 API 中填写https://api.302.ai/minimaxi/v1/t2a_v2
在配音角色名称中粘贴以下角色
,2种接入方式配音角色都是一样
青涩青年音色:male-qn-qingse,
精英青年音色:male-qn-jingying,
霸道青年音色:male-qn-badao,
青年大学生音色:male-qn-daxuesheng,
少女音色:female-shaonv,
御姐音色:female-yujie,
成熟女性音色:female-chengshu,
甜美女性音色:female-tianmei,
男性主持人:presenter_male,
女性主持人:presenter_female,
男性有声书1:audiobook_male_1,
男性有声书2:audiobook_male_2,
女性有声书1:audiobook_female_1,
女性有声书2:audiobook_female_2,
青涩青年音色-beta:male-qn-qingse-jingpin,
精英青年音色-beta:male-qn-jingying-jingpin,
霸道青年音色-beta:male-qn-badao-jingpin,
青年大学生音色-beta:male-qn-daxuesheng-jingpin,
少女音色-beta:female-shaonv-jingpin,
御姐音色-beta:female-yujie-jingpin,
成熟女性音色-beta:female-chengshu-jingpin,
甜美女性音色-beta:female-tianmei-jingpin,
聪明男童:clever_boy,
可爱男童:cute_boy,
萌萌女童:lovely_girl,
卡通猪小琪:cartoon_pig,
病娇弟弟:bingjiao_didi,
俊朗男友:junlang_nanyou,
纯真学弟:chunzhen_xuedi,
冷淡学长:lengdan_xiongzhang,
霸道少爷:badao_shaoye,
甜心小玲:tianxin_xiaoling,
俏皮萌妹:qiaopi_mengmei,
妩媚御姐:wumei_yujie,
嗲嗲学妹:diadia_xuemei,
淡雅学姐:danya_xuejie,
Santa Claus:Santa_Claus,
Grinch:Grinch,
Rudolph:Rudolph,
Arnold:Arnold,
Charming Santa:Charming_Santa,
Charming Lady:Charming_Lady,
Sweet Girl:Sweet_Girl,
Cute Elf:Cute_Elf,
Attractive Girl:Attractive_Girl,
Serene Woman:Serene_Woman
到 302.AI 后台复制 API KEY 粘贴到软件的 SK 中
最终填写后如下图所示,测试下如果正常播放音频,说明配置正确,保存就可以使用了。
二:原生接入 Minimaxi
注册登录地址 https://platform.minimaxi.com/login 登录后需银行卡号和银行预留手机号实名认证,认证通过后打开该地址 https://platform.minimaxi.com/user-center/basic-information 复制 groupID
然后打开软件 菜单--TTS设置--自定义TTS API
,在 api地址里填写,注意必须替换为你的groupID https://api.minimax.chat/v1/t2a_v2?GroupId=你复制的groupID
在 SK 中填写接口密钥,可打开该地址创建 https://platform.minimaxi.com/user-center/basic-information/interface-key
配音角色填写方式同 302.AI,全部填写后如下图
注意如果你未通过实名认证,测试可能会失败。 此外使用该方式时,请打开
菜单--工具/选项--高级选项--配音调整--同时配音数量设为1,配音后暂停时间设为大于25的值
,否则很可能超过频率失败, 普通用户1分钟只允许请求3次,即20s一次。
发音语言选择
支持15种语言,中文 (Chinese)、粤语 (Cantonese)、英语 (English)、西班牙语 (Spanish)、法语 (French)、俄语 (Russian)、德语 (German)、葡萄牙语 (Portuguese)、阿拉伯语 (Arabic)、意大利语 (Italian)、日语 (Japanese)、韩语 (Korean)、印尼语 (Indonesian)、越南语 (Vietnamese)、土耳其语 (Turkish)、荷兰语 (Dutch)、乌克兰语 (Ukrainian)
在软件界面中配音时,选择字幕所属语言即可,但注意必须在上述15种范围内。 只有在当你需要粤语发音时,需要打开该自定义TTS API
接口界面,将 语言设为 Chinese,Yue
,其他时候请确保这里选择的是 auto
发音情绪选择
Minimaxi 支持 高兴,悲伤,愤怒,害怕,厌恶,惊讶,中性
7种情绪,不过测试发现区别不大,如果有需要,可打开该界面设置。
最后说明,除非你在minimaxi开启了企业账号,并且等级较高,否则建议使用 302.AI 接入方式,不然的话 1分钟 3次请求用于字幕配音,要么慢的无法接收,要么频频报
rate limit
频率限制错误 302.AI注册地址(1美元体验额度): https://share.302.ai/pyvideo