Skip to content

字节语音合成大模型2.0 渠道使用方法

这是什么?

字节语音合成大模型2.0(Doubao TTS 2.0)是字节跳动推出的高质量中文语音合成服务,基于大模型技术,语音效果自然流畅。

重要提示:字节有非常多的语音合成产品,名称都类似。本渠道对应的是字节中 "语音合成大模型 → 大模型语音合成API",请务必准确,否则不可用。

如何开通

第一步:注册登录

  1. 访问 火山引擎控制台
  2. 注册账号并登录
  3. 完成实名认证(必须)

第二步:创建应用

  1. 进入后台,找到 豆包语音合成模型2.0

或直接访问:https://console.volcengine.com/speech/app

  1. 注意:左上角请切换到 "旧版",新版界面较乱,难以找到相关功能

  2. 按照路径进入:旧版 → 应用中心 → 应用管理 → 创建应用

  1. 填写应用名称和简介(随意填写)
  2. 重要:必须选中 "豆包语音合成模型2.0 → 豆包语音合成模型2.0 字符版" 这个复选框

第三步:开通试用或正式开通

  1. 访问语音合成页面:https://console.volcengine.com/speech/service/10035
  2. 顶部选择刚才创建的应用
  3. 点击 "试用" 开通

第四步:复制配置信息

在该页面下拉,找到并复制以下信息:

  1. App ID:在页面下方可见
  2. Access Token:在 App ID 右侧,点击复制

复制配置信息

在视频翻译软件中使用

第一步:填写配置

  1. 打开软件,进入 菜单 → TTS设置 → 字节语音合成模型2.0
  2. 填写 App ID 和 Access Token
  3. 点击测试按钮验证连接
  4. 测试无问题后保存

第二步:选择配音角色

  1. 回到主界面
  2. 配音渠道 中选择 字节语音合成模型2.0
  3. 选择目标语言
  4. 配音角色 中选择音色,可点击试听

特别注意

  • 很多音色需要到字节后台 单独开通和购买
  • 如果使用某个音色提示失败或不可用,大概率是需要单独购买该音色
  • 请确保选择的是 "大模型语音合成API" 而非其他类似产品
  • App ID 和 Access Token 必须与你创建的应用对应

常见问题

问题解决方案
找不到豆包语音合成模型2.0切换到"旧版"界面,按路径进入
测试失败检查 App ID 和 Access Token 是否正确
某些音色不可用需到字节后台单独开通购买该音色
提示未实名完成火山引擎实名认证