什么是 HuggingFace_ASR 语音识别渠道?
HuggingFace_ASR 是视频翻译软件从 v3.91 版本起新增的语音识别渠道,支持使用 HuggingFace 上的开源模型进行语音识别。该渠道涵盖了多种语言的识别模型,适合需要识别非中文语音(如英语、日语、越南语、泰语等)的场景。
前提条件
- 视频翻译软件版本 >= v3.91
- 首次使用某个模型会自动从 HuggingFace 下载,需要网络连接
- 国内用户可能需要使用镜像站或手动下载模型(详见下方说明)
- GPU 加速可显著提升识别速度(推荐使用 NVIDIA GPU)
自动下载说明
第一次使用某个模型时,软件会自动从以下地址下载:
- 国际站:
https://huggingface.co - 国内镜像:
https://hf-mirror.com
因网络原因,国内用户自动下载可能失败。如果失败,请参考下方 手动下载 部分。
支持的模型与语言
英语模型
| 模型名称 | 语言 | 说明 | |---------|------|---------|------| | nvidia/parakeet-ctc-1.1b | 英语 | NVIDIA 出品,识别精度高 |
日语模型
| 模型名称 | 语言 | 说明 | |---------|------|---------|------| | reazon-research/japanese-wav2vec2-large-rs35kh | 日语 | wav2vec2 架构 | | kotoba-tech/kotoba-whisper-v2.0 | 日语 | 专为日语优化的 whisper |
越南语模型
| 模型名称 | 语言 | 说明 |
|---|---|---|
| vinai/Phowhisper-large | 越南语 | whisper-large-v3 微调版 |
泰语模型
| 模型名称 | 语言 | 说明 |
|---|---|---|
| biodatlab/whisper-th-large-v3 | 泰语 | whisper-large-v3 泰语版 |
手动下载方法
如果自动下载失败,可以手动下载模型文件。所有模型的存放规则相同:
- 在
sp.exe(sp.py)同级的models文件夹内创建对应文件夹 - 打开模型下载页面,下载所有文件
- 将下载的文件放入创建的文件夹内
注意:下载后不要修改文件名称。如果下载目录已有同名文件(如
xxx(1)),请先删除旧文件再重命名。
nvidia/parakeet-ctc-1.1b(英语)
- 创建文件夹:在
models文件夹内创建models--nvidia--parakeet-ctc-1.1b - 下载地址:https://huggingface.co/nvidia/parakeet-ctc-1.1b/tree/main
- 将该页面所有文件下载后放入文件夹
reazon-research/japanese-wav2vec2-large-rs35kh(日语)
- 创建文件夹:在
models文件夹内创建models--reazon-research--japanese-wav2vec2-large-rs35kh - 下载地址:https://huggingface.co/reazon-research/japanese-wav2vec2-large-rs35kh/tree/main
- 将该页面所有文件下载后放入文件夹
kotoba-tech/kotoba-whisper-v2.0(日语)
- 创建文件夹:在
models文件夹内创建models--kotoba-tech--kotoba-whisper-v2.0 - 下载地址:https://huggingface.co/kotoba-tech/kotoba-whisper-v2.0/tree/main
- 将该页面所有文件下载后放入文件夹
biodatlab/whisper-th-large-v3(泰语)
- 创建文件夹:在
models文件夹内创建models--biodatlab--whisper-th-large-v3 - 下载地址:https://huggingface.co/biodatlab/whisper-th-large-v3/tree/main
- 将该页面所有文件下载后放入文件夹
vinai/Phowhisper-large(越南语)
- 创建文件夹:在
models文件夹内创建models--vinai--Phowhisper-large - 下载地址:https://huggingface.co/vinai/Phowhisper-large/tree/main
- 将该页面所有文件下载后放入文件夹
openai/whisper-large-v3
- 创建文件夹:在
models文件夹内创建models--openai--whisper-large-v3 - 下载地址:https://huggingface.co/openai/whisper-large-v3/tree/main
- 将该页面所有文件下载后放入文件夹
常见错误与排查
自动下载失败
- 原因:网络无法访问 HuggingFace 或镜像站不稳定
- 解决:使用上方手动下载方法,或配置代理后重试
模型文件名称错误
- 原因:下载时浏览器自动重命名(如
xxx(1)) - 解决:删除带有
(1)后缀的文件,将正确名称的文件放入模型文件夹
识别结果为空或报错
- 原因:模型文件不完整或文件夹结构不正确
- 解决:检查模型文件夹内是否包含所有必要文件,必要时重新下载
