语音翻译器 | 翻译99种语言音频

语音翻译器功能

此语音翻译器可在 99 种语言之间转换语音；翻译质量与源语言的词错误率相关。可上传录音或在浏览器中实时讲话。无需下载，无需账户，无时长限制。

拖入音频文件，获取翻译文本。 上传 MP3、WAV、M4A、MP4、OGG 或 FLAC 文件。模型会转录源语言，翻译成您选择的目标语言，并将结果导出为纯文本、SRT 或 VTT 格式，用于字幕。时长达 3 小时的文件可一次性处理。

实时翻译在同一浏览器标签页中运行。 点击麦克风，讲话，翻译文本将在 1.5 秒内出现。适用于国际支持电话、供应商会议和双语面试等不容等待录音完成的场景（2026 年 4 月延迟基准测试）。

主要功能：

该工具专为录制的会议、播客、采访、客户支持电话和视频内容而构建。使用实时模式进行实时对话，或上传文件进行批处理，并获取可搜索的文本记录。

翻译质量与转录质量相关。源语言词错误率（WER）低的语言对会产生更清晰的翻译，因为翻译过程中需要解释的模糊输入更少。以下数据来自2026 年 4 月 WER 重测。

语言对	平均 WER（转录）	翻译质量	备注
英语，西班牙语	4-5%	优秀	交易量最大、训练最多
英语，葡萄牙语	5-6%	优秀	支持巴西和欧洲变体
英语，法语	5-6%	优秀	覆盖魁北克法语
英语，德语	6-7%	良好	复合词处理正确
英语，日语	7-8%	良好	标点符号重构
英语，中文	7-8%	良好	简体和繁体
英语，韩语	7-8%	良好	保留敬语级别
西班牙语，葡萄牙语	5-6%	优秀	相互理解度高
英语，阿拉伯语	9-10%	可接受	仅限现代标准阿拉伯语，方言覆盖有限
英语，印地语	9-10%	可接受	处理与英语的语码转换

对于未列出的语言对，请在每种语言的准确性表格中查找源语言的 WER，并在 WER 级别和最终翻译之间大致增加一个质量等级。10% 以上 WER 范围的语言对仍能产生有用的翻译以理解大意，但预期会有更多专有名词和习语的润色。

无论您是上传录音还是实时讲话，该工具都分三步运行。

支持的语言包括西班牙语、法语、德语、中文、日语、韩语、阿拉伯语、印地语、葡萄牙语、俄语、意大利语和荷兰语，以及 90 多种其他语言。

实时语音翻译器模式可即时处理对话，延迟低于 1.5 秒。它专为商务会议、客户电话、面试和国际演示而设计。在通话过程中点击即可讲话和翻译，无需切换标签页。

麦克风输入直接在浏览器中捕捉您的语音。点击麦克风按钮，授予权限并讲话。AI 会检测语言，翻译内容并显示结果。在桌面和移动浏览器上均可使用。

在任何设备上翻译

AI 语言检测

语音翻译器与其他工具对比

功能	ScreenApp	Maestra	Sonix	Notta	Speechmatics	Veed.io
支持的语言	100+	125+	53	58	50+	125+
自动检测源语言	是	是	是	是	是	是
用于配音输出的语音克隆	否（文本转语音）	是	否	否	否	是
文件大小/长度限制	每次上传 3 小时	每个文件 5 GB	4 GB / 5 小时	2 GB / 5 小时	每个文件 2 GB	每个文件 2 GB
免费层级	无限分钟	30 分钟试用	30 分钟试用	120 分钟/月	8 小时/月
导出格式	TXT, SRT, VTT, DOCX	SRT, VTT, TXT, DOCX	SRT, VTT, TXT, DOCX	TXT, SRT, DOCX, PDF	TXT, SRT, JSON	SRT, VTT, TXT
价格（付费）	免费	29 美元/月	22 美元/小时	14.99 美元/月	0.30 美元/小时 API	24 美元/月

对比 Maestra： Maestra 克隆说话者的声音，用于目标语言的配音播放，这对于视频本地化非常有用。其免费试用限制为 30 分钟。ScreenApp 使用通用的文本转语音（TTS）声音而非克隆，但免费使用无分钟限制，并直接导出 SRT/VTT。
对比 Sonix： Sonix 覆盖 53 种语言，在 30 分钟试用后每小时收费 22 美元。ScreenApp 免费翻译 99 种语言，尽管 Sonix 在长会议录音中具有更强的说话人分离标签。
对比 Notta： Notta 每月提供 120 分钟的 58 种语言免费服务，并导出 SRT 用于视频工作。ScreenApp 支持更多文件格式（包括 OGG、FLAC），并取消了每月分钟限制，而 Notta 与 Zoom 和 Google Meet 机器人集成更紧密。
对比 Speechmatics： Speechmatics 是一个 API 优先的转录引擎，每音频小时收费 0.30 美元，每月有 8 小时免费。它需要开发人员集成才能进行翻译。ScreenApp 无需代码即可在浏览器中工作。
对比 Veed.io： Veed.io 为视频编辑者增加了 AI 语音克隆和屏幕字幕样式，每月提供 30 分钟免费服务。ScreenApp 专注于音频到文本的翻译路径，跳过视频编辑，但免费处理更长的文件（3 小时对比 2 GB）。