跳过导航

语音转文本

语音服务的一项功能,可准确地将口述语音听录为文本

使口述音频可操作

快速准确地将音频听录为超过 85 种语言和变体的文本。自定义模型以提高特定于域的术语的准确性。通过对听录的文本启用搜索或分析或方便操作来从口述音频中获得更多价值(全都使用首选编程语言)。

高质量听录

使用先进的语音识别获取准确的音频转文本听录。

可自定义模型

将特定单词添加到基本词汇或构建自己的语音转文本模型。

灵活的部署

在任意位置(在云中或容器边缘)运行语音转文本。

生产就绪

访问跨 Microsoft 产品支持语音识别的同一可靠技术。

使用此演示应用(基于 JavaScript SDK 构建)尝试语音转文本

若要通过麦克风使用自己的声音尝试演示,请改用支持 WebRTC 的其他浏览器,例如,最新版本的 Microsoft Edge、Firefox 或 Chrome。

不会存储你的语音数据

从各种源中准确听录语音

从一系列源(包括麦克风音频文件Blob 存储)中将音频转换为文本。使用说话人分隔聚类来确定说话人、说话内容和说话时间。通过自动设置格式和标点获取可读的脚本。

根据需求自定义语音模型

定制语音模型,以了解组织和行业特定的术语。克服语音识别障碍,如背景噪音、口音或唯一词汇。通过上传音频数据和脚本自定义模型使用 Office 365 数据自动生成自定义模型,以优化组织的语音识别准确性。

随地部署

在数据所在的任何位置运行语音转文本。使用容器构建针对强大的云功能和内部功能进行了优化的语音应用程序。

全面保障隐私和安全

  • 语音服务属于 Azure 认知服务的一部分,已通过 SOC、FedRAMP、PCI DSS、HIPAA、HITECH 和 ISO 认证
  • 你的数据仍然属于你。在音频处理期间,不会记录音频输入和听录数据。
  • 随时查看和删除自定义语音数据和模型。你的数据在存储中时是加密的。
  • 在 Azure 基础结构的支持下,语音服务提供了企业级的安全性、可用性、合规性和可管理性。

灵活的定价为你提供了所需的控制权

使用语音转文本功能,你可以根据听录的音频小时数进行即用即付,而无需提前付费。

文档和资源

开始使用

浏览文档

根据 Microsoft Learn 课程创建语音服务

探索代码示例

查看示例代码

查看自定义资源

通过 Speech Studio自定义语音转文本解决方案。无需编写代码。

信任语音转文本的企业

KPMG 简化呼叫听录

KPMG 使用语音转文本来转录和编录数千个小时的呼叫,可为其客户减少高达 80% 的合规性成本。

KPMG

Motorola 使用语音帮助第一反应员访问重要数据

Motorola Solutions 正在使用支持语音的虚拟助手来帮助警察和其他紧急第一反应员更快地获取重要的信息。

Motorola Solutions

Universal Electronics 提供支持语音的智能家居体验

Universal Electronics 正在帮助制造商提供适合智能家居设备且支持语音的导航和控制功能 - 提供真正独特的消费者体验。

Universal Electronics

Hochtief 使用语音记录构造缺陷

Hochtief 使用启用了语音的虚拟助手帮助项目经理在项目站点上识别并记录构造缺陷。

Cheetah Mobile

NTT DATA 通过会议见解快速做出决策

NTT DATA 通过实时会议听录从语音数据中获取见解。借助自定义语音识别,他们能够自定义语音识别模型,以了解特定于组织的术语。

NTTDATA

见解支持对话式银行体验

Insight Enterprises 使用支持对话式 AI 的银行解决方案帮助银行为其分支机构提供数字速度和便利性。语音转文本可将用户所说的内容转换为可以处理和分析的数据,使客户能够及时获得相关响应。

Insight Enterprise, Inc.

语音转文本常见问题解答

  • 它是语音服务中的一项功能,可以准确、迅速地将音频转录为文本。
  • 认知服务是可自定义的预构建 AI 模型的集合,可用于将 AI 添加到应用程序。它包含语音、决策、语言和愿景等多个域。语音转文本是语音服务中的一项功能。其他语音相关功能包括文本转语音语音翻译说话人识别。决策服务的一个示例是个性化体验创建服务,它可让你提供个性化的相关体验。语言服务的示例包括语言理解、用于自然语言处理的文本分析、用于 FAQ 体验的 QnA Maker,以及用于语言翻译 Translator

开始使用语音