跳到主内容

语音转文本

一项语音服务功能,可准确地将口述语音听录为文本。

使口述音频可操作

快速准确地将音频转录为超过 100 语言和方言的文本。自定义模型以提高特定于域的术语的准确性。通过对听录的文本启用搜索或分析或方便操作来从口述音频中获得更多价值(全都使用首选编程语言)。

高质量听录

使用先进的语音识别获取准确的音频转文本听录。

可自定义模型

将特定单词添加到基本词汇或构建自己的语音转文本模型。

灵活部署

在任意位置(在云中或容器边缘)运行语音转文本。

生产就绪

访问跨 Microsoft 产品支持语音识别的同一可靠技术。

从各种源中准确听录语音

从一系列源(包括 麦克风、 音频文件、 blob 存储)中将音频转换为文本。使用说话人分隔聚类来确定说话人、说话内容和说话时间。通过自动设置格式和标点获取可读的脚本。

根据需求自定义语音模型

定制语音模型,以了解组织和行业特定的术语。克服语音识别障碍,如背景噪音、口音或唯一词汇。 通过上传音频数据和脚本自定义模型 。 使用 Office 365 数据自动生成自定义模型 ,以优化组织的语音识别准确性。

随地部署

在数据所在的任何位置运行语音转文本。使用 容器构建针对强大的云功能和内部功能进行了优化的语音应用程序。

借助云 AI 服务推动应用创新

学习推动组织可以开始使用 AI 快速实现价值的 5 种关键方法。

标题为“借助云 AI 服务推动应用创新”的报告

全面的隐私保障和安全性

  • 语音服务是 Azure 认知服务的一部分,已通过 SOC、FedRAMP、PCI DSS、HIPAA、HITECH 和 ISO  认证 。

  • 随时查看和删除自定义语音数据和模型。你的数据在存储中时是加密的。

  • 你的数据仍然属于你。在音频处理期间,不会记录音频输入和听录数据。

  • 在 Azure 基础结构的支持下,语音服务提供了企业级的安全性、可用性、合规性和可管理性。

全面的安全性和合规性,内置于

  • Microsoft 每年在网络安全研发方面的投资超过 USD 10 亿

  • 我们雇佣了 3,500 多名安全专家,专门负责数据安全和隐私方面的工作。

  • Azure 拥有比任何其他云提供商都多的认证。查看完整列表

  • 灵活的定价为你提供了所需的控制权

    使用语音转文本功能,你可以根据听录的音频小时数进行即用即付,而无需提前付费。

开始使用 Azure 免费帐户

1

免费开始使用获取有效期 30 天的 USD200 额度。拥有额度后,可以免费使用很多热门服务,以及超过 55 项永久免费的服务。

2

用完额度后,请改为即付即用定价以继续使用相同的免费服务构建自己的内容。只需为超出每月免费使用量以外的部分付费。

3

12 个月后,你可以继续使用超过 55 种永久免费的服务,并且仍只需为超出每月免费使用量的部分付费。

信任语音转文本的企业

Motorola 使用语音帮助第一响应方访问重要数据

Motorola Solutions 正在使用支持语音的虚拟助手来帮助警察和其他紧急第一反应员更快地获取重要的信息。

一个人对着胸前的对讲机说话
返回标签页

文档和资源

开始使用

浏览 文档

根据  Microsoft Learn 课程创建语音服务

浏览代码示例

查看 示例代码

查看自定义资源

使用  Speech Studio 浏览和自定义语音语言转文本解决方案。无需编写代码。

语音转文本常见问题解答

  • 它是语音服务中的一项功能,可以准确、迅速地将音频转录为文本。

  • 认知服务 是可自定义的预构建 AI 模型的集合,可用于将 AI 添加到应用程序。它包含语音、决策、语言和愿景等多个域。语音转文本是语音服务中的一项功能。其他语音相关功能包括 文本转语音、 语音翻译和 说话人识别。决策服务的一个示例是 个性化体验创建服务,它可让你提供个性化的相关体验。语言服务的示例包括 语言理解、用于自然语言处理的 文本分析 、用于 FAQ 体验的  QnA Maker ,以及用于语言翻译 翻译工具 。

开始使用认知服务进行构建

免费试用语音转文本

与销售人员交谈