Trace Id is missing
跳到主内容

语音转文本

一项 AI 语音 功能,可准确地将口述语音听录为文本。

使口述音频可操作

快速准确地将音频转录为超过 100 语言和方言的文本。自定义模型以提高特定于域的术语的准确性。通过对听录的文本启用搜索或分析或方便操作来从口述音频中获得更多价值(全都使用首选编程语言)。

在 Microsoft Build 上了解 Azure AI 的新增功能

高质量听录

使用先进的语音识别获取准确的音频转文本听录。

可自定义模型

将特定单词添加到基本词汇表或构建自己的语音转文本模型。

灵活部署

在任意位置(在云中或容器边缘)运行语音转文本。

生产就绪

访问跨 Microsoft 产品支持语音识别的同一可靠技术。

从各种源中准确听录语音

从一系列源(包括 麦克风、 音频文件、 blob 存储)中将音频转换为文本。使用说话人分隔聚类来确定说话人、说话内容和说话时间。通过自动设置格式和标点获取可读的脚本。

根据需求自定义语音模型

定制语音模型,以了解组织和行业特定的术语。克服语音识别障碍,如背景噪音、口音或唯一词汇。 通过上传音频数据和脚本自定义模型 。 使用 Office 365 数据自动生成自定义模型 ,以优化组织的语音识别准确性。

随地部署

在数据所在的任何位置运行语音转文本。使用 容器构建针对强大的云功能和内部功能进行了优化的语音应用程序。

借助云 AI 服务推动应用创新

学习推动组织可以开始使用 AI 快速实现价值的 5 种关键方法。

标题为“借助云 AI 服务推动应用创新”的报告

全面的隐私保障和安全性

  • AI 语音是 Azure AI 服务的一部分,已通过 SOC、FedRamp、PCI DSS、HIPAA、HITECH 和 ISO  认证 。

  • 随时查看和删除自定义的语音数据和模型。你的数据在存储中时是加密的。

  • 你的数据仍然属于你。在音频处理期间,不会记录音频输入和听录数据。

  • 在 Azure 基础结构的支持下, AI 语音提供了企业级的安全性、可用性、合规性和可管理性。

全面的内置安全性和合规性

通过 Azure 免费帐户开始使用

1

免费开始使用获取有效期 30 天的 USD200 额度。拥有赠金时,可获取许多最热门服务的免费使用量,外加超过 55 种其他永久免费的服务的免费使用量。

2

用完额度后,请改为即付即用定价以继续使用相同的免费服务构建自己的内容。只需为超出每月免费金额以外的部分付费。

3

12 个月后,你将继续使用超过 55 种永久免费的服务,而且仍然只需为超出每月免费使用量的部分付费。

文档和资源

开始使用

浏览 文档

根据  Microsoft Learn 课程创建 AI 语音服务

浏览代码示例

查看 示例代码

查看自定义资源

使用  Speech Studio 浏览和自定义语音语言转文本解决方案。无需编写代码。

语音转文本常见问题解答

  • 它是语音服务中的一项功能,可以准确、迅速地将音频转录为文本。

  • AI 服务 是一组可自定义的预构建 AI 模型,可用于将 AI 添加到应用程序。它包含语音、决策、语言和愿景等多个域。语音转文本是 AI 语音服务中的一项功能。其他语音相关功能包括 文本转语音、 语音翻译和 说话人识别。决策服务的一个示例是 个性化体验创建服务,它可让你提供个性化的相关体验。AI 语言服务的示例包括 语言理解、用于自然语言处理的 文本分析 、用于 FAQ 体验的  QnA Maker ,以及用于语言翻译 翻译工具 。

开始使用 AI 服务进行构建

免费试用语音转文本