跳过导航

语音服务

将音频转换为文本,使用统一语音服务执行语音翻译和文本转语音的操作

快速开发支持高质量语音的应用

使用 语音 SDK 自信、快速地生成支持语音的应用。将语音转录为高度准确的文本、生成发音自然的文本转语音、翻译口头音频,并在对话期间使用说话人识别。探索无代码体验,并使用Speech studio 创建为应用定制的自定义模型。

行业领先的质量

获取最先进的语音转文本、逼真的文本转语音和屡获殊荣的说话人识别功能。

合规且安全

数据保持不变—处理期间不会记录语音输入。

可自定义的语音和模型

创建自定义语音、向基本词汇添加特定字词,或生成自己的模型。

灵活的部署

在云端或容器边缘的任何位置运行语音。

将语音转换为文本

以 100 多种语言和变体快速准确地听录音频。通过呼叫中心听录获得客户见解,使用支持语音的助手改善体验,捕捉会议中的关键讨论等。

为应用提供语音

使用文本转语音创建以对话方式朗读的应用和服务。创建发音自然的音频内容,使用大声朗读功能改进辅助功能,并创建自定义语音助理。

实时翻译语音

翻译来自 30 多种语言的音频,并自定义组织特定术语的翻译—所有内容以首选编程语言提供。

验证和识别说话人

向应用添加说话人验证和标识,从而确认某人的身份或识别会议中的发言人员。

使用自定义关键字激活助手或 IoT 设备

为 IoT 设备和启用语音的助理创建自定义关键字,从而让你的品牌与众不同—使其更个性化、更精美、更安全。

为免提方案添加语音命令

构建非接触式、语音优先的体验,以提高安全性并支持复工方案。

内置的全面的安全性和符合性

灵活的定价为你提供所需的功能和控制

仅支付所用内容,无预付成本。使用语音,根据以下内容即用即付:

  • 为语音转文本和语音翻译转录或翻译的音频小时数。
  • 为文本转语音转换为音频的字符数
  • 说话人识别的事务数

语音文档和资源

开始使用语音服务

浏览文档

参加 Microsoft Learn 语音课程

浏览热门开发人员资源

检查我们的示例代码和 SDK

使用 Speech studio Stack Overflow 快速生成语音模型

受到各种规模公司的信赖

AT&T 让客户畅享沉浸式体验

AT&T 正在以沉浸式体验展示其 5G 网络,允许客户直接与兔巴哥交谈。*

*“乐一通”以及所有华纳兄弟娱乐公司(s21)的相关人物和元素© & ™

ATT

Progressive 将 Flo 直接带给客户

Progressive 使用自定义神经语音生成发音自然的 Flo 虚拟版,从而帮助客户处理从获取免费汽车保险报价到常规保险问题等一切内容。

Progressive

KPMG 简化通话听录

毕马威使用语音转文本以转录并编录数千个通话,从而为客户降低了高达 80% 的合规性成本。

KPMG

Motorola 可帮助第一个响应者访问重要数据

摩托罗拉系统公司使用语音优先的虚拟助理帮助现场急救员访问重要信息。

Motorola Solutions

Hochtief 使用语音记载构造缺陷

支持语音的虚拟助手可帮助施工项目经理发现并记录建筑现场的缺陷。

HOCHTIEF

Zencity 通过 AI 解决方案提高生活质量

数据和分析初创公司 Zencity 使用语音翻译分析各种来源—社交媒体、维护请求等中的数据—有助于政府制定为居民提供更好服务的数据驱动型决策。

Zencity

语音更新、博客和公告

准备就绪后,即可开始设置 Azure 免费帐户

可以给你提供什么帮助?