文本转语音 

A Speech service feature that converts text to lifelike speech

通过自然语音为应用注入生命力

构建能够自然说话的应用和服务,有超过 45 种语言和变体的 110 多条语音可供选择。通过自定义语音让你的品牌独具特色,并使用具有不同说话风格和情感语调的语音来搭配你的用例,所有这些都是用你的首选编程语言实现的。

逼真的语音

让语音流畅、自然,符合人类语音模式和语调。

可自定义语音

创建反映品牌标识的独特语音。

精细音频控制

通过轻松地调整语速、音调、发音和停顿等,为你的方案优化语音输出。

灵活的部署

在任意位置(在云中或容器边缘)运行文本转语音。

为每个方案访问各种语音

通过超过 45 种语言和变体的 110 多条语音与全球受众交互。用富有表现力的、像人类一样的语音为方案注入生命力。神经文本转语音支持多种说话风格(包括聊天、新闻节目和客户服务),并支持高兴和同情等情感。

使用此演示应用(基于 JavaScript SDK 构建)尝试文本转语音

注意:不会存储你的数据。

利用音频内容创建工具控制文本转语音输出的更多方面

了解如何生成此内容

注意:不会存储你的数据。

利用音频内容创建工具控制文本转语音输出的更多方面

了解如何生成此内容

为品牌生成自定义语音

通过独特的自定义语音让你的品牌独具特色。使用自定义神经语音功能(预览)开发高度逼真的语音,以实现更自然的对话界面(请从 30 分钟的音频入手)。

语言

质量

示例文本 语音样本

想要开始构建自己的语音模型?

定制语音输出

微调音频来搭配你的方案。使用语音合成标记语言 (SSML) 或音频内容创建工具定义词典和控制发音、音调、语速、停顿和语调等语音参数。

随时随地部署,从云到边缘

在数据驻留的任何位置运行文本转语音。使用容器(预览)生成更适合强大的云功能和边缘区域的语音应用。语音容器支持标准语音和自定义语音。

全面保障隐私和安全

  • 语音服务是 Azure 认知服务的一部分,通过 SOC、FedRAMP、PCI DSS、HIPAA、HITECH 和 ISO 认证
  • 你的数据仍然属于你。你的文本数据不会在数据处理或音频生成期间存储。
  • 可随时查看和删除自定义语音数据和模型。你的数据在存储中时是加密的。
  • 在 Azure 基础结构的支持下,Speech 服务提供了企业级的安全性、可用性、符合性和可管理性。

灵活的定价给你所需的权力和控制

仅为你使用的资源付费(无前期成本)。使用文本转语音时,可以根据转换为音频的字符数即用即付。

生成负责任的合成语音的准则

文档和资源

开始使用

探索代码示例

查看自定义资源

依靠“文本转语音”技术进行构建

Motorola 帮助第一目击者访问重要的数据

Motorola Solutions 正在使用支持语音的虚拟助手来帮助警察和其他紧急第一反应员更快地获取重要的信息。

查看案例

Motorola Solutions

BBC 对可信内容的传输方式进行了创新

借助 Azure 认知服务和 Azure 机器人服务,BBC 创建了一个端到端的自定义数字语音助手,它可捕捉公司的品牌标识,帮助它与广泛的受众建立新的对话关系。

查看案例

BBC

Universal Electronics 为互联智能家居助力

Universal Electronics 正在帮助制造商提供适合智能家居设备且支持语音的导航和控制功能。

查看案例

Universal Electronics

Cheetah Mobile 拓展国际翻译市场

Cheetah Mobile 是一家移动互联网公司,它的应用用户遍布 200 多个国家和地区。该公司正在使用“文本转语音”技术将其翻译设备和应用的触及范围扩大到国际市场。

查看案例

Cheetah Mobile

开始使用语音