文本转语音
A Speech service feature that converts text to lifelike speech
通过自然语音为应用注入生命力
构建朗读自然的应用和服务,从跨 119 种语言和变体的 270 多种神经网络声音中进行选择。使用自定义的真实语音生成器让你的品牌与众不同,并获取具有不同朗读风格和情感音调的语音,从而适用于用例—从文本阅读器和说话器对到客户支持聊天机器人。
逼真的合成语音
实现与人声的语调和情感匹配的流畅、发音自然的文本转语音。
可自定义文本讲述者语音
创建反映品牌形象的独特 AI 语音生成器。
细化的文本转语音控件
通过轻松地调整语速、音调、发音和停顿等,为你的方案优化语音输出。
灵活的部署
在任何地方(在云中、本地或容器边缘)运行文本转语音。
为每个方案访问各种语音
使用跨 129 种语言和变体的 330 多种神经网络声音吸引全球受众。使用极具表现力和类似人类的声音,使文本阅读器和已启用语音的助理等方案栩栩如生。神经网络文本转语音支持多种朗读风格,包括新闻广播、客户服务、呼喊、耳语以及高兴、悲伤等情感。
定制语音输出
微调合成的语音音频以适应你的方案。使用使用语音合成标记语言(SSML)或音频内容创建工具定义词汇并控制语音参数,如发音、音调、速率、停顿和语调。
从云到边缘的任何位置部署文本转语音
在数据主流的任何位置运行文本转语音。使用 容器将逼真的语音合成构建到针对强大的云功能和边缘区域性而优化的应用程序中。
为品牌生成自定义语音
使用独特的定制声音让你的品牌与众不同。使用神经网络定制声音功能开发高度真实的语音,从而生成更自然的对话界面,从 30 分钟的音频开始。以下是一些当前正在进行 AI 语音生成的组织的示例:

AT&T 以身临其境的体验取悦客户
AT&T 将以沉浸式体验展示其 5G 网络的强大之处,该体验允许客户直接与兔巴哥* 交谈。
*《乐一通》以及所有相关人物和元素的版权和商标归华纳兄弟娱乐公司 (s21) 所有
Progressive 将 Flo 直接提供给其客户
Progressive 使用自定义神经语音构建了一个发音自然的虚拟版 Flo,可为客户提供方方面面的帮助,从获得免费的汽车保险报价到一般的保险问题等。
使用 Cloud AI 服务推动应用创新
了解组织开始使用 AI 快速实现价值的五种关键方法。
全面保障隐私和安全
- 语音服务是 Azure 认知服务的一部分,通过 SOC、FedRAMP、PCI DSS、HIPAA、HITECH 和 ISO 认证。
- 数据仍然是你的数据。数据处理或音频语音生成期间不会存储文本数据。
- 可随时查看和删除自定义语音数据和合成的语音模型。你的数据在存储中时是加密的。
- 在 Azure 基础结构的支持下,Speech 服务提供了企业级的安全性、可用性、符合性和可管理性。
灵活的定价给你所需的权力和控制
仅为你使用的资源付费(无前期成本)。使用文本转语音时,可以根据转换为音频的字符数即用即付。
生成负责任的合成语音的准则
依靠“文本转语音”技术进行构建




Cheetah Mobile 拓展国际翻译市场
Cheetah Mobile 是一家移动互联网公司,它的应用用户遍布 200 多个国家和地区。该公司正在使用“文本转语音”技术将其翻译设备和应用的触及范围扩大到国际市场。
