文本转语音 

将文本转换为逼真的语音,以获得更自然的界面

让机器和应用像人类一样说话

使用“文本转语音”(语音服务的一部分)来构建提供自然语音的应用和服务。利用多种语言中的各种自然口音,让你的解决方案更贴近人们的生活。利用基于语音合成技术突破性研究成果的神经网络语音合成功能生成逼真语音。对模型自定义,为解决方案和品牌创造独特声音。

逼真的语音

生成符合人类重音模式和语调的流畅自然的语音。

全球参与

以超过 80 种语音、45 种语言和变体与全球受众交互。

自定义体验

只需先花几分钟来训练数据,即可为你的应用生成独特的品牌声音。

优化音频

通过轻松调整速率、音量和发音等属性,为你的方案优化语音输出。

生成发音自然的语音

以自然拟人的语调和清晰的发音为你的应用赋予新的声音。借助深度神经网络,“文本转语音”功能可以使计算机的语音富有表现力,并且与自然语音几乎没有区别。

English (US): Aria

句子 语音样本
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

English (US):Guy

句子 语音样本
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

中文 (CN):Xiaoxiao

句子 语音样本
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

德语 (DE):Katja

句子 语音样本
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

意大利语 (IT):Elsa

句子 语音样本
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

想要生成它?

实时与全球受众互动

将文本实时转换为音频,创造流畅的会话体验。以超过 80 种语音、45 种语言和变体与全球受众交互。

语言 示例文本 语音样本
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (TR) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

想要生成它?

创造独特的品牌声音

只需先花几分钟来训练音频,无需一行代码就能构建自己独特的声音。通过使用带有自定义神经语音功能的深度神经网络模型,开发出高度逼真、类人的自定义语音,可用于实时场景和长格式音频内容的合成。

语言

质量

示例文本 语音样本

想要开始构建自己的语音模型?

轻松定制音频输出

通过控制速度、发音、音调、音量、语调和停顿等参数,实时微调文本到音频输出。有了神经语音,你可以调整说话风格来表达情绪,比如愉快或同理心,或者根据特定的场景需要来调整,比如用随意的语调来聊天,或者用正式的语调来播报新闻。

了解有关语音调整的更多信息

随时随地部署,从云到边缘

对于数据安全性和低延迟至关重要的场景,在云中或带有容器的本地运行文本转语音。语音容器现在支持标准语音和自定义语音。

了解有关容器中语音的详细信息

面向企业的安全性

  • Microsoft 每年在网络安全研发方面的投资超过 USD 1 billion

  • 我们雇佣了超过 3,500 名安全专家,他们完全专注于保护你的数据和隐私

  • Azure 拥有比任何其他云提供商都多的认证。查看综合列表

通过灵活的定价获取所需的功能、控制和自定义

仅为你使用的资源付费(无前期成本)。使用“文本转语音”功能时,可以根据转换为音频的字符数即用即付。

有关负责任的神经语音的准则

了解如何合理部署合成语音

合成声音在设计上必须让人们能够信赖。学习构建合成语音的原则,合成能够让受众对你的公司和服务有信心的声音。

阅读我们有关负责任的部署的准则

获得语音人才的同意

帮助语音人才了解神经文本转语音的工作原理,以及他们完成音频录制过程后如何使用语音。

阅读我们的语音人才披露指南

透明

确保用户在听到合成语音时能够理解,且语音人员知晓其语音会被如何使用。

请参阅披露准则 了解我们的负责任的方法

联系我们

自定义神经语音功能现处于封闭预览阶段。在此处了解有关门控过程以及如何获得访问权限的更多信息。

通过三个步骤开始使用文本转语音

通过注册 Azure 免费帐户获得即时访问权限和 $200 额度。

登录到 Azure 门户,并添加语音

了解如何通过快速入门文档来嵌入文本转语音。

文本转语音的开发人员资源

文档和教程

开始使用文本转语音。

课程

参加 Pluralsight 课程,了解使用文本转语音功能的步骤。

参加课程

文本转语音常见问题解答

  • 标准语音是使用统计参数合成技术和串联合成技术生成的。这些声音非常容易听懂,听起来很自然,有了这些声音,你的应用能以 45 种以上的语言进行语音交流,并提供多种语音选项。

    神经语音使用深度神经网络来克服传统的文本转语音系统在匹配口语中的重音和语调模式以及将语音单元合成为计算机语音方面的局限性。标准的文本转语音将韵律分解为独立的语言分析和声学预测步骤,这些步骤由独立的模型控制,可能会导致含混的语音合成效果。我们的神经功能可同时进行韵律预测和语音合成,从而生成听起来更自然的语音。
  • 有关完整列表,请参阅文档
  • 请查看区域可用性

开始使用语音