Trace Id is missing
跳转至主内容
Azure

Azure AI 语音

使用预构建的或可自定义的语音模型更快地构建多模式多语言 AI 应用。
概述

向生成式 AI 应用添加多模态性

  • 使用快速听录和自然声音构建支持语音的多语言生成式 AI 应用。
  • 在应用中自定义适合你所在领域的语音(包括使用 OpenAI Whisper 模型),或者为你的助手赋予品牌化声音。
  • 启用音频流的实时多语言语音转语音翻译和语音转文本翻译。
  • 在数据驻留的任何位置运行 AI 模型。使用容器在云中或边缘部署应用。
用例

使用语音模型开发多模态生成式 AI 应用

将语音转录为文本

转录呼叫中心或会议对话。通过 100 多种语言的音频字幕走向全球。

将文本转换为语音

构建能自然说话的机器人。使用定制的、真实的声音和说话风格来区分品牌。

语音分析

分析音频或视频通话录制以获得深入的见解。汇总关键主题并提取或编辑个人标识信息。

使用 OpenAI Whisper 转录音频

使用 Azure AI 语音或 Azure OpenAI 服务中最新的 OpenAI Whisper 模型实现呼叫中心转型。

生成自定义语音

使用神经网络定制声音生成自然的声音。

生成虚拟形象

使用预构建或自定义的带有自然声音的虚拟形象使品牌生动起来。

验证和辨识说话人

通过向应用添加说话人验证和识别功能,确认某个人的身份或辨识会议中发言人的身份。

启用多语言通信

在受支持的语言中翻译音频或视频数据 - 语言列表在不断扩大。自定义你所在行业的翻译。

嵌入式语音

在云连接时断时续或不可用的情况下,使用嵌入式语音助力设备上的语音转文本和文本转语音场景。
安全性

内置安全性和合规性 

Microsoft 已承诺在 5 年内在网络安全方面投资 200 亿美元
我们在 77 个国家/地区聘用了超过 8,500 名安全和威胁情报方面的专家
Azure 拥有行业内最大的合规性认证组合之一。
一位穿着牛仔夹克的人在服装店里使用平板电脑,背景中货架上挂着各种衣物。
定价

灵活定价,以满足你的需求

只需按实际使用量付费,无前期成本。Azure AI 语音即用即付定价基于:
客户案例

了解客户使用 Azure AI 语音构建什么内容

常见问题解答

常见问题解答

  •  Azure AI 语音提供多种特性和功能,包括语音转文本、文本转语音和语音翻译。这些是通过多种编程语言(包括 C#、C++、Java 等)的 SDK 提供的。
  • 是,Azure AI 语音支持 OpenAI Whisper 模型,尤其是批量听录。
  •  Azure AI 语音支持越来越多的语言。有关受支持语言的当前列表,请参阅此列表。
  • 客户正在使用 Azure AI 服务构建有趣的应用程序。开始使用 Azure AI Studio 中的语音分析,用于对话 AI、通话后分析、视频汇总等用户。
两个人坐在一张桌子旁,一边讨论一边看着一台笔记本电脑。背景是橙色
 帐户注册

通过免费帐户开始使用

从 USD200 的 Azure 额度开始
一个戴着眼镜,穿着绿色毛衣的人正在专心使用笔记本电脑,桌子上放着一棵小植物和一筒铅笔。
 帐户注册

以即用即付定价开始使用

无前期承诺使用量(可随时取消)。