Azure AI 语音
使用预构建的或可自定义的语音模型更快地构建多模式多语言 AI 应用。
概述
向生成式 AI 应用添加多模态性
- 使用快速听录和自然声音构建支持语音的多语言生成式 AI 应用。
- 在应用中自定义适合你所在领域的语音(包括使用 OpenAI Whisper 模型),或者为你的助手赋予品牌化声音。
- 启用音频流的实时多语言语音转语音翻译和语音转文本翻译。
- 在数据驻留的任何位置运行 AI 模型。使用容器在云中或边缘部署应用。
用例
使用语音模型开发多模态生成式 AI 应用
将语音转录为文本
转录呼叫中心或会议对话。通过 100 多种语言的音频字幕走向全球。
将文本转换为语音
构建能自然说话的机器人。使用定制的、真实的声音和说话风格来区分品牌。
语音分析
分析音频或视频通话录制以获得深入的见解。汇总关键主题并提取或编辑个人标识信息。
使用 OpenAI Whisper 转录音频
使用 Azure AI 语音或 Azure OpenAI 服务中最新的 OpenAI Whisper 模型实现呼叫中心转型。
生成自定义语音
使用神经网络定制声音生成自然的声音。
生成虚拟形象
使用预构建或自定义的带有自然声音的虚拟形象使品牌生动起来。
验证和辨识说话人
通过向应用添加说话人验证和识别功能,确认某个人的身份或辨识会议中发言人的身份。
启用多语言通信
在受支持的语言中翻译音频或视频数据 - 语言列表在不断扩大。自定义你所在行业的翻译。
嵌入式语音
在云连接时断时续或不可用的情况下,使用嵌入式语音助力设备上的语音转文本和文本转语音场景。
安全性
内置安全性和合规性
Microsoft 已承诺在 5 年内在网络安全方面投资 200 亿美元。
我们在 77 个国家/地区聘用了超过 8,500 名安全和威胁情报方面的专家。
Azure 拥有行业内最大的合规性认证组合之一。
客户案例
了解客户使用 Azure AI 语音构建什么内容
资源
开始使用 Azure AI 语音
帐户注册
通过免费帐户开始使用
从 USD200 的 Azure 额度开始
帐户注册
以即用即付定价开始使用
无前期承诺使用量(可随时取消)。