Azure

Foundry Tools 中的 Azure 语音

使用预生成的可自定义多语言语音 AI 模型为应用和智能体提供支持。

开始使用 Azure 使用 Microsoft Foundry 创建

概述

发现最新的 Azure 语音功能

使用快速听录和自然声音构建支持语音的多语言生成式 AI 应用。

探索 Azure 语音
使用端到端语音（包括自定义听录、语音和虚拟形象）实现 AI 智能体。

探索语音实时 API
启用音频流的实时多语言语音转语音翻译和语音转文本听录。

了解详细信息
在数据驻留的任何位置运行 AI 模型。使用容器在云中或边缘部署应用。

使用容器进行开发

用例

使用语音模型开发多模态生成式 AI 应用

构建支持语音的智能体

使用基础模型以及自定义音频传入和音频输出模型为智能体提供语音支持。

将语音转录为文本

转录呼叫中心或会议对话。使用超过 100 种语言的音频字幕走向全球。

将文本转换为语音

构建能自然说话的机器人。使用定制的、真实的声音和说话风格来区分品牌。

使用通话后分析

借助 Foundry Tools 中 Azure 内容理解中的基础模型，分析音频或视频通话录制内容来获取深入的见解。

使用 OpenAI Whisper 转录音频

使用 Azure AI 语音或 Foundry 模型中的 Azure OpenAI 中最新的 OpenAI Whisper 模型实现呼叫中心转型。

生成自定义语音

使用神经网络定制声音生成自然的声音。

生成虚拟形象

使用预构建或自定义的带有自然声音的虚拟形象使品牌生动起来。

启用多语言通信

在受支持的语言中翻译音频或视频数据 - 语言列表在不断扩大。自定义你所在行业的翻译。

嵌入语音

在云连接时断时续或不可用的情况下，使用嵌入式语音支持设备上的语音转文本和文本转语音应用场景。

一位穿着牛仔夹克的人在服装店里使用平板电脑，背景中货架上挂着各种衣物。

定价

灵活定价，满足你的需求

仅为所使用内容付费，无前期成本。Azure 语音即用即付定价基于：

Azure 语音定价

Azure OpenAI

整合多模态，并使用组合多种类型的数据（如文本、图像、视频和音频）的模型增强应用。

了解详细信息

Microsoft Foundry

在一个平台上获取开发生成式 AI 应用程序和自定义智能体所需的一切内容。

Foundry 控制平面中的内容安全

使用践行负责任 AI 原则的内置工具提供安全可靠的解决方案。

了解详细信息

Azure 内容理解

加速将多模式数据转换为见解。

了解详细信息

Azure 翻译工具

使用超过 100 种语言实时或批量翻译文档和文本，以实现全球覆盖。

Azure 语言

使用预生成的 AI 驱动功能生成对话界面、汇总文档和分析文本。

资源

开始使用 Azure 语音

一个戴着眼镜，穿着米色衬衫的人在户外咖啡馆里看着一台笔记本电脑，微笑着做着手势

探索 Azure 语音文档

发现教程和 API 参考等资源。

了解详细信息

两个人在工作站讨论计算机显示器上显示的代码，桌面上有一个键盘、耳机和一个马克杯。

构建支持语音的应用

设计和构建支持语音的企业级应用。

下载信息图

在办公室里，一位男士戴着眼镜，穿着橙色毛衣，一只手拿着文件正在使用笔记本电脑。

GitHub 资源

浏览示例代码和 SDK。

浏览 GitHub 上的示例

一个人坐在办公椅上的双显示器前，在键盘上输入代码

立即开始生成

在 Foundry 中快速生成模型。

探索 Foundry 中的 Azure 语音。

四个人坐在一张桌子旁，一边交谈一边在笔记本电脑上工作。他们似乎正在协作。

Azure 语音学习路径

使用 Azure 开发自然语言处理解决方案。

了解详细信息

创建智能体式 AI

将 AI 智能体无缝集成到应用中，并学习高级模型微调技术。

了解详细信息

一位穿着蓝色夹克的女士看着计算机屏幕。

寻找最佳 AI 模型

启用多模式模型、模型选择和基准检验，并创建多模式应用程序。

了解详细信息

安全且负责任的 AI

了解 AI 安全、评估和管理有害内容的基本知识。

了解详细信息

常见问题解答

Azure 语音是 Foundry Tools（以前称为 Azure AI 服务）的一部分，提供用于语音转文本、文本转语音、翻译和说话人识别的 API。它以前称为 Azure AI 语音。
是，我们正在将许多以前的 Azure AI 服务重命名为 Foundry Tools。这种转变反映了 Foundry 下更广泛的平台统一，并表明这些服务现已定位为用于构建智能体 AI 应用程序的核心工具。

Foundry Tools 中的 Azure 语音仍然提供强大的功能，如语音识别、文本转语音和翻译，但它现在是专门为开发人员构建智能的智能体而设计的统一工具包的一部分。

此次品牌重塑有助于明确这些 API 在 Foundry 生态系统中的定位，并使其更易于发现、编排和集成到现代 AI 工作流中。
Azure 语音提供多种特性和功能，包括语音转文本、文本转语音和语音翻译。这些是通过使用多种编程语言（包括 C#、C++ 和 Java）的 SDK 提供的。

了解详细信息
语音功能支持越来越多的语言。有关支持的语言，请参阅当前列表。
客户正在使用 Foundry Tools 构建有趣的应用程序。开始使用 Azure 语音，以将其用于括对话式 AI、通话后分析和视频汇总等用例。

一位女士正坐在桌前使用笔记本电脑。

后续步骤

选择适合你的 Azure 帐户 

即付即用或免费试用 Azure 最多 30 天。

开始使用 Azure

一位留着短卷发、面带微笑的女士，旁边坐着一位男士

AI 开发工具

设计和管理 AI 应用程序

高效创建、自定义和扩展 AI 应用与智能体。

一位穿着白色衬衫的男士正在使用笔记本电脑。

业务解决方案中心

使用创新的云解决方案推动结果

浏览业务解决方案中心，查找实现目标的产品和解决方案。

探索 Microsoft 解决方案

获取 Azure 移动应用