跳过导航

必应语音

将音频转换为文本,了解目的,然后将文本转换回语音,实现自然响应

语音识别

将口述音频转换为文本。该 API 可以直接打开并识别通过麦克风实时传入的音频,识别来自不同实时音频源的音频,或识别文件内的音频。在所有情况下,可采用实时流式处理将音频发送到服务器,并返回部分识别结果。

利用语音到文本转换 API,可以构建语音触发的智能应用。若要查看其工作原理,请选择目标语言,然后单击麦克风并开始说话。或者仅单击其中一个示例语音短语,即可查看语音识别的工作原理。使用此演示代表你同意将语音输入数据提供给 Microsoft 用于服务改善

在实际操作中查看

若要通过麦克风使用自己的声音尝试演示,请改用支持 WebRTC 的其他浏览器,例如,最新版本的 Microsoft Edge、Firefox 或 Chrome。

想要生成它?

文本到语音转换

将文本转换为语言音频。应用程序需要与其用户“交谈”时,此 API 会用于将应用生成的文本转换为可向用户播放的音频。

利用文本到语音转换 API,可以构建可以说话的智能应用。可以立刻进行测试,只要选择目标语言,添加语句,然后单击“播放”按钮,即可查看语音合成的工作原理。使用此演示代表你同意将语音输入数据提供给 Microsoft 用于服务改善。

在实际操作中查看

剩下 500 个字符

想要生成它?

了解认知服务 API

计算机影像

从图像中提取可操作信息

人脸

检测、识别、分析、组织和标记照片中的人脸

视频索引器 预览版

解锁视频见解

内容审查器

自动化图像、文本和视频审查

自定义视觉 预览版

为你独一无二的用例轻松自定义最先进的计算机影像模型

文本分析

轻松评估观点和主题以理解用户的需求

文本翻译

通过简单的 REST API 调用即可轻松进行机器翻译

必应拼写检查

检测并更正应用中的拼写错误

内容审查器

自动化图像、文本和视频审查

语言理解

教会应用理解用户发出的命令

必应语音

将语音转换为文本,再转回语音,并理解用户的意图

说话人识别 预览版

使用语音辨识和验证各个说话人的身份

语音翻译

通过简单的 REST API 调用即可轻松实现实时语音翻译

自定义语音 预览版

克服语音识别障碍,如说话风格、背景噪音和词汇

语音服务 预览版

针对语音转文本、文本转语音和语音翻译的统一语音服务

QnA Maker

提取信息,并将其转化为一目了然的对话式答案

准备好好利用你的应用了吗?