必应语音 API

将音频转换为文本,了解目的,然后将文本转换回语音,实现自然响应

语音识别

将口述音频转换为文本。该 API 可以直接打开并识别通过麦克风实时传入的音频,识别来自不同实时音频源的音频,或识别文件内的音频。在所有情况下,可采用实时流式处理将音频发送到服务器,并返回部分识别结果。

利用语音到文本转换 API,可以构建语音触发的智能应用。若要查看其工作原理,请选择目标语言,然后单击麦克风并开始说话。或者仅单击其中一个示例语音短语,即可查看语音识别的工作原理。使用此演示代表你同意将语音输入数据提供给 Microsoft 用于服务改善

在实际操作中查看

若要通过麦克风使用自己的声音尝试演示,请改用支持 WebRTC 的其他浏览器,例如,最新版本的 Microsoft Edge、Firefox 或 Chrome。

上传此演示的数据即表示你同意 Microsoft 对其进行存储并将其用于改进 Microsoft 服务(包括此 API)。为了保护用户隐私,我们会采取措施对数据进行反识别处理并确保它的安全。我们不会公开用户数据或让其他人使用这些数据。

想要生成它?

文本到语音转换

将文本转换为语言音频。应用程序需要与其用户“交谈”时,此 API 会用于将应用生成的文本转换为可向用户播放的音频。

利用文本到语音转换 API,可以构建可以说话的智能应用。可以立刻进行测试,只要选择目标语言,添加语句,然后单击“播放”按钮,即可查看语音合成的工作原理。使用此演示代表你同意将语音输入数据提供给 Microsoft 用于服务改善。

在实际操作中查看

剩下 500 个字符

上传此演示的数据即表示你同意 Microsoft 对其进行存储并将其用于改进 Microsoft 服务(包括此 API)。为了保护用户隐私,我们会采取措施对数据进行反识别处理并确保它的安全。我们不会公开用户数据或让其他人使用这些数据。

想要生成它?

Explore the Cognitive Services APIs

计算机影像 API

从图像中提取可操作信息

人脸 API

检测、识别、分析、组织和标记照片中的人脸

内容审查器

具有成本效益的文本、图像和视频内容审查

情感 API 预览版

通过情绪识别实现个性化体验

视频 API 预览版

智能视频处理可生成稳定的视频输出、检测运动、创建智能缩略图,以及进行面部检测和跟踪

自定义影像服务 预览版

一种可自定义的 Web 服务,用于识别图像中的特定内容

视频索引器 预览版

搜索、编辑、分析和学习视频

语言理解智能服务 预览版

教会应用理解用户发出的命令

文本分析 API 预览版

轻松评估观点和主题以理解用户的需求

必应拼写检查 API

帮助用户更正拼写错误,识别姓名、品牌名和俚语之间的不同之处,并在键入的同时理解同音异义词

翻译工具文本 API

通过简单的 REST API 调用即可轻松进行实时文本翻译

Web 语言模型 API 预览版

利用以 Web 上的数据为目标的预测语言模型的功能

语言分析 API 预览版

使用语言分析 API 简化复杂的语言定义并分析文本

翻译工具语音 API

执行实时语音翻译

说话人识别 API 预览版

使用语音以识别并对单个说话人进行身份验证

必应语音 API

将语音转换为文本,再转回语音,并理解用户的意图

自定义语音服务 预览版

消除语音识别障碍,如说话风格、背景噪音和词汇

建议 API 预览版

预测和推荐客户所需的商品

学术知识 API 预览版

利用 Microsoft Academic Graph 中的学术内容

知识探索服务 预览版

通过自然语言输入实现结构化数据的交互式搜索体验。

QnA Maker API 预览版

提取信息,并将其转化为一目了然的对话式答案。

实体链接智能服务 API 预览版

为应用的数据链接提供命名实体识别并消除歧义

自定义决策服务 预览版

一种日益成熟的基于云的上下文决策 API

布拉格项目

基于手势的控制

库斯科项目

与维基百科条目相关的活动

Project Nanjing

等时线计算

阿布达比项目

距离矩阵

约翰内斯堡项目

物流路线

伍伦贡项目

位置见解

准备好好利用你的应用了吗?