跳过导航

说话人识别

使用说话人识别辨识各个说话人,或将语音用作身份验证手段

说话人验证

使用自己的语音进行验证。该 API 可用于支持带有智能验证工具的应用程序。如果说话人宣称是某个身份,请使用语音对此进行验证。

若要了解其工作原理,请从给定短语列表中选择一个通行短语。使用该短语录制三个音频示例,向该服务注册语音,此步骤称为“注册”。完成注册后,可以使用其他语音录音或短语开始验证步骤,测试服务。

在实际操作中查看

"i am going to make him an offer he cannot refuse"

请重复朗读以上内容三次,进行语音注册。

1
2
3

想要生成它?

说话人识别

识别谁正在说话。该 API 可用于确定某个未知说话人的身份。未知说话人的输入音频与选中的说话人组配对,如果发现存在匹配,即返回说话人的身份。

我们选择了 5 位美国总统,并使用他们各自发表的一篇演讲注册这项服务。若要了解该演示的工作原理,请单击下面的示例音频选择一位总统的演讲,或上传自己的语音,测试如何自动识别正在说话的是哪位总统。

在实际操作中查看

巴拉克·奥巴马总统
乔治·沃克·布什总统
比尔·克林顿总统
乔治·赫伯特·沃克·布什总统
罗纳德·里根总统
吉米·卡特总统

想要生成它?

了解认知服务 API

计算机影像

从图像中提取可操作信息

人脸

检测、识别、分析、组织和标记照片中的人脸

视频索引器 预览版

解锁视频见解

内容审查器

自动化图像、文本和视频审查

自定义视觉 预览版

为你独一无二的用例轻松自定义最先进的计算机影像模型

文本分析

轻松评估观点和主题以理解用户的需求

文本翻译

通过简单的 REST API 调用即可轻松进行机器翻译

必应拼写检查

检测并更正应用中的拼写错误

内容审查器

自动化图像、文本和视频审查

语言理解

教会应用理解用户发出的命令

必应语音

将语音转换为文本,再转回语音,并理解用户的意图

说话人识别 预览版

使用语音辨识和验证各个说话人的身份

语音翻译

通过简单的 REST API 调用即可轻松实现实时语音翻译

自定义语音 预览版

克服语音识别障碍,如说话风格、背景噪音和词汇

语音服务 预览版

针对语音转文本、文本转语音和语音翻译的统一语音服务

QnA Maker

提取信息,并将其转化为一目了然的对话式答案

准备好好利用你的应用了吗?