说话人识别 API

借助说话人识别 API,识别单个说话人,或使用语音作为一种身份验证方法

说话人验证

使用自己的语音进行验证。该 API 可用于支持带有智能验证工具的应用程序。如果说话人宣称是某个身份,请使用语音对此进行验证。

若要了解其工作原理,请从给定短语列表中选择一个通行短语。使用该短语录制三个音频示例,向该服务注册语音,此步骤称为“注册”。完成注册后,可以使用其他语音录音或短语开始验证步骤,测试服务。

在实际操作中查看

"i am going to make him an offer he cannot refuse"

请重复朗读以上内容三次,进行语音注册。

1
2
3

上传此演示的数据即表示你同意 Microsoft 对其进行存储并将其用于改进 Microsoft 服务(包括此 API)。为了保护用户隐私,我们会采取措施对数据进行反识别处理并确保它的安全。我们不会公开用户数据或让其他人使用这些数据。

想要生成它?

说话人识别

识别谁正在说话。该 API 可用于确定某个未知说话人的身份。未知说话人的输入音频与选中的说话人组配对,如果发现存在匹配,即返回说话人的身份。

我们选择了 5 位美国总统,并使用他们各自发表的一篇演讲注册这项服务。若要了解该演示的工作原理,请单击下面的示例音频选择一位总统的演讲,或上传自己的语音,测试如何自动识别正在说话的是哪位总统。

在实际操作中查看

巴拉克·奥巴马总统
乔治·沃克·布什总统
比尔·克林顿总统
乔治·赫伯特·沃克·布什总统
罗纳德·里根总统
吉米·卡特总统

想要生成它?

了解认知服务 API

计算机影像 API

从图像中提取可操作信息

人脸 API

检测、识别、分析、组织和标记照片中的人脸

内容审查器

自动化图像、文本和视频审查

情感 API 预览版

通过情绪识别实现个性化用户体验

自定义影像服务 预览版

为你独一无二的用例轻松自定义最先进的计算机影像模型

视频索引器 预览版

解锁视频见解

语言理解智能服务 预览版

教会应用理解用户发出的命令

文本分析 API

轻松评估观点和主题以理解用户的需求

必应拼写检查 API

检测并更正应用中的拼写错误

Translator 文本 API

通过简单的 REST API 调用即可轻松进行机器翻译

Web 语言模型 API 预览版

利用以 Web 上的数据为目标的预测语言模型的功能

语言分析 API 预览版

使用语言分析 API 简化复杂的语言定义并分析文本

翻译工具语音 API

通过简单的 REST API 调用即可轻松实现实时语音翻译

说话人识别 API 预览版

使用语音以识别并对单个说话人进行身份验证

必应语音 API

将语音转换为文本,再转回语音,并理解用户的意图

自定义语音服务 预览版

克服语音识别障碍,如说话风格、背景噪音和词汇

建议 API 预览版

预测和推荐客户所需的商品

学术知识 API 预览版

利用 Microsoft Academic Graph 中丰富的学术内容

知识探索服务 预览版

通过自然语言输入实现结构化数据的交互式搜索体验

QnA Maker API 预览版

提取信息,并将其转化为一目了然的对话式答案

实体链接智能服务 API 预览版

为应用的数据链接提供命名实体识别并消除歧义

自定义决策服务 预览版

一种日益成熟的基于云的上下文决策 API

布拉格项目

基于手势的控制

库斯科项目

与维基百科条目相关的活动

Project Nanjing

等时线计算

阿布达比项目

距离矩阵

约翰内斯堡项目

物流路线

伍伦贡项目

位置见解

准备好好利用你的应用了吗?