自定义语音服务

克服语音识别障碍,如说话风格、词汇和背景噪音。

创建自定义语言模型

通过调整语音识别器的语言模型,使其匹配应用程序的词汇 和用户的说话风格,对其 进行自定义。

创建自定义声学模型

自定义语音识别器声学模型,以更好地匹配 应用程序的预期环境和用户群体。

部署自定义模型

部署模型,创建精确匹配应用程序的语音识别终结点。

从任何设备访问终结点

使用 RESTful API 或认知服务语音客户端库 将请求发送到自定义终结点。

Explore the Cognitive Services APIs

计算机影像 API

从图像中提取可操作信息

人脸 API

检测、识别、分析、组织和标记照片中的人脸

内容审查器

具有成本效益的文本、图像和视频内容审查

情感 API 预览版

通过情绪识别实现个性化体验

视频 API 预览版

智能视频处理可生成稳定的视频输出、检测运动、创建智能缩略图,以及进行面部检测和跟踪

自定义影像服务 预览版

一种可自定义的 Web 服务,用于识别图像中的特定内容

视频索引器 预览版

搜索、编辑、分析和学习视频

语言理解智能服务 预览版

教会应用理解用户发出的命令

文本分析 API 预览版

轻松评估观点和主题以理解用户的需求

必应拼写检查 API

帮助用户更正拼写错误,识别姓名、品牌名和俚语之间的不同之处,并在键入的同时理解同音异义词

翻译工具文本 API

通过简单的 REST API 调用即可轻松进行实时文本翻译

Web 语言模型 API 预览版

利用以 Web 上的数据为目标的预测语言模型的功能

语言分析 API 预览版

使用语言分析 API 简化复杂的语言定义并分析文本

翻译工具语音 API

执行实时语音翻译

说话人识别 API 预览版

使用语音以识别并对单个说话人进行身份验证

必应语音 API

将语音转换为文本,再转回语音,并理解用户的意图

自定义语音服务 预览版

消除语音识别障碍,如说话风格、背景噪音和词汇

建议 API 预览版

预测和推荐客户所需的商品

学术知识 API 预览版

利用 Microsoft Academic Graph 中的学术内容

知识探索服务 预览版

通过自然语言输入实现结构化数据的交互式搜索体验。

QnA Maker API 预览版

提取信息,并将其转化为一目了然的对话式答案。

实体链接智能服务 API 预览版

为应用的数据链接提供命名实体识别并消除歧义

自定义决策服务 预览版

一种日益成熟的基于云的上下文决策 API

布拉格项目

基于手势的控制

库斯科项目

与维基百科条目相关的活动

Project Nanjing

等时线计算

阿布达比项目

距离矩阵

约翰内斯堡项目

物流路线

伍伦贡项目

位置见解

准备好好利用你的应用了吗?