语音服务

将音频转换为文本,使用统一语音服务执行语音翻译和文本转语音的操作

语音转文本 – 将语音转换为文本,实现直观的交互

轻松将实时语音到文本功能添加到应用程序中,以用于语音命令、对话听录和调用中心日志分析等方案。

定制语音识别模型,以适应用户的说话风格、表达方式和特有词汇,以及背景噪音、口音和语音模式。

了解更多
语音转文本

文本转语音 – 为应用提供自然流畅的语音

构建能够通过文本转语音服务自然地与用户交流的智能应用和服务。近乎实时地将文本转换为音频,通过自定义来更改语速、音调、音量等。

使用自定义语音模型为应用程序提供辨识度高的独特语音。只需录制和上传定型数据,该服务即可创建根据录音调整的独特语音字体。

了解更多
文本转语音 

语音翻译

为应用提供任意支持语言的实时语言翻译功能,并接收文本或语音翻译。语音翻译模型基于前沿语音识别和神经机器翻译 (NMT) 技术。它们经过优化,可理解人们在现实生活中的说话方式并生成优质翻译。

了解更多
语音翻译

基于语音服务的业务方案

通过批量听录和针对调用中心方案增强的自定义语音服务,轻松听录每个调用并优化结果。为获得见解,可为调用听录编制索引以执行全文搜索,或应用文本分析来检测情绪、语言和关键短语。

了解更多
业务语音服务
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

了解认知服务 API

计算机影像

从图像中提取可操作信息

人脸

检测、识别、分析、组织和标记照片中的人脸

墨迹识别器 预览版

一种可识别数字墨迹内容(例如手写内容、形状和墨迹文档布局)的 AI 服务

视频索引器

解锁视频见解

自定义视觉

为你独一无二的用例轻松自定义最先进的计算机影像模型

表单识别器 预览版

AI 驱动的文档提取服务,可理解表单

文本分析

轻松评估观点和主题以理解用户的需求

文本翻译

通过简单的 REST API 调用即可轻松进行机器翻译

QnA Maker

提取信息,并将其转化为一目了然的对话式答案

语言理解

教会应用理解用户发出的命令

沉浸式阅读器 预览版

使各年龄层和各种能力水平的用户都能阅读并理解文本

语音服务

针对语音转文本、文本转语音和语音翻译的统一语音服务

说话人识别 预览版

使用语音辨识和验证各个说话人的身份

内容审查器

自动化图像、文本和视频审查

异常检测器 预览版

将异常检测功能轻松嵌入到应用中。

个性化体验创建服务 预览版

提供个性化用户体验的 AI 服务

准备好好利用你的应用了吗?