說話者辨識

說話者辨識功能可辨認說話者,還能用語音來進行驗證

說話者識別

分辨出說話的人是誰。此 API 可用以判別不明說話者的身分。系統會將不明說話者的輸入音訊與一群所選說話者相比對,若有相符項即會傳回說話者的身分。

我們選取了 5 位不同的美國總統,並利用他們所發表的其中一個演說將他們註冊到服務。若要查看此示範的運作方式,請按一下下列範例音訊選取其中一位總統的演說,或是上傳您自己的一個音訊,以測試如何自動識別正在說話的總統身分。

觀看影片

總統 Barack Obama
總統 George W Bush
總統 William J Clinton
總統 George H W Bush
總統 Ronald Reagan
總統 Jimmy Carter

要建置此 API 嗎?

探索認知服務 API

Computer Vision

從影像擷取可操作的資訊

臉部

偵測、識別、分析、組織和標記相片中的臉孔

筆跡辨識器

能夠辨識數位筆跡內容的 AI 服務,例如手寫、圖形及手寫文件的版面配置

影片索引器

深入探索影片

自訂視覺

輕鬆自訂先進且適合您獨特使用案例的電腦視覺模型

表單辨識器

具 AI 功能的文件擷取服務,能夠理解您的表單

文字分析

輕鬆解讀意見與話題,從而了解使用者的需求

Translator Text

使用簡單的 REST API 呼叫,輕鬆進行機器翻譯

製作問與答的人員

將資訊整理成易於導覽的交談式回答

語言理解

教導您的應用程式理解使用者發出的命令

沈浸式閱讀程式

讓年齡層和活動能力不同的使用者們都能閱讀和理解文字

語音服務

語音轉換文字、文字轉換語音和語音翻譯的統一語音服務

說話者辨識

使用語音來辨識及驗證各個說話者

語音翻譯

輕鬆地將即時語音翻譯整合到您的應用程式

語音轉換文字

將口語音訊轉換為文字,以進行更多自然互動

文字轉換語音

將文字轉換成語音以建立更自然且容易存取的介面

內容仲裁

自動審核影像、文字及影片

Anomaly Detector

輕鬆為應用程式賦予異常偵測功能。

個人化工具

提供個人化使用者體驗的 AI 服務

準備好大幅提升應用程式的效能了嗎?