略過導覽

語音轉換文字

迅速將音訊轉換成文字,以取得自然的回應。語音轉換文字 API 屬於語音服務。

語音轉譯

將語音轉換成文字。呼叫此 API,以辨識來自麥克風、其他即時串流音訊來源或錄製音訊檔案的音訊。當音訊傳送至伺服器時,會傳回部分辨識結果 (如經要求)。

您可以使用此 API 建置透過語音觸發的智慧型應用程式。試用示範查看運作方式。請選取您的目標語言,然後按一下麥克風並開始說話。或直接按一下其中一個範例語音片語。*

觀看影片

若要使用麥克風以您自己的聲音試用示範,請變更為具有 WebRTC 支援的其他瀏覽器,例如 Microsoft Edge、Firefox 或 Chrome 的最新版本。

想要建置這個嗎?

自訂語音服務:透過自訂模型進行語音轉譯

克服像是語音模式、詞彙及背景雜音等語音辨識的阻礙。我們的語音辨識技術結合了多個 API 來產生文字輸出。客戶可以根據自己的需求及可用的資料來自訂這些 API。

觀看影片

範例句子

基準

客製化的語音

建立根據使用者說話方式量身打造的自訂語言模型

別讓各種詞彙與說話方式妨礙理解。自訂您應用程式語音辨識的語言模型,根據您的產業措辭,技術、地理或市場詞彙,甚至是說話者風格來量身打造。

透過自訂原音模型根據使用者環境進行調整

確定您應用程式的語音辨識在所有環境中均運作正常。透過自訂原音模型,您可以處理背景雜音並達到使用者預期的環境。

使用 Microsoft 的強固語音模型

在 Microsoft 現有的最先進模型之上,建置您自己的自訂語音辨識模型,以啟用強大且個人化的語音辨識。

想要建置這個嗎?

探索語音案例

智慧型資訊站

語音服務與 Language Understanding 結合,讓應用程式與使用者可以自然互動。使用語音轉換文字來擷取使用者的問題,使用 Language Understanding 來剖析意圖並形成適當的回覆,然後使用文字轉換語音將文字合成為語音回覆。針對各種案例 (例如銀行、旅遊和娛樂) 建立交談介面。

商務聊天機器人

Kereskedelmi csevegőrobotAz Azure Bot Service és a Language Understanding szolgáltatások együttes használatával a fejlesztők természetes nyelvi felhasználói felületet alakíthatnak ki banki, utazási, szórakoztatási és sok más szolgáltatáshoz. Egy szálloda recepciószolgálata például robottal javíthatja a hagyományos e-mailes és telefonos kommunikációt azzal, hogy az ügyfelet az Azure Active Directory használatával azonosítja, a Cognitive Services alkalmazásával pedig az ügyfél elhangzó és szöveges kéréseit tudja a kontextust figyelembe véve feldolgozni. A szóbeli utasítások feldolgozására pedig a beszédfelismerési szolgáltatás is alkalmazható.1237456
  1. 概觀
  2. 流程

概觀

結合 Azure Bot Service 和 Language Understanding 服務,開發人員可建立各式案例的對話介面,例如銀行業、旅遊服務與娛樂服務。例如,飯店禮賓部可使用機器人透過 Azure Active Directory 驗證客戶,增強傳統電子郵件和通話互動,以及利用認知服務透過文字和語音,更完善地依情境處理客戶要求。您可新增語音辨識服務來支援語音命令。

流程

  1. 1 客戶使用您的行動裝置應用程式
  2. 2 使用者透過 Azure AD B2C 進行驗證
  3. 3 使用者透過自訂應用程式機器人要求資訊
  4. 4 認知服務可協助處理自然語言要求
  5. 5 回應會由能利用自然對話修正問題的客戶進行檢閱
  6. 6 若使用者滿意該結果,應用程式機器人就會更新客戶的保留項目
  7. 7 Application Insights 會收集執行階段遙測,協助開發機器人的效能與使用量

探索認知服務 API

Computer Vision

從影像擷取可操作的資訊

臉部

偵測、識別、分析、組織和標記相片中的臉孔

影片索引器

深入探索影片

內容仲裁

自動審核影像、文字及影片

自訂視覺 預覽

輕鬆自訂先進且適合您獨特使用案例的電腦視覺模型

文字分析

輕鬆解讀意見與話題,從而了解使用者的需求

Translator Text

使用簡單的 REST API 呼叫,輕鬆進行機器翻譯

Bing 拼字檢查

偵測並校正您應用程式中的拼字錯誤

內容仲裁

自動審核影像、文字及影片

語言理解

教導您的應用程式理解使用者發出的命令

語音服務

語音轉換文字、文字轉換語音和語音翻譯的統一語音服務

說話者辨識 預覽

使用語音來辨識及驗證各個說話者

製作問與答的人員

將資訊整理成易於導覽的交談式回答

使用 Speech Devices SDK 建置環境裝置並建立自訂喚醒字

深入了解