略過導覽

辨識服務定價 - Custom Speech Service 預覽

使用 Intelligence API 啟用辨識、語音、語言及知識庫功能

您可利用 Custom Speech Service 來建立自訂的語音辨識模型,並將其部署到專為您應用程式量身打造的語音轉換文字端點。有了 Custom Speech Service 之後,您可以自訂語音辨識器的語言模型,它如此即可學習您應用程式的詞彙,以及您使用者的語音模式。您可以自訂語音辨識器的原音模型,以更符合應用程式的預期環境及使用者人口。

定價詳細資料

模型調整免費。

免費 S2
模型部署 1 模型 $-/模型/月
模型調整 3 小時/月 無限制
正確性測試 2 小時/月 2 小時免費,之後 $-/小時
擴充 N/A $-/單位/天,其中每個單位可讓您傳送五個並行要求
無追蹤 N/A $-/模型/月
要求定價 2 小時/月 2 小時免費,之後 $-/小時

支援與 SLA

  • 含免費的帳單及訂用帳戶管理支援。
  • 需要預覽服務的技術支援嗎?請使用我們的論壇
  • 我們保證在標準層中執行認知服務時,其正常運作時間至少須達 99.9%。免費層不提供 SLA。閱讀 SLA
  • 預覽期間不提供 SLA。深入了解

常見問題集

Custom Speech Service

  • 定價層 1 可同時處理最多四個音訊片段 (例如,四則轉譯),而仍可即時回應。若使用者傳送超過四個並行的音訊片段,就會拒絶音訊片段的每個後續片段,並傳回指出並平辨識過多的錯誤碼。相同的情況適用於定價層 2,其可同時處理 12 則轉譯。免費層提供一則並行轉譯。假設音訊會即時上傳。若因為並行之故而上傳音訊較快,則會假設要求會持續,直到音訊的持續時間過去為止 (即使可能會較早傳送辨識結果)。

    注意:若需要較高等級的並行作業,請與我們連絡

  • 語言模型是一系列字的可能性分佈。語言模型可協助系統決定發音類似字的順序,而其取決於字組順序本身的相似程度。例如,"recognize speech" 與 "wreck a nice beach" 發音類似,但前者的假設較為可能發生,因此會依據語言模型指派為較高的分數。若預期您應用程式的語音查詢會包含特定的詞彙項目,像是一般語音中很少出現的產品名稱或行話,很有可能可透過自訂語言模型的方式強化效能。例如,如果將應用程式建置為會利用語音搜尋 MSDN,很有可能會較一般語音應用程式更常出現像是 “object-oriented” 或 “namespace” 或 “dot net” 等字詞。自訂語言模型能讓系統學習此情況。

  • 原音模型是會將簡短的音訊片斷標入各語言中數種音素或聲音單位之一的分類器。這些音素如此即可結合在一起形成字。例如,“speech” 這個字即由四個音素 “s p iy ch” 所組成。這些分類以類似每秒 100 倍的方式製作。自訂原音模型可讓系統學習,而更能辨識非典型環境中的語音。例如,如果您的應用程式設計為倉庫或工廠中的工作人員所使用,則自訂的原音模型可於這些環境中出現雜音時,更正確地辨識語音。

  • 簡短片語辨識支援長度最長 15 秒的發音。與語音用戶端程式庫一起使用時,因為資料會傳送至伺服器,所以用戶端會收到多重的部分結果以及一個最終「N-最佳選擇結果」。

  • 長段聽寫辨識支援長度最長兩分鐘的發音。與語音用戶端程式庫一起使用時,因為資料會傳送至伺服器,所以用戶端依據伺服器指示於何處暫停,而會收到多重的部分結果以及多重的最終結果。

  • 例如,若客戶使用 S1 定價層處理一百萬則轉譯,會收取該定價層的費用 ($-),前 100,000 則轉譯費用為每 1,000 則轉譯 $-,而其餘的 900,000 則轉譯費用則會是每 1,000 則轉譯 $-。因為,客戶實際上要支付 $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500

  • 請參閱 Microsoft 辨識服務網頁上的 Custom Speech Service 資訊,以及 Custom Speech Service 網站 www.cris.ai

  • 自訂模型部署是包裝自訂模型,然後將它公開為服務的程序。產生的已部署自訂模型會公開可用來存取該模型的端點。使用者可以視需要選擇部署許多模型。

  • Custom Speech Service 可讓使用者根據自己的原音和語言資料調整基準模型。此程序稱為模型自訂。

  • 建立自訂模型之後,使用者可以選擇上傳測試資料,以評估新建立的模型。使用者可以視需要使用許多資料來測試新的自訂模型,例如執行不限數目的正確性測試。

  • 部署自訂模型之後,其 URI 一次可以處理一個音訊要求。針對將多個音訊要求同時傳送至該 URI 的案例,使用者可以選擇依當時五個並行要求的費率相應放大。這可藉由購買縮放單位來達成。每個縮放單位保證最多有五個同時執行的並行音訊要求,每個縮放單位需支付 $200。例如,如果使用者預計會達到同時提出 23 個音訊要求的端點,使用者需要購買五個縮放單位,以保證最多有 25 個並行要求。

  • 記錄管理可讓使用者關閉已部署模型的記錄功能。重視隱私權的使用者可以選擇關閉已部署模型的記錄功能,每月費率為 $20

  • 要求定價是指處理已部署自訂模型端點所提出之音訊要求的費用。

一般

  • Bing Search APIs are invoiced based on number of transactions (also known as API calls). These plans are pay-as-you-go and doesn’t incur additional cost for complex queries and more than 10 results (up to 50 results in most cases).

  • If you happen to exceed the mentioned number of transactions per second (TPS), your usage will be throttled to be within the mentioned limit. If your application needs to have higher TPS than the ones mentioned on this page, please reach out to the Azure support team.

  • For billing purposes, a transaction is a successful Bing API call request (though there are caveats for DoS attacks). For logging and reporting purposes such as for the Bing Statistics Add-in, it is any Bing API call irrespective of whether it is successful or not.

  • You can change the tier of service anytime. Please make sure you use appropriate keys in your API calls. If you are having enterprise agreement with Microsoft, please work with your account executive.

資源

預估您 Azure 服務的每月成本

檢閱 Azure 定價常見問題集

深入了解 認知服務

檢閱技術教學課程、影片和更多資源

已新增至估算。 按下 'v' 即可在計算機上檢視 在計算機上檢視

了解和以信用額度中的 $200 來建置,並免費繼續使用