辨識服務定價 - Custom Speech Service 預覽

使用 Intelligence API 啟用辨識、語音、語言及知識庫功能

您可利用 Custom Speech Service 來建立自訂的語音辨識模型,並將其部署到專為您應用程式量身打造的語音轉換文字端點。有了 Custom Speech Service 之後,您可以自訂語音辨識器的語言模型,它如此即可學習您應用程式的詞彙,以及您使用者的語音模式。您可以自訂語音辨識器的原音模型,以更符合應用程式的預期環境及使用者人口。

模型調整免費。

定價詳細資料

自訂模型部署 0-1 - 免費
1+ - $-/模型/月
模型自訂 免費
正確性測試 0-2 小時 - 免費
2+ - $-/小時
擴充 $-/單位/天,其中每個單位可讓您傳送五個並行要求
無追蹤 $-/模型/月
要求定價 0-2 小時 - 免費
2+ - $-/小時

支援與 SLA

  • 免費帳單及免費訂用帳戶管理支援
  • 需要預覽服務的技術支援嗎? 請使用我們的論壇
  • 我們保證在標準層中執行之 Cognitive Services 的持續運作時間至少須達 99.9%。免費層試用版不提供 SLA。閱讀 SLA
  • 預覽期間不提供 SLA。深入了解

常見問題集

Custom Speech Service

  • 定價層 1 可同時處理最多四個音訊片段 (例如,四則轉譯),而仍可即時回應。若使用者傳送超過四個並行的音訊片段,就會拒絶音訊片段的每個後續片段,並傳回指出並平辨識過多的錯誤碼。相同的情況適用於定價層 2,其可同時處理 12 則轉譯。免費層提供一則並行轉譯。假設音訊會即時上傳。若因為並行之故而上傳音訊較快,則會假設要求會持續,直到音訊的持續時間過去為止 (即使可能會較早傳送辨識結果)。

    注意:若需要較高等級的並行作業,請與我們連絡

  • 語言模型是一系列字的可能性分佈。語言模型可協助系統決定發音類似字的順序,而其取決於字組順序本身的相似程度。例如,"recognize speech" 與 "wreck a nice beach" 發音類似,但前者的假設較為可能發生,因此會依據語言模型指派為較高的分數。若預期您應用程式的語音查詢會包含特定的詞彙項目,像是一般語音中很少出現的產品名稱或行話,很有可能可透過自訂語言模型的方式強化效能。例如,如果將應用程式建置為會利用語音搜尋 MSDN,很有可能會較一般語音應用程式更常出現像是 “object-oriented” 或 “namespace” 或 “dot net” 等字詞。自訂語言模型能讓系統學習此情況。

  • 原音模型是會將簡短的音訊片斷標入各語言中數種音素或聲音單位之一的分類器。這些音素如此即可結合在一起形成字。例如,“speech” 這個字即由四個音素 “s p iy ch” 所組成。這些分類以類似每秒 100 倍的方式製作。自訂原音模型可讓系統學習,而更能辨識非典型環境中的語音。例如,如果您的應用程式設計為倉庫或工廠中的工作人員所使用,則自訂的原音模型可於這些環境中出現雜音時,更正確地辨識語音。

  • 簡短片語辨識支援長度最長 15 秒的發音。與語音用戶端程式庫一起使用時,因為資料會傳送至伺服器,所以用戶端會收到多重的部分結果以及一個最終「N-最佳選擇結果」。

  • 長段聽寫辨識支援長度最長兩分鐘的發音。與語音用戶端程式庫一起使用時,因為資料會傳送至伺服器,所以用戶端依據伺服器指示於何處暫停,而會收到多重的部分結果以及多重的最終結果。

  • 例如,若客戶使用 S1 定價層處理一百萬則轉譯,會收取該定價層的費用 ($-),前 100,000 則轉譯費用為每 1,000 則轉譯 $-,而其餘的 900,000 則轉譯費用則會是每 1,000 則轉譯 $-。因為,客戶實際上要支付 $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500

  • 請參閱 Microsoft 辨識服務網頁上的 Custom Speech Service 資訊,以及 Custom Speech Service 網站 www.cris.ai

  • 自訂模型部署是包裝自訂模型,然後將它公開為服務的程序。產生的已部署自訂模型會公開可用來存取該模型的端點。使用者可以視需要選擇部署許多模型。

  • Custom Speech Service 可讓使用者根據自己的原音和語言資料調整基準模型。此程序稱為模型自訂。

  • 建立自訂模型之後,使用者可以選擇上傳測試資料,以評估新建立的模型。使用者可以視需要使用許多資料來測試新的自訂模型,例如執行不限數目的正確性測試。

  • 部署自訂模型之後,其 URI 一次可以處理一個音訊要求。針對將多個音訊要求同時傳送至該 URI 的案例,使用者可以選擇依當時五個並行要求的費率相應放大。這可藉由購買縮放單位來達成。每個縮放單位保證最多有五個同時執行的並行音訊要求,每個縮放單位需支付 $200。例如,如果使用者預計會達到同時提出 23 個音訊要求的端點,使用者需要購買五個縮放單位,以保證最多有 25 個並行要求。

  • 記錄管理可讓使用者關閉已部署模型的記錄功能。重視隱私權的使用者可以選擇關閉已部署模型的記錄功能,每月費率為 $20

  • 要求定價是指處理已部署自訂模型端點所提出之音訊要求的費用。

一般

  • 表情 API、臉部 API、Language Understanding Intelligent Service API、Bing 語音轉換文字 API 和 Bing 文字轉換語音 API 都在主動執行生產 API 呼叫時,按每 1,000 筆 API 交易呼叫計費。不足額的生產 API 交易呼叫則按比例計費。

    Bing Long Form Speech API 服務是按每小時語音分析計費。不足額部分會按分鐘比例計費。

    Recommendations API 和 Text Analytics API 可以固定價格購買標準層單位。各層每單位都附在 API 交易量中。如果使用者超過所附數量,超額部分會按上面的定價表費率收費。這些超額部分會按比例計費,服務則每個月收費。一層所附的數量每月會重新設定。

  • 如果達到免費層的交易限制,則會將使用量節流處理。消費者不能累積免費層的超額部分。

  • 如果超出標準層的使用量,帳戶就會開始累計超額部分。這些超額部分會每月計費,並按各層指定的費率計算。

  • 任何 API 呼叫 (除了批次評分呼叫) 皆視為一筆交易。批次評分會依據該筆交易中需要評分的項目數計費。

  • 如果達到免費層的交易限制,則會將使用量節流處理。消費者不能累積免費層的超額部分。免費層不支援批次評分。

  • 您可以購買 Recommendations API,其標準層以單位計算並以固定價格計費。各層每單位都附在 API 交易量中。如果使用者超過所附數量,超額部分會按上面的定價表費率收費。這些超額部分會按比例計費,服務則每個月收費。一層所附的數量每月會重新設定。

  • Bing 搜尋 API、Bing 自動建議 API 及 Bing 拼字檢查 API 以月計費。不同服務層內含數量 (稱為 API 呼叫數) 各不相同。無論起用時間為何,內含數量一律按日曆月計算。當使用者超出內含數量時,將依定價表中指定的費率收取超額的費用。超額費用不會按比例計算,而會按月收取服務的費用。每一層的內含數量會按月重設。

  • 您可以隨時升級為更高的服務層。更高服務層的費率與內含數量將於近期內公佈。

資源

計算機

預估您 Azure 服務的每月成本

購買常見問題集

檢閱 Azure 定價常見問題集

產品詳細資料

深入了解 辨識服務

文件

檢閱技術教學課程、影片和更多資源

立即註冊並取得 $200 Azure 點數

立即開始