略過導覽

語音服務定價

語音轉換文字、文字轉換語音和語音翻譯的統一語音服務

統一的語音服務可提供範圍廣泛的語音辨識以及產生語音功能,包括語音抄寫、文字轉換語音以及語音翻譯。語音服務可提供範圍廣泛的語音辨識以及產生語音功能,包括語音轉譯、文字轉換語音、語音翻譯及說話者辨識。

探索定價選項

套用篩選以根據您的需求自訂定價選項。

價格只是估計值,而非作為實際價格報價。實際價格可能會因 Microsoft 所輸入的合約類型、購買日期及貨幣匯兌而異。價格是根據美金計算,並且使用在每一個行事曆月份第一天所重新更新的 Thomson Reuters 基準匯率進行轉換。登入 Azure 定價計算機可查看您目前的 Microsoft 方案/優惠定價。如需有關定價或要求報價的詳細資訊,請連絡 Azure 銷售專員。請參閱 Azure 定價的常見問題集

免費

執行個體 類別 功能 價格
免費 - Web/容器
1 個並行要求1
語音轉換文字 標準2 每月免費 5 音訊小時
自訂 每月免費 5 音訊小時
端點裝載: 每月免費 1 個模型 3
交談轉譯多聲道音訊 預覽 4 每月免費 5 音訊小時
文字轉換語音 神經網路 每月免費 0.5 million 個字元
語音翻譯 標準 每月免費 5 音訊小時
說話者辨識 說話者驗證 每月免費 10,000 筆交易
說話者識別 每月免費 10,000 筆交易
語音儲存體 每月免費 10,000 筆交易

如需所有定價層的配額和限制等其他詳細資訊,請參閱文件

1若要增加並行要求,請參閱指示

2語音轉換文字現在會同時包含免費版執行個體 (例如每個月 5 個音訊小時免費) 以及標準版執行個體的發音評定,其將遵循每一音訊小時 $1 的標準價格。

3未使用的模型會在 7 天後自動解除。

4建議您在使用交談轉譯多聲道時,搭配圓形麥克風陣列裝置。如需詳細資料,請參閱 Microsoft 語音裝置 SDK。

隨用隨付

執行個體 類別 功能 價格
標準 - Web/容器
100 個基底模型的並行要求
20 個自訂模型的並行要求1
語音轉換文字 標準2 每音訊小時 $-
自訂 每音訊小時 $-
端點裝載: 每個模型每月 $-
交談轉譯多聲道音訊 預覽 每音訊小時 $-3
文字轉換語音 神經網路4 即時合成: $-/每 1 百萬個 字元4
長期音訊建立: 每 1 百萬個字元 $-
自訂神經網路4, 5 訓練:每計算時數 $- 個,最多 每個訓練 $-
即時合成: 每 1 百萬個字元 $-
端點裝載: 每個模型每月 $-
長期音訊建立: 每 1 百萬個字元 $-
語音翻譯 標準 每音訊小時 $-
說話者辨識 說話者驗證 每 1,000 筆交易 $-
說話者識別 每 1,000 筆交易 $-
語音儲存體 每個 1,000 音訊設定檔 $- (每月有 10,000 的音訊設定檔免費)

如需所有定價層的配額和限制等其他詳細資訊,請參閱文件

1 若要增加並行要求,請參閱指示

2 語音轉換文字現在會同時包含免費版執行個體 (例如每個月 5 個音訊小時免費) 以及標準版執行個體的發音評定,其將遵循每一音訊小時 $1 的標準價格。

3 此為公開預覽定價。正式版價格將於稍後正式上市時發佈。

4 文字轉換語音會針對轉換為語音的每個字元計費,包括標點符號。深入了解

5 自訂神經語音 (CNV) 是具有 Pro 和精簡版本的有限存取功能。透過 CNV 精簡 (公開預覽),客戶可以在申請 Pro 的存取權之前,錄製自己的語音並建立模型以進行示範/評估。查看 CNV 可用

承諾用量層

此價格的存取權有限制。在這裡套用

執行個體 類別 功能 價格 (每個月) 超額
Azure - 標準 語音轉換文字 標準 2,000 小時,價格為 $- 每小時 $-
10,000 小時,價格為 $- 每小時 $-
50,000 小時,價格為 $- 每小時 $-
文字轉換語音 神經網路1 80 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
400 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
2,000 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
連接的容器 - 標準 語音轉換文字 標準 2,000 小時,價格為 $- 每小時 $-
10,000 小時,價格為 $- 每小時 $-
50,000 小時,價格為 $- 每小時 $-
文字轉換語音 神經網路1 80 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
400 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
2,000 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
已中斷連線的容器 語音轉換文字 標準 註冊以取得存取
深入了解
文字轉換語音 神經網路1 註冊以取得存取
深入了解
1 僅限即時合成,這不包括建立長音訊。

這些功能即將淘汰,且僅供現有客戶使用。查看詳細資料,並了解如何移轉至新功能

執行個體 類別 功能 價格
免費 - Web/容器
1 個並行要求
文字轉換語音 標準 每月免費 5 million 個字元
自訂 每月免費 5 million 個字元
端點裝載: 每月免費 1 個模型
標準 - Web/容器
100 個基底模型的並行要求
20 個自訂模型的並行要求
文字轉換語音 標準 每 1 百萬個字元 $-
自訂 每 1 百萬個字元 $-
端點裝載: 每個模型每月 $-

Azure 定價與購買選項

直接與我們連絡

取得 Azure 定價的逐步解說。了解雲端解決方案的定價、了解成本最佳化,並要求自訂提案。

與銷售專員洽談

查看購買方式

透過 Azure 網站、Microsoft 代表或 Azure 合作夥伴購買 Azure 服務。

探索您的選擇

其他資源

語音服務 詳細資料

深入了解 語音服務 的功能。

定價計算機

預估您使用任何 Azure 產品組合的預期每月費用。

文件

檢閱技術教學課程、影片和更多 語音服務 資源。

    • 針對語音翻譯、語音轉換文字以及使用自訂語音模型的語音轉換文字:使用量按秒計費。
    • 針對具有神經或自訂神經語音的文字轉換語音:使用量是依字元計費。檢查定價提示中的字元定義。
    • 針對自訂語音模型代管:使用量按小時計費;針對自訂語音音調代管:使用量按日計費。
    • 針對自訂命令:按語音轉換文字、文字轉換語音及 Language Understanding 的使用量來計費。自訂命令不會推出新的計費計量。
    • 語音模型的訓練不會產生費用。唯一的成本是訓練後的模型裝載費用,以及按小時計費的語音轉譯成本。
  • 使用者可運用語音服務,依據其本身的原音與語言資料,採用基準的模型,然後再進入能同時運用在語音轉換文字及語音翻譯的客製化語音模型。

  • 語言模型是一系列字的可能性分佈。語言模型可協助系統決定發音類似字的順序,而其取決於字組順序本身的相似程度。例如,“recognize speech” 與 “wreck a nice beach” 發音類似,但前者的假設較為可能發生,因此會依據語言模型指派為較高的分數。若預期您應用程式的語音查詢會包含特定的詞彙項目,像是一般語音中很少出現的產品名稱或行話,很有可能可透過自訂語言模型的方式強化效能。例如,如果將應用程式建置為會利用語音搜尋 MSDN,很有可能會較一般語音應用程式更常出現像是 “object-oriented” 或 “namespace” 或 “dot net” 等字詞。自訂語言模型能讓系統學習此情況。

  • 原音模型是會將簡短的音訊片斷標入各語言中數種音素或聲音單位之一的分類器。這些音素如此即可結合在一起形成字。例如,“speech” 這個字即由四個音素 “s p iy ch” 所組成。這些分類以類似每秒 100 倍的方式製作。自訂原音模型可讓系統學習,而更能辨識非典型環境中的語音。例如,如果您的應用程式設計為倉庫或工廠中的工作人員所使用,則自訂的原音模型可於這些環境中出現雜音時,更正確地辨識語音。

  • 語音服務提供廣泛的文字轉換語音 (TTS) 語音字型,不過自訂神經語音可讓您建置自己的自訂語音,以符合您的需求和品牌。閱讀部落格文章以了解詳細資訊。

  • 在某些情況下,一或多個說話者可能會使用相同的音訊檔案或即時簡報來說多種語言。連續語言偵測可讓您識別口語語言中的切換,並據以正確地轉譯語音。此功能將免費提供私人預覽,並可透過語音 SDK 存取。瀏覽文件以深入了解。

與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。

取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。

已新增至估算。 按下 'v' 即可在計算機上檢視