跳至主要內容

語音服務定價

語音轉換文字、文字轉換語音和語音翻譯的統一語音服務

統一的語音服務可提供範圍廣泛的語音辨識以及產生語音功能,包括語音抄寫、文字轉換語音以及語音翻譯。語音服務可提供範圍廣泛的語音辨識以及產生語音功能,包括語音轉譯、文字轉換語音、語音翻譯及說話者辨識。

探索定價選項

套用篩選以根據您的需求自訂定價選項。

價格只是估計值,而非作為實際價格報價。實際價格可能會因 Microsoft 所輸入的合約類型、購買日期及貨幣匯兌而異。價格是根據美金計算,並且使用在每一個行事曆月份第一天所重新更新的 Thomson Reuters 基準匯率進行轉換。登入 Azure 定價計算機以查看您目前的 Microsoft 計劃/供應項目的定價。如需定價或要求報價的詳細資訊,請連絡 Azure 銷售專員。有關 Azure 定價的詳細資訊,請參閱常見問題

免費 (F0)

類別 功能 價格
語音轉換文字
(每秒計費)
標準 每月免費 5 音訊小時
自訂 每月免費 5 音訊小時
端點裝載: 每月免費 1 個模型1
交談轉譯多聲道音訊 預覽 每月免費 5 音訊小時
文字轉換語音
(每個字元計費)
神經網路 每月免費 0.5 million 個字元
語音翻譯
(每秒計費)
標準 每月免費 5 音訊小時
說話者辨識
(每個交易計費)
說話者驗證2 每月免費 10,000 筆交易
說話者識別2 每月免費 10,000 筆交易
語音設定檔儲存體 每月免費 10,000 筆交易

請參閱文件,以取得有關配額、限制和指示的詳細資訊,以了解如何增加同時要求。

1未使用的模型會在 7 天後自動解除。

2說話者辨識是有限的存取功能,需要套用存取

隨用隨付: 用多少付多少。

類別 功能 價格
語音轉換文字
(每秒計費)
標準 每音訊小時 $-
自訂 每音訊小時 $-
端點裝載: 每個模型每小時 $-
增強的附加元件功能:
  • 語言辨識
  • 3+ 個喇叭的批次分割
$- 每個功能的每個音訊時數
交談轉譯多聲道音訊 預覽 每音訊小時 $-1
文字轉換語音
(每個字元計費)
神經網路 即時與批次合成: $-/每 1 百萬個 字元
長期音訊建立: 每 1 百萬個字元 $-
自訂神經網路2 訓練:每計算時數 $- 個,最多 每個訓練 $-
即時與批次合成: 每 1 百萬個字元 $-
端點裝載: 每個模型每小時 $-
長期音訊建立: 每 1 百萬個字元 $-
語音翻譯
(每秒計費)
標準 每音訊小時 $-
說話者辨識
(每個交易計費)
說話者驗證3 每 1,000 筆交易 $-
說話者識別3 每 1,000 筆交易 $-
語音設定檔儲存體 每個 1,000 音訊設定檔 $- (每月有 10,000 的音訊設定檔免費)

請參閱文件,以取得有關配額、限制和指示的詳細資訊,以了解如何增加同時要求。

1 此為公開預覽定價。正式版價格將於稍後正式上市時發佈。

2 自訂神經語音 (CNV) 是具有 Pro 和精簡版本的有限存取功能。透過 CNV 精簡 (公開預覽),客戶可以在申請 Pro 的存取權之前,錄製自己的語音並建立模型以進行示範/評估。查看 CNV 可用

3 說話者辨識是有限的存取功能,需要套用存取

承諾用量層

執行個體 類別 功能 價格 (每個月) 超額
Azure - 標準 語音轉換文字 標準 2,000 小時,價格為 $- 每小時 $-
10,000 小時,價格為 $- 每小時 $-
50,000 小時,價格為 $- 每小時 $-
自訂 2,000 小時,價格為 $- 每小時 $-
10,000 小時,價格為 $- 每小時 $-
50,000 小時,價格為 $- 每小時 $-
連接的容器 - 標準 文字轉換語音 神經網路1 80 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
400 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
2,000 百萬個字元,價格為 $- 每 1 百萬個字元,價格為 $-
已中斷連線的容器 語音轉換文字 標準 註冊以取得存取
深入了解
自訂 註冊以取得存取
深入了解
文字轉換語音 神經網路1 註冊以取得存取
深入了解
1 僅限即時合成,這不包括建立長音訊。

這些功能即將淘汰,且僅供現有客戶使用。查看詳細資料,並了解如何移轉至新功能

執行個體 類別 功能 價格
免費 - Web/容器
1 個並行要求
文字轉換語音 標準 每月免費 5 million 個字元
自訂 每月免費 5 million 個字元
端點裝載: 每月免費 1 個模型
標準 - Web/容器
100 個基底模型的並行要求
20 個自訂模型的並行要求
文字轉換語音 標準 每 1 百萬個字元 $-
自訂 每 1 百萬個字元 $-
端點裝載: 每個模型每小時 $-

Azure 定價與購買選項

直接與我們連絡

取得 Azure 定價的逐步解說。了解雲端解決方案的定價、了解成本最佳化,並要求自訂提案。

與銷售專員洽談

查看購買方式

透過 Azure 網站、Microsoft 代表或 Azure 合作夥伴購買 Azure 服務。

探索您的選擇

其他資源

語音服務

深入了解 語音服務 的功能。

定價計算機

預估您使用任何 Azure 產品組合的預期每月費用。

文件

檢閱技術教學課程、影片和更多 語音服務 資源。

    • 針對語音轉換文字和語音翻譯,使用量會按每秒遞增方式計費。
    • 文字轉換語音: 使用量是依字元計費。檢查定價筆記中的字元定義。
    • 對於語音轉換文字和文字轉換語音,自訂模型的端點裝載會以每秒每一模型計費。
    • 針對自訂命令:按語音轉換文字、文字轉換語音及 Language Understanding 的使用量來計費。自訂命令不會推出新的計費計量。
    • 訓練語音到文字模型是免費的。唯一的成本是部署後每個模型的端點裝載,以及自訂語音轉換文字的每個音訊時數成本。
  • 使用者可運用語音服務,依據其本身的原音與語言資料,採用基準的模型,然後再進入能同時運用在語音轉換文字及語音翻譯的客製化語音模型。

  • 語言模型是一系列字的可能性分佈。語言模型可協助系統決定發音類似字的順序,而其取決於字組順序本身的相似程度。例如,“recognize speech” 與 “wreck a nice beach” 發音類似,但前者的假設較為可能發生,因此會依據語言模型指派為較高的分數。若預期您應用程式的語音查詢會包含特定的詞彙項目,像是一般語音中很少出現的產品名稱或行話,很有可能可透過自訂語言模型的方式強化效能。例如,如果將應用程式建置為會利用語音搜尋 MSDN,很有可能會較一般語音應用程式更常出現像是 “object-oriented” 或 “namespace” 或 “dot net” 等字詞。自訂語言模型能讓系統學習此情況。

  • 原音模型是會將簡短的音訊片斷標入各語言中數種音素或聲音單位之一的分類器。這些音素如此即可結合在一起形成字。例如,“speech” 這個字即由四個音素 “s p iy ch” 所組成。這些分類以類似每秒 100 倍的方式製作。自訂原音模型可讓系統學習,而更能辨識非典型環境中的語音。例如,如果您的應用程式設計為倉庫或工廠中的工作人員所使用,則自訂的原音模型可於這些環境中出現雜音時,更正確地辨識語音。

  • 語音服務提供廣泛的文字轉換語音 (TTS) 語音字型,不過自訂神經語音可讓您建置自己的自訂語音,以符合您的需求和品牌。閱讀部落格文章以了解詳細資訊。

  • 在某些情況下,一或多個說話者可能會使用相同的音訊檔案或即時簡報來說多種語言。連續語言偵測可讓您識別口語語言中的切換,並據以正確地轉譯語音。此功能將免費提供私人預覽,並可透過語音 SDK 存取。瀏覽文件以深入了解。

與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。

取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。

已新增至估算。 按下 'v' 即可在計算機上檢視