語音轉換文字、文字轉換語音和語音翻譯的統一語音服務
統一的語音服務可提供範圍廣泛的語音辨識以及產生語音功能,包括語音抄寫、文字轉換語音以及語音翻譯。語音服務可提供範圍廣泛的語音辨識以及產生語音功能,包括語音轉譯、文字轉換語音、語音翻譯及說話者辨識。
探索定價選項
套用篩選以根據您的需求自訂定價選項。
價格只是估計值,而非作為實際價格報價。實際價格可能會因 Microsoft 所輸入的合約類型、購買日期及貨幣匯兌而異。價格是根據美金計算,並且使用在每一個行事曆月份第一天所重新更新的 Thomson Reuters 基準匯率進行轉換。登入 Azure 定價計算機以查看您目前的 Microsoft 計劃/供應項目的定價。如需定價或要求報價的詳細資訊,請連絡 Azure 銷售專員。有關 Azure 定價的詳細資訊,請參閱常見問題。
美國政府機構有資格透過授權解決方案提供者購買 Azure Government 服務,無須預先支付費用;亦可直接透過隨用隨付線上訂用帳戶購買。
重要 - 以 R$ 表示的價格僅供參考;這是國際交易,因此最終價格需視匯率與是否內含 IOF 稅而定,而且不會發行 eNF。
美國政府機構有資格透過授權解決方案提供者購買 Azure Government 服務,無須預先支付費用;亦可直接透過隨用隨付線上訂用帳戶購買。
重要 - 以 R$ 表示的價格僅供參考;這是國際交易,因此最終價格需視匯率與是否內含 IOF 稅而定,而且不會發行 eNF。
免費 (F0)
類別 | 功能 | 價格 |
---|---|---|
語音轉換文字 (每秒計費) |
標準 | 每月免費 5 音訊小時 |
自訂 |
每月免費 5 音訊小時 端點裝載: 每月免費 1 個模型1 |
|
交談轉譯多聲道音訊 預覽 | 每月免費 5 音訊小時 | |
文字轉換語音 (每個字元計費) |
神經網路 | 每月免費 0.5 million 個字元 |
語音翻譯 (每秒計費) |
標準 | 每月免費 5 音訊小時 |
說話者辨識 (每個交易計費) |
說話者驗證2 | 每月免費 10,000 筆交易 |
說話者識別2 | 每月免費 10,000 筆交易 | |
語音設定檔儲存體 | 每月免費 10,000 筆交易 |
隨用隨付: 用多少付多少。
類別 | 功能 | 價格 |
---|---|---|
語音轉換文字 (每秒計費) |
標準 | 每音訊小時 $- |
自訂 |
每音訊小時 $- 端點裝載: 每個模型每小時 $- |
|
增強的附加元件功能:
|
$- 每個功能的每個音訊時數 | |
交談轉譯多聲道音訊 預覽 | 每音訊小時 $-1 | |
文字轉換語音 (每個字元計費) |
神經網路 |
即時與批次合成: $-/每 1 百萬個
字元 長期音訊建立: 每 1 百萬個字元 $- 元 |
自訂神經網路2 |
訓練:每計算時數 $- 個,最多 每個訓練 $- 個 即時與批次合成: 每 1 百萬個字元 $- 元 端點裝載: 每個模型每小時 $- 長期音訊建立: 每 1 百萬個字元 $- 元 |
|
語音翻譯 (每秒計費) |
標準 | 每音訊小時 $- |
說話者辨識 (每個交易計費) |
說話者驗證3 | 每 1,000 筆交易 $- |
說話者識別3 | 每 1,000 筆交易 $- | |
語音設定檔儲存體 | 每個 1,000 音訊設定檔 $- (每月有 10,000 的音訊設定檔免費) |
承諾用量層
執行個體 | 類別 | 功能 | 價格 (每個月) | 超額 |
---|---|---|---|---|
Azure - 標準 | 語音轉換文字 | 標準 | 2,000 小時,價格為 $- 元 | 每小時 $- |
10,000 小時,價格為 $- 元 | 每小時 $- | |||
50,000 小時,價格為 $- 元 | 每小時 $- | |||
自訂 | 2,000 小時,價格為 $- 元 | 每小時 $- | ||
10,000 小時,價格為 $- 元 | 每小時 $- | |||
50,000 小時,價格為 $- 元 | 每小時 $- | |||
連接的容器 - 標準 | 文字轉換語音 | 神經網路1 | 80 百萬個字元,價格為 $- 元 | 每 1 百萬個字元,價格為 $- 元 |
400 百萬個字元,價格為 $- 元 | 每 1 百萬個字元,價格為 $- 元 | |||
2,000 百萬個字元,價格為 $- 元 | 每 1 百萬個字元,價格為 $- 元 | |||
已中斷連線的容器 | 語音轉換文字 | 標準 |
註冊以取得存取
深入了解 |
|
自訂 |
註冊以取得存取
深入了解 |
|||
文字轉換語音 | 神經網路1 |
註冊以取得存取
深入了解 |
這些功能即將淘汰,且僅供現有客戶使用。查看詳細資料,並了解如何移轉至新功能。
執行個體 | 類別 | 功能 | 價格 |
---|---|---|---|
免費 - Web/容器 1 個並行要求 |
文字轉換語音 | 標準 | 每月免費 5 million 個字元 |
自訂 |
每月免費 5 million 個字元 端點裝載: 每月免費 1 個模型 |
||
標準 - Web/容器 100 個基底模型的並行要求 20 個自訂模型的並行要求 |
文字轉換語音 | 標準 | 每 1 百萬個字元 $- 元 |
自訂 |
每 1 百萬個字元 $- 元 端點裝載: 每個模型每小時 $- |
Azure 定價與購買選項
其他資源
常見問題集
-
- 針對語音轉換文字和語音翻譯,使用量會按每秒遞增方式計費。
- 文字轉換語音: 使用量是依字元計費。檢查定價筆記中的字元定義。
- 對於語音轉換文字和文字轉換語音,自訂模型的端點裝載會以每秒每一模型計費。
- 針對自訂命令:按語音轉換文字、文字轉換語音及 Language Understanding 的使用量來計費。自訂命令不會推出新的計費計量。
- 訓練語音到文字模型是免費的。唯一的成本是部署後每個模型的端點裝載,以及自訂語音轉換文字的每個音訊時數成本。
-
使用者可運用語音服務,依據其本身的原音與語言資料,採用基準的模型,然後再進入能同時運用在語音轉換文字及語音翻譯的客製化語音模型。
-
語言模型是一系列字的可能性分佈。語言模型可協助系統決定發音類似字的順序,而其取決於字組順序本身的相似程度。例如,“recognize speech” 與 “wreck a nice beach” 發音類似,但前者的假設較為可能發生,因此會依據語言模型指派為較高的分數。若預期您應用程式的語音查詢會包含特定的詞彙項目,像是一般語音中很少出現的產品名稱或行話,很有可能可透過自訂語言模型的方式強化效能。例如,如果將應用程式建置為會利用語音搜尋 MSDN,很有可能會較一般語音應用程式更常出現像是 “object-oriented” 或 “namespace” 或 “dot net” 等字詞。自訂語言模型能讓系統學習此情況。
-
原音模型是會將簡短的音訊片斷標入各語言中數種音素或聲音單位之一的分類器。這些音素如此即可結合在一起形成字。例如,“speech” 這個字即由四個音素 “s p iy ch” 所組成。這些分類以類似每秒 100 倍的方式製作。自訂原音模型可讓系統學習,而更能辨識非典型環境中的語音。例如,如果您的應用程式設計為倉庫或工廠中的工作人員所使用,則自訂的原音模型可於這些環境中出現雜音時,更正確地辨識語音。
-
語音服務提供廣泛的文字轉換語音 (TTS) 語音字型,不過自訂神經語音可讓您建置自己的自訂語音,以符合您的需求和品牌。閱讀部落格文章以了解詳細資訊。
-
在某些情況下,一或多個說話者可能會使用相同的音訊檔案或即時簡報來說多種語言。連續語言偵測可讓您識別口語語言中的切換,並據以正確地轉譯語音。此功能將免費提供私人預覽,並可透過語音 SDK 存取。瀏覽文件以深入了解。
與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。
取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。