Azure OpenAI 服務定價概觀
為了在此過程中協助客戶,我們會提供符合您需求的價格和成本管理解決方案,包括:
- 標準 (依需求): 輸入和輸出權杖隨用隨付。
- 已佈建 (PTU): 以可預測的成本配置輸送量,並透過每月和每年保留來減少整體支出。
- 批次 API: 全球部署和三個區域的批次 API 現在也提供語言模型,可在 24 小時內以全球標準價格的 50% 折扣傳回完成結果。
- 全球部署 – 全球 SKU
- 資料區域部署–地理型 (歐洲或美國)
- 區域部署–本地區域 (最多 27 個區域)
探索定價選項
套用篩選以根據您的需求自訂定價選項。
價格僅為估算值,並非實際價格報價。實際定價可能會根據與 Microsoft 簽訂的合約類型、購買日期和目前貨幣匯率而有所不同。價格是根據美元計算,並使用前一個月底最後一個工作天之前兩個工作天內擷取的倫敦即期匯率進行轉換。如果月底的前兩個工作天是主要市場中的銀行假日,則匯率設定日期通常為兩個工作天之前的那一天。此匯率適用於下個月的所有交易。登入 Azure 定價計算機查看依據您目前 Microsoft 方案/供應項目所訂的定價。如需定價的詳細資訊或要求報價,請連絡 Azure 銷售專員。請參閱 Azure 定價常見問題集。
美國政府機構有資格透過授權解決方案提供者購買 Azure Government 服務,無須預先支付費用;亦可直接透過隨用隨付線上訂用帳戶購買。
重要 - 以 R$ 表示的價格僅供參考;這是國際交易,因此最終價格需視匯率與是否內含 IOF 稅而定,而且不會發行 eNF。
美國政府機構有資格透過授權解決方案提供者購買 Azure Government 服務,無須預先支付費用;亦可直接透過隨用隨付線上訂用帳戶購買。
重要 - 以 R$ 表示的價格僅供參考;這是國際交易,因此最終價格需視匯率與是否內含 IOF 稅而定,而且不會發行 eNF。
o1
o1 是適用於複雜任務的新推理模型系列。此模型具有 200K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) |
---|---|
o1 1217 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
o1 1217 美國/歐洲 - 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
o1 1217 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
o1 預覽全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
o1 預覽 US/EU – 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
o1 預覽區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
使用定價計算機進行規劃
o1 Mini
o1-mini 專為編碼、數學和科學使用案例量身打造,是一款快速且符合成本效益的推理模型。此模型具有 128K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) |
---|---|
全球 |
輸入: $- 已快取的輸入: $- 輸出: $- |
美國/歐洲 - 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
使用定價計算機進行規劃
即時 API
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
模型 | 價格 (1 百萬個權杖) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
Chat Completions API
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
模型 | 價格 (1 百萬個權杖) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o
GPT-4o 是最進階的多模式模型,具有更強大的視覺功能,而且比 GPT-4 Turbo 更快、更便宜。此模型具有 128K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
GPT-4o-2024-1120 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-1120 美國/歐洲資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-1120 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4o-2024-08-06 全球 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-08-06 美國/歐洲資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-08-06 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4o-2024-0513 全域 |
輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-0513 美國/歐洲資料區域 |
輸入: $- 輸出: $- |
N/A |
GPT-4o-2024-0513 區域 |
輸入: $- 輸出: $- |
N/A |
使用定價計算機進行規劃
GPT-4o mini
GPT-4o mini 是最具成本效益的小型模型,而且具有視覺功能。此模型具有 128K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
GPT-4o-mini-0718 Global |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-mini-0718 Regional |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
使用定價計算機進行規劃
已佈建
您可以配置及管理部署的輸送量,確保可預測的效能與穩定容量。無論使用量的多寡,每個模型都會按小時計費,但您也可以透過每月和每年保留,節省額外的費用。在本 [學習] 頁面 中了解如何將您的區域部署和佈建保留過渡到全域和資料區域。
模型 | 最小 PTU | PTU 每小時價格 | PTU 每月保留價格 | PTU 每年保留價格 |
---|---|---|---|---|
GPT-4o 全球 | 15 | $- | $- | $- |
GPT-4o 美國/歐洲資料區域 | 15 | $- | $- | $- |
GPT-4o 區域 | 50 | $- | $- | $- |
GPT-4o Mini 全球 | 15 | $- | $- | $- |
GPT-4o Mini 美國/歐洲資料區域 | 15 | $- | $- | $- |
GPT-4o Mini 區域 | 25 | $- | $- | $- |
使用定價計算機進行規劃
基本模型
模型 | 每 1,000 個權杖的使用量 |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
微調模型
模型 | 價格 | |
---|---|---|
GPT-4o-2024-08-06 | 區域 |
輸入: $- / 1 百萬個權杖 已快取的輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
全球 |
輸入: $- / 1 百萬個權杖 已快取的輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: 使用區域 裝載: $- / 小時 |
|
GPT-4o-mini | 區域 |
輸入: $- / 1 百萬個權杖 已快取的輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
全球 |
輸入: $- / 1 百萬個權杖 已快取的輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: 使用區域 裝載: $- / 小時 |
|
GPT-4-0613 (8K) | 區域 |
輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
GPT-3.5-Turbo (16K) | 區域 |
輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
GPT-3.5-Turbo (4K) | 區域 |
輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
Babbage-002 |
輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
|
Davinci-002 |
輸入: $- / 1 百萬個權杖 輸出: $- / 1 百萬個權杖 訓練: $- / 1 百萬個權杖 裝載: $- / 小時 |
助理 API
助理 API 及其工具可讓開發人員輕鬆在其應用程式中建置 AI 助理。
用於助理 API 的權杖會依每個助理使用的每個權杖輸入/輸出速率,依所選語言模型的費率計費。此外,我們也針對工具使用收取下列費用:
*GB 是指二進位 GB,其中 1 GB 是 2^30 位元組。
**如果您的助理同時在兩個不同的對話中呼叫 Code Interpreter,這會建立兩個 Code Interpreter 工作階段 (2 * $-)。每個工作階段預設為使用一小時,這表示如果您的使用者在相同對話中持續在一小時内提供指示給 Code Interpreter,您只會支付此費用一次。
推斷成本 (輸入和輸出) 會視每個助理使用的 GPT 模型而異。如果您的助理同時在兩個不同的對話中呼叫程式碼解譯器,這會建立兩個程式碼解譯器工作階段 (2 * $-)。每個工作階段預設為使用一小時,這表示價格為在相同對話中提供指示給程式碼解譯器最多一小時的價格。
影像模型
模型 | 品質 | 解析度 | 價格 (每 100 張影像) |
---|---|---|---|
Dall-E-3 | 標準 | 1024 * 1024 | $- |
標準 | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | 標準 | 1024 * 1024 | $- |
內嵌模型
模型 | 每 1,000 個權杖 |
---|---|
Ada | $- |
文字-內嵌-3-大 | $- |
文字-內嵌-3-小 | $- |
語音模型
模型 | 價格 |
---|---|
Whisper | 每小時 $- |
TTS (文字轉換語音) | $-/100 萬個字元 |
TTS HD | $-/100 萬個字元 |
舊版語言模型
模型 | 內容 | 輸入 (每 1 百萬個權杖) | 輸出 (每 1 百萬個權杖) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure 定價與購買選項
其他資源
Azure OpenAI 服務
深入了解 Azure OpenAI 服務 的功能。
定價計算機
預估您使用任何 Azure 產品組合的預期每月費用。
SLA
檢閱 Azure OpenAI 服務 的服務等級協定。
文件
檢閱技術教學課程、影片和更多 Azure OpenAI 服務 資源。
常見問題集
-
Azure OpenAI 服務會根據隨用隨付及已佈建輸送量單位 (PTU) 提供定價。隨用隨付可讓您支付所耗用的資源,使其對可變工作負載更有彈性。PTU 提供可預測的定價模型,讓您可以保留和部署特定數量的模型處理容量。此模型適用於具有一致或可預測使用模式的工作負載,可提供穩定性與成本控制。
與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。
取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。