Azure OpenAI 服務定價概觀
為了在此過程中協助客戶,我們會提供符合您需求的價格和成本管理解決方案,包括:
- 標準 (依需求): 輸入和輸出權杖隨用隨付。
- 已佈建 (PTU): 以可預測的成本 配置輸送量,並透過每月和每年保留來減少整體支出。
- 批次 API: 全球部署和三個區域的批次 API 現在也提供語言模型,可在 24 小時內以全球標準價格的 50% 折扣傳回完成結果。
- 全球部署 - 全球 SKU
- 資料區域部署 - 地理型 (歐洲或美國)
- 區域部署 - 本地區域 (最多 27 個區域)
探索定價選項
套用篩選以根據您的需求自訂定價選項。
價格僅為估算值,並非實際價格報價。實際定價可能會根據與 Microsoft 簽訂的合約類型、購買日期和目前貨幣匯率而有所不同。價格是根據美元計算,並使用前一個月底最後一個工作天之前兩個工作天內擷取的倫敦即期匯率進行轉換。如果月底的前兩個工作天是主要市場中的銀行假日,則匯率設定日期通常為兩個工作天之前的那一天。此匯率適用於下個月的所有交易。登入 Azure 定價計算機查看依據您目前 Microsoft 方案/供應項目所訂的定價。如需定價的詳細資訊或要求報價,請連絡 Azure 銷售專員。請參閱 Azure 定價常見問題集。
美國政府機構有資格透過授權解決方案提供者購買 Azure Government 服務,無須預先支付費用;亦可直接透過隨用隨付線上訂用帳戶購買。
重要 - 以 R$ 表示的價格僅供參考;這是國際交易,因此最終價格需視匯率與是否內含 IOF 稅而定,而且不會發行 eNF。
美國政府機構有資格透過授權解決方案提供者購買 Azure Government 服務,無須預先支付費用;亦可直接透過隨用隨付線上訂用帳戶購買。
重要 - 以 R$ 表示的價格僅供參考;這是國際交易,因此最終價格需視匯率與是否內含 IOF 稅而定,而且不會發行 eNF。
o3
o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
o3 2025-04-16 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o4-mini
o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
o4-mini 2025-04-16 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4.1 系列
GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
GPT-4.1-2025-04-14 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4.1-mini-2025-04-14 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4.1-nano-2025-04-14 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4.5
GPT-4.5-preview 是最新的一般用途模型,具備深厚的世界知識和更佳的使用者意圖理解能力,使其在創意工作和代理規劃方面表現出色。此模型具有 128K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
GPT-4.5-Preview-2025-02-27 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1
o1 是適用於複雜任務的新推理模型系列。此模型具有 200K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
o1 2024-12-17 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1 2024-12-17 美國/歐洲 - 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1 2024-12-17 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1 預覽 2024-09-12 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1 預覽 2024-09-12 美國/歐洲 – 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1 預覽 2024-09-12 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
使用定價計算機進行規劃
o3 迷你
o3 迷你是 o1 迷你模型的更新版本。o3 迷你是一種快速且具成本效益的推理模型,專為程式、數學和科學應用案例量身打造。
o3-迷你模型目前擁有擴展至 200K 權杖的內容輸入視窗,以及最多 100K 權杖的輸出,為複雜且詳細的回應提供了充足的空間。o1 迷你模型有 128K 權杖的內容輸入。o3 和 o1 模型的知識截止日期為 2023 年 10 月。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
o3 迷你 2025-01-31 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
o3 迷你 2025-01-31-美國/歐洲 - 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
o3 迷你 2025-01-31 地區 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1-迷你 2024-09-12 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1-迷你 2024-09-12 美國/歐洲 - 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
o1 迷你 2024-09-12 地區 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
使用定價計算機進行規劃
電腦使用代理程式 (CUA)
電腦使用代理程式 (CUA) 是一種專門的 AI 模型,允許 AI 與圖形使用者介面 (GUI) 互動、瀏覽應用程式,以及自動化多步驟工作——全部都可透過自然語言指示完成。CUA 模型可以作為回應 API 中的工具使用。
模型 | 價格 |
---|---|
computer-use-preview Global |
輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 |
內建工具
回應 API 與助理 API 使您能夠與電腦使用、程式碼解譯器、函式呼叫及檔案搜尋等工具順暢互動,讓開發人員輕鬆建置 AI 代理程式。
工具 | 輸入 |
---|---|
電腦使用 (僅回應 API) |
輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 |
檔案搜尋工具呼叫 (僅回應 API) | $-/1K 工具呼叫 |
檔案搜尋* | 每天 $- / GB 向量儲存空間 (1 GB 免費) |
程式碼解譯器** | $-/工作階段 |
*GB 是指二進位 GB,其中 1 GB 是 2^30 位元組。
**如果您的助理同時在兩個不同的對話中呼叫 Code Interpreter,這會建立兩個 Code Interpreter 工作階段 (2 * $-)。每個工作階段預設為使用一小時,這表示如果您的使用者在相同對話中持續在一小時内提供指示給 Code Interpreter,您只會支付此費用一次。
推斷成本 (輸入和輸出) 會視每個助理使用的 GPT 模型而異。如果您的助理同時在兩個不同的對話中呼叫程式碼解譯器,這會建立兩個程式碼解譯器工作階段 (2 * $-)。每個工作階段預設為使用一小時,這表示價格為在相同對話中提供指示給程式碼解譯器最多一小時的價格。
即時 API
GPT-4o-Realtime-Preview 是即時 API 中的精選功能,支援多語系語音到語音轉換功能。該功能已針對即時低延遲交談進行最佳化,可讓您以最少的延遲進行自然的互動,非常適合用於聊天機器人和交談 AI。GPT-4o 是專為複雜工作所設計的全方位、功能更強大的版本,而 GPT-4o Mini 則是較小型且更實惠的選項,非常適合以成本效益和速度為優先考量的簡單應用程式。
模型 | 價格 (1 百萬個權杖) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU - 資料區域 |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU - 資料區域 |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU - 資料區域 |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
文字 輸入: $- 已快取的輸入: $- 輸出: $- 音訊 輸入: $- 已快取的輸入: $- 輸出: $- |
聊天完成 API
在聊天完成 API 中精選的 GPT 4o-Audio-Preview 模型可處理並產生音訊內容。它支援語音辨識和音訊合成等進階功能,非常適合用於非同步語音互動和情感分析。GPT-4o 是專為複雜工作所設計的全方位、功能更強大的版本,而 GPT-4o Mini 則是較小型且更實惠的選項,非常適合以成本效益和速度為優先考量的簡單應用程式。
模型 | 價格 (1 百萬個權杖) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU - 資料區域 |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU - 資料區域 |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
文字 輸入: $- 輸出: $- 音訊 輸入: $- 輸出: $- |
GPT-4o
GPT-4o 是最進階的多模式模型,具有更強大的視覺功能,而且比 GPT-4 Turbo 更快、更便宜。此模型具有 128K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
GPT-4o-2024-1120 全域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-1120 美國/歐洲資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-1120 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4o-2024-08-06 全球 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-08-06 美國/歐洲資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-08-06 區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
GPT-4o-2024-0513 全域 |
輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-2024-0513 美國/歐洲資料區域 |
輸入: $- 輸出: $- |
N/A |
GPT-4o-2024-0513 區域 |
輸入: $- 輸出: $- |
N/A |
使用定價計算機進行規劃
GPT-4o mini
GPT-4o mini 是最具成本效益的小型模型,而且具有視覺功能。此模型具有 128K 內容以及截至 2023 年 10 月的知識。
模型 | 價格 (1 百萬個權杖) | 批次 API 的價格 (1 百萬個權杖) |
---|---|---|
GPT-4o-mini-0718 全球 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-mini-0718 US/EU - 資料區域 |
輸入: $- 已快取的輸入: $- 輸出: $- |
輸入: $- 輸出: $- |
GPT-4o-mini-0718 地區 |
輸入: $- 已快取的輸入: $- 輸出: $- |
N/A |
使用定價計算機進行規劃
已佈建
您可以配置及管理部署的輸送量,確保可預測的效能與穩定容量。無論使用量的多寡,每個模型都會按小時計費,但您也可以透過每月和每年保留,節省額外的費用。在本 [學習] 頁面 中了解如何將您的區域部署和佈建保留過渡到全域和資料區域。
模型 | 最小 PTU | PTU 每小時價格 | PTU 每月保留價格 | PTU 每年保留價格 |
---|---|---|---|---|
GPT-4o 全球 | 15 | $- | $- | $- |
GPT-4o 美國/歐洲資料區域 | 15 | $- | $- | $- |
GPT-4o 區域 | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini 全球 | 15 | $- | $- | $- |
GPT-4o Mini 美國/歐洲資料區域 | 15 | $- | $- | $- |
GPT-4o Mini 區域 | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
使用定價計算機進行規劃
基本模型
模型 | 每 1,000 個權杖的使用量 |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
微調模型
模型 | 價格 | |
---|---|---|
GPT-4.1 | 區域 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
全球 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
|
GPT-4.1-mini | 區域 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
全球 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
|
GPT-4o-2024-08-06 | 區域 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
全球 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: 使用區域 裝載: 每小時 $- |
|
GPT-4o-mini | 區域 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
全球 |
輸入: $-/1 百萬個權杖 已快取的輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: 使用區域 裝載: 每小時 $- |
|
GPT-3.5-Turbo (16K) | 區域 |
輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
GPT-3.5-Turbo (4K) | 區域 |
輸入: $-/1 百萬個權杖 輸出: $-/1 百萬個權杖 訓練: $-/1 百萬個權杖 裝載: 每小時 $- |
影像模型
模型 | 品質 | 解析度 | 價格 (每 100 張影像) |
---|---|---|---|
Dall-E-3 | 標準 | 1024 * 1024 | $- |
標準 | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | 標準 | 1024 * 1024 | $- |
內嵌模型
模型 | 每 1,000 個權杖 |
---|---|
Ada | $- |
文字-內嵌-3-大 | $- |
文字-內嵌-3-小 | $- |
語音模型
模型 | 價格 |
---|---|
Whisper | 每小時 $- |
TTS (文字轉換語音) | $-/100 萬個字元 |
TTS HD | $-/100 萬個字元 |
舊版語言模型
模型 | 內容 | 輸入 (每 1 百萬個權杖) | 輸出 (每 1 百萬個權杖) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure 定價與購買選項
其他資源
Azure OpenAI 服務
深入了解 Azure OpenAI 服務 的功能。
定價計算機
預估您使用任何 Azure 產品組合的預期每月費用。
SLA
檢閱 Azure OpenAI 服務 的服務等級協定。
文件
檢閱技術教學課程、影片和更多 Azure OpenAI 服務 資源。
常見問題集
-
Azure OpenAI 服務會根據隨用隨付及已佈建輸送量單位 (PTU) 提供定價。隨用隨付可讓您支付所耗用的資源,使其對可變工作負載更有彈性。PTU 提供可預測的定價模型,讓您可以保留和部署特定數量的模型處理容量。此模型適用於具有一致或可預測使用模式的工作負載,可提供穩定性與成本控制。
與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。
取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。