跳到主要內容
Azure

Azure OpenAI 服務定價

Azure OpenAI 服務定價概觀

Azure OpenAI 服務提供企業就緒的生成式 AI,具有來自 OpenAI 的強大模型,能讓組織利用文字、音訊和視覺功能進行創新。除了最先進的模型之外,公司還選擇 Azure OpenAI 服務以取得內建資料隱私權、區域/地區/全球彈性,並且順暢地整合至 Azure 生態系統,包括 Fabric、Cosmos DB 和 Azure AI 搜尋服務。各種規模的公司都可以放心地調整 AI 解決方案,以增強客戶體驗、將工作流程自動化,並釋放創意潛力,推動可衡量的影響和競爭差異。

為了在此過程中協助客戶,我們會提供符合您需求的價格和成本管理解決方案,包括:
  • 標準 (依需求): 輸入和輸出權杖隨用隨付。
  • 已佈建 (PTU): 以可預測的成本配置輸送量,並透過每月和每年保留來減少整體支出。
  • 批次 API: 全球部署和三個區域的批次 API 現在也提供語言模型,可在 24 小時內以全球標準價格的 50% 折扣傳回完成結果。
針對「標準」和「已佈建」,您可以從下列部署類型中選擇,這能讓價格和效能具有更大的彈性和控制。當資料處理界限限制越來越嚴格,且需要增加輸送量和降低價格時,此彈性會有所幫助。
  • 全球部署 – 全球 SKU
  • 資料區域部署–地理型 (歐洲或美國)
  • 區域部署–本地區域 (最多 27 個區域)

探索定價選項

套用篩選以根據您的需求自訂定價選項。

價格僅為估算值,並非實際價格報價。實際定價可能會根據與 Microsoft 簽訂的合約類型、購買日期和目前貨幣匯率而有所不同。價格是根據美元計算,並使用前一個月底最後一個工作天之前兩個工作天內擷取的倫敦即期匯率進行轉換。如果月底的前兩個工作天是主要市場中的銀行假日,則匯率設定日期通常為兩個工作天之前的那一天。此匯率適用於下個月的所有交易。登入 Azure 定價計算機查看依據您目前 Microsoft 方案/供應項目所訂的定價。如需定價的詳細資訊或要求報價,請連絡 Azure 銷售專員。請參閱 Azure 定價常見問題集。

o1

o1 是適用於複雜任務的新推理模型系列。此模型具有 200K 內容以及截至 2023 年 10 月的知識。

模型 價格 (1 百萬個權杖)
o1 1217 全域 輸入: $-
已快取的輸入: $-
輸出: $-
o1 1217 美國/歐洲 - 資料區域 輸入: $-
已快取的輸入: $-
輸出: $-
o1 1217 區域 輸入: $-
已快取的輸入: $-
輸出: $-
o1 預覽全域 輸入: $-
已快取的輸入: $-
輸出: $-
o1 預覽 US/EU – 資料區域 輸入: $-
已快取的輸入: $-
輸出: $-
o1 預覽區域 輸入: $-
已快取的輸入: $-
輸出: $-

使用定價計算機進行規劃

o1 Mini

o1-mini 專為編碼、數學和科學使用案例量身打造,是一款快速且符合成本效益的推理模型。此模型具有 128K 內容以及截至 2023 年 10 月的知識。

模型 價格 (1 百萬個權杖)
全球 輸入: $-
已快取的輸入: $-
輸出: $-
美國/歐洲 - 資料區域 輸入: $-
已快取的輸入: $-
輸出: $-
區域 輸入: $-
已快取的輸入: $-
輸出: $-

使用定價計算機進行規劃

即時 API

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.

模型 價格 (1 百萬個權杖)
GPT-4o-Realtime-Preview-2024-12-17-Global 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Realtime-Preview-2024-10-01-Global 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional 文字
輸入: $-
已快取的輸入: $-
輸出: $-

音訊
輸入: $-
已快取的輸入: $-
輸出: $-

Chat Completions API

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.

模型 價格 (1 百萬個權杖)
GPT-4o-Audio-Preview-2024-12-17-Global 文字
輸入: $-
輸出: $-

音訊
輸入: $-
輸出: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones 文字
輸入: $-
輸出: $-

音訊
輸入: $-
輸出: $-
GPT-4o-Audio-Preview-2024-12-17-Regional 文字
輸入: $-
輸出: $-

音訊
輸入: $-
輸出: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global 文字
輸入: $-
輸出: $-

音訊
輸入: $-
輸出: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones 文字
輸入: $-
輸出: $-

音訊
輸入: $-
輸出: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional 文字
輸入: $-
輸出: $-

音訊
輸入: $-
輸出: $-

GPT-4o

GPT-4o 是最進階的多模式模型,具有更強大的視覺功能,而且比 GPT-4 Turbo 更快、更便宜。此模型具有 128K 內容以及截至 2023 年 10 月的知識。

模型 價格 (1 百萬個權杖) 批次 API 的價格 (1 百萬個權杖)
GPT-4o-2024-1120 全域 輸入: $-
已快取的輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-2024-1120 美國/歐洲資料區域 輸入: $-
已快取的輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-2024-1120 區域 輸入: $-
已快取的輸入: $-
輸出: $-
N/A
GPT-4o-2024-08-06 全球 輸入: $-
已快取的輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-2024-08-06 美國/歐洲資料區域 輸入: $-
已快取的輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-2024-08-06 區域 輸入: $-
已快取的輸入: $-
輸出: $-
N/A
GPT-4o-2024-0513 全域 輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-2024-0513 美國/歐洲資料區域 輸入: $-
輸出: $-
N/A
GPT-4o-2024-0513 區域 輸入: $-
輸出: $-
N/A

使用定價計算機進行規劃

GPT-4o mini

GPT-4o mini 是最具成本效益的小型模型,而且具有視覺功能。此模型具有 128K 內容以及截至 2023 年 10 月的知識。

模型 價格 (1 百萬個權杖) 批次 API 的價格 (1 百萬個權杖)
GPT-4o-mini-0718 Global 輸入: $-
已快取的輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-mini-0718 US/EU – Data Zones 輸入: $-
已快取的輸入: $-
輸出: $-
輸入: $-
輸出: $-
GPT-4o-mini-0718 Regional 輸入: $-
已快取的輸入: $-
輸出: $-
N/A

使用定價計算機進行規劃

已佈建

您可以配置及管理部署的輸送量,確保可預測的效能與穩定容量。無論使用量的多寡,每個模型都會按小時計費,但您也可以透過每月和每年保留,節省額外的費用。在本 [學習] 頁面 中了解如何將您的區域部署和佈建保留過渡到全域和資料區域。

模型 最小 PTU PTU 每小時價格 PTU 每月保留價格 PTU 每年保留價格
GPT-4o 全球 15 $- $- $-
GPT-4o 美國/歐洲資料區域 15 $- $- $-
GPT-4o 區域 50 $- $- $-
GPT-4o Mini 全球 15 $- $- $-
GPT-4o Mini 美國/歐洲資料區域 15 $- $- $-
GPT-4o Mini 區域 25 $- $- $-

使用定價計算機進行規劃

基本模型

模型 每 1,000 個權杖的使用量
Babbage-002 $-
Davinci-002 $-

微調模型

模型 價格
GPT-4o-2024-08-06 區域 輸入: $- / 1 百萬個權杖
已快取的輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時
全球 輸入: $- / 1 百萬個權杖
已快取的輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: 使用區域
裝載: $- / 小時
GPT-4o-mini 區域 輸入: $- / 1 百萬個權杖
已快取的輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時
全球 輸入: $- / 1 百萬個權杖
已快取的輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: 使用區域
裝載: $- / 小時
GPT-4-0613 (8K) 區域 輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時
GPT-3.5-Turbo (16K) 區域 輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時
GPT-3.5-Turbo (4K) 區域 輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時
Babbage-002 輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時
Davinci-002 輸入: $- / 1 百萬個權杖
輸出: $- / 1 百萬個權杖
訓練: $- / 1 百萬個權杖
裝載: $- / 小時

助理 API

助理 API 及其工具可讓開發人員輕鬆在其應用程式中建置 AI 助理。

用於助理 API 的權杖會依每個助理使用的每個權杖輸入/輸出速率,依所選語言模型的費率計費。此外,我們也針對工具使用收取下列費用:

工具 輸入
檔案搜尋* 每天 $- / GB 向量儲存空間 (1 GB 免費)
程式碼解譯器** $-/工作階段

*GB 是指二進位 GB,其中 1 GB 是 2^30 位元組。

**如果您的助理同時在兩個不同的對話中呼叫 Code Interpreter,這會建立兩個 Code Interpreter 工作階段 (2 * $-)。每個工作階段預設為使用一小時,這表示如果您的使用者在相同對話中持續在一小時内提供指示給 Code Interpreter,您只會支付此費用一次。

推斷成本 (輸入和輸出) 會視每個助理使用的 GPT 模型而異。如果您的助理同時在兩個不同的對話中呼叫程式碼解譯器,這會建立兩個程式碼解譯器工作階段 (2 * $-)。每個工作階段預設為使用一小時,這表示價格為在相同對話中提供指示給程式碼解譯器最多一小時的價格。

影像模型

模型 品質 解析度 價格 (每 100 張影像)
Dall-E-3 標準 1024 * 1024 $-
標準 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 標準 1024 * 1024 $-

內嵌模型

模型 每 1,000 個權杖
Ada $-
文字-內嵌-3-大 $-
文字-內嵌-3-小 $-

語音模型

模型 價格
Whisper 每小時 $-
TTS (文字轉換語音) $-/100 萬個字元
TTS HD $-/100 萬個字元

舊版語言模型

模型 內容 輸入 (每 1 百萬個權杖) 輸出 (每 1 百萬個權杖)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure 定價與購買選項

直接與我們連絡

取得 Azure 定價的逐步解說。了解雲端解決方案的定價、了解成本最佳化,並要求自訂提案。

與銷售專員洽談

查看購買方式

透過 Azure 網站、Microsoft 代表或 Azure 合作夥伴購買 Azure 服務。

探索您的選擇

其他資源

Azure OpenAI 服務

深入了解 Azure OpenAI 服務 的功能。

定價計算機

預估您使用任何 Azure 產品組合的預期每月費用。

SLA

檢閱 Azure OpenAI 服務 的服務等級協定。

文件

檢閱技術教學課程、影片和更多 Azure OpenAI 服務 資源。

  • Azure OpenAI 服務會根據隨用隨付及已佈建輸送量單位 (PTU) 提供定價。隨用隨付可讓您支付所耗用的資源,使其對可變工作負載更有彈性。PTU 提供可預測的定價模型,讓您可以保留和部署特定數量的模型處理容量。此模型適用於具有一致或可預測使用模式的工作負載,可提供穩定性與成本控制。
  • 若要深入了解 PTU 與 Azure Open AI 定價,請閱讀 PTU 文件連絡我們的銷售專員

與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。

取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。

已新增至估算。 按下 'v' 即可在計算機上檢視