Azure OpenAI Service の価格の概要
お客様の取り組みをお手伝いするために、お客様のニーズに合った価格設定とコスト管理ソリューションを提供しています。これには以下が含まれます:
- Standard (オンデマンド): 入力トークンと出力トークンは従量課金制です。
- Provisioned (PTU): 予測可能なコストでスループットを割り当て、月額予約と年額予約を利用して全体的な支出を削減できます。
- Batch API: 言語モデルは、グローバル デプロイと 3 つのリージョンの Batch API でも利用できるようになりました。これにより、Global Standard 価格の 50% 割引で 24 時間以内に完了結果が返されます。
- グローバル デプロイ – グローバル SKU
- データ ゾーン デプロイ – 地理ベース(ヨーロッパまたは米国)
- リージョン デプロイ – ローカル リージョン (最大 27 リージョン)
価格オプションの詳細
フィルターを適用して、価格オプションをお客様のニーズに合わせてカスタマイズします。
価格は見積もりのみで、実際の価格見積もりとして意図されていません。実際の価格は、Microsoft との契約の種類、購入日、為替レートによって異なる場合があります。価格は米ドルに基づいて計算され、前月の最後の営業日前の 2 営業日に捕捉されたロンドン市場の引け値レートを使用して変換されます。月末までの 2 営業日が主要市場の銀行休日に該当する場合、通常、レート設定日は 2 営業日の直前の日です。このレートは、今後 1 か月間のすべてのトランザクションに適用されます。Azure 料金計算ツールにサインインして、Microsoft の現在のプログラムまたはオファーに基づく価格を確認します。価格の詳細については、Azure 営業担当者にお問い合わせいただくか、価格見積もりを要求してください。Azure の価格についてはよく寄せられる質問を参照してください。
米国政府機関は、ライセンス ソリューション プロバイダーから、Azure Government サービスを購入できます。その際、事前の料金契約なしで、または従量課金制のオンライン サブスクリプションで直接ご購入いただけます。
重要 - R$ で示されている料金は参照用のみです。これは国際取引のため、最終料金は為替レートと IOF 税により変更される場合があります。eNF は発行されません。
米国政府機関は、ライセンス ソリューション プロバイダーから、Azure Government サービスを購入できます。その際、事前の料金契約なしで、または従量課金制のオンライン サブスクリプションで直接ご購入いただけます。
重要 - R$ で示されている料金は参照用のみです。これは国際取引のため、最終料金は為替レートと IOF 税により変更される場合があります。eNF は発行されません。
GPT-4.5
GPT-4.5-preview は、深い世界の知識を持ち、ユーザーの意図をより深く理解した最新の汎用モデルであり、クリエイティブなタスクやエージェント的なプラニングに適しています。モデルには 128K コンテキストと 2023 年 10 月のナレッジ カットオフがあります。
モデル | 価格 (100 万トークン) | Batch API を使用した価格設定 (100 万トークン) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1
o1 は、複雑なタスク向けの新しい推論モデル シリーズです。このモデルは 20 万のコンテキストを持ち、2023 年 10 月までの知識を有しています。
モデル | 価格 (100 万トークン) | Batch API を使用した価格設定 (100 万トークン) |
---|---|---|
o1 2024-12-17 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1 2024-12-17 US/EU – Data Zones |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1 2024-12-17 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1 preview 2024-09-12 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1 preview 2024-09-12 US/EU – Data Zones |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1 preview 2024-09-12 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
料金計算ツールを使用して計画する
o3 Mini
o3 mini は、o1 mini モデルの更新版です。o3-mini は、コーディング、数学、科学のユースケースに合わせて調整された、高速でコスト効率の高い推論モデルです。
o3-mini モデルは、コンテキスト入力ウィンドウが 200K トークンに拡張され、最大出力は 100K トークンになり、複雑かつ詳細な応答にも十分に対応できるスペースが確保されています。o1 mini モデルのコンテキスト入力は 128K です。o3 および o1 モデルのナレッジ カットオフは、両方とも 2023 年 10 月です。
モデル | 価格 (100 万トークン) | Batch API を使用した価格設定 (100 万トークン) |
---|---|---|
o3 mini 2025-01-31 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
o3 mini 2025-01-31-US/EU – Data Zones |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
o3 mini 2025-01-31 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1-mini 2024-09-12 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1-mini 2024-09-12 US/EU – Data Zones |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
o1-mini 2024-09-12 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
料金計算ツールを使用して計画する
Computer-Using Agent (CUA)
The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.
モデル | 価格 |
---|---|
computer-use-preview Global |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン |
Built-in tools
The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.
ツール | 入力 |
---|---|
Computer Use (Responses API only) |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン |
File Search Tool Call (Responses API only) | $-/1K tool calls |
ファイル検索* | $- / 1 日あたりのベクター ストレージの GB (1 GB 無料) |
コード インタープリター** | セッションあたり $- |
*GB は バイナリ ギガバイトを指し、1 GB は 2^30 バイトです。
**アシスタントが 2 つの異なるスレッドでコード インタープリターを同時に呼び出すと、2 つのコード インタープリター セッション (2 * $-) が作成されます。各セッションは既定で 1 時間アクティブです。このため、ユーザーが同じスレッドで最大 1 時間コード インタープリターに指示を出し続けた場合でも、この料金が 1 回だけ支払われます。
推論コスト (入力と出力) は、各アシスタントで使用される GPT モデルによって異なります。アシスタントが 2 つの異なるスレッドでコード インタープリターを同時に呼び出すと、2 つのコード インタープリター セッション (2 * $-) が作成されます。各セッションは既定では 1 時間アクティブです。料金は、同じスレッドで最大 1 時間コード インタープリターに指示を出す場合の価格です。
Realtime API
Realtime API で紹介されている GPT-4o-Realtime-Preview では、多言語の音声合成機能がサポートされています。リアルタイムで待ち時間の短い会話用に最適化されており、最小限の遅延で自然な対話を可能であるため、チャットボットや会話型 AI に最適です。GPT-4o は複雑なタスク向けに設計された包括的で強力なバージョンであるのに対し、GPT-4o Mini は、コスト効率と速度が優先されるシンプルなアプリケーションに最適な、より小さく、より安価なオプションです。
モデル | 価格 (100 万トークン) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
テキスト 入力: $- キャッシュされた入力: $- 出力: $- オーディオ 入力: $- キャッシュされた入力: $- 出力: $- |
Chat Completions API
Chat Completions API に搭載されている GPT 4o-Audio-Preview モデルは、オーディオ コンテンツを処理および生成します。音声認識やオーディオ合成などの高度な機能がサポートされており、非同期の音声対話や感情分析に最適です。GPT-4o は複雑なタスク向けに設計された包括的で強力なバージョンであるのに対し、GPT-4o Mini は、コスト効率と速度が優先されるシンプルなアプリケーションに最適な、より小さく、より安価なオプションです。
モデル | 価格 (100 万トークン) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
テキスト 入力: $- 出力: $- オーディオ 入力: $- 出力: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones |
テキスト 入力: $- 出力: $- オーディオ 入力: $- 出力: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
テキスト 入力: $- 出力: $- オーディオ 入力: $- 出力: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
テキスト 入力: $- 出力: $- オーディオ 入力: $- 出力: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones |
テキスト 入力: $- 出力: $- オーディオ 入力: $- 出力: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
テキスト 入力: $- 出力: $- オーディオ 入力: $- 出力: $- |
GPT-4o
GPT-4o は、GPT-4 Turbo よりも高速かつ安価で、より強力なビジョン機能を備えた最先端のマルチモーダル モデルです。モデルには 128K コンテキストと 2023 年 10 月のナレッジ カットオフがあります。
モデル | 価格 (100 万トークン) | Batch API を使用した価格設定 (100 万トークン) |
---|---|---|
GPT-4o-2024-1120 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-2024-1120 US/EU – データ ゾーン |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-2024-1120 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
GPT-4o-2024-08-06 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-2024-08-06 US/EU – データ ゾーン |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-2024-08-06 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
GPT-4o-2024-0513 Global |
入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-2024-0513 US/EU – データ ゾーン |
入力: $- 出力: $- |
N/A |
GPT-4o-2024-0513 Regional |
入力: $- 出力: $- |
N/A |
料金計算ツールを使用して計画する
GPT-4o mini
GPT-4o mini は最もコスト効率の高い小型モデルで、ビジョン機能を備えています。モデルには 128K コンテキストと 2023 年 10 月のナレッジ カットオフがあります。
モデル | 価格 (100 万トークン) | Batch API を使用した価格設定 (100 万トークン) |
---|---|---|
GPT-4o-mini-0718 Global |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
入力: $- キャッシュされた入力: $- 出力: $- |
入力: $- 出力: $- |
GPT-4o-mini-0718 Regional |
入力: $- キャッシュされた入力: $- 出力: $- |
N/A |
料金計算ツールを使用して計画する
Provisioned
デプロイのスループットを割り当て、管理できるため、予測可能なパフォーマンスと安定した容量を確保できます。使用量に関係なく、モデルごとに 1 時間単位の料金が請求されますが、月額または年額予約により、さらに節約することもできます。この Learn ページで、リージョンのデプロイとプロビジョニングされた予約をグローバルゾーンとデータ ゾーンに移行する方法をご確認ください。
モデル | 最小 PTU | PTU 時間単位の価格 | PTU 月額予約価格 | PTU 年額予約価格 |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o 米国/ヨーロッパ データ ゾーン | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
微調整された GPT-4o-リージョン | 50 | $- | $- | $- |
GPT-4o mini Global | 15 | $- | $- | $- |
GPT-4o mini 米国/ヨーロッパ データ ゾーン | 15 | $- | $- | $- |
GPT-4o-mini リージョン | 25 | $- | $- | $- |
微調整された GPT-4o-Mini リージョン | 25 | $- | $- | $- |
料金計算ツールを使用して計画する
ベース モデル
モデル | 1,000 トークンあたりの使用量 |
---|---|
バベッジ-002 | $- |
ダヴィンチ-002 | $- |
微調整モデル
モデル | 価格 | |
---|---|---|
GPT-4o-2024-08-06 | Regional |
入力: $-/100 万個のトークン キャッシュされた入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
グローバル |
入力: $-/100 万個のトークン キャッシュされた入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: Regional を使用する ホスティング: $-/時間 |
|
GPT-4o-mini | Regional |
入力: $-/100 万個のトークン キャッシュされた入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
グローバル |
入力: $-/100 万個のトークン キャッシュされた入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: Regional を使用する ホスティング: $-/時間 |
|
GPT-4-0613 (8K) | Regional |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
GPT-3.5-Turbo (16K) | Regional |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
GPT-3.5-Turbo (4K) | Regional |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
バベッジ-002 |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
|
ダヴィンチ-002 |
入力: $-/100 万個のトークン 出力: $-/100 万個のトークン トレーニング: $-/100 万個のトークン ホスティング: $-/時間 |
画像モデル
モデル | 画質 | 解像度 | 価格 (画像 100 件あたり) |
---|---|---|---|
Dall-E-3 | 標準 | 1024 * 1024 | $- |
標準 | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | 標準 | 1024 * 1024 | $- |
モデルの埋め込み
モデル | 1,000 トークンあたり |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
音声モデル
モデル | 価格 |
---|---|
Whisper | $-/時間 |
TTS (テキスト読み上げ) | 1,000,000 文字あたり $- |
TTS HD | 1,000,000 文字あたり $- |
レガシ言語モデル
モデル | コンテキスト | 入力 (100 万トークンあたり) | 出力 (100 万トークンあたり) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure の価格および購入オプション

Microsoft と直接つながる
Azure の価格のチュートリアルをご覧ください。お客様のクラウド ソリューションの価格について理解したり、コストの最適化について確認したり、カスタム提案を要求したりすることができます。
営業担当者に問い合わせるその他の資料
Azure OpenAI Service
Azure OpenAI Service の特徴と機能についての詳細情報
料金計算ツール
Azure 製品の任意の組み合わせを使用する場合の推定の月間コストを見積もります。
SLA
Azure OpenAI Service のサービス レベル アグリーメントをご確認ください。
ドキュメント
技術チュートリアル、ビデオ、その他の Azure OpenAI Service のリソースをご確認ください。
よく寄せられる質問
-
Azure OpenAI Service では、従量課金制とプロビジョニング済みスループット ユニット (PTU) の両方に基づく価格が提供されます。従量課金制では、消費したリソースに対して支払うことができるため、変動するワークロードに柔軟に対応できます。PTU は、一定のモデル処理容量を予約してデプロイする予測可能な価格モデルを提供します。このモデルは、一貫性のある、または予測可能な使用パターンのワークロードに最適で、安定性とコスト管理を実現します。
-
PTU と Azure OpenAI の価格の詳細については、PTU ドキュメントをお読みになるか、営業担当者にお問い合わせください。
Azure の価格の説明については、営業担当者にお問い合わせください。クラウド ソリューションの価格を把握できます。
無料のクラウド サービスと、30 日間 Azure を検証できる $200 のクレジットを利用できます。