Azure OpenAI Service の価格の概要
柔軟な Standard (オンデマンド) と Provisioned Throughput Units (PTUs) によって、Azure OpenAI Service の生成 AI モデルの能力を引き出します。Standard モデルでは、処理されたトークンに対してのみ料金をお支払いいただきます。一方、PTUs ではスケーラブルなソリューションに対して一貫したスループットを保証し、待機時間の差異を最小限に抑えます。価格には 1,000 トークンあたりのコストが含まれており、PTU レートは予測可能なコスト構造を提供します。言語モデルは、グローバル標準価格の 50% 割引で 24 時間以内に完了を返す Batch API でも利用できるようになりました。Azure OpenAI Service には、GPT-4o、カスタマイズのためのファインチューニング、画像生成用の DALL-E、音声テキスト変換用の Whisper などの高度な機能が用意されています。AI デプロイの最適化に関するカスタマイズされたガイダンスについては、営業担当者にお問い合わせください。
価格オプションの詳細
フィルターを適用して、価格オプションをお客様のニーズに合わせてカスタマイズします。
価格は見積もりのみで、実際の価格見積もりとして意図されていません。実際の価格は、Microsoft との契約の種類、購入日、為替レートによって異なる場合があります。価格は米ドルに基づいて計算され、前月の最後の営業日前の 2 営業日に捕捉されたロンドン市場の引け値レートを使用して変換されます。月末までの 2 営業日が主要市場の銀行休日に該当する場合、通常、レート設定日は 2 営業日の直前の日です。このレートは、今後 1 か月間のすべてのトランザクションに適用されます。Azure 料金計算ツールにサインインして、Microsoft の現在のプログラムまたはオファーに基づく価格を確認します。価格の詳細については、Azure 営業担当者にお問い合わせいただくか、価格見積もりを要求してください。Azure の価格についてはよく寄せられる質問を参照してください。
米国政府機関は、ライセンス ソリューション プロバイダーから、Azure Government サービスを購入できます。その際、事前の料金契約なしで、または従量課金制のオンライン サブスクリプションで直接ご購入いただけます。
重要 - R$ で示されている料金は参照用のみです。これは国際取引のため、最終料金は為替レートと IOF 税により変更される場合があります。eNF は発行されません。
米国政府機関は、ライセンス ソリューション プロバイダーから、Azure Government サービスを購入できます。その際、事前の料金契約なしで、または従量課金制のオンライン サブスクリプションで直接ご購入いただけます。
重要 - R$ で示されている料金は参照用のみです。これは国際取引のため、最終料金は為替レートと IOF 税により変更される場合があります。eNF は発行されません。
価格の詳細:
言語モデル
モデル | コンテキスト | 入力 (1,000 トークンあたり) | 出力 (1,000 トークンあたり) | 1 時間あたりの PTU あたりの価格 | スケーリングの最小増分 | PTU ごとの月間予約 | PTU ごとの年間予約 |
---|---|---|---|---|---|---|---|
gpt-4o-2024-08-06 Global Deployment | 128K | $- | $- | N/A | N/A | N/A | N/A |
gpt-4o-2024-08-06 Regional API | 128K | $- | $- | N/A | N/A | N/A | N/A |
GPT-4o グローバルデプロイ | 128K | $- | $- | N/A | N/A | N/A | N/A |
GPT-4o リージョン API | 128K | $- | $- | $- | 50 PTU | $- | $- |
GPT-4o-mini グローバル デプロイ | 128K | $- | $- | N/A | N/A | N/A | N/A |
GPT-4o-mini リージョン API | 128K | $- | $- | $- | 25 PTU | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- | $- | 100 PTU | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- | N/A | N/A | N/A | N/A |
GPT-4-Turbo | 128K | $- | $- | $- | 100 PTU | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- | N/A | N/A | N/A | N/A |
GPT-4 | 8K | $- | $- | $- | 50 PTU | $- | $- |
GPT-4 | 32K | $- | $- | $- | 200 PTU | $- | $- |
この表は、さまざまな言語モデルの Standard (オンデマンド) 価格とプロビジョニング済みスループット ユニット (PTU) 価格の詳細を比較しています。[コンテキスト] 列は、各モデルが応答ごとに処理できるトークンの最大数を指定します。入力トークンと出力トークンの価格の詳細が一覧表示され、1,000 トークンあたりのコストが反映されます。PTU 価格モデルには、1 時間あたりのレートとスケーリングの最小増分が含まれており、各モデルに必要な最小 PTU を示しています。[PTU ごとの月間予約] 列と [PTU ごとの年間予約] 列は、PTU あたりの予約コストを示します。この比較によって、ユーザーは Standard (オンデマンド) とプロビジョニング済みスループット ユニット (PTU) の両方の課金オプションで各モデルを使用する場合のコストへの影響を理解し、ユーザーのニーズに沿ったオプションを選ぶことができます。
言語モデルは、グローバル標準価格の 50% 割引で 24 時間以内に完了を返す Batch API でも利用できるようになりました。
レガシ言語モデル
モデル | コンテキスト | 入力 (1,000 トークンあたり) | 出力 (1,000 トークンあたり) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
アシスタント API
Assistants API とそのツールを使用すると、開発者はアプリケーションで AI アシスタントを簡単に構築できます。
Assistants API に使用されるトークンは、選択した言語モデルの各アシスタントで使用されるトークンあたりの入出力レートで課金されます。また、ツールの使用に対して次の料金が課金されます。
ツール | 入力 |
---|---|
ファイル検索* | $- / 1 日あたりのベクター ストレージの GB (1 GB 無料) |
コード インタープリター** | セッションあたり $- |
*GB は バイナリ ギガバイトを指し、1 GB は 2^30 バイトです。
**アシスタントが 2 つの異なるスレッドでコード インタープリターを同時に呼び出すと、2 つのコード インタープリター セッション (2 * $-) が作成されます。各セッションは既定で 1 時間アクティブです。このため、ユーザーが同じスレッドで最大 1 時間コード インタープリターに指示を出し続けた場合でも、この料金が 1 回だけ支払われます。
推論コスト (入力と出力) は、各アシスタントで使用される GPT モデルによって異なります。アシスタントが 2 つの異なるスレッドでコード インタープリターを同時に呼び出すと、2 つのコード インタープリター セッション (2 * $-) が作成されます。各セッションは既定では 1 時間アクティブです。料金は、同じスレッドで最大 1 時間コード インタープリターに指示を出す場合の価格です。
ベース モデル
モデル | 1,000 トークンあたりの使用量 |
---|---|
バベッジ-002 | $- |
ダヴィンチ-002 | $- |
微調整モデル
モデル | 1,000 トークンごとのトレーニング | 1 時間あたりのホスティング | 1,000 トークンあたりの入力使用量 | 1,000 トークンあたりの出力使用量 |
---|---|---|---|---|
バベッジ-002 | $- | $- | $- | $- |
ダヴィンチ-002 | $- | $- | $- | $- |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- |
GPT-3.5-Turbo (16K) | $- | $- | $- | $- |
GPT-4 (8K) | $- | $- | $- | $- |
GPT-4o | $- | $- | $- | $- |
GPT-4o-mini | $- | $- | $- | $- |
画像モデル
モデル | 画質 | 解像度 | 価格 (画像 100 件あたり) |
---|---|---|---|
Dall-E-3 | 標準 | 1024 * 1024 | $- |
標準 | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | 標準 | 1024 * 1024 | $- |
モデルの埋め込み
モデル | 1,000 トークンあたり |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
音声モデル
モデル | 価格 |
---|---|
Whisper | $-/時間 |
TTS (テキスト読み上げ) | 1,000,000 文字あたり $- |
TTS HD | 1,000,000 文字あたり $- |
Azure の価格および購入オプション
Microsoft と直接つながる
Azure の価格のチュートリアルをご覧ください。お客様のクラウド ソリューションの価格について理解したり、コストの最適化について確認したり、カスタム提案を要求したりすることができます。
営業担当者に問い合わせるその他の資料
Azure OpenAI Service
Azure OpenAI Service の特徴と機能についての詳細情報
料金計算ツール
Azure 製品の任意の組み合わせを使用する場合の推定の月間コストを見積もります。
SLA
Azure OpenAI Service のサービス レベル アグリーメントをご確認ください。
ドキュメント
技術チュートリアル、ビデオ、その他の Azure OpenAI Service のリソースをご確認ください。
よく寄せられる質問
-
Azure OpenAI Service では、従量課金制とプロビジョニング済みスループット ユニット (PTU) の両方に基づく価格が提供されます。従量課金制では、消費したリソースに対して支払うことができるため、変動するワークロードに柔軟に対応できます。PTU は、一定のモデル処理容量を予約してデプロイする予測可能な価格モデルを提供します。このモデルは、一貫性のある、または予測可能な使用パターンのワークロードに最適で、安定性とコスト管理を実現します。
-
PTU と Azure Open AI の価格の詳細については、PTU ドキュメントをお読みになるか、営業担当者にお問い合わせください
Azure の価格の説明については、営業担当者にお問い合わせください。クラウド ソリューションの価格を把握できます。
無料のクラウド サービスと、30 日間 Azure を検証できる $200 のクレジットを利用できます。