Gambaran umum harga Azure OpenAI Service
Untuk membantu pelanggan dalam perjalanan, kami menawarkan solusi manajemen harga dan biaya untuk memenuhi kebutuhan Anda. termasuk:
- Standar (Sesuai Permintaan): Bayar sesuai penggunaan untuk token input dan output.
- Disediakan (PTU): Alokasikan throughput dengan biaya yang dapat diprediksi, dengan reservasi bulanan dan tahunan yang tersedia untuk mengurangi pengeluaran secara keseluruhan.
- Batch API: Model bahasa kini juga tersedia di Batch API untuk penyebaran global dan tiga wilayah, yang mengembalikan penyelesaian dalam waktu 24 jam untuk diskon sebesar 50% dari Harga Standar Global.
- Penyebaran Global – SKU Global
- Penyebaran Zona Data – Berbasis geografis (UE atau AS)
- Penyebaran Regional – Wilayah Lokal (hingga 27 wilayah)
Jelajahi opsi harga
Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.
Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.
Entitas pemerintah AS memenuhi syarat untuk membeli layanan Azure Government dari penyedia solusi lisensi tanpa komitmen keuangan di muka, atau secara langsung melalui langganan online bayar sesuai penggunaan.
Penting— Harga dalam R$ hanyalah referensi. Ini adalah transaksi internasional dan harga akhir tunduk pada nilai tukar dan termasuk pajak IOF dan eNF tidak akan diterbitkan.
Entitas pemerintah AS memenuhi syarat untuk membeli layanan Azure Government dari penyedia solusi lisensi tanpa komitmen keuangan di muka, atau secara langsung melalui langganan online bayar sesuai penggunaan.
Penting— Harga dalam R$ hanyalah referensi. Ini adalah transaksi internasional dan harga akhir tunduk pada nilai tukar dan termasuk pajak IOF dan eNF tidak akan diterbitkan.
o3
o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o3 2025-04-16 |
Input: $- Input Cache: $- Output: $- |
T/T |
o4-mini
o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o4-mini 2025-04-16 |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4.1 series
GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4.1-2025-04-14 |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4.1-mini-2025-04-14 |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4.1-nano-2025-04-14 |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4.5
GPT-4.5-pratinjau merupakan model tujuan umum terbaru yang memiliki pengetahuan mendalam tentang dunia dan pemahaman niat pengguna yang lebih baik, sehingga membuatnya unggul dalam tugas kreatif dan perencanaan agentik. Model ini memiliki 128K konteks dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1
o1 adalah seri model alasan baru untuk tugas kompleks. Model memiliki konteks 200K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o1 2024-12-17 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 2024-12-17 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 2024-12-17 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 pratinjau 2024-09-12 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 pratinjau 2024-09-12 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 pratinjau 2024-09-12 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
o3 Mini
o3 mini adalah versi terbaru dari model o1 mini. o3-mini adalah model penalaran yang cepat dan hemat biaya yang dirancang untuk pengodean, matematika, dan kasus penggunaan sains.
Model o3-mini kini menawarkan jendela input konteks yang diperluas hingga 200K token dan output maksimum 100K token, memberikan ruang yang cukup untuk respons yang kompleks dan mendetail. Model o1 mini memiliki input konteks 128K. Model o3 dan o1 memiliki batas pengetahuan hingga Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o3 mini 2025-01-31 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
o3 mini 2025-01-31-US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
o3 mini 2025-01-31 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
o1-mini 2024-09-12 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1-mini-2024-09-12 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
T/T |
o1-mini 2024-09-12 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
Agen Pengguna Komputer (CUA)
Agen Pengguna Komputer (CUA) adalah model AI khusus yang memungkinkan AI berinteraksi dengan antarmuka pengguna grafis (GUI), menavigasi aplikasi, dan mengotomatiskan tugas multi-langkah—semuanya melalui instruksi dalam bahasa alami. Model CUA dapat digunakan sebagai alat dalam API Respons.
Model | Harga |
---|---|
pratinjau-penggunaan-komputer Global |
Input: $-/1Jt token Output: $-/1Jt token |
Alat bawaan
API Respons dan API Asisten memungkinkan interaksi yang lancar dengan alat-alat seperti penggunaan komputer, penerjemah kode, pemanggilan fungsi, dan pencarian file, sehingga memudahkan pengembang dalam membangun agen AI.
Alat | Input |
---|---|
Penggunaan Komputer (API Respons saja) |
Input: $-/1Jt token Output: $-/1Jt token |
Panggilan Alat Pencarian File (API Respons saja) | $-/1K pemanggilan alat |
Pencarian File* | $-/GB penyimpanan vektor per hari (gratis 1 GB) |
Penerjemah Kode** | $-/sesi |
*GB mengacu pada gigabyte biner, berarti 1 gb sama dengan 2^30 byte.
**Dua sesi Penerjemah Kode (2 * $-) akan dibuat jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua utas yang berbeda. Setiap sesi aktif secara default selama satu jam, yang berarti bahwa Anda hanya akan membayar biaya ini satu kali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di utas yang sama hingga satu jam.
Biaya inferensi (input dan output) bervariasi berdasarkan model GPT yang digunakan dengan setiap Asisten. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan dalam dua utas yang berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $-). Setiap sesi aktif secara default selama satu jam, yang berarti harga adalah untuk hingga satu jam memberikan instruksi kepada Penerjemah Kode di utas yang sama.
Realtime API
Diunggulkan dalam API Realtime, GPT-4o-Realtime-Preview mendukung kemampuan ucapan ke ucapan multibahasa. Dioptimalkan untuk percakapan real time dengan latensi rendah, memungkinkan interaksi alami dengan penundaan minimal, ideal untuk chatbot dan AI percakapan. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.
Model | Harga (1Jt Token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zona Data |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
API Penyelesaian Obrolan
Model GPT 4o-Audio-Preview yang ditampilkan dalam Chat Completions API dapat memproses dan menghasilkan konten audio. Aplikasi ini mendukung fitur-fitur canggih seperti pengenalan suara dan sintesis audio, yang ideal untuk interaksi suara asinkron dan analisis sentimen. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.
Model | Harga (1Jt Token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o
GPT-4o adalah model multimodal paling canggih yang lebih cepat dan lebih murah daripada GPT-4 Turbo dengan kemampuan penglihatan yang lebih kuat. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-2024-1120 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4o-2024-08-06 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4o-2024-0513 Global |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 AS/UE – Zona Data |
Input: $- Output: $- |
T/T |
GPT-4o-2024-0513 Regional |
Input: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
GPT-4o mini
GPT-4o mini adalah model kecil yang paling hemat biaya, dan memiliki kemampuan penglihatan. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
Disediakan
Anda dapat mengalokasikan dan mengelola throughput untuk penyebaran, memastikan kinerja yang dapat diprediksi dan kapasitas stabil. Anda dikenakan tarif per jam per model terlepas dari penggunaan, tetapi Anda juga dapat mengamankan penghematan tambahan melalui reservasi bulanan dan tahunan. Temukan cara mengalihkan penyebaran regional dan reservasi yang disediakan ke zona global dan data di halaman Pelajari ini.
Model | PTU Min | Harga PTU Per Jam | Harga Reservasi Bulanan PTU | Harga Reservasi Tahunan PTU |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
Zona Data AS/UE GPT-4o | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o-Regional yang Disempurnakan | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Zona Data GPT-4o Mini AS/UE | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
GPT-4o-Regional Mini yang Disempurnakan | 25 | $- | $- | $- |
Rencanakan dengan Kalkulator Harga
Model dasar
Model | Penggunaan per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Menyempurnakan model
Model | Harga | |
---|---|---|
GPT-4.1 | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
|
GPT-4.1-mini | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
|
GPT-4o-2024-08-06 | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: gunakan regional Hosting: $-/jam |
|
GPT-4o-mini | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: gunakan regional Hosting: $-/jam |
|
GPT-3.5-Turbo (16K) | Regional |
Input: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
GPT-3.5-Turbo (4K) | Regional |
Input: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Model gambar
Model | Kualitas | Resolusi | Harga (per 100 gambar) |
---|---|---|---|
Dall-E-3 | Standar | 1024 * 1024 | $- |
Standar | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standar | 1024 * 1024 | $- |
Menyematkan model
Model | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Model Ucapan
Model | Harga |
---|---|
Berbisik | $-/jam |
TTS (Teks ke Ucapan) | $-/1Jt karakter |
TTS HD | $-/1Jt karakter |
Model Bahasa Lama
Model | Konteks | Input (Per Token 1M) | Output (Per 1Jt Token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung
Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.
Bicara dengan spesialis penjualanLihat cara pembelian
Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.
Jelajahi opsi AndaSumber daya tambahan
Azure OpenAI Service
Pelajari selengkapnya tentang fitur dan kemampuan Azure OpenAI Service.
Kalkulator harga
Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.
SLA
Tinjau Perjanjian Tingkat Layanan untuk Azure OpenAI Service.
Dokumentasi
Tinjau tutorial teknis, video, dan Azure OpenAI Service sumber daya lainnya.
Tanya jawab umum
-
Azure OpenAI Service menawarkan harga berdasarkan PAYG dan Unit Throughput yang Disediakan (PTU). PAYG memungkinkan Anda untuk membayar sumber daya yang Anda gunakan, menjadikannya fleksibel bagi beragam beban kerja. PTU menawarkan model harga yang dapat diprediksi tempat Anda mereservasi dan menyebarkan jumlah kapasitas pemrosesan model tertentu. Model ini ideal untuk beban kerja dengan pola penggunaan yang konsisten atau dapat diprediksi, memberikan stabilitas dan kontrol biaya.
-
Untuk mempelajari selengkapnya tentang harga PTUs dan Azure OpenAI, baca dokumentasi PTU atau hubungi spesialis penjualan kami.
Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.
Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.