Gambaran umum harga Azure OpenAI Service
Untuk membantu pelanggan dalam perjalanan, kami menawarkan solusi manajemen harga dan biaya untuk memenuhi kebutuhan Anda. termasuk:
- Standar (Sesuai Permintaan): Bayar sesuai penggunaan untuk token input dan output.
- Disediakan (PTU): Alokasikan throughput dengan biaya yang dapat diprediksi, dengan reservasi bulanan dan tahunan yang tersedia untuk mengurangi pengeluaran secara keseluruhan.
- Batch API: Model bahasa kini juga tersedia di Batch API untuk penyebaran global dan tiga wilayah, yang mengembalikan penyelesaian dalam waktu 24 jam untuk diskon sebesar 50% dari Harga Standar Global.
- Penyebaran Global – SKU Global
- Penyebaran Zona Data – Berbasis geografis (UE atau AS)
- Penyebaran Regional – Wilayah Lokal (hingga 27 wilayah)
Jelajahi opsi harga
Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.
Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.
Entitas pemerintah AS memenuhi syarat untuk membeli layanan Azure Government dari penyedia solusi lisensi tanpa komitmen keuangan di muka, atau secara langsung melalui langganan online bayar sesuai penggunaan.
Penting— Harga dalam R$ hanyalah referensi. Ini adalah transaksi internasional dan harga akhir tunduk pada nilai tukar dan termasuk pajak IOF dan eNF tidak akan diterbitkan.
Entitas pemerintah AS memenuhi syarat untuk membeli layanan Azure Government dari penyedia solusi lisensi tanpa komitmen keuangan di muka, atau secara langsung melalui langganan online bayar sesuai penggunaan.
Penting— Harga dalam R$ hanyalah referensi. Ini adalah transaksi internasional dan harga akhir tunduk pada nilai tukar dan termasuk pajak IOF dan eNF tidak akan diterbitkan.
GPT-5 series
Model | Harga (1Jt Token) |
---|---|
GPT-5 2025-08-07 Global |
Input: $- Input Cache: $- Output: $- |
GPT-5 Data Zone |
Input: $- Input Cache: $- Output: $- |
GPT-5-mini Global |
Input: $- Input Cache: $- Output: $- |
GPT-5-mini Data Zone |
Input: $- Input Cache: $- Output: $- |
GPT-5-nano Global |
Input: $- Input Cache: $- Output: $- |
GPT-5-nano Data Zone |
Input: $- Input Cache: $- Output: $- |
GPT-5 chat Global |
Input: $- Input Cache: $- Output: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Model | Harga |
---|---|
o3-deep research Global |
Input: $- Input Cache: $- Output: $- |
o3
o3 adalah model penalaran yang canggih dari model penalaran seri-o, mendorong batas dalam pengodean, matematika, sains, dan persepsi visual. Model ini unggul dalam kueri kompleks yang memerlukan analisis multi-faset dan berkinerja sangat baik dalam tugas visual seperti menganalisis gambar, bagan, dan grafik. Model ini memiliki 200K jendela konteks token dan memiliki batas pengetahuan Juni 2024.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o3 2025-04-16 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
Zona Data o3 2025-04-16 |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
o3 2025-04-16 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
o4-mini
o4-mini adalah model penalaran yang ringkas, efisien, dan hemat biaya dari OpenAI seri-o. Model ini unggul dalam tugas matematika, pengodean, dan visual. Model ini memiliki 200K jendela konteks token dan memiliki batas pengetahuan Juni 2024.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o4-mini 2025-04-16 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
Zona Data o4-mini 2025-04-16 |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
o4-mini 2025-04-16 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Seri GPT-4.1
Seri GPT-4.1 adalah model tujuan umum yang sangat canggih dengan pengetahuan dunia yang luas dan kemampuan untuk memahami niat pengguna yang telah ditingkatkan, sehingga sangat mahir dalam tugas kreatif dan perencanaan agentik. Seri ini memiliki 1 juta jendela konteks token dan memiliki batas pengetahuan Juni 2024.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4.1-2025-04-14 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
Zona Data GPT-4.1-2025-04-14 |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-2025-04-14 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4.1-mini-2025-04-14 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
Zona Data GPT-4.1-mini-2025-04-14 |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-mini-2025-04-14 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4.1-nano-2025-04-14 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
Zona Data GPT-4.1-nano-2025-04-14 |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-nano-2025-04-14 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Sora di Azure OpenAI
Sora adalah model AI generatif multimoda yang kini tersedia di Azure AI Foundry, yang didesain untuk membantu tim kreatif mewujudkan ide melalui integrasi yang mengutamakan API yang lancar. Dibangun pada infrastruktur kelas perusahaan Azure, Sora menawarkan penyebaran yang aman dan terukur untuk mengubah konsep menjadi konten visual berkualitas tinggi.
Harga per detik | 1-5 detik | 6-10 detik | 11-15 detik | 16-20 detik |
---|---|---|---|---|
480 Persegi | $- | $- | $- | $- |
480p | $- | $- | $- | $- |
720 Persegi | $- | $- | $- | $- |
720p | $- | $- | $- | $- |
1080 Persegi | $- | $- | $- | $- |
1080p | $- | $- | $- | $- |
GPT-Image-1
GPT-image-1 meningkatkan DALL·E dengan kemampuan mengikuti instruksi yang lebih baik, perenderan teks yang akurat, serta bantuan untuk input dan pengeditan citra digital. Harga model ini dihitung per token, dan harga berbeda untuk token teks dan token gambar.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-Image-1 Global |
Teks Input: $- Citra Input: $- Citra Output: $- |
T/T |
GPT-Image-1 Regional |
Teks Input: $- Citra Input: $- Citra Output: $- |
T/T |
GPT-Image-1 Zona Data |
Teks Input: $- Citra Input: $- Citra Output: $- |
T/T |
GPT-4.5
GPT-4.5-pratinjau merupakan model tujuan umum terbaru yang memiliki pengetahuan mendalam tentang dunia dan pemahaman niat pengguna yang lebih baik, sehingga membuatnya unggul dalam tugas kreatif dan perencanaan agentik. Model ini memiliki 128K konteks dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1
o1 adalah seri model alasan baru untuk tugas kompleks. Model memiliki konteks 200K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o1 2024-12-17 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 2024-12-17 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 2024-12-17 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 pratinjau 2024-09-12 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 pratinjau 2024-09-12 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
T/T |
o1 pratinjau 2024-09-12 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
o3 Mini
o3 mini adalah versi terbaru dari model o1 mini. o3-mini adalah model penalaran yang cepat dan hemat biaya yang dirancang untuk pengodean, matematika, dan kasus penggunaan sains.
Model o3-mini kini menawarkan jendela input konteks yang diperluas hingga 200K token dan output maksimum 100K token, memberikan ruang yang cukup untuk respons yang kompleks dan mendetail. Model o1 mini memiliki input konteks 128K. Model o3 dan o1 memiliki batas pengetahuan hingga Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
o3 mini 2025-01-31 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
o3 mini 2025-01-31-US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
o3 mini 2025-01-31 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
o1-mini 2024-09-12 Global |
Input: $- Input Cache: $- Output: $- |
T/T |
o1-mini-2024-09-12 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
T/T |
o1-mini 2024-09-12 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
Model Audio
Azure OpenAI Service mencakup model audio tingkat lanjut GPT-4o-Transcribe, GPT-4o-Mini-Transcribe, dan GPT-4o-Mini-TTS. Model-model ini meningkatkan kemampuan ucapan ke teks dan teks ke ucapan, menawarkan akurasi tinggi dan output ucapan yang dapat disesuaikan untuk berbagai aplikasi. Ideal untuk pusat panggilan pelanggan, keterangan langsung, dan output suara interaktif karena model memanfaatkan prapelatihan ekstensif dan teknik distilasi canggih untuk kinerja unggul.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-Transcribe |
Teks Input: $- Output: $- Audio Input: $- Output: T/T |
T/T |
GPT-4o-Mini-Transcribe |
Teks Input: $- Output: $- Audio Input: $- Output: T/T |
T/T |
GPT-4o-Mini-TTS |
Teks Input: $- Output: T/T Audio Input: T/T Output: $- |
T/T |
Agen Pengguna Komputer (CUA)
Agen Pengguna Komputer (CUA) adalah model AI khusus yang memungkinkan AI berinteraksi dengan antarmuka pengguna grafis (GUI), menavigasi aplikasi, dan mengotomatiskan tugas multi-langkah—semuanya melalui instruksi dalam bahasa alami. Model CUA dapat digunakan sebagai alat dalam API Respons.
Model | Harga |
---|---|
pratinjau-penggunaan-komputer Global |
Input: $-/1Jt token Output: $-/1Jt token |
Alat bawaan
API Respons dan API Asisten memungkinkan interaksi yang lancar dengan alat-alat seperti penggunaan komputer, penerjemah kode, pemanggilan fungsi, dan pencarian file, sehingga memudahkan pengembang dalam membangun agen AI.
Alat | Input |
---|---|
Penggunaan Komputer (API Respons saja) |
Input: $-/1Jt token Output: $-/1Jt token |
Panggilan Alat Pencarian File (API Respons saja) | $-/1K pemanggilan alat |
Pencarian File* | $-/GB penyimpanan vektor per hari (gratis 1 GB) |
Penerjemah Kode** | $-/sesi |
*GB mengacu pada gigabyte biner, berarti 1 gb sama dengan 2^30 byte.
**Dua sesi Penerjemah Kode (2 * $-) akan dibuat jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua utas yang berbeda. Setiap sesi aktif secara default selama satu jam, yang berarti bahwa Anda hanya akan membayar biaya ini satu kali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di utas yang sama hingga satu jam.
Biaya inferensi (input dan output) bervariasi berdasarkan model GPT yang digunakan dengan setiap Asisten. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan dalam dua utas yang berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $-). Setiap sesi aktif secara default selama satu jam, yang berarti harga adalah untuk hingga satu jam memberikan instruksi kepada Penerjemah Kode di utas yang sama.
Realtime API
Diunggulkan dalam API Realtime, GPT-4o-Realtime-Preview mendukung kemampuan ucapan ke ucapan multibahasa. Dioptimalkan untuk percakapan real time dengan latensi rendah, memungkinkan interaksi alami dengan penundaan minimal, ideal untuk chatbot dan AI percakapan. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.
Model | Harga (1Jt Token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zona Data |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
API Penyelesaian Obrolan
Model GPT 4o-Audio-Preview yang ditampilkan dalam Chat Completions API dapat memproses dan menghasilkan konten audio. Aplikasi ini mendukung fitur-fitur canggih seperti pengenalan suara dan sintesis audio, yang ideal untuk interaksi suara asinkron dan analisis sentimen. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.
Model | Harga (1Jt Token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zona Data |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o
GPT-4o adalah model multimodal paling canggih yang lebih cepat dan lebih murah daripada GPT-4 Turbo dengan kemampuan penglihatan yang lebih kuat. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-2024-1120 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4o-2024-08-06 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4o-2024-0513 Global |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 AS/UE – Zona Data |
Input: $- Output: $- |
T/T |
GPT-4o-2024-0513 Regional |
Input: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
GPT-4o mini
GPT-4o mini adalah model kecil yang paling hemat biaya, dan memiliki kemampuan penglihatan. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
Disediakan
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Model | PTU Min | Harga PTU Per Jam | Harga Reservasi Bulanan PTU | Harga Reservasi Tahunan PTU |
---|---|---|---|---|
GPT-4.1 Global | 15 | $- | $- | $- |
Zona Data GPT-4.1 | 15 | $- | $- | $- |
GPT-4.1 Regional | 50 | $- | $- | $- |
GPT-4.1-mini Global | 15 | $- | $- | $- |
GPT-4.1-mini Zona Data AS/UE | 15 | $- | $- | $- |
GPT-4.1-mini Regional | 25 | $- | $- | $- |
GPT-4.1-nano Global | 15 | $- | $- | $- |
GPT-4.1-nano Zona Data AS/UE | 15 | $- | $- | $- |
GPT-4.1-nano Regional | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 Global | 15 | $- | $- | $- |
o3 Zona Data AS/UE | 15 | $- | $- | $- |
o3 Regional | 50 | $- | $- | $- |
o4-mini Global | 15 | $- | $- | $- |
o4-mini Zona Data AS/UE | 15 | $- | $- | $- |
o4-mini Regional | 25 | $- | $- | $- |
GPT-4o Global | 15 | $- | $- | $- |
Zona Data AS/UE GPT-4o | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o-Regional yang Disempurnakan | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Zona Data GPT-4o Mini AS/UE | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
GPT-4o-Regional Mini yang Disempurnakan | 25 | $- | $- | $- |
Rencanakan dengan Kalkulator Harga
Model dasar
Model | Penggunaan per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Menyempurnakan model
Model | Harga | |
---|---|---|
o4-mini (Penyempurnaan Penguatan) | Regional |
Input: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/jam Hosting: $-/jam Input grader: o4-mini: $-/1Jt token 4.1-mini: $-/1Jt token 4.1: $-/1Jt token 4.1-nano: $-/1Jt token o3: $-/1Jt token Input cache grader: o4-mini: $-/1Jt token 4.1-mini: $-/1Jt token 4.1: $-/1Jt token 4.1-nano: $-/1Jt token o3: $-/1Jt token Output grader: o4-mini: $-/1Jt token 4.1-mini: $-/1Jt token 4.1: $-/1Jt token 4.1-nano: $-/1Jt token o3: $-/1Jt token |
Global |
Input: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/jam Hosting: $-/jam Input grader: o4-mini: $-/1Jt token 4.1-mini: $-/1Jt token 4.1: $-/1Jt token 4.1-nano: $-/1Jt token o3: $-/1Jt token Input cache grader: o4-mini: $-/1Jt token 4.1-mini: $-/1Jt token 4.1: $-/1Jt token 4.1-nano: $-/1Jt token o3: $-/1Jt token Output grader: o4-mini: $-/1Jt token 4.1-mini: $-/1Jt token 4.1: $-/1Jt token 4.1-nano: $-/1Jt token o3: $-/1Jt token |
|
GPT-4.1 | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
|
Pengembang |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token |
|
GPT-4.1-mini | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
|
Pengembang |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token |
|
GPT-4.1-nano | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
|
Pengembang |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token |
|
GPT-4o-2024-08-06 | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: gunakan regional Hosting: $-/jam |
|
GPT-4o-mini | Regional |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Global |
Input: $-/1Jt token Input Cache: $-/1Jt token Output: $-/1Jt token Pelatihan: gunakan regional Hosting: $-/jam |
|
GPT-3.5-Turbo (16K) | Regional |
Input: $-/1Jt token Output: $-/1Jt token Pelatihan: $-/1Jt token Hosting: $-/jam |
Model gambar
Model | Kualitas | Resolusi | Harga (per 100 gambar) |
---|---|---|---|
Dall-E-3 | Standar | 1024 * 1024 | $- |
Standar | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standar | 1024 * 1024 | $- |
Menyematkan model
Model | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Model Ucapan
Model | Harga |
---|---|
Berbisik | $-/jam |
TTS (Teks ke Ucapan) | $-/1Jt karakter |
TTS HD | $-/1Jt karakter |
Model Bahasa Lama
Model | Konteks | Input (Per Token 1M) | Output (Per 1Jt Token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung
Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.
Bicara dengan spesialis penjualanLihat cara pembelian
Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.
Jelajahi opsi AndaSumber daya tambahan
Azure OpenAI Service
Pelajari selengkapnya tentang fitur dan kemampuan Azure OpenAI Service.
Kalkulator harga
Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.
SLA
Tinjau Perjanjian Tingkat Layanan untuk Azure OpenAI Service.
Dokumentasi
Tinjau tutorial teknis, video, dan Azure OpenAI Service sumber daya lainnya.
Tanya jawab umum
-
Azure OpenAI Service menawarkan harga berdasarkan PAYG dan Unit Throughput yang Disediakan (PTU). PAYG memungkinkan Anda untuk membayar sumber daya yang Anda gunakan, menjadikannya fleksibel bagi beragam beban kerja. PTU menawarkan model harga yang dapat diprediksi tempat Anda mereservasi dan menyebarkan jumlah kapasitas pemrosesan model tertentu. Model ini ideal untuk beban kerja dengan pola penggunaan yang konsisten atau dapat diprediksi, memberikan stabilitas dan kontrol biaya.
-
Untuk mempelajari selengkapnya tentang harga PTUs dan Azure OpenAI, baca dokumentasi PTU atau hubungi spesialis penjualan kami.
Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.
Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.