Gambaran umum harga Azure OpenAI Service
Untuk membantu pelanggan dalam perjalanan, kami menawarkan solusi manajemen harga dan biaya untuk memenuhi kebutuhan Anda. termasuk:
- Standard (Sesuai Permintaan): Bayar sesuai penggunaan untuk token input dan output.
- Provisioned (PTU): Alokasikan throughput dengan biaya yang dapat diprediksi, dengan reservasi bulanan dan tahunan yang tersedia untuk mengurangi pengeluaran keseluruhan.
- Model API: Bahasa kini juga tersedia di API Batchuntuk penyebaran global dan tiga wilayah, yang mengembalikan penyelesaian dalam waktu 24 jam untuk diskon 50% untuk Harga Standar Global.
- Sebaran Global – SKU Global
- Sebaran Zona Data – berbasis Geografis (UE atau AS)
- Sebaran Regional – Wilayah Lokal (hingga 27 wilayah)
Jelajahi opsi harga
Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.
Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.
Entitas pemerintah AS memenuhi syarat untuk membeli layanan Azure Government dari penyedia solusi lisensi tanpa komitmen keuangan di muka, atau secara langsung melalui langganan online bayar sesuai penggunaan.
Penting— Harga dalam R$ hanyalah referensi. Ini adalah transaksi internasional dan harga akhir tunduk pada nilai tukar dan termasuk pajak IOF dan eNF tidak akan diterbitkan.
Entitas pemerintah AS memenuhi syarat untuk membeli layanan Azure Government dari penyedia solusi lisensi tanpa komitmen keuangan di muka, atau secara langsung melalui langganan online bayar sesuai penggunaan.
Penting— Harga dalam R$ hanyalah referensi. Ini adalah transaksi internasional dan harga akhir tunduk pada nilai tukar dan termasuk pajak IOF dan eNF tidak akan diterbitkan.
o1
o1 adalah seri model alasan baru untuk tugas kompleks. Model memiliki konteks 200K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) |
---|---|
o1 1217 Global |
Input: $- Input Cache: $- Output: $- |
o1 1217 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
o1 1217 Regional |
Input: $- Input Cache: $- Output: $- |
o1 pratinjau Global |
Input: $- Input Cache: $- Output: $- |
o1 pratinjau US/EU – Zona Data |
Input: $- Input Cache: $- Output: $- |
Regional pratinjau o1 |
Input: $- Input Cache: $- Output: $- |
Rencanakan dengan Kalkulator Harga
o1 Mini
o1-mini adalah model penalaran yang cepat dan hemat biaya yang disesuaikan dengan kasus pengodean, matematika, dan penggunaan sains. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) |
---|---|
Global |
Input: $- Input Cache: $- Output: $- |
AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Regional |
Input: $- Input Cache: $- Output: $- |
Rencanakan dengan Kalkulator Harga
Realtime API
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Model | Harga (1Jt Token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Teks Input: $- Input Cache: $- Output: $- Audio Input: $- Input Cache: $- Output: $- |
Chat Completions API
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Model | Harga (1Jt Token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Teks Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o
GPT-4o adalah model multimodal paling canggih yang lebih cepat dan lebih murah daripada GPT-4 Turbo dengan kemampuan penglihatan yang lebih kuat. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-2024-1120 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4o-2024-08-06 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 AS/UE – Zona Data |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
GPT-4o-2024-0513 Global |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 AS/UE – Zona Data |
Input: $- Output: $- |
T/T |
GPT-4o-2024-0513 Regional |
Input: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
GPT-4o mini
GPT-4o mini adalah model kecil yang paling hemat biaya, dan memiliki kemampuan penglihatan. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.
Model | Harga (1Jt Token) | Harga dengan API Batch (Token 1M) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
Input: $- Input Cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Input Cache: $- Output: $- |
T/T |
Rencanakan dengan Kalkulator Harga
Disediakan
Anda dapat mengalokasikan dan mengelola throughput untuk penyebaran, memastikan kinerja yang dapat diprediksi dan kapasitas stabil. Anda dikenakan tarif per jam per model terlepas dari penggunaan, tetapi Anda juga dapat mengamankan penghematan tambahan melalui reservasi bulanan dan tahunan. Temukan cara mengalihkan penyebaran regional dan reservasi yang disediakan ke zona global dan data di halaman Pelajari ini.
Model | PTU Min | Harga PTU Per Jam | Harga Reservasi Bulanan PTU | Harga Reservasi Tahunan PTU |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
Zona Data AS/UE GPT-4o | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Zona Data GPT-4o Mini AS/UE | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Rencanakan dengan Kalkulator Harga
Model dasar
Model | Penggunaan per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Menyempurnakan model
Model | Harga | |
---|---|---|
GPT-4o-2024-08-06 | Regional |
Input: $- / 1M token Input Cache: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
Global |
Input: $- / 1M token Input Cache: $- / 1M token Output: $- / 1M token Pelatihan: gunakan regional Hosting: $- /jam |
|
GPT-4o-mini | Regional |
Input: $- / 1M token Input Cache: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
Global |
Input: $- / 1M token Input Cache: $- / 1M token Output: $- / 1M token Pelatihan: gunakan regional Hosting: $- /jam |
|
GPT-4-0613 (8K) | Regional |
Input: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
GPT-3.5-Turbo (16K) | Regional |
Input: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
GPT-3.5-Turbo (4K) | Regional |
Input: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
Babbage-002 |
Input: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
|
Davinci-002 |
Input: $- / 1M token Output: $- / 1M token Pelatihan: $- / 1M token Hosting: $- /jam |
Assistants API
API Asisten dan berbagai alatnya memudahkan pengembang dalam membangun Asisten AI di aplikasi.
Token yang digunakan untuk API Asisten ditagih berdasarkan tarif input/output per token model bahasa yang dipilih yang digunakan pada setiap Asisten. Selain itu, kami mengenakan biaya berikut untuk penggunaan alat:
Alat | Input |
---|---|
Pencarian File* | $-/GB penyimpanan vektor per hari (gratis 1 GB) |
Penerjemah Kode** | $-/sesi |
*GB mengacu pada gigabyte biner, berarti 1 gb sama dengan 2^30 byte.
**Dua sesi Penerjemah Kode (2 * $-) akan dibuat jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua utas yang berbeda. Setiap sesi aktif secara default selama satu jam, yang berarti bahwa Anda hanya akan membayar biaya ini satu kali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di utas yang sama hingga satu jam.
Biaya inferensi (input dan output) bervariasi berdasarkan model GPT yang digunakan dengan setiap Asisten. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan dalam dua utas yang berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $-). Setiap sesi aktif secara default selama satu jam, yang berarti harga adalah untuk hingga satu jam memberikan instruksi kepada Penerjemah Kode di utas yang sama.
Model gambar
Model | Kualitas | Resolusi | Harga (per 100 gambar) |
---|---|---|---|
Dall-E-3 | Standar | 1024 * 1024 | $- |
Standar | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standar | 1024 * 1024 | $- |
Menyematkan model
Model | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Model Ucapan
Model | Harga |
---|---|
Berbisik | $-/jam |
TTS (Teks ke Ucapan) | $-/1Jt karakter |
TTS HD | $-/1Jt karakter |
Model Bahasa Lama
Model | Konteks | Input (Per Token 1M) | Output (Per 1Jt Token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung
Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.
Bicara dengan spesialis penjualanLihat cara pembelian
Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.
Jelajahi opsi AndaSumber daya tambahan
Azure OpenAI Service
Pelajari selengkapnya tentang fitur dan kemampuan Azure OpenAI Service.
Kalkulator harga
Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.
SLA
Tinjau Perjanjian Tingkat Layanan untuk Azure OpenAI Service.
Dokumentasi
Tinjau tutorial teknis, video, dan Azure OpenAI Service sumber daya lainnya.
Tanya jawab umum
-
Azure OpenAI Service menawarkan harga berdasarkan PAYG dan Unit Throughput yang Disediakan (PTU). PAYG memungkinkan Anda untuk membayar sumber daya yang Anda gunakan, menjadikannya fleksibel bagi beragam beban kerja. PTU menawarkan model harga yang dapat diprediksi tempat Anda mereservasi dan menyebarkan jumlah kapasitas pemrosesan model tertentu. Model ini ideal untuk beban kerja dengan pola penggunaan yang konsisten atau dapat diprediksi, memberikan stabilitas dan kontrol biaya.
-
Untuk mempelajari selengkapnya tentang harga PTUs dan Azure Open AI, baca dokumentasi PTU atau hubungi spesialis penjualan kami
Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.
Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.