Lompati ke konten utama
Azure

Harga Azure OpenAI Service

Gambaran umum harga Azure OpenAI Service

Azure OpenAI Service memberikan AI generatif siap dipakai perusahaan dengan model canggih dari OpenAI, memungkinkan organisasi berinovasi dengan kemampuan teks, audio, dan penglihatan. Selain model canggih, perusahaan memilih Azure OpenAI Service untuk privasi data bawaan, fleksibilitas regional/area/global, dan integrasi tanpa hambatan ke ekosistem Azure termasuk Fabric, Cosmos DB, dan Azure AI Search. Perusahaan dalam segala ukuran dapat menskalakan solusi AI dengan percaya diri untuk meningkatkan pengalaman pelanggan, mengotomatiskan alur kerja, dan membuka potensi kreatif, mendorong dampak yang dapat diukur dan diferensiasi yang kompetitif.

Untuk membantu pelanggan dalam perjalanan, kami menawarkan solusi manajemen harga dan biaya untuk memenuhi kebutuhan Anda. termasuk:
  • Standar (Sesuai Permintaan): Bayar sesuai penggunaan untuk token input dan output.
  • Disediakan (PTU): Alokasikan throughput dengan biaya yang dapat diprediksi, dengan reservasi bulanan dan tahunan yang tersedia untuk mengurangi pengeluaran secara keseluruhan.
  • Batch API: Model bahasa kini juga tersedia di Batch API untuk penyebaran global dan tiga wilayah, yang mengembalikan penyelesaian dalam waktu 24 jam untuk diskon sebesar 50% dari Harga Standar Global.
Anda dapat memilih dari tipe penyebaran berikut untuk Standar dan Disediakan, yang memungkinkan fleksibilitas dan kontrol harga dan penyebaran yang lebih besar. Fleksibilitas ini membantu ketika ada batas pemrosesan data yang semakin ketat dan kebutuhan untuk peningkatan throughput dan harga yang lebih rendah.
  • Penyebaran Global – SKU Global
  • Penyebaran Zona Data – Berbasis geografis (UE atau AS)
  • Penyebaran Regional – Wilayah Lokal (hingga 27 wilayah)

Jelajahi opsi harga

Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.

Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.

o3

o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o3 2025-04-16 Input: $-
Input Cache: $-
Output: $-
T/T

o4-mini

o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o4-mini 2025-04-16 Input: $-
Input Cache: $-
Output: $-
T/T

GPT-4.1 series

GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4.1-2025-04-14 Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4.1-mini-2025-04-14 Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4.1-nano-2025-04-14 Input: $-
Input Cache: $-
Output: $-
T/T

GPT-4.5

GPT-4.5-pratinjau merupakan model tujuan umum terbaru yang memiliki pengetahuan mendalam tentang dunia dan pemahaman niat pengguna yang lebih baik, sehingga membuatnya unggul dalam tugas kreatif dan perencanaan agentik. Model ini memiliki 128K konteks dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4.5-Preview-2025-02-27 Global Input: $-
Input Cache: $-
Output: $-
T/T

o1

o1 adalah seri model alasan baru untuk tugas kompleks. Model memiliki konteks 200K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o1 2024-12-17 Global Input: $-
Input Cache: $-
Output: $-
T/T
o1 2024-12-17 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
T/T
o1 2024-12-17 Regional Input: $-
Input Cache: $-
Output: $-
T/T
o1 pratinjau 2024-09-12 Global Input: $-
Input Cache: $-
Output: $-
T/T
o1 pratinjau 2024-09-12 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
T/T
o1 pratinjau 2024-09-12 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

o3 Mini

o3 mini adalah versi terbaru dari model o1 mini. o3-mini adalah model penalaran yang cepat dan hemat biaya yang dirancang untuk pengodean, matematika, dan kasus penggunaan sains.

Model o3-mini kini menawarkan jendela input konteks yang diperluas hingga 200K token dan output maksimum 100K token, memberikan ruang yang cukup untuk respons yang kompleks dan mendetail. Model o1 mini memiliki input konteks 128K. Model o3 dan o1 memiliki batas pengetahuan hingga Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o3 mini 2025-01-31 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
o3 mini 2025-01-31-US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
o3 mini 2025-01-31 Regional Input: $-
Input Cache: $-
Output: $-
T/T
o1-mini 2024-09-12 Global Input: $-
Input Cache: $-
Output: $-
T/T
o1-mini-2024-09-12 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
T/T
o1-mini 2024-09-12 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

Agen Pengguna Komputer (CUA)

Agen Pengguna Komputer (CUA) adalah model AI khusus yang memungkinkan AI berinteraksi dengan antarmuka pengguna grafis (GUI), menavigasi aplikasi, dan mengotomatiskan tugas multi-langkah—semuanya melalui instruksi dalam bahasa alami. Model CUA dapat digunakan sebagai alat dalam API Respons.

Model Harga
pratinjau-penggunaan-komputer Global Input: $-/1Jt token
Output: $-/1Jt token

Alat bawaan

API Respons dan API Asisten memungkinkan interaksi yang lancar dengan alat-alat seperti penggunaan komputer, penerjemah kode, pemanggilan fungsi, dan pencarian file, sehingga memudahkan pengembang dalam membangun agen AI.

Alat Input
Penggunaan Komputer (API Respons saja) Input: $-/1Jt token
Output: $-/1Jt token
Panggilan Alat Pencarian File (API Respons saja) $-/1K pemanggilan alat
Pencarian File* $-/GB penyimpanan vektor per hari (gratis 1 GB)
Penerjemah Kode** $-/sesi

*GB mengacu pada gigabyte biner, berarti 1 gb sama dengan 2^30 byte.

**Dua sesi Penerjemah Kode (2 * $-) akan dibuat jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua utas yang berbeda. Setiap sesi aktif secara default selama satu jam, yang berarti bahwa Anda hanya akan membayar biaya ini satu kali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di utas yang sama hingga satu jam.

Biaya inferensi (input dan output) bervariasi berdasarkan model GPT yang digunakan dengan setiap Asisten. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan dalam dua utas yang berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $-). Setiap sesi aktif secara default selama satu jam, yang berarti harga adalah untuk hingga satu jam memberikan instruksi kepada Penerjemah Kode di utas yang sama.

Realtime API

Diunggulkan dalam API Realtime, GPT-4o-Realtime-Preview mendukung kemampuan ucapan ke ucapan multibahasa. Dioptimalkan untuk percakapan real time dengan latensi rendah, memungkinkan interaksi alami dengan penundaan minimal, ideal untuk chatbot dan AI percakapan. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.

Model Harga (1Jt Token)
GPT-4o-Realtime-Preview-2024-12-17-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zona Data Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-

API Penyelesaian Obrolan

Model GPT 4o-Audio-Preview yang ditampilkan dalam Chat Completions API dapat memproses dan menghasilkan konten audio. Aplikasi ini mendukung fitur-fitur canggih seperti pengenalan suara dan sintesis audio, yang ideal untuk interaksi suara asinkron dan analisis sentimen. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.

Model Harga (1Jt Token)
GPT-4o-Audio-Preview-2024-12-17-Global Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-

GPT-4o

GPT-4o adalah model multimodal paling canggih yang lebih cepat dan lebih murah daripada GPT-4 Turbo dengan kemampuan penglihatan yang lebih kuat. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-2024-1120 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4o-2024-08-06 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4o-2024-0513 Global Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 AS/UE – Zona Data Input: $-
Output: $-
T/T
GPT-4o-2024-0513 Regional Input: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

GPT-4o mini

GPT-4o mini adalah model kecil yang paling hemat biaya, dan memiliki kemampuan penglihatan. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-mini-0718 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

Disediakan

Anda dapat mengalokasikan dan mengelola throughput untuk penyebaran, memastikan kinerja yang dapat diprediksi dan kapasitas stabil. Anda dikenakan tarif per jam per model terlepas dari penggunaan, tetapi Anda juga dapat mengamankan penghematan tambahan melalui reservasi bulanan dan tahunan. Temukan cara mengalihkan penyebaran regional dan reservasi yang disediakan ke zona global dan data di halaman Pelajari ini.

Model PTU Min Harga PTU Per Jam Harga Reservasi Bulanan PTU Harga Reservasi Tahunan PTU
GPT-4o Global 15 $- $- $-
Zona Data AS/UE GPT-4o 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o-Regional yang Disempurnakan 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Zona Data GPT-4o Mini AS/UE 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
GPT-4o-Regional Mini yang Disempurnakan 25 $- $- $-

Rencanakan dengan Kalkulator Harga

Model dasar

Model Penggunaan per 1.000 token
Babbage-002 $-
Davinci-002 $-

Menyempurnakan model

Model Harga
GPT-4.1 Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
GPT-4.1-mini Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
GPT-4o-2024-08-06 Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: gunakan regional
Hosting: $-/jam
GPT-4o-mini Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: gunakan regional
Hosting: $-/jam
GPT-3.5-Turbo (16K) Regional Input: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
GPT-3.5-Turbo (4K) Regional Input: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam

Model gambar

Model Kualitas Resolusi Harga (per 100 gambar)
Dall-E-3 Standar 1024 * 1024 $-
Standar 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standar 1024 * 1024 $-

Menyematkan model

Model Per 1.000 token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Model Ucapan

Model Harga
Berbisik $-/jam
TTS (Teks ke Ucapan) $-/1Jt karakter
TTS HD $-/1Jt karakter

Model Bahasa Lama

Model Konteks Input (Per Token 1M) Output (Per 1Jt Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung

Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.

Bicara dengan spesialis penjualan

Lihat cara pembelian

Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.

Jelajahi opsi Anda

Sumber daya tambahan

Azure OpenAI Service

Pelajari selengkapnya tentang fitur dan kemampuan Azure OpenAI Service.

Kalkulator harga

Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.

SLA

Tinjau Perjanjian Tingkat Layanan untuk Azure OpenAI Service.

Dokumentasi

Tinjau tutorial teknis, video, dan Azure OpenAI Service sumber daya lainnya.

  • Azure OpenAI Service menawarkan harga berdasarkan PAYG dan Unit Throughput yang Disediakan (PTU). PAYG memungkinkan Anda untuk membayar sumber daya yang Anda gunakan, menjadikannya fleksibel bagi beragam beban kerja. PTU menawarkan model harga yang dapat diprediksi tempat Anda mereservasi dan menyebarkan jumlah kapasitas pemrosesan model tertentu. Model ini ideal untuk beban kerja dengan pola penggunaan yang konsisten atau dapat diprediksi, memberikan stabilitas dan kontrol biaya.
  • Untuk mempelajari selengkapnya tentang harga PTUs dan Azure OpenAI, baca dokumentasi PTU atau hubungi spesialis penjualan kami.

Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.

Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.

Ditambahkan ke perkiraan. Tekan 'v' untuk melihat pada kalkulator