Lompati ke konten utama
Azure

Harga Azure OpenAI Service

Gambaran umum harga Azure OpenAI Service

Azure OpenAI Service memberikan AI generatif siap dipakai perusahaan dengan model canggih dari OpenAI, memungkinkan organisasi berinovasi dengan kemampuan teks, audio, dan penglihatan. Selain model canggih, perusahaan memilih Azure OpenAI Service untuk privasi data bawaan, fleksibilitas regional/area/global, dan integrasi tanpa hambatan ke ekosistem Azure termasuk Fabric, Cosmos DB, dan Azure AI Search. Perusahaan dalam segala ukuran dapat menskalakan solusi AI dengan percaya diri untuk meningkatkan pengalaman pelanggan, mengotomatiskan alur kerja, dan membuka potensi kreatif, mendorong dampak yang dapat diukur dan diferensiasi yang kompetitif.

Untuk membantu pelanggan dalam perjalanan, kami menawarkan solusi manajemen harga dan biaya untuk memenuhi kebutuhan Anda. termasuk:
  • Standar (Sesuai Permintaan): Bayar sesuai penggunaan untuk token input dan output.
  • Disediakan (PTU): Alokasikan throughput dengan biaya yang dapat diprediksi, dengan reservasi bulanan dan tahunan yang tersedia untuk mengurangi pengeluaran secara keseluruhan.
  • Batch API: Model bahasa kini juga tersedia di Batch API untuk penyebaran global dan tiga wilayah, yang mengembalikan penyelesaian dalam waktu 24 jam untuk diskon sebesar 50% dari Harga Standar Global.
Anda dapat memilih dari tipe penyebaran berikut untuk Standar dan Disediakan, yang memungkinkan fleksibilitas dan kontrol harga dan penyebaran yang lebih besar. Fleksibilitas ini membantu ketika ada batas pemrosesan data yang semakin ketat dan kebutuhan untuk peningkatan throughput dan harga yang lebih rendah.
  • Penyebaran Global – SKU Global
  • Penyebaran Zona Data – Berbasis geografis (UE atau AS)
  • Penyebaran Regional – Wilayah Lokal (hingga 27 wilayah)

Jelajahi opsi harga

Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.

Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.

GPT-5 series

Model Harga (1Jt Token)
GPT-5 2025-08-07 Global Input: $-
Input Cache: $-
Output: $-
GPT-5 Data Zone Input: $-
Input Cache: $-
Output: $-
GPT-5-mini Global Input: $-
Input Cache: $-
Output: $-
GPT-5-mini Data Zone Input: $-
Input Cache: $-
Output: $-
GPT-5-nano Global Input: $-
Input Cache: $-
Output: $-
GPT-5-nano Data Zone Input: $-
Input Cache: $-
Output: $-
GPT-5 chat Global Input: $-
Input Cache: $-
Output: $-

Deep Research

Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.

Model Harga
o3-deep research Global Input: $-
Input Cache: $-
Output: $-

o3

o3 adalah model penalaran yang canggih dari model penalaran seri-o, mendorong batas dalam pengodean, matematika, sains, dan persepsi visual. Model ini unggul dalam kueri kompleks yang memerlukan analisis multi-faset dan berkinerja sangat baik dalam tugas visual seperti menganalisis gambar, bagan, dan grafik. Model ini memiliki 200K jendela konteks token dan memiliki batas pengetahuan Juni 2024.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o3 2025-04-16 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
Zona Data o3 2025-04-16 Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
o3 2025-04-16 Regional Input: $-
Input Cache: $-
Output: $-
T/T

o4-mini

o4-mini adalah model penalaran yang ringkas, efisien, dan hemat biaya dari OpenAI seri-o. Model ini unggul dalam tugas matematika, pengodean, dan visual. Model ini memiliki 200K jendela konteks token dan memiliki batas pengetahuan Juni 2024.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o4-mini 2025-04-16 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
Zona Data o4-mini 2025-04-16 Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
o4-mini 2025-04-16 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Seri GPT-4.1

Seri GPT-4.1 adalah model tujuan umum yang sangat canggih dengan pengetahuan dunia yang luas dan kemampuan untuk memahami niat pengguna yang telah ditingkatkan, sehingga sangat mahir dalam tugas kreatif dan perencanaan agentik. Seri ini memiliki 1 juta jendela konteks token dan memiliki batas pengetahuan Juni 2024.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4.1-2025-04-14 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
Zona Data GPT-4.1-2025-04-14 Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4.1-2025-04-14 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4.1-mini-2025-04-14 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
Zona Data GPT-4.1-mini-2025-04-14 Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4.1-mini-2025-04-14 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4.1-nano-2025-04-14 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
Zona Data GPT-4.1-nano-2025-04-14 Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4.1-nano-2025-04-14 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Sora di Azure OpenAI

Sora adalah model AI generatif multimoda yang kini tersedia di Azure AI Foundry, yang didesain untuk membantu tim kreatif mewujudkan ide melalui integrasi yang mengutamakan API yang lancar. Dibangun pada infrastruktur kelas perusahaan Azure, Sora menawarkan penyebaran yang aman dan terukur untuk mengubah konsep menjadi konten visual berkualitas tinggi.

Harga per detik 1-5 detik 6-10 detik 11-15 detik 16-20 detik
480 Persegi $- $- $- $-
480p $- $- $- $-
720 Persegi $- $- $- $-
720p $- $- $- $-
1080 Persegi $- $- $- $-
1080p $- $- $- $-

GPT-Image-1

GPT-image-1 meningkatkan DALL·E dengan kemampuan mengikuti instruksi yang lebih baik, perenderan teks yang akurat, serta bantuan untuk input dan pengeditan citra digital. Harga model ini dihitung per token, dan harga berbeda untuk token teks dan token gambar.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-Image-1 Global Teks Input: $-
Citra Input: $-
Citra Output: $-
T/T
GPT-Image-1 Regional Teks Input: $-
Citra Input: $-
Citra Output: $-
T/T
GPT-Image-1 Zona Data Teks Input: $-
Citra Input: $-
Citra Output: $-
T/T

GPT-4.5

GPT-4.5-pratinjau merupakan model tujuan umum terbaru yang memiliki pengetahuan mendalam tentang dunia dan pemahaman niat pengguna yang lebih baik, sehingga membuatnya unggul dalam tugas kreatif dan perencanaan agentik. Model ini memiliki 128K konteks dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4.5-Preview-2025-02-27 Global Input: $-
Input Cache: $-
Output: $-
T/T

o1

o1 adalah seri model alasan baru untuk tugas kompleks. Model memiliki konteks 200K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o1 2024-12-17 Global Input: $-
Input Cache: $-
Output: $-
T/T
o1 2024-12-17 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
T/T
o1 2024-12-17 Regional Input: $-
Input Cache: $-
Output: $-
T/T
o1 pratinjau 2024-09-12 Global Input: $-
Input Cache: $-
Output: $-
T/T
o1 pratinjau 2024-09-12 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
T/T
o1 pratinjau 2024-09-12 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

o3 Mini

o3 mini adalah versi terbaru dari model o1 mini. o3-mini adalah model penalaran yang cepat dan hemat biaya yang dirancang untuk pengodean, matematika, dan kasus penggunaan sains.

Model o3-mini kini menawarkan jendela input konteks yang diperluas hingga 200K token dan output maksimum 100K token, memberikan ruang yang cukup untuk respons yang kompleks dan mendetail. Model o1 mini memiliki input konteks 128K. Model o3 dan o1 memiliki batas pengetahuan hingga Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
o3 mini 2025-01-31 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
o3 mini 2025-01-31-US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
o3 mini 2025-01-31 Regional Input: $-
Input Cache: $-
Output: $-
T/T
o1-mini 2024-09-12 Global Input: $-
Input Cache: $-
Output: $-
T/T
o1-mini-2024-09-12 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
T/T
o1-mini 2024-09-12 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

Model Audio

Azure OpenAI Service mencakup model audio tingkat lanjut GPT-4o-Transcribe, GPT-4o-Mini-Transcribe, dan GPT-4o-Mini-TTS. Model-model ini meningkatkan kemampuan ucapan ke teks dan teks ke ucapan, menawarkan akurasi tinggi dan output ucapan yang dapat disesuaikan untuk berbagai aplikasi. Ideal untuk pusat panggilan pelanggan, keterangan langsung, dan output suara interaktif karena model memanfaatkan prapelatihan ekstensif dan teknik distilasi canggih untuk kinerja unggul.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-Transcribe Teks
Input: $-
Output: $-

Audio
Input: $-
Output: T/T
T/T
GPT-4o-Mini-Transcribe Teks
Input: $-
Output: $-

Audio
Input: $-
Output: T/T
T/T
GPT-4o-Mini-TTS Teks
Input: $-
Output: T/T

Audio
Input: T/T
Output: $-
T/T

Agen Pengguna Komputer (CUA)

Agen Pengguna Komputer (CUA) adalah model AI khusus yang memungkinkan AI berinteraksi dengan antarmuka pengguna grafis (GUI), menavigasi aplikasi, dan mengotomatiskan tugas multi-langkah—semuanya melalui instruksi dalam bahasa alami. Model CUA dapat digunakan sebagai alat dalam API Respons.

Model Harga
pratinjau-penggunaan-komputer Global Input: $-/1Jt token
Output: $-/1Jt token

Alat bawaan

API Respons dan API Asisten memungkinkan interaksi yang lancar dengan alat-alat seperti penggunaan komputer, penerjemah kode, pemanggilan fungsi, dan pencarian file, sehingga memudahkan pengembang dalam membangun agen AI.

Alat Input
Penggunaan Komputer (API Respons saja) Input: $-/1Jt token
Output: $-/1Jt token
Panggilan Alat Pencarian File (API Respons saja) $-/1K pemanggilan alat
Pencarian File* $-/GB penyimpanan vektor per hari (gratis 1 GB)
Penerjemah Kode** $-/sesi

*GB mengacu pada gigabyte biner, berarti 1 gb sama dengan 2^30 byte.

**Dua sesi Penerjemah Kode (2 * $-) akan dibuat jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua utas yang berbeda. Setiap sesi aktif secara default selama satu jam, yang berarti bahwa Anda hanya akan membayar biaya ini satu kali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di utas yang sama hingga satu jam.

Biaya inferensi (input dan output) bervariasi berdasarkan model GPT yang digunakan dengan setiap Asisten. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan dalam dua utas yang berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $-). Setiap sesi aktif secara default selama satu jam, yang berarti harga adalah untuk hingga satu jam memberikan instruksi kepada Penerjemah Kode di utas yang sama.

Realtime API

Diunggulkan dalam API Realtime, GPT-4o-Realtime-Preview mendukung kemampuan ucapan ke ucapan multibahasa. Dioptimalkan untuk percakapan real time dengan latensi rendah, memungkinkan interaksi alami dengan penundaan minimal, ideal untuk chatbot dan AI percakapan. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.

Model Harga (1Jt Token)
GPT-4o-Realtime-Preview-2024-12-17-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zona Data Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-

API Penyelesaian Obrolan

Model GPT 4o-Audio-Preview yang ditampilkan dalam Chat Completions API dapat memproses dan menghasilkan konten audio. Aplikasi ini mendukung fitur-fitur canggih seperti pengenalan suara dan sintesis audio, yang ideal untuk interaksi suara asinkron dan analisis sentimen. GPT-4o adalah versi komprehensif yang lebih canggih, dirancang untuk tugas-tugas kompleks, sementara GPT-4o Mini adalah opsi yang lebih kecil dan terjangkau, cocok untuk aplikasi sederhana yang memprioritaskan biaya dan kecepatan yang efisien.

Model Harga (1Jt Token)
GPT-4o-Audio-Preview-2024-12-17-Global Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zona Data Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-

GPT-4o

GPT-4o adalah model multimodal paling canggih yang lebih cepat dan lebih murah daripada GPT-4 Turbo dengan kemampuan penglihatan yang lebih kuat. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-2024-1120 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4o-2024-08-06 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4o-2024-0513 Global Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 AS/UE – Zona Data Input: $-
Output: $-
T/T
GPT-4o-2024-0513 Regional Input: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

GPT-4o mini

GPT-4o mini adalah model kecil yang paling hemat biaya, dan memiliki kemampuan penglihatan. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-mini-0718 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

Disediakan

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.

Model PTU Min Harga PTU Per Jam Harga Reservasi Bulanan PTU Harga Reservasi Tahunan PTU
GPT-4.1 Global 15 $- $- $-
Zona Data GPT-4.1 15 $- $- $-
GPT-4.1 Regional 50 $- $- $-
GPT-4.1-mini Global 15 $- $- $-
GPT-4.1-mini Zona Data AS/UE 15 $- $- $-
GPT-4.1-mini Regional 25 $- $- $-
GPT-4.1-nano Global 15 $- $- $-
GPT-4.1-nano Zona Data AS/UE 15 $- $- $-
GPT-4.1-nano Regional 25 $- $- $-
o3-mini Global 15 $- $- $-
o3-mini US/EU Data Zones 15 $- $- $-
o3-mini Regional 25 $- $- $-
o3 Global 15 $- $- $-
o3 Zona Data AS/UE 15 $- $- $-
o3 Regional 50 $- $- $-
o4-mini Global 15 $- $- $-
o4-mini Zona Data AS/UE 15 $- $- $-
o4-mini Regional 25 $- $- $-
GPT-4o Global 15 $- $- $-
Zona Data AS/UE GPT-4o 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o-Regional yang Disempurnakan 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Zona Data GPT-4o Mini AS/UE 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
GPT-4o-Regional Mini yang Disempurnakan 25 $- $- $-

Rencanakan dengan Kalkulator Harga

Model dasar

Model Penggunaan per 1.000 token
Babbage-002 $-
Davinci-002 $-

Menyempurnakan model

Model Harga
o4-mini (Penyempurnaan Penguatan) Regional Input: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/jam
Hosting: $-/jam

Input grader:
o4-mini: $-/1Jt token
4.1-mini: $-/1Jt token
4.1: $-/1Jt token
4.1-nano: $-/1Jt token
o3: $-/1Jt token

Input cache grader:
o4-mini: $-/1Jt token
4.1-mini: $-/1Jt token
4.1: $-/1Jt token
4.1-nano: $-/1Jt token
o3: $-/1Jt token

Output grader:
o4-mini: $-/1Jt token
4.1-mini: $-/1Jt token
4.1: $-/1Jt token
4.1-nano: $-/1Jt token
o3: $-/1Jt token
Global Input: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/jam
Hosting: $-/jam

Input grader:
o4-mini: $-/1Jt token
4.1-mini: $-/1Jt token
4.1: $-/1Jt token
4.1-nano: $-/1Jt token
o3: $-/1Jt token

Input cache grader:
o4-mini: $-/1Jt token
4.1-mini: $-/1Jt token
4.1: $-/1Jt token
4.1-nano: $-/1Jt token
o3: $-/1Jt token

Output grader:
o4-mini: $-/1Jt token
4.1-mini: $-/1Jt token
4.1: $-/1Jt token
4.1-nano: $-/1Jt token
o3: $-/1Jt token
GPT-4.1 Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Pengembang Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
GPT-4.1-mini Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Pengembang Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
GPT-4.1-nano Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Pengembang Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
GPT-4o-2024-08-06 Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: gunakan regional
Hosting: $-/jam
GPT-4o-mini Regional Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam
Global Input: $-/1Jt token
Input Cache: $-/1Jt token
Output: $-/1Jt token
Pelatihan: gunakan regional
Hosting: $-/jam
GPT-3.5-Turbo (16K) Regional Input: $-/1Jt token
Output: $-/1Jt token
Pelatihan: $-/1Jt token
Hosting: $-/jam

Model gambar

Model Kualitas Resolusi Harga (per 100 gambar)
Dall-E-3 Standar 1024 * 1024 $-
Standar 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standar 1024 * 1024 $-

Menyematkan model

Model Per 1.000 token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Model Ucapan

Model Harga
Berbisik $-/jam
TTS (Teks ke Ucapan) $-/1Jt karakter
TTS HD $-/1Jt karakter

Model Bahasa Lama

Model Konteks Input (Per Token 1M) Output (Per 1Jt Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung

Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.

Bicara dengan spesialis penjualan

Lihat cara pembelian

Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.

Jelajahi opsi Anda

Sumber daya tambahan

Azure OpenAI Service

Pelajari selengkapnya tentang fitur dan kemampuan Azure OpenAI Service.

Kalkulator harga

Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.

SLA

Tinjau Perjanjian Tingkat Layanan untuk Azure OpenAI Service.

Dokumentasi

Tinjau tutorial teknis, video, dan Azure OpenAI Service sumber daya lainnya.

  • Azure OpenAI Service menawarkan harga berdasarkan PAYG dan Unit Throughput yang Disediakan (PTU). PAYG memungkinkan Anda untuk membayar sumber daya yang Anda gunakan, menjadikannya fleksibel bagi beragam beban kerja. PTU menawarkan model harga yang dapat diprediksi tempat Anda mereservasi dan menyebarkan jumlah kapasitas pemrosesan model tertentu. Model ini ideal untuk beban kerja dengan pola penggunaan yang konsisten atau dapat diprediksi, memberikan stabilitas dan kontrol biaya.
  • Untuk mempelajari selengkapnya tentang harga PTUs dan Azure OpenAI, baca dokumentasi PTU atau hubungi spesialis penjualan kami.

Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.

Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.

Ditambahkan ke perkiraan. Tekan 'v' untuk melihat pada kalkulator