Lompati ke konten utama
Azure

Harga Azure OpenAI Service

Gambaran umum harga Azure OpenAI Service

Azure OpenAI Service memberikan AI generatif siap pakai perusahaan dengan model canggih dari OpenAI, memungkinkan organisasi berinovasi dengan kemampuan teks, audio, dan penglihatan. Selain model canggih, perusahaan memilih Azure OpenAI Service untuk privasi data bawaan, fleksibilitas regional/area/global, dan integrasi tanpa hambatan ke ekosistem Azure termasuk Fabric, Cosmos DB, dan Azure AI Search. Perusahaan dengan segala ukuran dapat menskalakan solusi AI dengan percaya diri untuk meningkatkan pengalaman pelanggan, mengotomatiskan alur kerja, dan membuka potensi kreatif, mendorong dampak yang dapat diukur dan diferensiasi yang kompetitif.

Untuk membantu pelanggan dalam perjalanan, kami menawarkan solusi manajemen harga dan biaya untuk memenuhi kebutuhan Anda. termasuk:
  • Standard (Sesuai Permintaan): Bayar sesuai penggunaan untuk token input dan output.
  • Provisioned (PTU): Alokasikan throughput dengan biaya yang dapat diprediksi, dengan reservasi bulanan dan tahunan yang tersedia untuk mengurangi pengeluaran keseluruhan.
  • Model API: Bahasa kini juga tersedia di API Batchuntuk penyebaran global dan tiga wilayah, yang mengembalikan penyelesaian dalam waktu 24 jam untuk diskon 50% untuk Harga Standar Global.
Anda dapat memilih dari tipe penyebaran berikut untuk Standar dan Disediakan, yang memungkinkan fleksibilitas dan kontrol harga dan kinerja yang lebih besar. Fleksibilitas ini membantu ketika ada batas pemrosesan data yang semakin ketat dan kebutuhan untuk throughput yang ditingkatkan dan harga yang lebih rendah.
  • Sebaran Global – SKU Global
  • Sebaran Zona Data – berbasis Geografis (UE atau AS)
  • Sebaran Regional – Wilayah Lokal (hingga 27 wilayah)

Jelajahi opsi harga

Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.

Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.

o1

o1 adalah seri model alasan baru untuk tugas kompleks. Model memiliki konteks 200K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token)
o1 1217 Global Input: $-
Input Cache: $-
Output: $-
o1 1217 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
o1 1217 Regional Input: $-
Input Cache: $-
Output: $-
o1 pratinjau Global Input: $-
Input Cache: $-
Output: $-
o1 pratinjau US/EU – Zona Data Input: $-
Input Cache: $-
Output: $-
Regional pratinjau o1 Input: $-
Input Cache: $-
Output: $-

Rencanakan dengan Kalkulator Harga

o1 Mini

o1-mini adalah model penalaran yang cepat dan hemat biaya yang disesuaikan dengan kasus pengodean, matematika, dan penggunaan sains. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token)
Global Input: $-
Input Cache: $-
Output: $-
AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Regional Input: $-
Input Cache: $-
Output: $-

Rencanakan dengan Kalkulator Harga

Realtime API

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.

Model Harga (1Jt Token)
GPT-4o-Realtime-Preview-2024-12-17-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Teks
Input: $-
Input Cache: $-
Output: $-

Audio
Input: $-
Input Cache: $-
Output: $-

Chat Completions API

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.

Model Harga (1Jt Token)
GPT-4o-Audio-Preview-2024-12-17-Global Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Teks
Input: $-
Output: $-

Audio
Input: $-
Output: $-

GPT-4o

GPT-4o adalah model multimodal paling canggih yang lebih cepat dan lebih murah daripada GPT-4 Turbo dengan kemampuan penglihatan yang lebih kuat. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-2024-1120 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4o-2024-08-06 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 AS/UE – Zona Data Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 Regional Input: $-
Input Cache: $-
Output: $-
T/T
GPT-4o-2024-0513 Global Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 AS/UE – Zona Data Input: $-
Output: $-
T/T
GPT-4o-2024-0513 Regional Input: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

GPT-4o mini

GPT-4o mini adalah model kecil yang paling hemat biaya, dan memiliki kemampuan penglihatan. Model memiliki konteks 128K dan batas pengetahuan Oktober 2023.

Model Harga (1Jt Token) Harga dengan API Batch (Token 1M)
GPT-4o-mini-0718 Global Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 US/EU – Data Zones Input: $-
Input Cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 Regional Input: $-
Input Cache: $-
Output: $-
T/T

Rencanakan dengan Kalkulator Harga

Disediakan

Anda dapat mengalokasikan dan mengelola throughput untuk penyebaran, memastikan kinerja yang dapat diprediksi dan kapasitas stabil. Anda dikenakan tarif per jam per model terlepas dari penggunaan, tetapi Anda juga dapat mengamankan penghematan tambahan melalui reservasi bulanan dan tahunan. Temukan cara mengalihkan penyebaran regional dan reservasi yang disediakan ke zona global dan data di halaman Pelajari ini.

Model PTU Min Harga PTU Per Jam Harga Reservasi Bulanan PTU Harga Reservasi Tahunan PTU
GPT-4o Global 15 $- $- $-
Zona Data AS/UE GPT-4o 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Zona Data GPT-4o Mini AS/UE 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Rencanakan dengan Kalkulator Harga

Model dasar

Model Penggunaan per 1.000 token
Babbage-002 $-
Davinci-002 $-

Menyempurnakan model

Model Harga
GPT-4o-2024-08-06 Regional Input: $- / 1M token
Input Cache: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam
Global Input: $- / 1M token
Input Cache: $- / 1M token
Output: $- / 1M token
Pelatihan: gunakan regional
Hosting: $- /jam
GPT-4o-mini Regional Input: $- / 1M token
Input Cache: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam
Global Input: $- / 1M token
Input Cache: $- / 1M token
Output: $- / 1M token
Pelatihan: gunakan regional
Hosting: $- /jam
GPT-4-0613 (8K) Regional Input: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam
GPT-3.5-Turbo (16K) Regional Input: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam
GPT-3.5-Turbo (4K) Regional Input: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam
Babbage-002 Input: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam
Davinci-002 Input: $- / 1M token
Output: $- / 1M token
Pelatihan: $- / 1M token
Hosting: $- /jam

Assistants API

API Asisten dan berbagai alatnya memudahkan pengembang dalam membangun Asisten AI di aplikasi.

Token yang digunakan untuk API Asisten ditagih berdasarkan tarif input/output per token model bahasa yang dipilih yang digunakan pada setiap Asisten. Selain itu, kami mengenakan biaya berikut untuk penggunaan alat:

Alat Input
Pencarian File* $-/GB penyimpanan vektor per hari (gratis 1 GB)
Penerjemah Kode** $-/sesi

*GB mengacu pada gigabyte biner, berarti 1 gb sama dengan 2^30 byte.

**Dua sesi Penerjemah Kode (2 * $-) akan dibuat jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua utas yang berbeda. Setiap sesi aktif secara default selama satu jam, yang berarti bahwa Anda hanya akan membayar biaya ini satu kali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di utas yang sama hingga satu jam.

Biaya inferensi (input dan output) bervariasi berdasarkan model GPT yang digunakan dengan setiap Asisten. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan dalam dua utas yang berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $-). Setiap sesi aktif secara default selama satu jam, yang berarti harga adalah untuk hingga satu jam memberikan instruksi kepada Penerjemah Kode di utas yang sama.

Model gambar

Model Kualitas Resolusi Harga (per 100 gambar)
Dall-E-3 Standar 1024 * 1024 $-
Standar 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standar 1024 * 1024 $-

Menyematkan model

Model Per 1.000 token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Model Ucapan

Model Harga
Berbisik $-/jam
TTS (Teks ke Ucapan) $-/1Jt karakter
TTS HD $-/1Jt karakter

Model Bahasa Lama

Model Konteks Input (Per Token 1M) Output (Per 1Jt Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung

Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.

Bicara dengan spesialis penjualan

Lihat cara pembelian

Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.

Jelajahi opsi Anda

Sumber daya tambahan

Azure OpenAI Service

Pelajari selengkapnya tentang fitur dan kemampuan Azure OpenAI Service.

Kalkulator harga

Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.

SLA

Tinjau Perjanjian Tingkat Layanan untuk Azure OpenAI Service.

Dokumentasi

Tinjau tutorial teknis, video, dan Azure OpenAI Service sumber daya lainnya.

  • Azure OpenAI Service menawarkan harga berdasarkan PAYG dan Unit Throughput yang Disediakan (PTU). PAYG memungkinkan Anda untuk membayar sumber daya yang Anda gunakan, menjadikannya fleksibel bagi beragam beban kerja. PTU menawarkan model harga yang dapat diprediksi tempat Anda mereservasi dan menyebarkan jumlah kapasitas pemrosesan model tertentu. Model ini ideal untuk beban kerja dengan pola penggunaan yang konsisten atau dapat diprediksi, memberikan stabilitas dan kontrol biaya.
  • Untuk mempelajari selengkapnya tentang harga PTUs dan Azure Open AI, baca dokumentasi PTU atau hubungi spesialis penjualan kami

Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.

Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.

Ditambahkan ke perkiraan. Tekan 'v' untuk melihat pada kalkulator