Azure OpenAI Service 가격 책정 개요
고객의 여정을 돕기 위해 요구 사항을 충족하는 가격 책정 및 비용 관리 솔루션을 제공합니다. 포함:
- 표준(주문형): 입력 및 출력 토큰에 대한 종량제입니다.
- 프로비전(CPU): 예측 가능한 비용으로 처리량을 할당하고 월별 및 연간 예약을 통해 전체 지출을 줄일 수 있습니다.
- Batch API: 언어 모델은 전역 배포용 Batch API와 3개 지역에서 사용할 수 있으며, 글로벌 표준 가격 책정에서 50% 할인을 위해 24시간 이내에 완료를 반환합니다.
- 글로벌 배포 – 글로벌 SKU
- 데이트 영역 배포 – 지리적 기반(EU 또는 미국)
- 리조널 배포 – 지역(최대 27개 지역)
가격 옵션 살펴보기
필터를 적용하여 요구 사항에 맞게 가격 옵션을 사용자 지정하세요.
가격은 예상값일 뿐이며 실제 가격 견적이 아닙니다. 실제 가격 책정은 Microsoft와 체결한 계약 유형, 구매 날짜 및 환율에 따라 다를 수 있습니다. 가격은 미국 달러를 기준으로 계산되며 전월 마지막 영업일 이전 영업일 기준 2일 동안 수집된 런던 종가 현물 환율을 사용하여 변환됩니다. 월말 전 영업일 기준 2일이 주요 시장의 공휴일인 경우에는 통상 영업일 기준 2일의 직전일을 기준금리 설정일로 합니다. 이 비율은 다가오는 달의 모든 거래에 적용됩니다. Azure 가격 책정 계산기에 로그인하여 Microsoft의 현재 프로그램/제안을 기반으로 가격 책정을 확인하세요. 가격 책정에 대한 자세한 내용을 알아보거나 가격 견적을 요청하려면 Azure 영업 전문가에게 문의하세요. Azure 가격 책정에 대한 자주 묻는 질문을 참조하세요.
미국 정부 기관은 Azure Government 서비스를 종량제 온라인 구독을 통해 직접 구입하거나 라이선스 솔루션 공급자를 통해 선불 약정 없이 구입할 수 없습니다.
중요: R$로 표시된 가격은 단순 참조용입니다. 국제 거래이기 때문에 최종 가격은 환율과 IOF 세금 포함 여부에 따라 달라집니다. eNF는 발행되지 않습니다.
미국 정부 기관은 Azure Government 서비스를 종량제 온라인 구독을 통해 직접 구입하거나 라이선스 솔루션 공급자를 통해 선불 약정 없이 구입할 수 없습니다.
중요: R$로 표시된 가격은 단순 참조용입니다. 국제 거래이기 때문에 최종 가격은 환율과 IOF 세금 포함 여부에 따라 달라집니다. eNF는 발행되지 않습니다.
o1
o1은 복잡한 작업에 대한 새로운 추론 모델 시리즈입니다. 모델에는 200K 컨텍스트와 2023년 10월 지식 구분이 있습니다.
모델 | 가격 책정(1M 토큰) |
---|---|
o1 1217 Global |
입력: $- 캐시된 입력: $- 출력: $- |
o1 1217 미국/EU – 데이터 영역 |
입력: $- 캐시된 입력: $- 출력: $- |
o1 1217 Regional |
입력: $- 캐시된 입력: $- 출력: $- |
o1 미리 보기 Global |
입력: $- 캐시된 입력: $- 출력: $- |
o1 preview 미국/EU – 데이터 영역 |
입력: $- 캐시된 입력: $- 출력: $- |
o1 미리 보기 Regional |
입력: $- 캐시된 입력: $- 출력: $- |
가격 계산기 사용하여 계획
o1 미니
o1-mini는 코딩, 수학 및 과학 사용 사례에 맞게 조정된 빠르고 비용 효율적인 추론 모델입니다. 모델에는 128K 컨텍스트와 2023년 10월 지식 구분이 있습니다.
모델 | 가격 책정(1M 토큰) |
---|---|
글로벌 |
입력: $- 캐시된 입력: $- 출력: $- |
미국/EU – 데이터 영역 |
입력: $- 캐시된 입력: $- 출력: $- |
지역적 |
입력: $- 캐시된 입력: $- 출력: $- |
가격 계산기 사용하여 계획
실시간 API
실시간 API에 추천되는 GPT-4o-Realtime-Preview는 다국어 음성 대 음성 변환 기능을 지원합니다. 실시간, 짧은 대기 시간 대화에 최적화된 이 기능은 최소한의 지연으로 자연스러운 상호 작용을 가능하게 하며, 챗봇 및 대화형 AI에 적합합니다.
모델 | 가격 책정(1M 토큰) |
---|---|
GPT-4o-Realtime-Preview-Global |
텍스트 입력: $- 캐시된 입력: $- 출력: $- 오디오 입력: $- 캐시된 입력: $- 출력: $- |
GPT-4o-Realtime-Preview-미국/EU – 데이터 영역 |
텍스트 입력: $- 캐시된 입력: $- 출력: $- 오디오 입력: $- 캐시된 입력: $- 출력: $- |
GPT-4o-Realtime-Preview-Regional |
텍스트 입력: $- 캐시된 입력: $- 출력: $- 오디오 입력: $- 캐시된 입력: $- 출력: $- |
Chat Completions API - 출시 예정
채팅 완성 API에 포함된 GPT 4o-Audio-Preview 모델은 오디오 콘텐츠를 처리하고 생성합니다. 비동기 음성 상호 작용 및 감정 분석에 적합한 음성 인식 및 오디오 합성과 같은 고급 기능을 지원합니다. 캐시된 입력이 곧 제공될 예정입니다.
모델 | 가격 책정(1M 토큰) |
---|---|
GPT-4o-Audio-Preview-Global |
텍스트 입력: $- 캐시된 입력: 해당 없음 출력: $- 오디오 입력: $- 캐시된 입력: 해당 없음 출력: $- |
GPT-4o
GPT-4o는 더 강력한 비전 기능을 갖춘 GPT-4 Turbo보다 빠르고 저렴한 가장 고급 다중 모달 모델입니다. 모델에는 128K 컨텍스트와 2023년 10월 지식 구분이 있습니다.
모델 | 가격 책정(1M 토큰) | Batch API를 사용한 가격 책정(1M 토큰) |
---|---|---|
GPT-4o-2024-1120 Global |
입력: $- 캐시된 입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-2024-1120 US/EU – 데이터 영역 |
입력: $- 캐시된 입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-2024-1120 Regional |
입력: $- 캐시된 입력: $- 출력: $- |
해당 없음 |
GPT-4o-2024-08-06 Global |
입력: $- 캐시된 입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-2024-08-06 미국/EU – 데이터 영역 |
입력: $- 캐시된 입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-2024-08-06 Regional |
입력: $- 캐시된 입력: $- 출력: $- |
해당 없음 |
GPT-4o-2024-0513 Global |
입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-2024-0513 미국/EU – 데이터 영역 |
입력: $- 출력: $- |
해당 없음 |
GPT-4o-2024-0513 Regional |
입력: $- 출력: $- |
해당 없음 |
가격 계산기 사용하여 계획
GPT-4o mini
GPT-4o mini는 가장 비용 효율적인 소형 모델이며 비전 기능이 있습니다. 모델에는 128K 컨텍스트와 2023년 10월 지식 구분이 있습니다.
모델 | 가격 책정(1M 토큰) | Batch API를 사용한 가격 책정(1M 토큰) |
---|---|---|
GPT-4o-mini-0718 Global |
입력: $- 캐시된 입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
입력: $- 캐시된 입력: $- 출력: $- |
입력: $- 출력: $- |
GPT-4o-mini-0718 Regional |
입력: $- 캐시된 입력: $- 출력: $- |
해당 없음 |
가격 계산기 사용하여 계획
프로비전됨
배포에 대한 처리량을 할당하고 관리하여 예측 가능한 성능과 안정적인 용량을 보장할 수 있습니다. 사용량에 관계없이 모델 마다 시간당 요금이 청구되지만 월별 및 연간 예약을 통해 추가 절감액을 보호할 수도 있습니다. 이 자세한 정보 페이지에서 지역 배포 및 프로비전된 예약을 전역 및 데이터 영역으로 전환하는 방법을 알아봅니다.
모델 | 최소 PTU | PTU 시간별 가격 책정 | PTU 월별 예약 가격 | PTU 연간 예약 가격 |
---|---|---|---|---|
GPT-4o 전역 | 15 | $- | $- | $- |
GPT-4o 미국/EU 데이터 영역 | 15 | $- | $- | $- |
GPT-4o 지역 | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU 데이터 영역 | 15 | $- | $- | $- |
GPT-4o 미니 지역 | 25 | $- | $- | $- |
가격 계산기 사용하여 계획
기본 모델
모델 | 토큰 1,000개당 사용량 |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
미세 조정 모델
모델 | 가격 책정 | |
---|---|---|
GPT-4o-2024-08-06 | 지역적 |
입력: $-/1M 토큰 캐시된 입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
글로벌 |
입력: $-/1M 토큰 캐시된 입력: $-/1M 토큰 출력: $-/1M 토큰 교육: 지역별 사용 호스팅: $- /시간 |
|
GPT-4o-mini | 지역적 |
입력: $-/1M 토큰 캐시된 입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
글로벌 |
입력: $-/1M 토큰 캐시된 입력: $-/1M 토큰 출력: $-/1M 토큰 교육: 지역별 사용 호스팅: $- /시간 |
|
GPT-4-0613(8K) | 지역적 |
입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
GPT-3.5-Turbo(16K) | 지역적 |
입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
GPT-3.5-Turbo(4K) | 지역적 |
입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
Babbage-002 |
입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
|
Davinci-002 |
입력: $-/1M 토큰 출력: $-/1M 토큰 교육: $-/1M 토큰 호스팅: $- /시간 |
도우미 API
도우미 API와 해당 도구를 사용하면 개발자가 애플리케이션에서 AI 도우미를 손쉽게 빌드할 수 있습니다.
도우미 API에 사용되는 토큰은 각 도우미와 함께 사용되는 토큰 입출력 속도별로 선택한 언어 모델로 청구됩니다. 또한 도구 사용량에 대해 다음 요금이 부과됩니다.
*GB는 이진 기가바이트(1gb는 2^30바이트)를 나타냅니다.
**도우미가 서로 다른 두 스레드에서 코드 인터프리터를 동시에 호출하는 경우 두 개의 코드 인터프리터 세션(2 * $-)이 만들어집니다. 각 세션은 기본적으로 1시간 동안 활성화되므로 사용자가 동일한 스레드에서 코드 인터프리터에게 최대 1시간 동안 계속 지침을 제공하는 경우 이 요금은 한 번만 지불하면 됩니다.
유추 비용(입력 및 출력)은 각 도우미에 사용되는 GPT 모델에 따라 달라집니다. 도우미가 서로 다른 두 스레드에서 코드 인터프리터를 동시에 호출하는 경우 두 개의 코드 인터프리터 세션(2 * $-)이 만들어집니다. 각 세션은 기본적으로 1시간 동안 활성화됩니다. 즉, 가격은 동일한 스레드에서 코드 인터프리터에 지침을 제공하는 최대 1시간에 대한 가격입니다.
이미지 모델
모델 | 품질 | 해상도 | 가격(이미지 100개당) |
---|---|---|---|
Dall-E-3 | 표준 | 1024 * 1024 | $- |
표준 | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | 표준 | 1024 * 1024 | $- |
모델 포함
모델 | 토큰 1,000개당 |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
음성 모델
모델 | 가격 |
---|---|
속삭임 | $-/시간 |
TTS(Text to Speech) | $-/1M 문자 |
TTS HD | $-/1M 문자 |
레거시 언어 모델
모델 | 컨텍스트 | 입력(1M 토큰당) | 출력(1M 토큰당) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32k | $- | $- |
Azure 가격 책정 및 구매 옵션
Microsoft와 직접 연락하기
Azure 가격 책정을 살펴보세요. 클라우드 솔루션의 가격 책정을 이해하고 비용 최적화에 대해 알아보고 사용자 지정 제안을 요청하세요.
판매 전문가에게 문의하기추가 리소스
Azure OpenAI Service
Azure OpenAI Service 기능에 대해 자세히 알아보세요.
가격 계산기
요구 사항에 맞는 모든 Azure 제품을 사용하는 데 드는 월별 예상 비용을 산출해 보세요.
SLA
Azure OpenAI Service에 대한 서비스 수준 계약을 검토하세요.
설명서
기술 자습서, 동영상, 추가 Azure OpenAI Service 리소스를 검토하세요.
자주 묻는 질문
-
Azure OpenAI Service는 종량제 및 프로비전된 처리량 단위(PTU)를 모두 기준으로 가격 책정을 제공합니다. 종량제를 사용하면 소비한 리소스에 대해 비용을 지불할 수 있어 다양한 워크로드에 유연하게 대처할 수 있습니다. PTU는 특정 양의 모델 처리 용량을 예약하고 배포하는 예측 가능한 가격 책정 모델을 제공합니다. 이 모델은 일관성이 있거나 예측 가능한 사용 패턴이 있는 워크로드에 적합하며 안정성과 비용 제어를 제공합니다.
-
PTU 및 Azure Open AI 가격 책정에 대해 자세히 알아보려면 PTU 설명서를 읽거나 영업 전문가에게 문의하세요.
판매 전문가에게 문의하여 Azure 가격을 알아보세요. 클라우드 솔루션의 가격을 파악하세요.
별도 비용이 없는 클라우드 서비스와 $200 크레딧을 사용하여 30일간 Azure를 체험해 보세요.