주 콘텐츠로 건너뛰기
Azure

Azure OpenAI Service 가격

Azure OpenAI Service 가격 책정 개요

Azure OpenAI Service는 OpenAI의 강력한 모델을 갖춘 엔터프라이즈급 생성 AI를 제공하여 조직이 텍스트, 오디오 및 비전 기능으로 혁신할 수 있도록 합니다. 기업은 최첨단 모델 외에도 기본 제공 데이터 개인 정보 보호, 지역/지역/지역/글로벌 유연성 및 패브릭, Cosmos DB 및 Azure AI Search를 포함한 Azure 에코시스템에 원활하게 통합할 수 있도록 Azure OpenAI 서비스를 선택합니다. 모든 규모의 회사는 자신 있게 AI 솔루션을 확장하여 고객 환경을 개선하고, 워크플로를 자동화하고, 창의적인 잠재력을 발휘하여 측정 가능한 영향과 경쟁적 차별화를 추진할 수 있습니다.

고객의 여정을 돕기 위해 요구 사항을 충족하는 가격 책정 및 비용 관리 솔루션을 제공합니다. 포함:
  • 표준(주문형): 입력 및 출력 토큰에 대한 종량제입니다.
  • 프로비전(CPU): 예측 가능한 비용으로 처리량을 할당하고 월별 및 연간 예약을 통해 전체 지출을 줄일 수 있습니다.
  • Batch API: 언어 모델은 전역 배포용 Batch API와 3개 지역에서 사용할 수 있으며, 글로벌 표준 가격 책정에서 50% 할인을 위해 24시간 이내에 완료를 반환합니다.
표준 및 프로비저닝에 대해 다음 배포 유형 중에서 선택할 수 있으므로 가격 책정 및 성능을 더 유연하게 제어할 수 있습니다. 이러한 유연성은 점점 더 제한적인 데이터 처리 경계가 있고 처리량을 늘리고 가격을 낮춰야 하는 경우에 도움이 됩니다.
  • 글로벌 배포 – 글로벌 SKU
  • 데이트 영역 배포 – 지리적 기반(EU 또는 미국)
  • 리조널 배포 – 지역(최대 27개 지역)

가격 옵션 살펴보기

필터를 적용하여 요구 사항에 맞게 가격 옵션을 사용자 지정하세요.

가격은 예상값일 뿐이며 실제 가격 견적이 아닙니다. 실제 가격 책정은 Microsoft와 체결한 계약 유형, 구매 날짜 및 환율에 따라 다를 수 있습니다. 가격은 미국 달러를 기준으로 계산되며 전월 마지막 영업일 이전 영업일 기준 2일 동안 수집된 런던 종가 현물 환율을 사용하여 변환됩니다. 월말 전 영업일 기준 2일이 주요 시장의 공휴일인 경우에는 통상 영업일 기준 2일의 직전일을 기준금리 설정일로 합니다. 이 비율은 다가오는 달의 모든 거래에 적용됩니다. Azure 가격 책정 계산기에 로그인하여 Microsoft의 현재 프로그램/제안을 기반으로 가격 책정을 확인하세요. 가격 책정에 대한 자세한 내용을 알아보거나 가격 견적을 요청하려면 Azure 영업 전문가에게 문의하세요. Azure 가격 책정에 대한 자주 묻는 질문을 참조하세요.

o1

o1은 복잡한 작업에 대한 새로운 추론 모델 시리즈입니다. 모델에는 200K 컨텍스트와 2023년 10월 지식 구분이 있습니다.

모델 가격 책정(1M 토큰)
o1 1217 Global 입력: $-
캐시된 입력: $-
출력: $-
o1 1217 미국/EU – 데이터 영역 입력: $-
캐시된 입력: $-
출력: $-
o1 1217 Regional 입력: $-
캐시된 입력: $-
출력: $-
o1 미리 보기 Global 입력: $-
캐시된 입력: $-
출력: $-
o1 preview 미국/EU – 데이터 영역 입력: $-
캐시된 입력: $-
출력: $-
o1 미리 보기 Regional 입력: $-
캐시된 입력: $-
출력: $-

가격 계산기 사용하여 계획

o1 미니

o1-mini는 코딩, 수학 및 과학 사용 사례에 맞게 조정된 빠르고 비용 효율적인 추론 모델입니다. 모델에는 128K 컨텍스트와 2023년 10월 지식 구분이 있습니다.

모델 가격 책정(1M 토큰)
글로벌 입력: $-
캐시된 입력: $-
출력: $-
미국/EU – 데이터 영역 입력: $-
캐시된 입력: $-
출력: $-
지역적 입력: $-
캐시된 입력: $-
출력: $-

가격 계산기 사용하여 계획

실시간 API

실시간 API에 추천되는 GPT-4o-Realtime-Preview는 다국어 음성 대 음성 변환 기능을 지원합니다. 실시간, 짧은 대기 시간 대화에 최적화된 이 기능은 최소한의 지연으로 자연스러운 상호 작용을 가능하게 하며, 챗봇 및 대화형 AI에 적합합니다.

모델 가격 책정(1M 토큰)
GPT-4o-Realtime-Preview-Global 텍스트
입력: $-
캐시된 입력: $-
출력: $-

오디오
입력: $-
캐시된 입력: $-
출력: $-
GPT-4o-Realtime-Preview-미국/EU – 데이터 영역 텍스트
입력: $-
캐시된 입력: $-
출력: $-

오디오
입력: $-
캐시된 입력: $-
출력: $-
GPT-4o-Realtime-Preview-Regional 텍스트
입력: $-
캐시된 입력: $-
출력: $-

오디오
입력: $-
캐시된 입력: $-
출력: $-

Chat Completions API - 출시 예정

채팅 완성 API에 포함된 GPT 4o-Audio-Preview 모델은 오디오 콘텐츠를 처리하고 생성합니다. 비동기 음성 상호 작용 및 감정 분석에 적합한 음성 인식 및 오디오 합성과 같은 고급 기능을 지원합니다. 캐시된 입력이 곧 제공될 예정입니다.

모델 가격 책정(1M 토큰)
GPT-4o-Audio-Preview-Global 텍스트
입력: $-
캐시된 입력: 해당 없음
출력: $-

오디오
입력: $-
캐시된 입력: 해당 없음
출력: $-

GPT-4o

GPT-4o는 더 강력한 비전 기능을 갖춘 GPT-4 Turbo보다 빠르고 저렴한 가장 고급 다중 모달 모델입니다. 모델에는 128K 컨텍스트와 2023년 10월 지식 구분이 있습니다.

모델 가격 책정(1M 토큰) Batch API를 사용한 가격 책정(1M 토큰)
GPT-4o-2024-1120 Global 입력: $-
캐시된 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-2024-1120 US/EU – 데이터 영역 입력: $-
캐시된 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-2024-1120 Regional 입력: $-
캐시된 입력: $-
출력: $-
해당 없음
GPT-4o-2024-08-06 Global 입력: $-
캐시된 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-2024-08-06 미국/EU – 데이터 영역 입력: $-
캐시된 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-2024-08-06 Regional 입력: $-
캐시된 입력: $-
출력: $-
해당 없음
GPT-4o-2024-0513 Global 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-2024-0513 미국/EU – 데이터 영역 입력: $-
출력: $-
해당 없음
GPT-4o-2024-0513 Regional 입력: $-
출력: $-
해당 없음

가격 계산기 사용하여 계획

GPT-4o mini

GPT-4o mini는 가장 비용 효율적인 소형 모델이며 비전 기능이 있습니다. 모델에는 128K 컨텍스트와 2023년 10월 지식 구분이 있습니다.

모델 가격 책정(1M 토큰) Batch API를 사용한 가격 책정(1M 토큰)
GPT-4o-mini-0718 Global 입력: $-
캐시된 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-mini-0718 US/EU – Data Zones 입력: $-
캐시된 입력: $-
출력: $-
입력: $-
출력: $-
GPT-4o-mini-0718 Regional 입력: $-
캐시된 입력: $-
출력: $-
해당 없음

가격 계산기 사용하여 계획

프로비전됨

배포에 대한 처리량을 할당하고 관리하여 예측 가능한 성능과 안정적인 용량을 보장할 수 있습니다. 사용량에 관계없이 모델 마다 시간당 요금이 청구되지만 월별 및 연간 예약을 통해 추가 절감액을 보호할 수도 있습니다. 이 자세한 정보 페이지에서 지역 배포 및 프로비전된 예약을 전역 및 데이터 영역으로 전환하는 방법을 알아봅니다.

모델 최소 PTU PTU 시간별 가격 책정 PTU 월별 예약 가격 PTU 연간 예약 가격
GPT-4o 전역 15 $- $- $-
GPT-4o 미국/EU 데이터 영역 15 $- $- $-
GPT-4o 지역 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU 데이터 영역 15 $- $- $-
GPT-4o 미니 지역 25 $- $- $-

가격 계산기 사용하여 계획

기본 모델

모델 토큰 1,000개당 사용량
Babbage-002 $-
Davinci-002 $-

미세 조정 모델

모델 가격 책정
GPT-4o-2024-08-06 지역적 입력: $-/1M 토큰
캐시된 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간
글로벌 입력: $-/1M 토큰
캐시된 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: 지역별 사용
호스팅: $- /시간
GPT-4o-mini 지역적 입력: $-/1M 토큰
캐시된 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간
글로벌 입력: $-/1M 토큰
캐시된 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: 지역별 사용
호스팅: $- /시간
GPT-4-0613(8K) 지역적 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간
GPT-3.5-Turbo(16K) 지역적 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간
GPT-3.5-Turbo(4K) 지역적 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간
Babbage-002 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간
Davinci-002 입력: $-/1M 토큰
출력: $-/1M 토큰
교육: $-/1M 토큰
호스팅: $- /시간

도우미 API

도우미 API와 해당 도구를 사용하면 개발자가 애플리케이션에서 AI 도우미를 손쉽게 빌드할 수 있습니다.

도우미 API에 사용되는 토큰은 각 도우미와 함께 사용되는 토큰 입출력 속도별로 선택한 언어 모델로 청구됩니다. 또한 도구 사용량에 대해 다음 요금이 부과됩니다.

도구 입력
파일 검색* 하루 $-/GB의 벡터 스토리지(1GB 무료)
코드 인터프리터** $-/세션

*GB는 이진 기가바이트(1gb는 2^30바이트)를 나타냅니다.

**도우미가 서로 다른 두 스레드에서 코드 인터프리터를 동시에 호출하는 경우 두 개의 코드 인터프리터 세션(2 * $-)이 만들어집니다. 각 세션은 기본적으로 1시간 동안 활성화되므로 사용자가 동일한 스레드에서 코드 인터프리터에게 최대 1시간 동안 계속 지침을 제공하는 경우 이 요금은 한 번만 지불하면 됩니다.

유추 비용(입력 및 출력)은 각 도우미에 사용되는 GPT 모델에 따라 달라집니다. 도우미가 서로 다른 두 스레드에서 코드 인터프리터를 동시에 호출하는 경우 두 개의 코드 인터프리터 세션(2 * $-)이 만들어집니다. 각 세션은 기본적으로 1시간 동안 활성화됩니다. 즉, 가격은 동일한 스레드에서 코드 인터프리터에 지침을 제공하는 최대 1시간에 대한 가격입니다.

이미지 모델

모델 품질 해상도 가격(이미지 100개당)
Dall-E-3 표준 1024 * 1024 $-
표준 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 표준 1024 * 1024 $-

모델 포함

모델 토큰 1,000개당
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

음성 모델

모델 가격
속삭임 $-/시간
TTS(Text to Speech) $-/1M 문자
TTS HD $-/1M 문자

레거시 언어 모델

모델 컨텍스트 입력(1M 토큰당) 출력(1M 토큰당)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32k $- $-

Azure 가격 책정 및 구매 옵션

Microsoft와 직접 연락하기

Azure 가격 책정을 살펴보세요. 클라우드 솔루션의 가격 책정을 이해하고 비용 최적화에 대해 알아보고 사용자 지정 제안을 요청하세요.

판매 전문가에게 문의하기

구매 방법 확인

Azure 웹 사이트, Microsoft 담당자 또는 Azure 파트너를 통해 Azure 서비스를 구매하세요.

옵션 살펴보기

추가 리소스

Azure OpenAI Service

Azure OpenAI Service 기능에 대해 자세히 알아보세요.

가격 계산기

요구 사항에 맞는 모든 Azure 제품을 사용하는 데 드는 월별 예상 비용을 산출해 보세요.

SLA

Azure OpenAI Service에 대한 서비스 수준 계약을 검토하세요.

설명서

기술 자습서, 동영상, 추가 Azure OpenAI Service 리소스를 검토하세요.

  • Azure OpenAI Service는 종량제 및 프로비전된 처리량 단위(PTU)를 모두 기준으로 가격 책정을 제공합니다. 종량제를 사용하면 소비한 리소스에 대해 비용을 지불할 수 있어 다양한 워크로드에 유연하게 대처할 수 있습니다. PTU는 특정 양의 모델 처리 용량을 예약하고 배포하는 예측 가능한 가격 책정 모델을 제공합니다. 이 모델은 일관성이 있거나 예측 가능한 사용 패턴이 있는 워크로드에 적합하며 안정성과 비용 제어를 제공합니다.
  • PTU 및 Azure Open AI 가격 책정에 대해 자세히 알아보려면 PTU 설명서를 읽거나 영업 전문가에게 문의하세요.

판매 전문가에게 문의하여 Azure 가격을 알아보세요. 클라우드 솔루션의 가격을 파악하세요.

별도 비용이 없는 클라우드 서비스와 $200 크레딧을 사용하여 30일간 Azure를 체험해 보세요.

예상 비용에 추가되었습니다. 계산기에서 보려면 ‘v’를 누르세요.
무엇을 도와 드릴까요?