주 콘텐츠로 건너뛰기
Azure

Azure OpenAI Service 가격

Azure OpenAI Service 가격 책정 개요

유연한 표준(주문형) 및 PTU(프로비전된 처리량 단위)를 사용하여 Azure OpenAI Service의 생성형 AI 모델의 기능을 활용하세요. 표준 모델을 사용하면 처리된 토큰에 대해서만 비용을 지불할 수 있으며, PTU는 확장 가능한 솔루션에 대해 일관된 처리량과 최소 대기 시간 차이를 보장합니다. 가격에는 토큰 1,000개당 비용이 포함되며 PTU 요금은 예측 가능한 비용 구조를 제공합니다. 언어 모델은 이제 글로벌 표준 가격 책정에 대해 50% 할인된 가격으로 24시간 이내에 완료를 반환하는 Batch API에서도 사용할 수 있습니다. Azure OpenAI Service는 GPT-4o, 사용자 지정을 위한 미세 조정, 이미지 생성을 위한 DALL-E 및 음성 텍스트 변환을 위한 Whisper와 같은 고급 기능을 제공합니다. AI 배포 최적화에 대한 개인 설정된 지침은 영업 전문가에게 문의하세요.

가격 옵션 살펴보기

필터를 적용하여 요구 사항에 맞게 가격 옵션을 사용자 지정하세요.

가격은 예상값일 뿐이며 실제 가격 견적이 아닙니다. 실제 가격 책정은 Microsoft와 체결한 계약 유형, 구매 날짜 및 환율에 따라 다를 수 있습니다. 가격은 미국 달러를 기준으로 계산되며 전월 마지막 영업일 이전 영업일 기준 2일 동안 수집된 런던 종가 현물 환율을 사용하여 변환됩니다. 월말 전 영업일 기준 2일이 주요 시장의 공휴일인 경우에는 통상 영업일 기준 2일의 직전일을 기준금리 설정일로 합니다. 이 비율은 다가오는 달의 모든 거래에 적용됩니다. Azure 가격 책정 계산기에 로그인하여 Microsoft의 현재 프로그램/제안을 기반으로 가격 책정을 확인하세요. 가격 책정에 대한 자세한 내용을 알아보거나 가격 견적을 요청하려면 Azure 영업 전문가에게 문의하세요. Azure 가격 책정에 대한 자주 묻는 질문을 참조하세요.

가격 책정 세부 정보:

언어 모델

모델 컨텍스트 Input (Per 1,000,000 tokens) Output (Per 1,000,000 tokens) 시간당 PTU당 가격 최소 크기 조정 증분 PTU당 월간 예약 PTU당 연간 예약
o1 preview Global Deployment 128K $- $- 해당 없음 해당 없음 해당 없음 해당 없음
o1 preview Regional API 128K $- $- 해당 없음 해당 없음 해당 없음 해당 없음
o1 mini Global Deployment 128K $- $- 해당 없음 해당 없음 해당 없음 해당 없음
o1 mini Regional API 128K $- $- 해당 없음 해당 없음 해당 없음 해당 없음
gpt-4o-2024-08-06 Global Deployment 128K $- $- 해당 없음 해당 없음 해당 없음 해당 없음
gpt-4o-2024-08-06 Regional API 128K $- $- 해당 없음 해당 없음 해당 없음 해당 없음
GPT-4o 글로벌 배포 128K $- $- $- 50 PTU $- $-
GPT-4o 지역 API 128K $- $- $- 50 PTU $- $-
GPT-4o-mini 전역 배포 128K $- $- $- 25 PTU $- $-
GPT-4o-mini 지역 API 128K $- $- $- 25 PTU $- $-

이 표에서는 다양한 언어 모델에 대한 표준(주문형) 가격과 프로비전된(PTU) 가격을 자세히 비교합니다. 'Context' 열은 각 모델이 응답당 처리할 수 있는 최대 토큰 수를 지정합니다. 1,000개 토큰당 비용을 반영하여 입력 및 출력 토큰에 대한 가격 세부 정보가 나열됩니다. PTU 가격 책정 모델에는 시간당 요금과 각 모델에 필요한 최소 PTU 수를 나타내는 최소 크기 조정 증분이 포함됩니다. "PTU당 월간 예약" 및 "PTU당 연간 예약" 열은 PTU당 예약 비용을 나타냅니다. 이 비교는 사용자가 표준(주문형) 및 프로비전된(PTU) 청구 옵션 모두에서 각 모델을 사용할 경우의 비용 영향을 이해하여 특정 사용량 요구 사항에 따라 정보에 입각한 결정을 내릴 수 있도록 합니다.

언어 모델은 이제 글로벌 표준 가격 책정에 대한 50% 할인을 위해 24시간 이내에 완료를 반환하는 Batch API를 사용할 수 있습니다.

레거시 언어 모델

모델 컨텍스트 Input (Per 1,000,000 tokens) Output (Per 1,000,000 tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32k $- $-

도우미 API

도우미 API와 해당 도구를 사용하면 개발자가 애플리케이션에서 AI 도우미를 손쉽게 빌드할 수 있습니다.

도우미 API에 사용되는 토큰은 각 도우미와 함께 사용되는 토큰 입출력 속도별로 선택한 언어 모델로 청구됩니다. 또한 도구 사용량에 대해 다음 요금이 부과됩니다.

도구 입력
파일 검색* 하루 $-/GB의 벡터 스토리지(1GB 무료)
코드 인터프리터** $-/세션

*GB는 이진 기가바이트(1gb는 2^30바이트)를 나타냅니다.

**도우미가 서로 다른 두 스레드에서 코드 인터프리터를 동시에 호출하는 경우 두 개의 코드 인터프리터 세션(2 * $-)이 만들어집니다. 각 세션은 기본적으로 1시간 동안 활성화되므로 사용자가 동일한 스레드에서 코드 인터프리터에게 최대 1시간 동안 계속 지침을 제공하는 경우 이 요금은 한 번만 지불하면 됩니다.

유추 비용(입력 및 출력)은 각 도우미에 사용되는 GPT 모델에 따라 달라집니다. 도우미가 서로 다른 두 스레드에서 코드 인터프리터를 동시에 호출하는 경우 두 개의 코드 인터프리터 세션(2 * $-)이 만들어집니다. 각 세션은 기본적으로 1시간 동안 활성화됩니다. 즉, 가격은 동일한 스레드에서 코드 인터프리터에 지침을 제공하는 최대 1시간에 대한 가격입니다.

기본 모델

모델 토큰 1,000개당 사용량
Babbage-002 $-
Davinci-002 $-

미세 조정 모델

모델 토큰 1,000개당 학습 시간당 호스팅 1,000개 토큰당 입력 사용량 1,000개 토큰당 출력 사용량
Babbage-002 $- $- $- $-
Davinci-002 $- $- $- $-
GPT-3.5-Turbo(4K) $- $- $- $-
GPT-3.5-Turbo(16K) $- $- $- $-
GPT-4(8K) $- $- $- $-
GPT-4o $- $- $- $-
GPT-4o-mini $- $- $- $-

이미지 모델

모델 품질 해상도 가격(이미지 100개당)
Dall-E-3 표준 1024 * 1024 $-
표준 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 표준 1024 * 1024 $-

모델 포함

모델 토큰 1,000개당
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

음성 모델

모델 가격
속삭임 $-/시간
TTS(Text to Speech) $-/1M 문자
TTS HD $-/1M 문자

Azure 가격 책정 및 구매 옵션

Microsoft와 직접 연락하기

Azure 가격 책정을 살펴보세요. 클라우드 솔루션의 가격 책정을 이해하고 비용 최적화에 대해 알아보고 사용자 지정 제안을 요청하세요.

판매 전문가에게 문의하기

구매 방법 확인

Azure 웹 사이트, Microsoft 담당자 또는 Azure 파트너를 통해 Azure 서비스를 구매하세요.

옵션 살펴보기

추가 리소스

Azure OpenAI Service

Azure OpenAI Service 기능에 대해 자세히 알아보세요.

가격 계산기

요구 사항에 맞는 모든 Azure 제품을 사용하는 데 드는 월별 예상 비용을 산출해 보세요.

SLA

Azure OpenAI Service에 대한 서비스 수준 계약을 검토하세요.

설명서

기술 자습서, 동영상, 추가 Azure OpenAI Service 리소스를 검토하세요.

  • Azure OpenAI Service는 종량제 및 프로비전된 처리량 단위(PTU)를 모두 기준으로 가격 책정을 제공합니다. 종량제를 사용하면 소비한 리소스에 대해 비용을 지불할 수 있어 다양한 워크로드에 유연하게 대처할 수 있습니다. PTU는 특정 양의 모델 처리 용량을 예약하고 배포하는 예측 가능한 가격 책정 모델을 제공합니다. 이 모델은 일관성이 있거나 예측 가능한 사용 패턴이 있는 워크로드에 적합하며 안정성과 비용 제어를 제공합니다.
  • PTU 및 Azure Open AI 가격 책정에 대해 자세히 알아보려면 PTU 설명서를 읽거나 영업 전문가에게 문의하세요.

판매 전문가에게 문의하여 Azure 가격을 알아보세요. 클라우드 솔루션의 가격을 파악하세요.

별도 비용이 없는 클라우드 서비스와 $200 크레딧을 사용하여 30일간 Azure를 체험해 보세요.

예상 비용에 추가되었습니다. 계산기에서 보려면 ‘v’를 누르세요.
무엇을 도와 드릴까요?