Перейти к основному контенту
Azure

Цены на Служба Azure OpenAI

Обзор цен на службу Azure OpenAI

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
  • Standard (On-Demand): Pay-as-you-go for input and output tokens.
  • Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
  • Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.
  • Global Deployment – Global SKU
  • Data Zone Deployment – Geographic based (EU or US)
  • Regional Deployment – Local Region (up to 27 regions)

Изучите варианты оплаты

Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.

Цены являются ориентировочными и не должны рассматриваться как фактические предложения с расценками. Фактические цены могут различаться в зависимости от типа соглашения, заключенного с Майкрософт, от даты покупки и курса обмена валюты. Цены рассчитываются в долларах США и конвертируются на основе спотовых курсов закрытия лондонской биржи, фиксируемых за два рабочих дня до последнего рабочего дня конца предыдущего месяца. Если два рабочих дня до конца месяца выпадают на выходной день на основных рынках, днем установления ставки обычно является день, непосредственно предшествующий этим двум рабочим дням. Данная ставка применяется ко всем транзакциям в течение последующего месяца. Войдите в Калькулятор цен Azure, чтобы увидеть цены на основе вашей текущей программы или предложения от Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить предложение с расценками. Ознакомьтесь с часто задаваемыми вопросами о ценах на Azure.

o1 Preview

o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Входные данные: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Входные данные: $-
Cached Input: $-
Output: $-
Regional Входные данные: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

o1 Mini

o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Входные данные: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Входные данные: $-
Cached Input: $-
Output: $-
Regional Входные данные: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

Realtime API

Featured in the new Realtime API, the model GPT-4o-Realtime-Preview supports audio/speech capabilities including multilingual speech-to-speech.

Model Pricing (1M Tokens)
GPT-4o-Realtime-Preview-Global Text
Входные данные: $-
Output: $-

Audio
Входные данные: $-
Output: $-

Chat Completions API - Coming soon

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.

Model Pricing (1M Tokens)
GPT-4o-Audio-Preview-Global Text
Входные данные: $-
Cached Input: Н/Д
Output: $-

Audio
Входные данные: $-
Cached Input: Н/Д
Output: $-

GPT-4o

GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
GPT-4o-2024-08-06 Global Входные данные: $-
Cached Input: $-
Output: $-
Входные данные: $-
Output: $-
US/EU – Data Zones Входные данные: $-
Cached Input: $-
Output: $-
Н/Д
Regional Входные данные: $-
Cached Input: $-
Output: $-
Н/Д
GPT-4o-0513 Global Входные данные: $-
Output: $-
Входные данные: $-
Output: $-
US/EU – Data Zones Входные данные: $-
Output: $-
Н/Д
Regional Входные данные: $-
Output: $-
Н/Д

Plan with the Pricing Calculator

GPT-4o mini

GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
Global Входные данные: $-
Cached Input: $-
Output: $-
Входные данные: $-
Output: $-
US/EU – Data Zones Входные данные: $-
Cached Input: $-
Output: $-
Н/Д
Regional Входные данные: $-
Cached Input: $-
Output: $-
Н/Д

Plan with the Pricing Calculator

Provisioned

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations.

Model Min PTUs PTU Hourly pricing PTU Monthly Reservation Pricing PTU Yearly Reservation Pricing
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Plan with the Pricing Calculator

Базовые модели

Модели Использование на 1000 токенов
Babbage-002 $-
Davinci-002 $-

Модели с точной настройкой

Модели Обучение на 1000 маркеров Размещение в час Использование входных данных на 1000 токенов Использование выходных данных на 1000 токенов
Babbage-002 $- $- $- $-
Davinci-002 $- $- $- $-
GPT-3.5-Turbo (4K) $- $- $- $-
GPT-3.5-Turbo (16K) $- $- $- $-
GPT-4 (8K) $- $- $- $-
GPT-4o $- $- $- $-
GPT-4o-mini $- $- $- $-

API помощников

API помощников и инструменты упрощают разработку помощников на основе ИИ в приложениях.

Счета за токены, используемые для API помощников, выставляются по выбранным тарифам ввода и вывода токенов для выбранной языковой модели, используемым каждым помощником. Кроме того, взимается следующая плата за использование инструмента:

Средство Входные данные
Поиск файлов* $- за ГБ векторного хранилища в день (1 ГБ предоставляется бесплатно)
Интерпретатор кода** $- за сеанс

*ГБ — это двоичный гигабайт, когда 1 ГБ равен 2^30 байт.

**Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это приведет к созданию двух сеансов интерпретаторов кода (2 * $-). Каждый сеанс по умолчанию активен в течение часа. Это означает, что вы будете платить только один раз, если пользователь продолжает давать инструкции интерпретатору кода в одной цепочке в течение часа.

Затраты на вывод (входные и выходные данные) зависят от модели GPT, используемой с каждым помощником. Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это создаст два сеанса интерпретатора кода (2 * $-). По умолчанию каждый сеанс активен в течение одного часа. Это означает, что цена указана за один час предоставления инструкций интерпретатору кода в том же потоке.

Модели изображений

Модели Качество Разрешение Цена (за 100 изображений)
Dall-E-3 Стандартный 1024 * 1024 $-
Стандартный 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Стандартный 1024 * 1024 $-

Внедрение моделей

Модели На 1000 маркеров
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Модели речи

Модели Цена
Whisper $- в час
Преобразование текста в речь $-/1 миллион символов
TTS HD $-/1 миллион символов

Устаревшие языковые модели

Модели Контекст Input (Per 1M Tokens) Output (Per 1M Tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16 КБ $- $-
GPT-3.5-Turbo-1106 16 КБ $- $-
GPT-3.5-Turbo-0125 16 КБ $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure: цены и варианты приобретения

Свяжитесь с нами напрямую

Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.

Обратитесь к специалисту по продажам

Узнайте о способах приобретения

Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.

Изучить доступные варианты

Дополнительные ресурсы

Служба Azure OpenAI

Узнайте больше о функциях и возможностях службы "Служба Azure OpenAI".

Калькулятор цен

Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.

Соглашение об уровне обслуживания

Ознакомьтесь с Соглашением об уровне обслуживания для Служба Azure OpenAI.

Документация

Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Служба Azure OpenAI".

Часто задаваемые вопросы

  • Служба Azure OpenAI предлагает расценки как с оплатой по мере использования, так и на основе подготовленных единиц пропускной способности (PTU). Оплата по мере использования позволяет оплатить только потребляемую вами нагрузку, предоставляя гибкость в случае переменных рабочих нагрузок. Оплата на основе PTU предлагает предсказуемую модель ценообразования, которая позволяет резервировать и развертывать определенный объем вычислительной мощности модели. Эта модель идеально подходит для рабочих нагрузок с однообразными или прогнозируемыми графиками использования, так как обеспечивает стабильность и контроль над затратами.
  • Подробнее о расценках на PTU и Azure Open AI можно узнать в документации по PTUили обратившись к нашему специалисту по продажам

Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.

К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.

Добавлено для расчета. Щелкните v для просмотра на калькуляторе