Перейти к основному контенту
Azure

Цены на Служба Azure OpenAI

Обзор цен на службу Azure OpenAI

Служба Azure OpenAI предоставляет готовый для предприятий генеративный ИИ с мощными моделями от OpenAI, что позволяет организациям внедрять инновации с использованием текста, звука и визуальных возможностей. Компании выбирают Службу Azure OpenAI за передовые модели, а также за встроенную конфиденциальность данных, региональную/зональную/глобальную гибкость и удобную интеграцию в экосистему Azure, включая Fabric, Cosmos DB и Поиск с использованием ИИ Azure. Компании любого размера могут уверенно масштабировать ИИ-решения для улучшения взаимодействия с клиентами, автоматизации рабочих процессов и раскрытия творческого потенциала с поддержкой измеряемого влияния и возможности обеспечения конкурентных преимуществ.

Чтобы помочь клиентам, мы предлагаем решения по управлению ценами и затратами согласно потребностям, в том числе:
  • Стандартный (по запросу): оплата по мере использования за входные и выходные токены.
  • Подготовленный (PTU): выделение пропускной способности с предсказуемыми затратами и доступными месячными и годовыми резервированиями для сокращения общих расходов.
  • Пакетный API: языковые модели теперь также доступны в пакетном API для глобальных развертываний и трех регионов, который возвращает завершенные проекты в течение 24 часов со скидкой 50 % от глобальных стандартных цен.
Вы можете выбрать следующие типы развертывания для категории "Стандартный" и "Подготовленный", что обеспечивает дополнительную гибкость и возможности управления ценами и производительностью. Такая гибкость помогает при возрастающих ограничениях в отношении границ обработки данных и при необходимости увеличения пропускной способности и снижения цены.
  • Глобальное развертывание — ценовая категория "Глобальный"
  • Развертывание зоны данных — на основе географического расположения (ЕС или США)
  • Региональное развертывание — локальный регион (до 27 регионов)

Изучите варианты оплаты

Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.

Цены являются ориентировочными и не должны рассматриваться как фактические предложения с расценками. Фактические цены могут различаться в зависимости от типа соглашения, заключенного с Майкрософт, от даты покупки и курса обмена валюты. Цены рассчитываются в долларах США и конвертируются на основе спотовых курсов закрытия лондонской биржи, фиксируемых за два рабочих дня до последнего рабочего дня конца предыдущего месяца. Если два рабочих дня до конца месяца выпадают на выходной день на основных рынках, днем установления ставки обычно является день, непосредственно предшествующий этим двум рабочим дням. Данная ставка применяется ко всем транзакциям в течение последующего месяца. Войдите в Калькулятор цен Azure, чтобы увидеть цены на основе вашей текущей программы или предложения от Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить предложение с расценками. Ознакомьтесь с часто задаваемыми вопросами о ценах на Azure.

GPT-5 series

Модель Цены (1 млн токенов)
GPT-5 2025-08-07 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-5 Data Zone Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-5-mini Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-5-mini Data Zone Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-5-nano Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-5-nano Data Zone Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-5 chat Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Deep Research

Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.

Модель Цены
o3-deep research Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

o3

o3 — мощная модель рассуждений из серии o, расширяющая границы возможного в области программирования, математики, естественных наук и визуального восприятия. Она превосходно справляется со сложными запросами, требующими многостороннего анализа, и демонстрирует высокие результаты в визуальных задачах, таких как анализ изображений, диаграмм и графиков. У этой модели контекстное окно на 200 тыс. токенов, отсечка знаний — июнь 2024 года.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
o3 2025-04-16 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Зона данных o3 2025-04-16 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
o3 2025-04-16 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

o4-mini

o4-mini — это компактная, эффективная и экономичная модель рассуждений из серии o от OpenAI. Она превосходно справляется с математикой, программированием и визуальными задачами. У этой модели контекстное окно на 200 тыс. токенов, отсечка знаний — июнь 2024 года.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
o4-mini 2025-04-16 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Зона данных o4-mini 2025-04-16 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
o4-mini 2025-04-16 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Серия GPT-4.1

Серия GPT-4.1 — значительно усовершенствованная модель общего назначения с обширными знаниями о мире и улучшенной способностью понимать намерения пользователей, благодаря чему она особенно эффективна в творческих задачах и агентском планировании. У этой серии контекстное окно на 1 миллион токенов; отсечка знаний — июнь 2024 года.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-4.1-2025-04-14 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Зона данных GPT-4.1-2025-04-14 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4.1-2025-04-14 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
GPT-4.1-mini-2025-04-14 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Зона данных GPT-4.1-mini-2025-04-14 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4.1-mini-2025-04-14 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
GPT-4.1-nano-2025-04-14 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Зона данных GPT-4.1-nano-2025-04-14 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4.1-nano-2025-04-14 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Sora в Azure OpenAI

Sora — это мультимодальная генеративная модель ИИ, теперь доступная в Azure AI Foundry, разработанная для помощи творческим коллективам в реализации идей через беспроблемную интеграцию с API. Созданная на базе инфраструктуры Azure ко, она предлагает безопасное и масштабируемое развертывание для преобразования концепций в высококачественное визуальное содержимое.

Цена за секунду 1-5 с 6-10 с 11-15 с 16-20 с
480, квадрат $- $- $- $-
480p $- $- $- $-
720, квадрат $- $- $- $-
720p $- $- $- $-
1080, квадрат $- $- $- $-
1080p $- $- $- $-

GPT-Image-1

GPT-image-1 улучшает DALL·E, обеспечивая улучшенное выполнение инструкций, точную отрисовку текста и поддержку ввода и редактирования изображений. Стоимость работы модели зависит от числа токенов, при этом цена токенов для текста и для изображений различается.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-Image-1 глобальное Введите текст: $-
Изображение на входе: $-
Изображение на выходе: $-
Н/Д
GPT-Image-1 региональное Введите текст: $-
Изображение на входе: $-
Изображение на выходе: $-
Н/Д
GPT-Image-1 зона данных Введите текст: $-
Изображение на входе: $-
Изображение на выходе: $-
Н/Д

GPT-4.5

GPT-4.5-preview — это новейшая модель общего назначения с глубокими знаниями о мире и улучшенным пониманием намерений пользователей, что делает ее эффективной в выполнении творческих задач и агентном планировании. Объем контекста модели составляет 128 000 токенов, отсечка знаний — октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-4.5-Preview-2025-02-27 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

o1

o1 — новый ряд моделей рассуждений для сложных задач. Объем контекста модели составляет 200 000 входных токенов, отсечка знаний — октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
o1 2024-12-17 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 2024-12-17 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 2024-12-17 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 preview 2024-09-12 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 preview 2024-09-12 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 preview 2024-09-12 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

o3 Mini

o3 mini — это обновленная версия модели o1 mini. o3-mini — это быстрая и экономичная модель рассуждений, адаптированная для вариантов использования в программировании, математике и науке.

Модель o3-mini теперь обладает расширенным окном ввода контекста на 200 тыс. токенов и максимальным выходом в 100 тыс. токенов, что предоставляет достаточно пространства для сложных и детализированных ответов. В модели o1 mini предусмотрен ввод контекста размером 128 тыс. токенов. Обе модели o3 и o1 используют отсечку знаний на октябрь 2023 года.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
o3 mini 2025-01-31 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
o3 mini 2025-01-31-US/EU — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
o3 mini 2025-01-31 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1-mini 2024-09-12 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1-mini 2024-09-12 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1-mini 2024-09-12 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

Модели для работы со звуком

Служба Azure OpenAI включает в себя усовершенствованные модели для работы со звуком GPT-4o-Transcribe, GPT-4o-Mini-Transcribe и GPT-4o-Mini-TTS. Эти модели улучшают возможности преобразования речи в текст и текста в речь, обеспечивая высокую точность и настраиваемость выдаваемой речи для различных приложений. Они идеально подходят для центров обработки звонков клиентов, создания динамических субтитров и синтезируемого интерактивного голоса. При их создании используется широкий набор методов предварительного обучения и усовершенствованной дистилляции для достижения высокого качества.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-4o-Transcribe Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: Н/Д
Н/Д
GPT-4o-Mini-Transcribe Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: Н/Д
Н/Д
GPT-4o-Mini-TTS Текст
Входные данные: $-
Вывод: Н/Д

Аудио
Входные данные: Н/Д
Вывод: $-
Н/Д

Агент, использующий компьютер (CUA)

Агент, использующий компьютер (CUA), — это специализированная модель ИИ, способная взаимодействовать с графическими пользовательскими интерфейсами (GUI), перемещаться по приложениям и автоматизировать многошаговые задачи с помощью инструкций на естественном языке. Модель CUA может использоваться в качестве инструмента в API ответов.

Модель Цены
computer-use-preview Global Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов

Встроенные инструменты

API ответов (Responses API) и API ассистентов (Assistants API) обеспечивают беспроблемное взаимодействие с такими инструментами, как использование компьютера, интерпретатор кода, вызовы функций и поиск файлов, что упрощает разработку ИИ-агентов.

Средство Входные данные
Использование компьютера (только API ответов) Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Вызов средства поиска файлов (только API ответов) $- за 1000 вызовов инструментов
Поиск файлов* $- за ГБ векторного хранилища в день (1 ГБ предоставляется бесплатно)
Интерпретатор кода** $- за сеанс

*ГБ — это двоичный гигабайт, когда 1 ГБ равен 2^30 байт.

**Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это приведет к созданию двух сеансов интерпретаторов кода (2 * $-). Каждый сеанс по умолчанию активен в течение часа. Это означает, что вы будете платить только один раз, если пользователь продолжает давать инструкции интерпретатору кода в одной цепочке в течение часа.

Затраты на вывод (входные и выходные данные) зависят от модели GPT, используемой с каждым помощником. Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это создаст два сеанса интерпретатора кода (2 * $-). По умолчанию каждый сеанс активен в течение одного часа. Это означает, что цена указана за один час предоставления инструкций интерпретатору кода в том же потоке.

API реального времени

Представленное в API Realtime решение GPT-4o-Realtime-Preview поддерживает многоязычные возможности преобразования речи в речь. Оптимизированное для разговоров в реальном времени с минимальной задержкой, оно обеспечивает естественное взаимодействие с минимальной задержкой, что идеально подходит для чат-ботов и разговорного ИИ. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.

Модель Цены (1 млн токенов)
GPT-4o-Realtime-Preview-2024-12-17-Global Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU — зоны данных Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

API завершений чата

Модель GPT 4o-Audio-Preview, используемая в API завершений чата, обрабатывает и генерирует звуковое содержимое. Она поддерживает дополнительные функции, например распознавание речи и синтез звука, что идеально подходит для асинхронного речевого взаимодействия и анализа тональности. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.

Модель Цены (1 млн токенов)
GPT-4o-Audio-Preview-2024-12-17-Global Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-

GPT-4o

GPT-4o — это самая продвинутая мультимодальная модель, которая быстрее и дешевле, чем GPT-4 Turbo, и обладает улучшенными возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
Глобальный GPT-4o-2024-1120 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-2024-1120 для США и ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Региональный GPT-4o-2024-1120 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
Глобальный GPT-4o-2024-08-06 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-2024-08-06 для США и ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Региональный GPT-4o-2024-08-06 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
Глобальный GPT-4o-2024-0513 Входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-2024-0513 для США и ЕС — зоны данных Входные данные: $-
Вывод: $-
Н/Д
Региональный GPT-4o-2024-0513 Входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

GPT-4o mini

GPT-4o mini — это самая экономичная небольшая модель с возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-4o-mini-0718 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-mini-0718 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-mini-0718 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

Подготовленный

Вы можете выделить пропускную способность для развертывания и управлять ею, обеспечивая прогнозируемую производительность и стабильную емкость. С вас будет взиматься почасовая ставка на модель независимо от использования, но вы также можете обеспечить дополнительную экономию за счет месячных и годовых резервирований. Узнайте на этой странице обучения, как перенести региональные развертывания и подготовленные резервирования в глобальные зоны и зоны данных.

Модель Минимальное количество PTU Почасовые цены PTU Цены на месячное резервирование PTU Цены на годовое резервирование PTU
GPT-4.1 Global 15 $- $- $-
Зоны данных GPT-4.1 15 $- $- $-
GPT-4.1 Regional 50 $- $- $-
GPT-4.1-mini Global 15 $- $- $-
GPT-4.1-mini — зоны данных США/ЕС 15 $- $- $-
GPT-4.1-mini Regional 25 $- $- $-
GPT-4.1-nano Global 15 $- $- $-
GPT-4.1-nano — зоны данных США/ЕС 15 $- $- $-
GPT-4.1-nano Regional 25 $- $- $-
o3-mini Global 15 $- $- $-
o3-mini US/EU Data Zones 15 $- $- $-
o3-mini Regional 25 $- $- $-
o3 Global 15 $- $- $-
o3 — зоны данных США/ЕС 15 $- $- $-
o3 Regional 50 $- $- $-
o4-mini Global 15 $- $- $-
o4-mini — зоны данных США/ЕС 15 $- $- $-
o4-mini Regional 25 $- $- $-
Глобальный GPT-4o 15 $- $- $-
Зоны данных США и ЕС для GPT-4o 15 $- $- $-
Региональный GPT-4o 50 $- $- $-
Fine-Tuned GPT-4o-Regional 50 $- $- $-
Глобальный GPT-4o Mini 15 $- $- $-
Зоны данных США/ЕС для GPT-4o Mini 15 $- $- $-
Региональный GPT-4o-Mini 25 $- $- $-
Fine-Tuned GPT-4o-Mini Regional 25 $- $- $-

Планируйте с помощью калькулятора цен

Базовые модели

Модели Использование на 1000 токенов
Babbage-002 $-
Davinci-002 $-

Модели с точной настройкой

Модель Цены
o4-mini (тонкая настройка с подкреплением) Региональный Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/час
Размещение: $-/час

Входные данные оценщика:
o4-mini: $-/1 млн токенов
4.1-mini: $-/1 млн токенов
4.1: $-/1 млн токенов
4.1-nano: $-/1 млн токенов
o3: $-/1 млн токенов

Кэшированные входные данные оценщика:
o4-mini: $-/1 млн токенов
4.1-mini: $-/1 млн токенов
4.1: $-/1 млн токенов
4.1-nano: $-/1 млн токенов
o3: $-/1 млн токенов

Выход оценщика:
o4-mini: $-/1 млн токенов
4.1-mini: $-/1 млн токенов
4.1: $-/1 млн токенов
4.1-nano: $-/1 млн токенов
o3: $-/1 млн токенов
Глобальный Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/час
Размещение: $-/час

Входные данные оценщика:
o4-mini: $-/1 млн токенов
4.1-mini: $-/1 млн токенов
4.1: $-/1 млн токенов
4.1-nano: $-/1 млн токенов
o3: $-/1 млн токенов

Кэшированные входные данные оценщика:
o4-mini: $-/1 млн токенов
4.1-mini: $-/1 млн токенов
4.1: $-/1 млн токенов
4.1-nano: $-/1 млн токенов
o3: $-/1 млн токенов

Выход оценщика:
o4-mini: $-/1 млн токенов
4.1-mini: $-/1 млн токенов
4.1: $-/1 млн токенов
4.1-nano: $-/1 млн токенов
o3: $-/1 млн токенов
GPT-4.1 Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Разработчик Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
GPT-4.1-mini Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Разработчик Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
GPT-4.1-nano Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Разработчик Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
GPT-4o-2024-08-06 Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: использовать региональный
Размещение: $-/час
GPT-4o-mini Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: использовать региональный
Размещение: $-/час
GPT-3.5-Turbo (16K) Региональный Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час

Модели изображений

Модели Качество Разрешение Цена (за 100 изображений)
Dall-E-3 Стандартный 1024 * 1024 $-
Стандартный 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Стандартный 1024 * 1024 $-

Внедрение моделей

Модели На 1000 маркеров
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Модели речи

Модели Цена
Whisper $- в час
Преобразование текста в речь $-/1 миллион символов
TTS HD $-/1 миллион символов

Устаревшие языковые модели

Модели Контекст Входные данные (на 1 млн токенов) Выходные данные (на 1 млн токенов)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16 КБ $- $-
GPT-3.5-Turbo-1106 16 КБ $- $-
GPT-3.5-Turbo-0125 16 КБ $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure: цены и варианты приобретения

Свяжитесь с нами напрямую

Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.

Обратитесь к специалисту по продажам

Узнайте о способах приобретения

Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.

Изучить доступные варианты

Дополнительные ресурсы

Служба Azure OpenAI

Узнайте больше о функциях и возможностях службы "Служба Azure OpenAI".

Калькулятор цен

Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.

Соглашение об уровне обслуживания

Ознакомьтесь с Соглашением об уровне обслуживания для Служба Azure OpenAI.

Документация

Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Служба Azure OpenAI".

Часто задаваемые вопросы

  • Служба Azure OpenAI предлагает расценки как с оплатой по мере использования, так и на основе подготовленных единиц пропускной способности (PTU). Оплата по мере использования позволяет оплатить только потребляемую вами нагрузку, предоставляя гибкость в случае переменных рабочих нагрузок. Оплата на основе PTU предлагает предсказуемую модель ценообразования, которая позволяет резервировать и развертывать определенный объем вычислительной мощности модели. Эта модель идеально подходит для рабочих нагрузок с однообразными или прогнозируемыми графиками использования, так как обеспечивает стабильность и контроль над затратами.
  • Подробнее о ценах на PTU и Azure OpenAI можно узнать в документации по PTU или обратившись к нашему специалисту по продажам.

Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.

К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.

Добавлено для расчета. Щелкните v для просмотра на калькуляторе