Обзор цен на службу Azure OpenAI
Чтобы помочь клиентам, мы предлагаем решения по управлению ценами и затратами согласно потребностям, в том числе:
- Стандартный (по запросу): оплата по мере использования за входные и выходные токены.
- Подготовленный (PTU): выделение пропускной способности с предсказуемыми затратами и доступными месячными и годовыми резервированиями для сокращения общих расходов.
- Пакетный API: языковые модели теперь также доступны в пакетном API для глобальных развертываний и трех регионов, который возвращает завершенные проекты в течение 24 часов со скидкой 50 % от глобальных стандартных цен.
- Глобальное развертывание — ценовая категория "Глобальный"
- Развертывание зоны данных — на основе географического расположения (ЕС или США)
- Региональное развертывание — локальный регион (до 27 регионов)
Изучите варианты оплаты
Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.
Цены являются ориентировочными и не должны рассматриваться как фактические предложения с расценками. Фактические цены могут различаться в зависимости от типа соглашения, заключенного с Майкрософт, от даты покупки и курса обмена валюты. Цены рассчитываются в долларах США и конвертируются на основе спотовых курсов закрытия лондонской биржи, фиксируемых за два рабочих дня до последнего рабочего дня конца предыдущего месяца. Если два рабочих дня до конца месяца выпадают на выходной день на основных рынках, днем установления ставки обычно является день, непосредственно предшествующий этим двум рабочим дням. Данная ставка применяется ко всем транзакциям в течение последующего месяца. Войдите в Калькулятор цен Azure, чтобы увидеть цены на основе вашей текущей программы или предложения от Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить предложение с расценками. Ознакомьтесь с часто задаваемыми вопросами о ценах на Azure.
Государственные структуры США могут приобрести службы "Azure для государственных организаций" у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
Государственные структуры США могут приобрести службы "Azure для государственных организаций" у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
GPT-5 series
Модель | Цены (1 млн токенов) |
---|---|
GPT-5 2025-08-07 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-5 Data Zone |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-5-mini Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-5-mini Data Zone |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-5-nano Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-5-nano Data Zone |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-5 chat Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Модель | Цены |
---|---|
o3-deep research Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
o3
o3 — мощная модель рассуждений из серии o, расширяющая границы возможного в области программирования, математики, естественных наук и визуального восприятия. Она превосходно справляется со сложными запросами, требующими многостороннего анализа, и демонстрирует высокие результаты в визуальных задачах, таких как анализ изображений, диаграмм и графиков. У этой модели контекстное окно на 200 тыс. токенов, отсечка знаний — июнь 2024 года.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
o3 2025-04-16 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Зона данных o3 2025-04-16 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
o3 2025-04-16 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o4-mini
o4-mini — это компактная, эффективная и экономичная модель рассуждений из серии o от OpenAI. Она превосходно справляется с математикой, программированием и визуальными задачами. У этой модели контекстное окно на 200 тыс. токенов, отсечка знаний — июнь 2024 года.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
o4-mini 2025-04-16 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Зона данных o4-mini 2025-04-16 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
o4-mini 2025-04-16 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Серия GPT-4.1
Серия GPT-4.1 — значительно усовершенствованная модель общего назначения с обширными знаниями о мире и улучшенной способностью понимать намерения пользователей, благодаря чему она особенно эффективна в творческих задачах и агентском планировании. У этой серии контекстное окно на 1 миллион токенов; отсечка знаний — июнь 2024 года.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-4.1-2025-04-14 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Зона данных GPT-4.1-2025-04-14 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4.1-2025-04-14 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
GPT-4.1-mini-2025-04-14 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Зона данных GPT-4.1-mini-2025-04-14 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4.1-mini-2025-04-14 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
GPT-4.1-nano-2025-04-14 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Зона данных GPT-4.1-nano-2025-04-14 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4.1-nano-2025-04-14 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Sora в Azure OpenAI
Sora — это мультимодальная генеративная модель ИИ, теперь доступная в Azure AI Foundry, разработанная для помощи творческим коллективам в реализации идей через беспроблемную интеграцию с API. Созданная на базе инфраструктуры Azure ко, она предлагает безопасное и масштабируемое развертывание для преобразования концепций в высококачественное визуальное содержимое.
Цена за секунду | 1-5 с | 6-10 с | 11-15 с | 16-20 с |
---|---|---|---|---|
480, квадрат | $- | $- | $- | $- |
480p | $- | $- | $- | $- |
720, квадрат | $- | $- | $- | $- |
720p | $- | $- | $- | $- |
1080, квадрат | $- | $- | $- | $- |
1080p | $- | $- | $- | $- |
GPT-Image-1
GPT-image-1 улучшает DALL·E, обеспечивая улучшенное выполнение инструкций, точную отрисовку текста и поддержку ввода и редактирования изображений. Стоимость работы модели зависит от числа токенов, при этом цена токенов для текста и для изображений различается.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-Image-1 глобальное |
Введите текст: $- Изображение на входе: $- Изображение на выходе: $- |
Н/Д |
GPT-Image-1 региональное |
Введите текст: $- Изображение на входе: $- Изображение на выходе: $- |
Н/Д |
GPT-Image-1 зона данных |
Введите текст: $- Изображение на входе: $- Изображение на выходе: $- |
Н/Д |
GPT-4.5
GPT-4.5-preview — это новейшая модель общего назначения с глубокими знаниями о мире и улучшенным пониманием намерений пользователей, что делает ее эффективной в выполнении творческих задач и агентном планировании. Объем контекста модели составляет 128 000 токенов, отсечка знаний — октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1
o1 — новый ряд моделей рассуждений для сложных задач. Объем контекста модели составляет 200 000 входных токенов, отсечка знаний — октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
o1 2024-12-17 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 2024-12-17 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 2024-12-17 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 preview 2024-09-12 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 preview 2024-09-12 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 preview 2024-09-12 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
o3 Mini
o3 mini — это обновленная версия модели o1 mini. o3-mini — это быстрая и экономичная модель рассуждений, адаптированная для вариантов использования в программировании, математике и науке.
Модель o3-mini теперь обладает расширенным окном ввода контекста на 200 тыс. токенов и максимальным выходом в 100 тыс. токенов, что предоставляет достаточно пространства для сложных и детализированных ответов. В модели o1 mini предусмотрен ввод контекста размером 128 тыс. токенов. Обе модели o3 и o1 используют отсечку знаний на октябрь 2023 года.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
o3 mini 2025-01-31 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
o3 mini 2025-01-31-US/EU — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
o3 mini 2025-01-31 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1-mini 2024-09-12 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1-mini 2024-09-12 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1-mini 2024-09-12 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
Модели для работы со звуком
Служба Azure OpenAI включает в себя усовершенствованные модели для работы со звуком GPT-4o-Transcribe, GPT-4o-Mini-Transcribe и GPT-4o-Mini-TTS. Эти модели улучшают возможности преобразования речи в текст и текста в речь, обеспечивая высокую точность и настраиваемость выдаваемой речи для различных приложений. Они идеально подходят для центров обработки звонков клиентов, создания динамических субтитров и синтезируемого интерактивного голоса. При их создании используется широкий набор методов предварительного обучения и усовершенствованной дистилляции для достижения высокого качества.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-4o-Transcribe |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: Н/Д |
Н/Д |
GPT-4o-Mini-Transcribe |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: Н/Д |
Н/Д |
GPT-4o-Mini-TTS |
Текст Входные данные: $- Вывод: Н/Д Аудио Входные данные: Н/Д Вывод: $- |
Н/Д |
Агент, использующий компьютер (CUA)
Агент, использующий компьютер (CUA), — это специализированная модель ИИ, способная взаимодействовать с графическими пользовательскими интерфейсами (GUI), перемещаться по приложениям и автоматизировать многошаговые задачи с помощью инструкций на естественном языке. Модель CUA может использоваться в качестве инструмента в API ответов.
Модель | Цены |
---|---|
computer-use-preview Global |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
Встроенные инструменты
API ответов (Responses API) и API ассистентов (Assistants API) обеспечивают беспроблемное взаимодействие с такими инструментами, как использование компьютера, интерпретатор кода, вызовы функций и поиск файлов, что упрощает разработку ИИ-агентов.
Средство | Входные данные |
---|---|
Использование компьютера (только API ответов) |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
Вызов средства поиска файлов (только API ответов) | $- за 1000 вызовов инструментов |
Поиск файлов* | $- за ГБ векторного хранилища в день (1 ГБ предоставляется бесплатно) |
Интерпретатор кода** | $- за сеанс |
*ГБ — это двоичный гигабайт, когда 1 ГБ равен 2^30 байт.
**Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это приведет к созданию двух сеансов интерпретаторов кода (2 * $-). Каждый сеанс по умолчанию активен в течение часа. Это означает, что вы будете платить только один раз, если пользователь продолжает давать инструкции интерпретатору кода в одной цепочке в течение часа.
Затраты на вывод (входные и выходные данные) зависят от модели GPT, используемой с каждым помощником. Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это создаст два сеанса интерпретатора кода (2 * $-). По умолчанию каждый сеанс активен в течение одного часа. Это означает, что цена указана за один час предоставления инструкций интерпретатору кода в том же потоке.
API реального времени
Представленное в API Realtime решение GPT-4o-Realtime-Preview поддерживает многоязычные возможности преобразования речи в речь. Оптимизированное для разговоров в реальном времени с минимальной задержкой, оно обеспечивает естественное взаимодействие с минимальной задержкой, что идеально подходит для чат-ботов и разговорного ИИ. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.
Модель | Цены (1 млн токенов) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU — зоны данных |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
API завершений чата
Модель GPT 4o-Audio-Preview, используемая в API завершений чата, обрабатывает и генерирует звуковое содержимое. Она поддерживает дополнительные функции, например распознавание речи и синтез звука, что идеально подходит для асинхронного речевого взаимодействия и анализа тональности. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.
Модель | Цены (1 млн токенов) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o
GPT-4o — это самая продвинутая мультимодальная модель, которая быстрее и дешевле, чем GPT-4 Turbo, и обладает улучшенными возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
Глобальный GPT-4o-2024-1120 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-2024-1120 для США и ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Региональный GPT-4o-2024-1120 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Глобальный GPT-4o-2024-08-06 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-2024-08-06 для США и ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Региональный GPT-4o-2024-08-06 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Глобальный GPT-4o-2024-0513 |
Входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-2024-0513 для США и ЕС — зоны данных |
Входные данные: $- Вывод: $- |
Н/Д |
Региональный GPT-4o-2024-0513 |
Входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
GPT-4o mini
GPT-4o mini — это самая экономичная небольшая модель с возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-4o-mini-0718 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-mini-0718 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-mini-0718 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
Подготовленный
Вы можете выделить пропускную способность для развертывания и управлять ею, обеспечивая прогнозируемую производительность и стабильную емкость. С вас будет взиматься почасовая ставка на модель независимо от использования, но вы также можете обеспечить дополнительную экономию за счет месячных и годовых резервирований. Узнайте на этой странице обучения, как перенести региональные развертывания и подготовленные резервирования в глобальные зоны и зоны данных.
Модель | Минимальное количество PTU | Почасовые цены PTU | Цены на месячное резервирование PTU | Цены на годовое резервирование PTU |
---|---|---|---|---|
GPT-4.1 Global | 15 | $- | $- | $- |
Зоны данных GPT-4.1 | 15 | $- | $- | $- |
GPT-4.1 Regional | 50 | $- | $- | $- |
GPT-4.1-mini Global | 15 | $- | $- | $- |
GPT-4.1-mini — зоны данных США/ЕС | 15 | $- | $- | $- |
GPT-4.1-mini Regional | 25 | $- | $- | $- |
GPT-4.1-nano Global | 15 | $- | $- | $- |
GPT-4.1-nano — зоны данных США/ЕС | 15 | $- | $- | $- |
GPT-4.1-nano Regional | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 Global | 15 | $- | $- | $- |
o3 — зоны данных США/ЕС | 15 | $- | $- | $- |
o3 Regional | 50 | $- | $- | $- |
o4-mini Global | 15 | $- | $- | $- |
o4-mini — зоны данных США/ЕС | 15 | $- | $- | $- |
o4-mini Regional | 25 | $- | $- | $- |
Глобальный GPT-4o | 15 | $- | $- | $- |
Зоны данных США и ЕС для GPT-4o | 15 | $- | $- | $- |
Региональный GPT-4o | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
Глобальный GPT-4o Mini | 15 | $- | $- | $- |
Зоны данных США/ЕС для GPT-4o Mini | 15 | $- | $- | $- |
Региональный GPT-4o-Mini | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Планируйте с помощью калькулятора цен
Базовые модели
Модели | Использование на 1000 токенов |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Модели с точной настройкой
Модель | Цены | |
---|---|---|
o4-mini (тонкая настройка с подкреплением) | Региональный |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/час Размещение: $-/час Входные данные оценщика: o4-mini: $-/1 млн токенов 4.1-mini: $-/1 млн токенов 4.1: $-/1 млн токенов 4.1-nano: $-/1 млн токенов o3: $-/1 млн токенов Кэшированные входные данные оценщика: o4-mini: $-/1 млн токенов 4.1-mini: $-/1 млн токенов 4.1: $-/1 млн токенов 4.1-nano: $-/1 млн токенов o3: $-/1 млн токенов Выход оценщика: o4-mini: $-/1 млн токенов 4.1-mini: $-/1 млн токенов 4.1: $-/1 млн токенов 4.1-nano: $-/1 млн токенов o3: $-/1 млн токенов |
Глобальный |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/час Размещение: $-/час Входные данные оценщика: o4-mini: $-/1 млн токенов 4.1-mini: $-/1 млн токенов 4.1: $-/1 млн токенов 4.1-nano: $-/1 млн токенов o3: $-/1 млн токенов Кэшированные входные данные оценщика: o4-mini: $-/1 млн токенов 4.1-mini: $-/1 млн токенов 4.1: $-/1 млн токенов 4.1-nano: $-/1 млн токенов o3: $-/1 млн токенов Выход оценщика: o4-mini: $-/1 млн токенов 4.1-mini: $-/1 млн токенов 4.1: $-/1 млн токенов 4.1-nano: $-/1 млн токенов o3: $-/1 млн токенов |
|
GPT-4.1 | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
|
Разработчик |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
|
GPT-4.1-mini | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
|
Разработчик |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
|
GPT-4.1-nano | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
|
Разработчик |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
|
GPT-4o-2024-08-06 | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: использовать региональный Размещение: $-/час |
|
GPT-4o-mini | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: использовать региональный Размещение: $-/час |
|
GPT-3.5-Turbo (16K) | Региональный |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Модели изображений
Модели | Качество | Разрешение | Цена (за 100 изображений) |
---|---|---|---|
Dall-E-3 | Стандартный | 1024 * 1024 | $- |
Стандартный | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Стандартный | 1024 * 1024 | $- |
Внедрение моделей
Модели | На 1000 маркеров |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Модели речи
Модели | Цена |
---|---|
Whisper | $- в час |
Преобразование текста в речь | $-/1 миллион символов |
TTS HD | $-/1 миллион символов |
Устаревшие языковые модели
Модели | Контекст | Входные данные (на 1 млн токенов) | Выходные данные (на 1 млн токенов) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16 КБ | $- | $- |
GPT-3.5-Turbo-1106 | 16 КБ | $- | $- |
GPT-3.5-Turbo-0125 | 16 КБ | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure: цены и варианты приобретения

Свяжитесь с нами напрямую
Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.
Обратитесь к специалисту по продажамУзнайте о способах приобретения
Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.
Изучить доступные вариантыДополнительные ресурсы
Служба Azure OpenAI
Узнайте больше о функциях и возможностях службы "Служба Azure OpenAI".
Калькулятор цен
Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.
Соглашение об уровне обслуживания
Ознакомьтесь с Соглашением об уровне обслуживания для Служба Azure OpenAI.
Документация
Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Служба Azure OpenAI".
Часто задаваемые вопросы
-
Служба Azure OpenAI предлагает расценки как с оплатой по мере использования, так и на основе подготовленных единиц пропускной способности (PTU). Оплата по мере использования позволяет оплатить только потребляемую вами нагрузку, предоставляя гибкость в случае переменных рабочих нагрузок. Оплата на основе PTU предлагает предсказуемую модель ценообразования, которая позволяет резервировать и развертывать определенный объем вычислительной мощности модели. Эта модель идеально подходит для рабочих нагрузок с однообразными или прогнозируемыми графиками использования, так как обеспечивает стабильность и контроль над затратами.
-
Подробнее о ценах на PTU и Azure OpenAI можно узнать в документации по PTU или обратившись к нашему специалисту по продажам.
Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.
К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.