Обзор цен на службу Azure OpenAI
Чтобы помочь клиентам, мы предлагаем решения по управлению ценами и затратами согласно потребностям, в том числе:
- Стандартный (по запросу): оплата по мере использования за входные и выходные токены.
- Подготовленный (PTU): выделение пропускной способности с предсказуемыми затратами и доступными месячными и годовыми резервированиями для сокращения общих расходов.
- Пакетный API: языковые модели теперь также доступны в пакетном API для глобальных развертываний и трех регионов, который возвращает завершенные проекты в течение 24 часов со скидкой 50 % от глобальных стандартных цен.
- Глобальное развертывание — ценовая категория "Глобальный"
- Развертывание зоны данных — на основе географического расположения (ЕС или США)
- Региональное развертывание — локальный регион (до 27 регионов)
Изучите варианты оплаты
Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.
Цены являются ориентировочными и не должны рассматриваться как фактические предложения с расценками. Фактические цены могут различаться в зависимости от типа соглашения, заключенного с Майкрософт, от даты покупки и курса обмена валюты. Цены рассчитываются в долларах США и конвертируются на основе спотовых курсов закрытия лондонской биржи, фиксируемых за два рабочих дня до последнего рабочего дня конца предыдущего месяца. Если два рабочих дня до конца месяца выпадают на выходной день на основных рынках, днем установления ставки обычно является день, непосредственно предшествующий этим двум рабочим дням. Данная ставка применяется ко всем транзакциям в течение последующего месяца. Войдите в Калькулятор цен Azure, чтобы увидеть цены на основе вашей текущей программы или предложения от Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить предложение с расценками. Ознакомьтесь с часто задаваемыми вопросами о ценах на Azure.
Государственные структуры США могут приобрести службы "Azure для государственных организаций" у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
Государственные структуры США могут приобрести службы "Azure для государственных организаций" у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
GPT-4.5
GPT-4.5-preview — это новейшая модель общего назначения с глубокими знаниями о мире и улучшенным пониманием намерений пользователей, что делает ее эффективной в выполнении творческих задач и агентном планировании. Объем контекста модели составляет 128 000 токенов, отсечка знаний — октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1
o1 — новый ряд моделей рассуждений для сложных задач. Объем контекста модели составляет 200 000 входных токенов, отсечка знаний — октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
o1 2024-12-17 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 2024-12-17 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 2024-12-17 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 preview 2024-09-12 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 preview 2024-09-12 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1 preview 2024-09-12 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
o3 Mini
o3 mini — это обновленная версия модели o1 mini. o3-mini — это быстрая и экономичная модель рассуждений, адаптированная для вариантов использования в программировании, математике и науке.
Модель o3-mini теперь обладает расширенным окном ввода контекста на 200 тыс. токенов и максимальным выходом в 100 тыс. токенов, что предоставляет достаточно пространства для сложных и детализированных ответов. В модели o1 mini предусмотрен ввод контекста размером 128 тыс. токенов. Обе модели o3 и o1 используют отсечку знаний на октябрь 2023 года.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
o3 mini 2025-01-31 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
o3 mini 2025-01-31-US/EU — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
o3 mini 2025-01-31 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1-mini 2024-09-12 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1-mini 2024-09-12 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
o1-mini 2024-09-12 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
Computer-Using Agent (CUA)
The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.
Модель | Цены |
---|---|
computer-use-preview Global |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
Built-in tools
The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.
Средство | Входные данные |
---|---|
Computer Use (Responses API only) |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов |
File Search Tool Call (Responses API only) | $-/1K tool calls |
Поиск файлов* | $- за ГБ векторного хранилища в день (1 ГБ предоставляется бесплатно) |
Интерпретатор кода** | $- за сеанс |
*ГБ — это двоичный гигабайт, когда 1 ГБ равен 2^30 байт.
**Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это приведет к созданию двух сеансов интерпретаторов кода (2 * $-). Каждый сеанс по умолчанию активен в течение часа. Это означает, что вы будете платить только один раз, если пользователь продолжает давать инструкции интерпретатору кода в одной цепочке в течение часа.
Затраты на вывод (входные и выходные данные) зависят от модели GPT, используемой с каждым помощником. Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это создаст два сеанса интерпретатора кода (2 * $-). По умолчанию каждый сеанс активен в течение одного часа. Это означает, что цена указана за один час предоставления инструкций интерпретатору кода в том же потоке.
API реального времени
Представленное в API Realtime решение GPT-4o-Realtime-Preview поддерживает многоязычные возможности преобразования речи в речь. Оптимизированное для разговоров в реальном времени с минимальной задержкой, оно обеспечивает естественное взаимодействие с минимальной задержкой, что идеально подходит для чат-ботов и разговорного ИИ. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.
Модель | Цены (1 млн токенов) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU — зоны данных |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Текст Входные данные: $- Кэшированные входные данные: $- Вывод: $- Аудио Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
API завершений чата
Модель GPT 4o-Audio-Preview, используемая в API завершений чата, обрабатывает и генерирует звуковое содержимое. Она поддерживает дополнительные функции, например распознавание речи и синтез звука, что идеально подходит для асинхронного речевого взаимодействия и анализа тональности. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.
Модель | Цены (1 млн токенов) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — зоны данных |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Текст Входные данные: $- Вывод: $- Аудио Входные данные: $- Вывод: $- |
GPT-4o
GPT-4o — это самая продвинутая мультимодальная модель, которая быстрее и дешевле, чем GPT-4 Turbo, и обладает улучшенными возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
Глобальный GPT-4o-2024-1120 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-2024-1120 для США и ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Региональный GPT-4o-2024-1120 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Глобальный GPT-4o-2024-08-06 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-2024-08-06 для США и ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
Региональный GPT-4o-2024-08-06 |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Глобальный GPT-4o-2024-0513 |
Входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-2024-0513 для США и ЕС — зоны данных |
Входные данные: $- Вывод: $- |
Н/Д |
Региональный GPT-4o-2024-0513 |
Входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
GPT-4o mini
GPT-4o mini — это самая экономичная небольшая модель с возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.
Модель | Цены (1 млн токенов) | Цены с пакетным API (1 млн токенов) |
---|---|---|
GPT-4o-mini-0718 Global |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-mini-0718 США/ЕС — зоны данных |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Входные данные: $- Вывод: $- |
GPT-4o-mini-0718 Regional |
Входные данные: $- Кэшированные входные данные: $- Вывод: $- |
Н/Д |
Планируйте с помощью калькулятора цен
Подготовленный
Вы можете выделить пропускную способность для развертывания и управлять ею, обеспечивая прогнозируемую производительность и стабильную емкость. С вас будет взиматься почасовая ставка на модель независимо от использования, но вы также можете обеспечить дополнительную экономию за счет месячных и годовых резервирований. Узнайте на этой странице обучения, как перенести региональные развертывания и подготовленные резервирования в глобальные зоны и зоны данных.
Модель | Минимальное количество PTU | Почасовые цены PTU | Цены на месячное резервирование PTU | Цены на годовое резервирование PTU |
---|---|---|---|---|
Глобальный GPT-4o | 15 | $- | $- | $- |
Зоны данных США и ЕС для GPT-4o | 15 | $- | $- | $- |
Региональный GPT-4o | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
Глобальный GPT-4o Mini | 15 | $- | $- | $- |
Зоны данных США/ЕС для GPT-4o Mini | 15 | $- | $- | $- |
Региональный GPT-4o-Mini | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Планируйте с помощью калькулятора цен
Базовые модели
Модели | Использование на 1000 токенов |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Модели с точной настройкой
Модель | Цены | |
---|---|---|
GPT-4o-2024-08-06 | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: использовать региональный Размещение: $-/час |
|
GPT-4o-mini | Региональный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Глобальный |
Входные данные: $-/1 млн токенов Кэшированные входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: использовать региональный Размещение: $-/час |
|
GPT-4-0613 (8K) | Региональный |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
GPT-3.5-Turbo (16K) | Региональный |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
GPT-3.5-Turbo (4K) | Региональный |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Babbage-002 |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
|
Davinci-002 |
Входные данные: $-/1 млн токенов Вывод: $-/1 млн токенов Обучение: $-/1 млн токенов Размещение: $-/час |
Модели изображений
Модели | Качество | Разрешение | Цена (за 100 изображений) |
---|---|---|---|
Dall-E-3 | Стандартный | 1024 * 1024 | $- |
Стандартный | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Стандартный | 1024 * 1024 | $- |
Внедрение моделей
Модели | На 1000 маркеров |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Модели речи
Модели | Цена |
---|---|
Whisper | $- в час |
Преобразование текста в речь | $-/1 миллион символов |
TTS HD | $-/1 миллион символов |
Устаревшие языковые модели
Модели | Контекст | Входные данные (на 1 млн токенов) | Выходные данные (на 1 млн токенов) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16 КБ | $- | $- |
GPT-3.5-Turbo-1106 | 16 КБ | $- | $- |
GPT-3.5-Turbo-0125 | 16 КБ | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure: цены и варианты приобретения

Свяжитесь с нами напрямую
Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.
Обратитесь к специалисту по продажамУзнайте о способах приобретения
Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.
Изучить доступные вариантыДополнительные ресурсы
Служба Azure OpenAI
Узнайте больше о функциях и возможностях службы "Служба Azure OpenAI".
Калькулятор цен
Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.
Соглашение об уровне обслуживания
Ознакомьтесь с Соглашением об уровне обслуживания для Служба Azure OpenAI.
Документация
Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Служба Azure OpenAI".
Часто задаваемые вопросы
-
Служба Azure OpenAI предлагает расценки как с оплатой по мере использования, так и на основе подготовленных единиц пропускной способности (PTU). Оплата по мере использования позволяет оплатить только потребляемую вами нагрузку, предоставляя гибкость в случае переменных рабочих нагрузок. Оплата на основе PTU предлагает предсказуемую модель ценообразования, которая позволяет резервировать и развертывать определенный объем вычислительной мощности модели. Эта модель идеально подходит для рабочих нагрузок с однообразными или прогнозируемыми графиками использования, так как обеспечивает стабильность и контроль над затратами.
-
Подробнее о ценах на PTU и Azure OpenAI можно узнать в документации по PTU или обратившись к нашему специалисту по продажам.
Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.
К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.