Перейти к основному контенту
Azure

Цены на Служба Azure OpenAI

Обзор цен на службу Azure OpenAI

Служба Azure OpenAI предоставляет готовый для предприятий генеративный ИИ с мощными моделями от OpenAI, что позволяет организациям внедрять инновации с использованием текста, звука и визуальных возможностей. Компании выбирают Службу Azure OpenAI за передовые модели, а также за встроенную конфиденциальность данных, региональную/зональную/глобальную гибкость и удобную интеграцию в экосистему Azure, включая Fabric, Cosmos DB и Поиск с использованием ИИ Azure. Компании любого размера могут уверенно масштабировать ИИ-решения для улучшения взаимодействия с клиентами, автоматизации рабочих процессов и раскрытия творческого потенциала с поддержкой измеряемого влияния и возможности обеспечения конкурентных преимуществ.

Чтобы помочь клиентам, мы предлагаем решения по управлению ценами и затратами согласно потребностям, в том числе:
  • Стандартный (по запросу): оплата по мере использования за входные и выходные токены.
  • Подготовленный (PTU): выделение пропускной способности с предсказуемыми затратами и доступными месячными и годовыми резервированиями для сокращения общих расходов.
  • Пакетный API: языковые модели теперь также доступны в пакетном API для глобальных развертываний и трех регионов, который возвращает завершенные проекты в течение 24 часов со скидкой 50 % от глобальных стандартных цен.
Вы можете выбрать следующие типы развертывания для категории "Стандартный" и "Подготовленный", что обеспечивает дополнительную гибкость и возможности управления ценами и производительностью. Такая гибкость помогает при возрастающих ограничениях в отношении границ обработки данных и при необходимости увеличения пропускной способности и снижения цены.
  • Глобальное развертывание — ценовая категория "Глобальный"
  • Развертывание зоны данных — на основе географического расположения (ЕС или США)
  • Региональное развертывание — локальный регион (до 27 регионов)

Изучите варианты оплаты

Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.

Цены являются ориентировочными и не должны рассматриваться как фактические предложения с расценками. Фактические цены могут различаться в зависимости от типа соглашения, заключенного с Майкрософт, от даты покупки и курса обмена валюты. Цены рассчитываются в долларах США и конвертируются на основе спотовых курсов закрытия лондонской биржи, фиксируемых за два рабочих дня до последнего рабочего дня конца предыдущего месяца. Если два рабочих дня до конца месяца выпадают на выходной день на основных рынках, днем установления ставки обычно является день, непосредственно предшествующий этим двум рабочим дням. Данная ставка применяется ко всем транзакциям в течение последующего месяца. Войдите в Калькулятор цен Azure, чтобы увидеть цены на основе вашей текущей программы или предложения от Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить предложение с расценками. Ознакомьтесь с часто задаваемыми вопросами о ценах на Azure.

GPT-4.5

GPT-4.5-preview — это новейшая модель общего назначения с глубокими знаниями о мире и улучшенным пониманием намерений пользователей, что делает ее эффективной в выполнении творческих задач и агентном планировании. Объем контекста модели составляет 128 000 токенов, отсечка знаний — октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-4.5-Preview-2025-02-27 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

o1

o1 — новый ряд моделей рассуждений для сложных задач. Объем контекста модели составляет 200 000 входных токенов, отсечка знаний — октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
o1 2024-12-17 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 2024-12-17 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 2024-12-17 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 preview 2024-09-12 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 preview 2024-09-12 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1 preview 2024-09-12 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

o3 Mini

o3 mini — это обновленная версия модели o1 mini. o3-mini — это быстрая и экономичная модель рассуждений, адаптированная для вариантов использования в программировании, математике и науке.

Модель o3-mini теперь обладает расширенным окном ввода контекста на 200 тыс. токенов и максимальным выходом в 100 тыс. токенов, что предоставляет достаточно пространства для сложных и детализированных ответов. В модели o1 mini предусмотрен ввод контекста размером 128 тыс. токенов. Обе модели o3 и o1 используют отсечку знаний на октябрь 2023 года.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
o3 mini 2025-01-31 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
o3 mini 2025-01-31-US/EU — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
o3 mini 2025-01-31 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1-mini 2024-09-12 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1-mini 2024-09-12 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
o1-mini 2024-09-12 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

Computer-Using Agent (CUA)

The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.

Модель Цены
computer-use-preview Global Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов

Built-in tools

The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.

Средство Входные данные
Computer Use (Responses API only) Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
File Search Tool Call (Responses API only) $-/1K tool calls
Поиск файлов* $- за ГБ векторного хранилища в день (1 ГБ предоставляется бесплатно)
Интерпретатор кода** $- за сеанс

*ГБ — это двоичный гигабайт, когда 1 ГБ равен 2^30 байт.

**Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это приведет к созданию двух сеансов интерпретаторов кода (2 * $-). Каждый сеанс по умолчанию активен в течение часа. Это означает, что вы будете платить только один раз, если пользователь продолжает давать инструкции интерпретатору кода в одной цепочке в течение часа.

Затраты на вывод (входные и выходные данные) зависят от модели GPT, используемой с каждым помощником. Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это создаст два сеанса интерпретатора кода (2 * $-). По умолчанию каждый сеанс активен в течение одного часа. Это означает, что цена указана за один час предоставления инструкций интерпретатору кода в том же потоке.

API реального времени

Представленное в API Realtime решение GPT-4o-Realtime-Preview поддерживает многоязычные возможности преобразования речи в речь. Оптимизированное для разговоров в реальном времени с минимальной задержкой, оно обеспечивает естественное взаимодействие с минимальной задержкой, что идеально подходит для чат-ботов и разговорного ИИ. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.

Модель Цены (1 млн токенов)
GPT-4o-Realtime-Preview-2024-12-17-Global Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU — зоны данных Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Текст
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-

API завершений чата

Модель GPT 4o-Audio-Preview, используемая в API завершений чата, обрабатывает и генерирует звуковое содержимое. Она поддерживает дополнительные функции, например распознавание речи и синтез звука, что идеально подходит для асинхронного речевого взаимодействия и анализа тональности. GPT-4o — это комплексная и более мощная версия, предназначенная для сложных задач, а GPT-4o Mini — это меньший и более доступный вариант, идеально подходящий для простых приложений, где приоритетами являются экономия средств и скорость.

Модель Цены (1 млн токенов)
GPT-4o-Audio-Preview-2024-12-17-Global Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — зоны данных Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Текст
Входные данные: $-
Вывод: $-

Аудио
Входные данные: $-
Вывод: $-

GPT-4o

GPT-4o — это самая продвинутая мультимодальная модель, которая быстрее и дешевле, чем GPT-4 Turbo, и обладает улучшенными возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
Глобальный GPT-4o-2024-1120 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-2024-1120 для США и ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Региональный GPT-4o-2024-1120 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
Глобальный GPT-4o-2024-08-06 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-2024-08-06 для США и ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
Региональный GPT-4o-2024-08-06 Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д
Глобальный GPT-4o-2024-0513 Входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-2024-0513 для США и ЕС — зоны данных Входные данные: $-
Вывод: $-
Н/Д
Региональный GPT-4o-2024-0513 Входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

GPT-4o mini

GPT-4o mini — это самая экономичная небольшая модель с возможностями зрения. Модель использует контекст 128 тыс. и отсечку знаний на октябрь 2023 г.

Модель Цены (1 млн токенов) Цены с пакетным API (1 млн токенов)
GPT-4o-mini-0718 Global Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-mini-0718 США/ЕС — зоны данных Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Входные данные: $-
Вывод: $-
GPT-4o-mini-0718 Regional Входные данные: $-
Кэшированные входные данные: $-
Вывод: $-
Н/Д

Планируйте с помощью калькулятора цен

Подготовленный

Вы можете выделить пропускную способность для развертывания и управлять ею, обеспечивая прогнозируемую производительность и стабильную емкость. С вас будет взиматься почасовая ставка на модель независимо от использования, но вы также можете обеспечить дополнительную экономию за счет месячных и годовых резервирований. Узнайте на этой странице обучения, как перенести региональные развертывания и подготовленные резервирования в глобальные зоны и зоны данных.

Модель Минимальное количество PTU Почасовые цены PTU Цены на месячное резервирование PTU Цены на годовое резервирование PTU
Глобальный GPT-4o 15 $- $- $-
Зоны данных США и ЕС для GPT-4o 15 $- $- $-
Региональный GPT-4o 50 $- $- $-
Fine-Tuned GPT-4o-Regional 50 $- $- $-
Глобальный GPT-4o Mini 15 $- $- $-
Зоны данных США/ЕС для GPT-4o Mini 15 $- $- $-
Региональный GPT-4o-Mini 25 $- $- $-
Fine-Tuned GPT-4o-Mini Regional 25 $- $- $-

Планируйте с помощью калькулятора цен

Базовые модели

Модели Использование на 1000 токенов
Babbage-002 $-
Davinci-002 $-

Модели с точной настройкой

Модель Цены
GPT-4o-2024-08-06 Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: использовать региональный
Размещение: $-/час
GPT-4o-mini Региональный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Глобальный Входные данные: $-/1 млн токенов
Кэшированные входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: использовать региональный
Размещение: $-/час
GPT-4-0613 (8K) Региональный Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
GPT-3.5-Turbo (16K) Региональный Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
GPT-3.5-Turbo (4K) Региональный Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Babbage-002 Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час
Davinci-002 Входные данные: $-/1 млн токенов
Вывод: $-/1 млн токенов
Обучение: $-/1 млн токенов
Размещение: $-/час

Модели изображений

Модели Качество Разрешение Цена (за 100 изображений)
Dall-E-3 Стандартный 1024 * 1024 $-
Стандартный 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Стандартный 1024 * 1024 $-

Внедрение моделей

Модели На 1000 маркеров
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Модели речи

Модели Цена
Whisper $- в час
Преобразование текста в речь $-/1 миллион символов
TTS HD $-/1 миллион символов

Устаревшие языковые модели

Модели Контекст Входные данные (на 1 млн токенов) Выходные данные (на 1 млн токенов)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16 КБ $- $-
GPT-3.5-Turbo-1106 16 КБ $- $-
GPT-3.5-Turbo-0125 16 КБ $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure: цены и варианты приобретения

Свяжитесь с нами напрямую

Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.

Обратитесь к специалисту по продажам

Узнайте о способах приобретения

Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.

Изучить доступные варианты

Дополнительные ресурсы

Служба Azure OpenAI

Узнайте больше о функциях и возможностях службы "Служба Azure OpenAI".

Калькулятор цен

Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.

Соглашение об уровне обслуживания

Ознакомьтесь с Соглашением об уровне обслуживания для Служба Azure OpenAI.

Документация

Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Служба Azure OpenAI".

Часто задаваемые вопросы

  • Служба Azure OpenAI предлагает расценки как с оплатой по мере использования, так и на основе подготовленных единиц пропускной способности (PTU). Оплата по мере использования позволяет оплатить только потребляемую вами нагрузку, предоставляя гибкость в случае переменных рабочих нагрузок. Оплата на основе PTU предлагает предсказуемую модель ценообразования, которая позволяет резервировать и развертывать определенный объем вычислительной мощности модели. Эта модель идеально подходит для рабочих нагрузок с однообразными или прогнозируемыми графиками использования, так как обеспечивает стабильность и контроль над затратами.
  • Подробнее о ценах на PTU и Azure OpenAI можно узнать в документации по PTU или обратившись к нашему специалисту по продажам.

Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.

К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.

Добавлено для расчета. Щелкните v для просмотра на калькуляторе