Обзор цен на службу Azure OpenAI
To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
- Standard (On-Demand): Pay-as-you-go for input and output tokens.
- Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
- Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
- Global Deployment – Global SKU
- Data Zone Deployment – Geographic based (EU or US)
- Regional Deployment – Local Region (up to 27 regions)
Изучите варианты оплаты
Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.
Цены являются ориентировочными и не должны рассматриваться как фактические предложения с расценками. Фактические цены могут различаться в зависимости от типа соглашения, заключенного с Майкрософт, от даты покупки и курса обмена валюты. Цены рассчитываются в долларах США и конвертируются на основе спотовых курсов закрытия лондонской биржи, фиксируемых за два рабочих дня до последнего рабочего дня конца предыдущего месяца. Если два рабочих дня до конца месяца выпадают на выходной день на основных рынках, днем установления ставки обычно является день, непосредственно предшествующий этим двум рабочим дням. Данная ставка применяется ко всем транзакциям в течение последующего месяца. Войдите в Калькулятор цен Azure, чтобы увидеть цены на основе вашей текущей программы или предложения от Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить предложение с расценками. Ознакомьтесь с часто задаваемыми вопросами о ценах на Azure.
Государственные структуры США могут приобрести службы "Azure для государственных организаций" у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
Государственные структуры США могут приобрести службы "Azure для государственных организаций" у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
o1 Preview
o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Входные данные: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Входные данные: $- Cached Input: $- Output: $- |
Regional |
Входные данные: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
o1 Mini
o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Входные данные: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Входные данные: $- Cached Input: $- Output: $- |
Regional |
Входные данные: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
Realtime API
Featured in the new Realtime API, the model GPT-4o-Realtime-Preview supports audio/speech capabilities including multilingual speech-to-speech.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Realtime-Preview-Global |
Text Входные данные: $- Output: $- Audio Входные данные: $- Output: $- |
Chat Completions API - Coming soon
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Audio-Preview-Global |
Text Входные данные: $- Cached Input: Н/Д Output: $- Audio Входные данные: $- Cached Input: Н/Д Output: $- |
GPT-4o
GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
GPT-4o-2024-08-06 Global |
Входные данные: $- Cached Input: $- Output: $- |
Входные данные: $- Output: $- |
US/EU – Data Zones |
Входные данные: $- Cached Input: $- Output: $- |
Н/Д |
Regional |
Входные данные: $- Cached Input: $- Output: $- |
Н/Д |
GPT-4o-0513 Global |
Входные данные: $- Output: $- |
Входные данные: $- Output: $- |
US/EU – Data Zones |
Входные данные: $- Output: $- |
Н/Д |
Regional |
Входные данные: $- Output: $- |
Н/Д |
Plan with the Pricing Calculator
GPT-4o mini
GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
Global |
Входные данные: $- Cached Input: $- Output: $- |
Входные данные: $- Output: $- |
US/EU – Data Zones |
Входные данные: $- Cached Input: $- Output: $- |
Н/Д |
Regional |
Входные данные: $- Cached Input: $- Output: $- |
Н/Д |
Plan with the Pricing Calculator
Provisioned
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations.
Model | Min PTUs | PTU Hourly pricing | PTU Monthly Reservation Pricing | PTU Yearly Reservation Pricing |
---|---|---|---|---|
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Plan with the Pricing Calculator
Базовые модели
Модели | Использование на 1000 токенов |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Модели с точной настройкой
Модели | Обучение на 1000 маркеров | Размещение в час | Использование входных данных на 1000 токенов | Использование выходных данных на 1000 токенов |
---|---|---|---|---|
Babbage-002 | $- | $- | $- | $- |
Davinci-002 | $- | $- | $- | $- |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- |
GPT-3.5-Turbo (16K) | $- | $- | $- | $- |
GPT-4 (8K) | $- | $- | $- | $- |
GPT-4o | $- | $- | $- | $- |
GPT-4o-mini | $- | $- | $- | $- |
API помощников
API помощников и инструменты упрощают разработку помощников на основе ИИ в приложениях.
Счета за токены, используемые для API помощников, выставляются по выбранным тарифам ввода и вывода токенов для выбранной языковой модели, используемым каждым помощником. Кроме того, взимается следующая плата за использование инструмента:
Средство | Входные данные |
---|---|
Поиск файлов* | $- за ГБ векторного хранилища в день (1 ГБ предоставляется бесплатно) |
Интерпретатор кода** | $- за сеанс |
*ГБ — это двоичный гигабайт, когда 1 ГБ равен 2^30 байт.
**Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это приведет к созданию двух сеансов интерпретаторов кода (2 * $-). Каждый сеанс по умолчанию активен в течение часа. Это означает, что вы будете платить только один раз, если пользователь продолжает давать инструкции интерпретатору кода в одной цепочке в течение часа.
Затраты на вывод (входные и выходные данные) зависят от модели GPT, используемой с каждым помощником. Если помощник вызывает интерпретатор кода одновременно в двух разных потоках, это создаст два сеанса интерпретатора кода (2 * $-). По умолчанию каждый сеанс активен в течение одного часа. Это означает, что цена указана за один час предоставления инструкций интерпретатору кода в том же потоке.
Модели изображений
Модели | Качество | Разрешение | Цена (за 100 изображений) |
---|---|---|---|
Dall-E-3 | Стандартный | 1024 * 1024 | $- |
Стандартный | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Стандартный | 1024 * 1024 | $- |
Внедрение моделей
Модели | На 1000 маркеров |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Модели речи
Модели | Цена |
---|---|
Whisper | $- в час |
Преобразование текста в речь | $-/1 миллион символов |
TTS HD | $-/1 миллион символов |
Устаревшие языковые модели
Модели | Контекст | Input (Per 1M Tokens) | Output (Per 1M Tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16 КБ | $- | $- |
GPT-3.5-Turbo-1106 | 16 КБ | $- | $- |
GPT-3.5-Turbo-0125 | 16 КБ | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure: цены и варианты приобретения
Свяжитесь с нами напрямую
Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.
Обратитесь к специалисту по продажамУзнайте о способах приобретения
Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.
Изучить доступные вариантыДополнительные ресурсы
Служба Azure OpenAI
Узнайте больше о функциях и возможностях службы "Служба Azure OpenAI".
Калькулятор цен
Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.
Соглашение об уровне обслуживания
Ознакомьтесь с Соглашением об уровне обслуживания для Служба Azure OpenAI.
Документация
Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Служба Azure OpenAI".
Часто задаваемые вопросы
-
Служба Azure OpenAI предлагает расценки как с оплатой по мере использования, так и на основе подготовленных единиц пропускной способности (PTU). Оплата по мере использования позволяет оплатить только потребляемую вами нагрузку, предоставляя гибкость в случае переменных рабочих нагрузок. Оплата на основе PTU предлагает предсказуемую модель ценообразования, которая позволяет резервировать и развертывать определенный объем вычислительной мощности модели. Эта модель идеально подходит для рабочих нагрузок с однообразными или прогнозируемыми графиками использования, так как обеспечивает стабильность и контроль над затратами.
-
Подробнее о расценках на PTU и Azure Open AI можно узнать в документации по PTUили обратившись к нашему специалисту по продажам
Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.
К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.