Passer directement au contenu principal
Azure

Tarification Azure OpenAI Service

Vue d’ensemble de la tarification d’Azure OpenAI Service

Unlock the power of Azure OpenAI Service's generative AI models with flexible Standard (On-Demand) and Provisioned Throughput Units (PTUs). The Standard model lets you pay only for tokens processed, while PTUs ensure consistent throughput and minimal latency variance for scalable solutions. Pricing includes costs per 1,000 tokens, and PTU rates provide a predictable cost structure. Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing. Azure OpenAI Service offers advanced capabilities like GPT-4o, fine-tuning for customization, DALL-E for image generation, and Whisper for speech-to-text. For personalized guidance on optimizing AI deployments, contact a sales specialist.

Explorez les options tarifaires

Appliquez des filtres pour personnaliser les options de tarification à vos besoins.

Les prix ne sont que des estimations et ne sont pas destinés à être des devis réels. Le prix réel peut varier selon le type de contrat conclu avec Microsoft, la date d'achat et le taux de change. Les prix sont calculés en dollars américains et convertis à l'aide des taux de clôture au comptant de Londres saisis au cours des deux jours ouvrables précédant le dernier jour ouvrable de la fin du mois précédent. Si les deux jours ouvrables précédant la fin du mois tombent un jour férié sur les principaux marchés, le jour de fixation des taux est généralement le jour précédant immédiatement les deux jours ouvrables. Ce taux s'applique à toutes les transactions du mois à venir. Connectez-vous au calculateur de prix Azure pour voir les prix en fonction de votre programme/offre actuel avec Microsoft. Contactez un spécialiste des ventes Azure pour plus d'informations sur les prix ou pour demander un devis. Consultez les questions fréquemment posées sur la tarification Azure.

Détails de la tarification :

Modèles de langage

Modèles Contexte Input (Per 1,000,000 tokens) Output (Per 1,000,000 tokens) Prix par PTU par heure Incrément de mise à l’échelle minimum Réservation mensuelle par PTU Réservation annuelle par PTU
o1 preview Global Deployment 128K $- $- N/A N/A N/A N/A
o1 preview Regional API 128K $- $- N/A N/A N/A N/A
o1 mini Global Deployment 128K $- $- N/A N/A N/A N/A
o1 mini Regional API 128K $- $- N/A N/A N/A N/A
gpt-4o-2024-08-06 Global Deployment 128K $- $- N/A N/A N/A N/A
gpt-4o-2024-08-06 Regional API 128K $- $- N/A N/A N/A N/A
Déploiement mondial GPT-4o 128K $- $- $- 50 PTU $- $-
API régionale GPT-4o 128K $- $- $- 50 PTU $- $-
Déploiement global GPT-4o-mini 128K $- $- $- 25 PTU $- $-
API régionale GPT-4o-mini 128K $- $- $- 25 PTU $- $-

Ce tableau fournit une comparaison détaillée de la tarification Standard (à la demande) et Approvisionnée (PTU) pour différents modèles de langage. La colonne « Contexte » spécifie le nombre maximal de jetons que chaque modèle peut gérer par réponse. Les détails de la tarification des jetons d’entrée et de sortie sont listés, ce qui reflète le coût par tranche de 1 000 jetons. Le modèle de tarification PTU inclut un taux horaire et un incrément de mise à l’échelle minimal, représentant le nombre minimal de PTU requis pour chaque modèle. Les colonnes « Réservation mensuelle par PTU » et « Réservation annuelle par PTU » indiquent les coûts de réservation par PTU. Cette comparaison permet aux utilisateurs de comprendre les implications du coût de l’utilisation de chaque modèle sous les options de facturation Standard (à la demande) et Approvisionnée (PTU), ce qui permet de prendre des décisions en connaissance de cause selon leurs besoins d’utilisation spécifiques.

Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing.

Modèles de langage hérités

Modèles Contexte Input (Per 1,000,000 tokens) Output (Per 1,000,000 tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Assistants API

L’API Assistants et ses outils permettent aux développeurs de générer facilement des Assistants IA dans leurs applications.

Les jetons utilisés pour l’API Assistants sont facturés aux taux d’entrée/sortie par jeton utilisés avec chaque Assistant pour le modèle de langage choisi. En outre, nous facturons les frais suivants pour l’utilisation de l’outil :

Outil Entrée
Recherche de fichiers* $- / Go de stockage vectoriel par jour (1 Go gratuit)
Interpréteur de code** $- / session

*Go fait référence à des gigaoctets binaires, où 1 Go correspond à 2^30 octets.

**Si votre assistant appelle l’interpréteur de code simultanément dans deux threads différents, cela créera deux sessions d’interpréteur de code (2 * $-). Chaque session est active par défaut pendant une heure, ce qui signifie que vous ne paierez ces frais qu'une seule fois si votre utilisateur continue de donner des instructions à l’interpréteur de code dans la même conversation pendant une heure maximum.

Le coût d’inférence (entrée et sortie) varie en fonction du modèle GPT utilisé avec chaque assistant. Si votre assistant appelle l’interpréteur de code simultanément dans deux conversations différentes, cela créera deux sessions d’interpréteur de code (2 * $-). Chaque session est active par défaut pendant une heure, ce qui signifie que le prix correspond à une heure maximum d’instructions fournies à l’interpréteur de code dans la même conversation.

Modèles De base

Modèles Utilisation pour 1 000 jetons
Babbage-002 $-
Davinci-002 $-

Modèles de mise au point

Modèles Formation pour 1 000 jetons Hosting par heure Utilisation des entrées pour 1 000 jetons Utilisation de la sortie pour 1 000 jetons
Babbage-002 $- $- $- $-
Davinci-002 $- $- $- $-
GPT-3.5-Turbo (4K) $- $- $- $-
GPT-3.5-Turbo (16K) $- $- $- $-
GPT-4 (8K) $- $- $- $-
GPT-4o $- $- $- $-
GPT-4o-mini $- $- $- $-

Modèles d’image

Modèles Qualité Résolution Prix (par 100 images)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Incorporation de modèles

Modèles Par 1 000 jetons
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modèles de discours

Modèles Tarif
Chuchoter $-/heure
TTS (Synthèse vocale) $- / 1 million de caractères
TTS HD $- / 1 million de caractères

Tarification et options d’achat Azure

Connectez-vous directement avec nous

Obtenez un guide pas à pas de la tarification Azure. Comprenez la tarification de votre solution cloud, découvrez l’optimisation des coûts et demandez une offre personnalisée.

Discuter avec un spécialiste des ventes

Découvrez les modalités d'achat

Achetez des services Azure via le site web Azure, un représentant Azure ou un partenaire Azure.

Explorez vos options

Ressources supplémentaires

Azure OpenAI Service

En savoir plus sur les fonctionnalités et capacités Azure OpenAI Service.

Calculatrice de prix

Estimez vos coûts mensuels pour l’utilisation des différentes combinaisons de produits Azure.

SLA

Consultez le Contrat de niveau de service (SLA) pour Azure OpenAI Service.

Documentation

Consulter les didacticiels et vidéos techniques, et d’autres ressources Azure OpenAI Service.

  • Azure OpenAI Service propose une tarification basée à la fois sur le paiement à l'utilisation et sur les unités de débit provisionnées (PTU). Pay-As-You-Go vous permet de payer pour les ressources que vous consommez, ce qui le rend flexible pour les charges de travail variables. Les PTU offrent un modèle de tarification prévisible dans lequel vous réservez et déployez une quantité spécifique de capacité de traitement de modèle. Ce modèle est idéal pour les charges de travail avec des modèles d'utilisation cohérents ou prévisibles, offrant stabilité et contrôle des coûts.
  • Pour en savoir plus sur les PTU et les tarifs Azure Open AI, veuillez lire la documentation PTU ou contacter notre spécialiste des ventes

Discutez avec un spécialiste des ventes pour qu’il vous explique en détail la tarification Azure. Comprendre la tarification de votre solution cloud.

Profitez de services cloud gratuits et d’un crédit de $200 pour découvrir Azure pendant 30 jours.

Ajout à des fins d’estimation. Appuyez sur « v » pour afficher sur la calculatrice