Passer la navigation

Services vocaux

Convertissez l’audio en texte, traduisez la parole et convertissez du texte en parole avec les services vocaux unifiés

Développez rapidement des applications vocales de haute qualité

Créez des applications vocales en toute confiance et rapidement avec le SDK speech. Transcrivez la voix en texte avec une grande précision, produisez des voix textuelles à voix normales, traduisez l’audio parlé et utilisez la reconnaissance de l’orateur pendant les conversations. Explorez avec une expérience sans code et créez des modèles personnalisés adaptés à votre application avec Speech Studio.

Qualité de pointe du secteur

obtenez une synthèse vocale à la pointe de la technique, du texte réaliste par synthèse vocale et une reconnaissance de l’orateurs reconnue.

Conforme et sécurisé

Vos données restent les vôtres – votre entrée vocale n’est pas enregistrée pendant le traitement.

Voix et modèles personnalisables

Créez des voix personnalisées, ajoutez des mots spécifiques à votre vocabulaire de base ou créez vos propres modèles.

Déploiement flexible

Exécutez Speech où que vous soyez, dans le cloud ou à la périphérie dans containers.

Convertir la parole en texte

Transcrivez rapidement et avec précision des fichiers audio dans plus de 100 langues et variantes. Obtenez des informations sur les clients grâce à la transcription des centres d'appels, améliorez les expériences avec les assistants vocaux, capturez les discussions clés lors des réunions, etc.

Donnez une voix à votre application

Utilisez la synthèse vocale pour créer des applications et des services qui parlent en conversation. Créez du contenu audio, améliorez l’accessibilité avec les fonctionnalités de lecture à voix haute et créez des assistants vocaux personnalisés.

Traduire la voix en temps réel

Traduisez l’audio à partir de plus de 30 langues et personnalisez les traductions pour les termes spécifiques de votre organisation, le tout dans votre langage de programmation préféré.

Vérifier et reconnaître les orateurs

Confirmez l’identité d’une personne ou reconnaissez qui parle dans une réunion en ajoutant la vérification et l’identification des intervenants à votre application.

Activez votre assistant ou appareil IoT avec un mot clé personnalisé

Créez un mot clé personnalisé pour les appareils IoT et les assistants à extension vocale afin de différencier votre marque, ce qui le rend plus personnel, plus personnalisé et plus sécurisé.

Ajouter des commandes vocales pour les scénarios mains libres

Créez une expérience vocale sans interaction tactile pour améliorer la sécurité et prendre en charge les scénarios de retour au travail.

Sécurité et conformité complètes et intégrées

  • Microsoft investit plus de USD 1 milliard par an dans la recherche et le développement en matière de cybersécurité.

  • Nous employons plus de 3,500 experts de sécurité qui se consacrent à la sécurité et à la protection des données.

  • Azure a plus de certifications que tout autre fournisseur de services cloud. Affichez la liste complète.

La tarification flexible vous offre la puissance et le contrôle dont vous avez besoin

Payez uniquement ce que vous utilisez, sans frais initiaux. Avec Speech, payez à l’utilisation sur la base de :

  • Nombre d’heures d’audio que vous transcrivez ou traduisez pour la reconnaissance vocale et traduction vocale.
  • Nombre de caractères que vous convertissez en audio pour la synthèse vocale
  • Nombre de transactions pour Reconnaissance de l'orateur

Documentation et ressources Speech

Démarrer avec Speech Services

Browse the documentation

Take the Microsoft Learn Speech course

Explorez les ressources appréciées des développeurs

Checkout our sample code and SDKs

Build speech models quickly with Speech studio Stack Overflow

Approuvé par des organisations de toutes tailles

&ATT satisfait les clients grâce à des expériences immersives

AT&T is showcasing its 5G network with an immersive experience that allows customers to talk directly to Bugs Bunny.*

*LOONEY TUNES and all related characters and elements © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

Progressive apporte Flo directement aux clients

Progressive a utilisé Voix neuronale personnalisée pour créer une version virtuelle de Flo au son naturel pour aider les clients à obtenir un devis gratuit d'assurance automobile ou à répondre à des questions générales sur l'assurance.

Progressive

KPMG rationalise la transcription des appels

KPMG utilise Reconnaissance vocale pour transcrire et cataloguer des milliers d’appels, ce qui réduit les coûts de conformité de ses clients de 80 pour cent.

KPMG

Elle aide les premiers répondants à accéder aux données essentielles

Motorola Solutions permet aux premiers intervenants sur le terrain d'accéder à des informations vitales grâce à un assistant virtuel à commande vocale.

Motorola Solutions

Défauts de construction des documents d’office à l’aide de la voix

Un assistant virtuel à commande vocale aide les gestionnaires de projets de construction à identifier et à documenter les défauts sur les sites de construction.

HOCHTIEF

Zencity améliore la qualité de vie avec des solutions d’intelligence artificielle

La start-up de données et d’analytique Zencity utilise Traduction vocale pour analyser les données provenant de sources diverses (réseaux sociaux, demandes de maintenance, etc.) pour aider les gouvernements à prendre des décisions basées sur les données et à fournir de meilleurs services à leurs résidents.

Zencity

Mises à jour vocales, blogs et annonces

Créez un compte Azure gratuit

Pouvons-nous vous aider ?