Ignorez la navigation

Reconnaissance vocale

Fonctionnalité du service Speech qui convertit avec précision le contenu audio prononcé en texte

Rendre l’audio parlé exploitable

Transcrivez rapidement et précisément l’audio en texte dans plus de 100 langues et variantes. Personnalisez les modèles pour améliorer la précision de la terminologie spécifique au domaine. Tirez davantage parti de l’audio parlé en activant la recherche ou l’analytique sur le texte transcrit ou l’action qui facilite, le tout dans votre langage de programmation préféré.

Transcription de haute qualité

Obtenez des transcriptions d’audio en texte précises grâce à la reconnaissance vocale de pointe.

Modèles personnalisables

Ajoutez des mots spécifiques à votre vocabulaire de base, ou créez vos propres modèles de reconnaissance vocale.

Déploiement flexible

Exécutez l’API Reconnaissance vocale partout, dans le cloud, en local ou à la périphérie dans des conteneurs.

Prêt pour la production

Bénéficiez de la technologie robuste qui sous-tend la reconnaissance vocale dans les produits Microsoft.

Essayez la reconnaissance vocale avec cette application de démonstration basée sur notre SDK JavaScript

Pour essayer la démo avec votre propre voix à l’aide d’un microphone, Passez à un autre navigateur prenant en charge WebRTC, par exemple, une version récente de Microsoft Edge, de Firefox ou de Chrome.

Vos données vocales ne sont pas stockées

Transcrivez la parole avec précision à partir de différentes sources

Convertir l’audio en texte à partir d’une gamme de sources, y compris microphones, fichiers audio et blob stockage. Utilisez la diarisation du locuteur pour déterminer qui a dit quoi et quand. Obtenez des transcriptions lisibles avec mise en forme et ponctuation automatiques.

Personnaliser des modèles vocaux en fonction de vos besoins

Adaptez vos modèles vocaux pour comprendre la terminologie spécifique à l’organisation et à l’industrie. Surmontez les obstacles à la reconnaissance vocale tels que le bruit de fond, les accents ou le vocabulaire unique. Personnalisez vos modèles en téléchargeant des données audio et des transcriptions. Générez automatiquement des modèles personnalisés à l’aide des données Office 365 pour optimiser la précision de la reconnaissance vocale pour votre organisation.

Déployer n’importe où

Exécutez Speech to Text où que se trouvent vos données. Créez des applications vocales optimisées pour des fonctionnalités cloud robustes et sur site à l’aide de conteneurs.

Innovation dans les applications avec Cloud AI Services

Découvrez 5 façons dont votre organisation peut prendre en main l’IA pour réaliser rapidement des valeurs.

Confidentialité et sécurité complètes

  • Le service Speech, qui fait partie d’Azure Cognitive Services, est certifié par SOC, FedRAMP, PCI DSS, HIPAA, HITECH et ISO.
  • Vos données n’appartiennent qu’à vous. Vos données d’entrée et de transcription audio ne sont pas journalisées lors du traitement audio.
  • Affichez et supprimez vos données et modèles vocaux personnalisés à tout moment. Vos données stockées sont chiffrées.
  • S’appuyant sur l’infrastructure Azure, le service Speech offre une sécurité, une disponibilité, une conformité et une facilité de gestion de classe Entreprise.

La tarification flexible vous offre le contrôle dont vous avez besoin

Avec l’API Reconnaissance vocale, payez à l’utilisation, sur la base du nombre d’heures d’audio que vous transcrivez, sans coût initial.

Documentation et ressources

Bien démarrer

Parcourir la documentation

Créez un service vocal avec le cours Microsoft Learn

Explorer des exemples de code

Consulter notre exemple de code

Voir les ressources de personnalisation

Explorez et personnalisez votre solution de conversion vocale avec Speech Studio. Aucun code n’est requis.

Entreprises qui font confiance à la reconnaissance vocale

KPMG simplifie la transcription des appels

KPMG utilise Reconnaissance vocale pour transcrire et cataloguer des milliers d’heures d’appels, réduisant ainsi jusqu’à 80 % les coûts de conformité de ses clients.

KPMG

Motorola aide les premiers intervenants à accéder aux données vitales à l’aide de la reconnaissance vocale

Motorola Solutions aide les policiers et d’autres intervenants de première ligne à accéder plus rapidement à des informations importantes avec un assistant virtuel vocal.

Motorola Solutions

Universal Electronics propose des solutions vocales pour la maison intelligente

Universal Electronics aide les marques à proposer des fonctions de navigation et de contrôle à commande vocale compatibles avec les appareils courants domestiques, offrant ainsi une expérience utilisateur vraiment unique.

Universal Electronics

Défauts de construction des documents d’office à l’aide de la voix

Hochtief aide les chefs de projet à identifier et à documenter les défauts de construction sur les sites des projets grâce à un assistant virtuel à commande vocale.

Cheetah Mobile

NTT DATA accélère la prise de décision grâce aux insights de réunions

NTT DATA tire parti des données voix pour transcrire les réunions en temps réel. Avec Custom Speech, l’entreprise personnalise les modèles de reconnaissance vocale pour comprendre ses spécificités internes.

NTTDATA

Insight propulse les expériences bancaires conversationnelles

Insight Enterprises aide les banques à apporter la vitesse et la commodité du numérique à leurs agences grâce à une solution bancaire basée sur l’intelligence artificielle conversationnelle. Reconnaissance vocale convertit les propos des clients en données qui peuvent être traitées et analysées afin que les clients puissent obtenir des réponses pertinentes en temps utile.

Insight Enterprise, Inc.

Questions fréquentes sur la reconnaissance vocale

  • Il s’agit d’une fonctionnalité au sein du service de reconnaissance vocale qui permet une transcription précise et rapide de l’audio en texte.
  • Cognitive Services est une collection de modèles d’IA personnalisables et prédéfinis qui peuvent être utilisés pour ajouter l’intelligence artificielle aux applications. Il existe un large éventail de domaines, notamment la reconnaissance vocale, la décision, la langue et la vision. La reconnaissance vocale est une fonctionnalité du service Speech. Les autres fonctionnalités liées à la reconnaissance vocale incluent la synthèse vocale, la traduction vocale et la reconnaissance de l’orateur. Un exemple de service de décision est Personalizer, qui vous permet de fournir des expériences personnalisées et pertinentes. Voici des exemples de services de langage : Language Understanding, Analyse de texte pour le traitement en langage naturel, QnA Maker pour les FAQ et Traducteur pour la traduction linguistique.

Commencer à utiliser Speech