Reconnaissance vocale

Fonctionnalité du service Speech qui convertit avec précision le contenu audio prononcé en texte

Rendre l’audio parlé exploitable

Quickly and accurately transcribe audio to text in more than 85 languages and variants. Customize models to enhance accuracy for domain-specific terminology. Get more value from spoken audio by enabling search or analytics on transcribed text or facilitating action—all in your preferred programming language.

Transcription de haute qualité

Recevez des transcriptions précises grâce à la reconnaissance vocale de pointe.

Modèles personnalisables

Ajoutez des mots spécifiques à votre vocabulaire de base, ou créez vos propres modèles.

Déploiement flexible

Exécutez l’API Reconnaissance vocale partout, dans le cloud, en local ou à la périphérie dans des conteneurs.

Prêt pour la production

Bénéficiez de la technologie robuste qui sous-tend la reconnaissance vocale dans les produits Microsoft.

Essayez la reconnaissance vocale avec cette application de démonstration basée sur notre SDK JavaScript

Pour essayer la démo avec votre propre voix à l’aide d’un microphone, Passez à un autre navigateur prenant en charge WebRTC, par exemple, une version récente de Microsoft Edge, de Firefox ou de Chrome.

Vos données vocales ne sont pas stockées

Transcrire la parole avec précision à partir de différentes sources

Convertissez du contenu audio en texte à partir d’une série de sources, dont des microphones, des fichiers audio et un stockage blob. Utilisez la diarisation des haut-parleurs pour déterminer qui a dit quoi à quel moment. Recevez des transcriptions lisibles avec une mise en forme et une ponctuation automatiques.

Personnaliser des modèles vocaux en fonction de vos besoins

Personnalisez vos modèles vocaux pour comprendre la terminologie spécifique d’une organisation et d’un secteur. Surmontez les obstacles à la reconnaissance vocale, tels que les bruits de fond, les accents ou les jargons. Personnaliser vos modèles en chargeant des données et transcriptions audio. Générez automatiquement des modèles personnalisés à l’aide de données Office 365 afin d’optimiser la précision de la reconnaissance vocale pour votre organisation.

Déployer en tout lieu, du cloud à la périphérie

Run Speech to Text wherever your data resides. Build speech applications that are optimized for both robust cloud capabilities and edge locality using containers and language detection (preview). Speech containers support both standard and custom speech.

Confidentialité et sécurité complètes

  • Le service Speech, qui fait partie d’Azure Cognitive Services, est certifié par SOC, FedRAMP, PCI DSS, HIPAA, HITECH et ISO.
  • Vos données n’appartiennent qu’à vous. Vos données d’entrée et de transcription audio ne sont pas journalisées lors du traitement audio.
  • Affichez et supprimez vos données et modèles vocaux personnalisés à tout moment. Vos données stockées sont chiffrées.
  • Adossé à l’infrastructure Azure, le service Speech offre une sécurité, une disponibilité, une conformité et une facilité de gestion de classe Entreprise.

La tarification flexible vous offre la puissance et le contrôle dont vous avez besoin

Payez uniquement en fonction de votre utilisation, sans coût de démarrage. Avec l’API Reconnaissance vocale, vous payez à l’utilisation, sur la base du nombre d’heures d’audio transcrit.

Documentation et ressources

Bien démarrer

Lire notre documentation

Suivre le cours Microsoft Learn

Explorer des exemples de code

Consulter notre exemple de code

Voir les ressources de personnalisation

Personnalisez votre solution vocale avec Speech Studio. Aucun code requis.

Développée avec Reconnaissance vocale

KPMG rationalise la transcription des appels

KPMG utilise Reconnaissance vocale pour transcrire et cataloguer des milliers d’heures d’appels, réduisant ainsi jusqu’à 80 % les coûts de conformité de ses clients.

KPMG

Motorola aide les premiers intervenants à accéder aux données vitales à l’aide de la reconnaissance vocale

Motorola Solutions aide les policiers et d’autres intervenants de première ligne à accéder plus rapidement à des informations importantes avec un assistant virtuel vocal.

Motorola Solutions

Universal Electronics propose des solutions vocales pour la maison intelligente

Universal Electronics aide les marques à proposer des fonctions de navigation et de contrôle à commande vocale compatibles avec les appareils courants domestiques, offrant ainsi une expérience utilisateur vraiment unique.

Universal Electronics

Hochtief documente les défauts de construction à l’aide de la reconnaissance vocale

Hochtief aide les chefs de projet à identifier et à documenter les défauts de construction sur les sites des projets grâce à un assistant virtuel à commande vocale.

Cheetah Mobile

NTT DATA accélère la prise de décision grâce aux insights de réunions

NTT DATA tire parti des données voix pour transcrire les réunions en temps réel. Avec Custom Speech, l’entreprise personnalise les modèles de reconnaissance vocale pour comprendre ses spécificités internes.

NTTDATA

Insight propulse les expériences bancaires conversationnelles

Insight Enterprises aide les banques à apporter la vitesse et la commodité du numérique à leurs agences grâce à une solution bancaire basée sur l’intelligence artificielle conversationnelle. Reconnaissance vocale convertit les propos des clients en données qui peuvent être traitées et analysées afin que les clients puissent obtenir des réponses pertinentes en temps utile.

Insight Enterprise, Inc.

Commencer à utiliser Speech