Passer la navigation

Services Speech

Convertissez l’audio en texte, traduisez la parole et convertissez du texte en parole avec les services vocaux unifiés

La reconnaissance vocale convertit de la parole audio en texte pour permettre une interaction intuitive.

Ajoutez facilement la conversion de parole en texte en temps réel à vos applications pour des usages tels que les commandes vocales, les transcriptions en temps réel ou l’analyse de journaux de centre d’appels.

Adaptez vos modèles de reconnaissance vocale aux styles oraux, expressions ou jargon des utilisateurs, ainsi qu’aux bruits de fond, accents et caractéristiques vocales spécifiques de votre scénario.

En savoir plus.
Reconnaissance vocale

La synthèse vocale confère une voix naturelle à vos applications.

Générez des applications et services intelligents qui s’adressent aux utilisateurs en langage naturel grâce au service de synthèse vocale. Convertissez du texte en audio en temps quasi réel, et adaptez la vitesse, la tonalité, le volume et d’autres paramètres de la parole.

Donnez à votre application une voix caractéristique unique et reconnaissable à l’aide de modèles vocaux personnalisés. Enregistrez et chargez simplement des données d’apprentissage. Le service crée ensuite une police de la voix unique calquée sur votre enregistrement.

En savoir plus.
Synthèse vocale

Traduction vocale

Dotez votre application de fonctionnalités de traduction vocale en temps réel dans l’une des langues prises en charge, et obtenez une traduction de texte ou de parole. Les modèles de traduction vocale sont basés sur des technologies de pointe en matière de reconnaissance vocale et de traduction automatique neuronale. Ils sont optimisés pour comprendre la façon dont les gens parlent dans la vie réelle, et générer des traductions d’une qualité exceptionnelle.

En savoir plus.
Traduction vocale
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Explorer les API Cognitive Services

Vision par ordinateur

Dévoilez des informations pertinentes à partir d’images

Visage

Détectez, analysez, organisez et identifiez les visages dans vos photos

Video Indexer

Tirez des insights de vos vidéos

Content Moderator

Modération automatisée des images, textes et vidéos

Vision personnalisée VERSION PRÉLIMINAIRE

Personnalisez facilement vos modèles de vision par ordinateur pour les adapter à votre cas d’utilisation

Analyse de texte

Évaluez facilement les sentiments et les thèmes pour comprendre ce que les clients recherchent

Traduction de texte Translator Text

Effectuez facilement une traduction automatique avec un simple appel d’API REST

Vérification orthographique Bing

Détectez et corrigez les fautes d’orthographe dans votre application

Content Moderator

Modération automatisée des images, textes et vidéos

Language Understanding

Formez vos applications pour qu’elles comprennent les commandes de vos utilisateurs

Services Speech

Services vocaux unifiés pour la reconnaissance vocale, la synthèse vocale et la traduction vocale

Reconnaissance de l’orateur VERSION PRÉLIMINAIRE

Identifier et vérifier les orateurs en fonction de leur voix

QnA Maker

Distillez des informations au travers de réponses de style conversationnel dans lesquelles il est facile de naviguer

Prêt à booster votre application ?