Services Speech

Convertissez l’audio en texte, traduisez la parole et convertissez du texte en parole avec les services vocaux unifiés

La reconnaissance vocale convertit de la parole audio en texte pour permettre une interaction intuitive.

Ajoutez facilement des fonctionnalités de reconnaissance vocale en temps réel à vos applications pour les scénarios tels que les commandes vocales, la transcription de conversation et l'analyse de journaux de centre d'appels.

Adaptez vos modèles de reconnaissance vocale aux styles oraux, expressions ou jargon des utilisateurs, ainsi qu’aux bruits de fond, accents et caractéristiques vocales.

En savoir plus
Reconnaissance vocale

La synthèse vocale confère une voix naturelle à vos applications.

Générez des applications et services intelligents qui s’adressent aux utilisateurs en langage naturel grâce au service de synthèse vocale. Convertissez du texte en audio en temps quasi réel, et adaptez la vitesse, la tonalité, le volume et d’autres paramètres de la parole.

Donnez à votre application une voix caractéristique unique et reconnaissable à l’aide de modèles vocaux personnalisés. Enregistrez et chargez simplement des données d’apprentissage. Le service crée ensuite une police de la voix unique calquée sur votre enregistrement.

En savoir plus
Synthèse vocale

Traduction vocale

Dotez votre application de fonctionnalités de traduction vocale en temps réel dans l’une des langues prises en charge, et obtenez une traduction de texte ou de parole. Les modèles de traduction vocale sont basés sur des technologies de pointe en matière de reconnaissance vocale et de traduction automatique neuronale. Ils sont optimisés pour comprendre la façon dont les gens parlent dans la vie réelle, et générer des traductions d’une qualité exceptionnelle.

En savoir plus
Traduction vocale

Scénarios d'entreprise basés sur les services Speech

Transcrivez facilement chaque appel et optimisez les résultats grâce à la transcription par lots et aux services de reconnaissance vocale personnalisés optimisés pour les scénarios des centre d'appels. Indexez les transcriptions d'appels pour la recherche en texte intégral, ou appliquez l'analyse de texte pour détecter les sentiments, la langue et les expressions clés à des fins d'analyse.

En savoir plus
Services Speech d'entreprise
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Explorer les API Cognitive Services

Vision par ordinateur

Dévoilez des informations pertinentes à partir d’images

Visage

Détectez, analysez, organisez et identifiez les visages dans vos photos

Ink Recognizer VERSION PRÉLIMINAIRE

Service d’intelligence artificielle qui reconnaît le contenu manuscrit, tel que l’écriture manuscrite, les formes et la mise en page de document manuscrit

Video Indexer

Tirez des insights de vos vidéos

Vision personnalisée

Personnalisez facilement vos modèles de vision par ordinateur pour les adapter à votre cas d’utilisation

Form Recognizer VERSION PRÉLIMINAIRE

Le service d’extraction de document optimisé par l’intelligence artificielle qui comprend vos formulaires

Analyse de texte

Évaluez facilement les sentiments et les thèmes pour comprendre ce que les clients recherchent

Traduction de texte Translator Text

Effectuez facilement une traduction automatique avec un simple appel d’API REST

Vérification orthographique Bing

Détectez et corrigez les fautes d’orthographe dans votre application

QnA Maker

Distillez des informations au travers de réponses de style conversationnel dans lesquelles il est facile de naviguer

Content Moderator

Modération automatisée des images, textes et vidéos

Language Understanding

Formez vos applications pour qu’elles comprennent les commandes de vos utilisateurs

Services Speech

Services vocaux unifiés pour la reconnaissance vocale, la synthèse vocale et la traduction vocale

Reconnaissance de l’orateur VERSION PRÉLIMINAIRE

Identifier et vérifier les orateurs en fonction de leur voix

Content Moderator

Modération automatisée des images, textes et vidéos

Détecteur d’anomalies VERSION PRÉLIMINAIRE

Ajoutez aisément des fonctionnalités de détection d’anomalies à vos applications.

Personalizer VERSION PRÉLIMINAIRE

Un service d’IA qui offre une expérience utilisateur personnalisée

Prêt à booster votre application ?