Synthèse vocale

Convertissez du texte en parole pour créer des interfaces accessibles plus naturelles

Parlez comme un humain et non comme un robot

Générez des applications et services qui s’adressent aux utilisateurs de façon naturelle, en améliorant l’accessibilité et la facilité d’utilisation. Convertissez le texte en audio presque en temps réel, lisez-le et enregistrez-le sous forme de fichier pour une utilisation ultérieure. La synthèse vocale est disponible en deux versions : Neuronale et Standard.

En appliquant les dernières innovations en matière de synthèse vocale numérique, la fonctionnalité de synthèse vocale neuronale rend les voix de vos applications presque impossibles à distinguer des enregistrements de voix humaines. L’inflexion naturelle et l’articulation claire réduisent considérablement la fatigue d’écoute lors de l’interaction avec les systèmes d’intelligence artificielle. Utilisez la synthèse vocale neuronale pour rendre les interactions avec les chatbots et les assistants virtuels plus naturelles et plus attrayantes, pour convertir des textes numériques tels que des livres électroniques en livres audio et pour améliorer les systèmes de navigation embarqués.

La synthèse vocale neuronale en action

Anglais (États-Unis) : Jessa

Phrase Échantillon vocal
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Anglais (États-Unis) : Guy

Phrase Échantillon vocal
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chinois (CN) : Xiaoxiao

Phrase Échantillon vocal
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Allemand (DE) : Katja

Phrase Échantillon vocal
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italien (IT) : Elsa

Phrase Échantillon vocal
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Voulez-vous le créer ?

La fonctionnalité de synthèse vocale Standard parle aux utilisateurs dans plusieurs langues. Choisissez parmi plus de 75 voix dans plus de 45 langues ou dialectes, notamment des options pour les voix masculines et féminines. Ajustez les paramètres tels que le débit, le ton, le volume, la prononciation et des pauses supplémentaires.

La synthèse vocale Standard en action

Pour voir comment fonctionne la synthèse vocale, cliquez sur Lecture.*

Langage Texte d’échantillon Échantillon vocal
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Voulez-vous le créer ?

Synthèse vocale avec des modèles vocaux personnalisés

Vous devez donner à votre agent vocal une voix caractéristique, unique et reconnaissable ? La fonctionnalité de personnalisation de la synthèse vocale facilite la création d’applications vocales uniques, même si vous ne disposez d’aucune expertise.

Voir en action

Langage

Qualité

Texte d’échantillon Échantillon vocal

Vous voulez commencer à construire votre propre modèle vocal ?

Modèles vocaux faciles

Pour personnaliser votre agent vocal, il vous suffit d’enregistrer et de charger des données d’apprentissage. Le service crée ensuite une police de la voix unique claquée sur votre enregistrement. Commencez une preuve de concept avec une petite quantité de données. Le système adapte son échelle sans problème à mesure que la taille de vos données augmente, ce qui améliore la qualité de la voix naturelle.

Cohérent et intégré

Les modèles vocaux personnalisés sont entièrement intégrés aux autres services vocaux de Cognitive Services. Aucun codage n’est requis et vous pouvez facilement déployer votre modèle vocal personnalisé dans l’API.

Rapide et sécurisé

Grâce à un point de terminaison d’API unique et à la gestion de l’authentification sécurisée, vous pouvez intégrer rapidement vos polices de la voix dans toutes les plateformes. Vous contrôlez vos modèles.

Explorez un scénario vocal

Kiosque intelligent

Les services vocaux combinés avec Language Understanding permettent aux applications et aux utilisateurs d’interagir de manière naturelle. Utilisez Reconnaissance vocale pour capturer la question d’un utilisateur, Language Understanding pour analyser l’intention et formuler une réponse appropriée, et Synthèse vocale pour convertir le texte de la réponse en parole. Créez des interfaces de conversation pour divers scénarios adaptés à des secteurs tels que la banque, les voyages et le divertissement.

Commerce ChatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional email and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The speech recognition service can be added to support voice commands.1234567
  1. Présentation
  2. Flux

Bot conversationnel commercial

Présentation

Ensemble, Azure Bot Service et le service Reconnaissance vocale permettent aux développeurs de créer des interfaces conversationnelles pour divers usages, tels que les opérations bancaires, les voyages et le divertissement. Par exemple, le concierge d’un hôtel peut utiliser un robot pour améliorer les interactions traditionnelles par e-mail et par téléphone en validant un client via Azure Active Directory et en utilisant les services Cognitive Services pour mieux traiter contextuellement les demandes que les clients formulent par SMS ou par téléphone. Le service Reconnaissance vocale peut être ajouté pour prendre en charge les commandes vocales.

Flux

  1. 1 Le client utilise votre application mobile.
  2. 2 L’utilisateur s’authentifie à l’aide d’Azure AD B2C.
  3. 3 L’utilisateur demande des informations à l’aide du robot d’application personnalisé.
  4. 4 Les services Cognitive Services aident à traiter la requête en langage naturel.
  5. 5 La réponse est examinée par le client, qui peut l’affiner en s’exprimant en langage naturel.
  6. 6 Quand l’utilisateur est satisfait des résultats, le robot d’application met à jour la réservation du client.
  7. 7 Application Insights collecte la télémétrie d’exécution pour aider le développement en fournissant des informations sur les performances et l’utilisation du robot.

"ROOBO is an AI solution provider. Now with Microsoft's world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei : CTO, roobo

Explorer les API Cognitive Services

Vision par ordinateur

Dévoilez des informations pertinentes à partir d’images

Visage

Détectez, analysez, organisez et identifiez les visages dans vos photos

Ink Recognizer VERSION PRÉLIMINAIRE

Service d’intelligence artificielle qui reconnaît le contenu manuscrit, tel que l’écriture manuscrite, les formes et la mise en page de document manuscrit

Video Indexer

Tirez des insights de vos vidéos

Vision personnalisée

Personnalisez facilement vos modèles de vision par ordinateur pour les adapter à votre cas d’utilisation

Form Recognizer VERSION PRÉLIMINAIRE

Le service d’extraction de document optimisé par l’intelligence artificielle qui comprend vos formulaires

Analyse de texte

Évaluez facilement les sentiments et les thèmes pour comprendre ce que les clients recherchent

Traduction de texte Translator Text

Effectuez facilement une traduction automatique avec un simple appel d’API REST

QnA Maker

Distillez des informations au travers de réponses de style conversationnel dans lesquelles il est facile de naviguer

Language Understanding

Formez vos applications pour qu’elles comprennent les commandes de vos utilisateurs

Lecteur immersif VERSION PRÉLIMINAIRE

Donnez aux utilisateurs de tous âges et de toutes capacités les moyens de lire et de comprendre du texte

Services Speech

Services vocaux unifiés pour la reconnaissance vocale, la synthèse vocale et la traduction vocale

Reconnaissance de l’orateur VERSION PRÉLIMINAIRE

Identifier et vérifier les orateurs en fonction de leur voix

Content Moderator

Modération automatisée des images, textes et vidéos

Détecteur d’anomalies VERSION PRÉLIMINAIRE

Ajoutez aisément des fonctionnalités de détection d’anomalies à vos applications.

Personalizer VERSION PRÉLIMINAIRE

Un service d’IA qui offre une expérience utilisateur personnalisée

Utilisez le Kit de développement logiciel (SDK) Speech Devices pour construire un dispositif d’ambiance et créer un mot déclencheur personnalisé

En savoir plus