Synthèse vocale

A Speech service feature that converts text to lifelike speech

Donner vie à vos applications avec des voix naturelles

Créez des applications et services qui s’expriment dans un langage naturel, en choisissant parmi plus de 100 voix dans plus de 40 langues. Différenciez votre marque avec une voix personnalisée, en accédant à des voix associées à différents styles d’expression et tons émotionnels adaptés à votre cas d’usage, le tout dans votre langage de programmation de prédilection.

Un langage réaliste

Activez une voix fluide et naturelle qui reflète les modulations et intonations de la voix humaine.

Voix personnalisables

Créez une voix unique correspondant à votre image de marque.

Contrôles audio affinés

Réglez la sortie vocale pour vos scénarios en ajustant facilement le débit, le ton, la prononciation, les pauses, et bien plus encore.

Déploiement flexible

Exécutez l’API Synthèse vocale partout, dans le cloud, en local ou à la périphérie dans des conteneurs.

Accéder à un large éventail de voix pour chaque scénario

Touchez un public mondial avec plus de 100 voix et 40 langues et variantes. Donnez vie à vos scénarios avec des voix hautement expressives et anthropomorphiques. La synthèse vocale neuronale prend en charge plusieurs styles d’expression orale, par exemple, conversationnel, journalistique ou technique, et reflète diverses émotions telles que la jovialité et l’empathie.

Try text-to-speech with this demo app, built on our JavaScript SDK

Control more aspects of your text-to-speech output with the Audio Content Creation tool

Voulez-vous créer l'expérience ?

Control more aspects of your text-to-speech output with the Audio Content Creation tool

Voulez-vous créer l'expérience ?

Créer une voix personnalisée pour votre marque

Différenciez votre marque avec une voix personnalisée unique. Élaborez une voix très réaliste pour des interfaces conversationnelles naturelles en utilisant la fonctionnalité de voix neuronale personnalisée (préversion), à partir de 30 minutes d’audio.

Langage

Qualité

Texte d’échantillon Échantillon vocal

Vous voulez commencer à construire votre propre modèle vocal ?

Adapter votre sortie vocale

Adaptez l’audio à votre scénario. Élaborez des lexiques et contrôlez des paramètres vocaux tels que la prononciation, le ton, le débit, les pauses et les intonations avec le langage de balisage de synthèse vocale (SSML, Speech Synthesis Markup Language) ou l’outil de création de contenu audio.

Déployer en tout lieu, du cloud à la périphérie

Exécutez l’API Synthèse vocale là où vos données résident. Créez des applications vocales optimisées pour offrir des fonctionnalités cloud robustes et opérer à la périphérie à l’aide de conteneurs (préversion). Les conteneurs Speech prennent en charge les voix standard et personnalisées.

Confidentialité et sécurité complètes

  • Le service Speech, qui fait partie d’Azure Cognitive Services, est certifié par SOC, FedRAMP, PCI DSS, HIPAA, HITECH et ISO.
  • Vos données n’appartiennent qu’à vous. Vos données texte ne sont pas stockées pendant le traitement des données ou la génération d’audio.
  • Affichez et supprimez vos données et modèles vocaux personnalisés à tout moment. Vos données stockées sont chiffrées.
  • Adossé à l’infrastructure Azure, le service Speech offre une sécurité, une disponibilité, une conformité et une facilité de gestion de classe Entreprise.

La tarification flexible vous offre la puissance et le contrôle dont vous avez besoin

Payez uniquement en fonction de votre utilisation, sans coût de démarrage. Avec la synthèse vocale, vous payez à l’utilisation, en fonction du nombre de caractères convertis en audio.

Instructions pour la création de voix de synthèse responsables

Documentation et ressources

Bien démarrer

Explorer des exemples de code

Voir les ressources de personnalisation

Commencer à utiliser Speech