Text-to-Speech

A Speech service feature that converts text to lifelike speech

Gestalten Sie Ihre Apps mit natürlichen Stimmen

Entwickeln Sie Apps und Dienste, die in über 40 Sprachen und mit über 100 Stimmen natürlich mit Benutzern interagieren. Heben Sie sich von anderen Marken ab, indem Sie eine Stimme mit Wiedererkennungswert einsetzen. Passen Sie zudem den Sprechstil und die Gefühlslage der Stimme an jeweilige Situationen an. Für all das können Sie die Programmiersprache Ihrer Wahl benutzen.

Lebensechte Sprache

Erzeugen Sie flüssige, natürlich klingende Sprache, die die Muster und Intonation menschlicher Stimmen nachbildet.

Anpassbare Stimmen

Erstellen Sie eine einzigartige Stimme, die zu Ihrer Markenidentität passt.

Präzise Audiosteuerelemente

Nehmen Sie eine Feinabstimmung für Ihre Anwendungsfälle vor, indem Sie Geschwindigkeit, Tonhöhe, Aussprache und Sprechpausen an das jeweilige Szenario anpassen.

Flexible Bereitstellung

Ob in der Cloud oder am Edge in Containern – Sie können Text-to-Speech überall einsetzen.

Verschiedene Stimmen für jedes Szenario

Erreichen Sie Benutzer auf der ganzen Welt mit mehr als 100 Stimmen und 40 Sprachen und Sprachvarianten. Setzen Sie Ihre Ideen mit ausdrucksstarken, menschenähnlichen Stimmen in die Tat um. Die neuronale Text-to-Speech-Funktion unterstützt verschiedene Sprechstile für Szenarios wie Smalltalk, Nachrichten und Kundendienst und Emotionen wie Freude und Mitgefühl.

Testen Sie die Sprachsynthese in dieser Demo-App, die auf unserem JavaScript SDK basiert

Hinweis: Ihre Daten werden nicht gespeichert.

Steuern Sie mit dem Audio Content Creation-Tool weitere Aspekte der Sprachsyntheseausgabe

Informationen zum Erstellen von

Hinweis: Ihre Daten werden nicht gespeichert.

Steuern Sie mit dem Audio Content Creation-Tool weitere Aspekte der Sprachsyntheseausgabe

Informationen zum Erstellen von

Eine benutzerdefinierte Stimme für Ihre Marke

Heben Sie sich mit einer Stimme mit Wiedererkennungswert von anderen Marken ab. Mit der neuen Previewfunktion für benutzerdefinierte neuronale Stimmen können Sie realistische Stimmen für natürlichere Gesprächsschnittstellen entwickeln. Zunächst können Sie Audiodaten in der Länge von 30 Minuten aufnehmen.

Sprache

Qualität

Beispieltext Stimmbeispiel

Möchten Sie Ihr eigenes Stimmmodell erstellen?

Sprachausgabe nach Maß

Passen Sie die Sprache an Ihr Szenario an. Legen Sie Lexika fest, und nutzen Sie SSML (Speech Synthesis Markup Language) oder das Tool zum Erstellen von Audioinhalten, um Parameter wie Aussprache, Tonhöhe, Geschwindigkeit, Sprechpausen und Betonung anzupassen.

Bereitstellungen von der Cloud bis zum Edge

Nutzen Sie die Text-to-Speech-Funktionen, ganz gleich, wo sich Ihre Daten befinden. Entwickeln Sie Sprachanwendungen, die sowohl für robuste Cloudfunktionen als auch unter Verwendung von Containern (Vorschauversion) für den Edge optimiert sind. Sprachcontainer unterstützen sowohl Standardstimmen als auch benutzerdefinierte Stimmen.

Umfassende Datenschutz- und Sicherheitsfunktionen

  • Der Speech-Dienst ist Teil von Azure Cognitive Services und SOC-, FedRAMP-, PCI DSS-, HIPAA-, HITECH- und ISO-zertifiziert.
  • Sie behalten die Kontrolle über Ihre Daten. Ihre Textdaten werden während der Datenverarbeitung oder der Audiogenerierung nicht gespeichert.
  • Sie können Ihre benutzerdefinierten Stimmdaten und -modelle jederzeit aufrufen und löschen. Ihre Daten werden im Speicher verschlüsselt.
  • Der Speech-Dienst basiert auf der Azure-Infrastruktur und überzeugt durch Sicherheit, Verfügbarkeit, Compliance und Verwaltbarkeit auf Unternehmensniveau.

Flexible Preise für die gewünschte Leistung und Kontrolle

Sie zahlen nur für Ressourcen, die Sie wirklich nutzen – ohne jegliche Vorabkosten. Text-to-Speech wird nutzungsbasiert abgerechnet. Als Grundlage dient die Anzahl der in Audiodaten konvertierten Zeichen.

Richtlinien für die verantwortungsbewusste Entwicklung synthetischer Stimmen

Dokumentation und Ressourcen

Codebeispiele erkunden

Ressourcen zur Anpassung

Sprachsynthese in der Praxis

Motorola macht wichtige Daten für Rettungskräfte zugänglich

Dank Motorola-Lösungen können Polizeibeamte und Rettungskräfte schnell auf wichtige Informationen zugreifen, indem sie den sprachgesteuerten virtuellen Assistenten nutzen.

Erfolgsstory lesen

Motorola Solutions

Die BBS revolutioniert die Verbreitung von Inhalten

Mithilfe von Azure Cognitive Services und Azure Bot Service hat die BBC einen vollständigen, angepassten digitalen Sprachassistenten entwickelt, der die Markenidentität repräsentiert und eine neue Kommunikationsbeziehung mit der breiten Zielgruppe ermöglicht.

Erfolgsstory lesen

BBC

Universal Electronics ermöglicht vernetzte Smart Homes

Universal Electronics unterstützt Hersteller bei der Bereitstellung sprachgesteuerter Navigations- und Steuerungsfunktionen für Smart-Home-Geräte.

Erfolgsstory lesen

Universal Electronics

Cheetah Mobile baut die internationale Übersetzung aus

Cheetah Mobile ist ein Unternehmen, dessen Apps von Benutzern in über 200 Ländern und Regionen weltweit verwendet werden. Das Unternehmen setzt jetzt die Sprachsynthese ein, um sein Übersetzungsgerät und die Übersetzungs-App auf den internationalen Markt zu bringen.

Erfolgsstory lesen

Cheetah Mobile

Erste Schritte mit Speech