Text-to-Speech

A Speech service feature that converts text to lifelike speech

Gestalten Sie Ihre Apps mit natürlichen Stimmen

Entwickeln Sie Apps und Dienste mit natürlicher Sprache, und wählen Sie aus über 215 Stimmen und 60 Sprachen und Sprachvarianten aus. Heben Sie sich von anderen Marken ab, indem Sie eine Stimme mit Wiedererkennungswert einsetzen. Passen Sie zudem den Sprechstil und die Gefühlslage der Stimme an jeweilige Situationen an. Für all das können Sie die Programmiersprache Ihrer Wahl benutzen.

Lifelike text to speech

Enable fluid, natural-sounding text to speech that matches the patterns and intonation of human voices.

Anpassbare Stimmen

Erstellen Sie eine einzigartige Stimme, die zu Ihrer Markenidentität passt.

Präzise Audiosteuerelemente

Nehmen Sie eine Feinabstimmung für Ihre Anwendungsfälle vor, indem Sie Geschwindigkeit, Tonhöhe, Aussprache und Sprechpausen an das jeweilige Szenario anpassen.

Flexible Bereitstellung

Ob in der Cloud oder am Edge in Containern – Sie können Text-to-Speech überall einsetzen.

Eine benutzerdefinierte Stimme für Ihre Marke

Heben Sie sich mit einer Stimme mit Wiedererkennungswert von anderen Marken ab. Entwickeln Sie realistische Stimmen für natürlichere Gesprächsfeatures mit der Funktion „Benutzerdefinierte neuronale Stimme“. Zunächst können Sie Audiomaterial in einer Länge von 30 Minuten generieren. Folgende Unternehmen nutzen das Feature zum Beispiel bereits:

Swisscom improves customer experiences with multi-lingual voice assistant

Swisscom used Speech service to create a natural sounding custom voice assistant with voice personas that are unique to Swisscom across English, French, German, and Italian.

AT&T begeistert Kunden mit immersiven Umgebungen

AT&T stellt die Leistungsstärke seines 5G-Netzes mit einer immersiven Benutzerumgebung unter Beweis, in der sich Kunden direkt mit Bugs Bunny* unterhalten können.

* LOONEY TUNES und alle zugehörigen Charaktere und Elemente © & ™ Warner Bros. Entertainment Inc. (s21)

Progressive vernetzt seine Kunden direkt mit Flo

Progressive used Custom Neural Voice to build a natural-sounding, virtual version of Flo to help customers with everything from getting a free car insurance quote to general insurance questions.

Verschiedene Stimmen für jedes Szenario

Erreichen Sie Benutzer auf der ganzen Welt mit mehr als 200 Stimmen und 50 Sprachen und Sprachvarianten. Setzen Sie Ihre Ideen mit ausdrucksstarken, menschenähnlichen Stimmen in die Tat um. Die neuronale Text-to-Speech-Funktion unterstützt verschiedene Sprechstile für Szenarios wie Smalltalk, Nachrichten und Kundendienst und Emotionen wie Freude und Mitgefühl.

Testen Sie die Sprachsynthese in dieser Demo-App, die auf unserem JavaScript SDK basiert

Sprachausgabe nach Maß

Fine-tune synthesized speech audio to fit your scenario. Define lexicons and control speech parameters such as pronunciation, pitch, rate, pauses, and intonation with Speech Synthesis Markup Language (SSML) or with the audio content creation tool.

Bereitstellungen von der Cloud bis zum Edge

Run Text to Speech wherever your data resides. Build lifelike speech synthesis into applications optimized for both robust cloud capabilities and edge locality using containers. Speech containers support both standard and custom text to speech capabilities.

Umfassende Datenschutz- und Sicherheitsfunktionen

  • Der Speech-Dienst ist Teil von Azure Cognitive Services und SOC-, FedRAMP-, PCI DSS-, HIPAA-, HITECH- und ISO-zertifiziert.
  • Sie behalten die Kontrolle über Ihre Daten. Ihre Textdaten werden während der Datenverarbeitung oder der Audiogenerierung nicht gespeichert.
  • View and delete your custom voice data and synthesized speech models at any time. Your data is encrypted while it’s in storage.
  • Der Speech-Dienst basiert auf der Azure-Infrastruktur und überzeugt durch Sicherheit, Verfügbarkeit, Compliance und Verwaltbarkeit auf Unternehmensniveau.

Flexible Preise für die gewünschte Leistung und Kontrolle

Sie zahlen nur für Ressourcen, die Sie wirklich nutzen – ohne jegliche Vorabkosten. Text-to-Speech wird nutzungsbasiert abgerechnet. Als Grundlage dient die Anzahl der in Audiodaten konvertierten Zeichen.

Richtlinien für die verantwortungsbewusste Entwicklung synthetischer Stimmen

Dokumentation und Ressourcen

Codebeispiele erkunden

Beispielcode

Ressourcen zur Anpassung

Passen Sie Ihre Speech-Lösung mit Speech Studio an. Dafür müssen Sie nicht programmieren können.

Sprachsynthese in der Praxis

Die BBS revolutioniert die Verbreitung von Inhalten

Using Azure Cognitive Services and Azure Bot Services, the BBC created an end-to-end, customized digital voice assistant that captures its brand identity and helps it establish a new conversational relationship with its broad audiences.

BBC

Swisscom verbessert den Nutzungskomfort für Kunden dank mehrsprachigem Sprach-Assistenten

Swisscom erstellte mithilfe des Diensts „Speech“ einen benutzerdefinierten Sprach-Assistenten mit Stimmpersonas für Englisch, Französisch, Deutsch und Italienisch, die kein anderes Unternehmen verwendet.

Swisscom

Motorola macht wichtige Daten für Rettungskräfte zugänglich

Dank Motorola-Lösungen können Polizeibeamte und Rettungskräfte schnell auf wichtige Informationen zugreifen, indem sie den sprachgesteuerten virtuellen Assistenten nutzen.

Motorola Solutions

Universal Electronics ermöglicht vernetzte Smart Homes

Universal Electronics unterstützt Hersteller bei der Bereitstellung sprachgesteuerter Navigations- und Steuerungsfunktionen für Smart-Home-Geräte.

Universal Electronics

Cheetah Mobile baut die internationale Übersetzung aus

Cheetah Mobile ist ein Unternehmen, dessen Apps von Benutzern in über 200 Ländern und Regionen weltweit verwendet werden. Das Unternehmen setzt jetzt die Sprachsynthese ein, um sein Übersetzungsgerät und die Übersetzungs-App auf den internationalen Markt zu bringen.

Cheetah Mobile

Erste Schritte mit Speech