Text in Sprache umwandeln

Intuitive und niederschwellige Oberflächen erstellen – mit Sprachsynthese

Sprechen wie ein Mensch – nicht wie ein Roboter

Erstellen Sie Apps und Dienste, die auf natürliche Weise mit Benutzern sprechen, und verbessern Sie damit die Barrierefreiheit und die Benutzerfreundlichkeit. Wandeln Sie Text nahezu in Echtzeit in Audiosignale um, geben Sie sie wieder, und speichern Sie sie für die spätere Verwendung als Datei. Text-to-Speech ist in einer neuronalen und einer Standardversion verfügbar.

Die neuronale Text-to-Speech-Version nutzt hochmoderne und innovative digitale Sprachsynthese. Deswegen sind die Stimmen in Ihrer App von echten Menschen praktisch nicht mehr zu unterscheiden. Der natürliche Tonfall und die deutliche Artikulation verringern die Hörermüdung bei der Interaktion mit KI-Systemen. Gestalten Sie mit neuronalen Text-to-Speech-Funktionen Interaktionen mit Chatbots und virtuellen Helfern noch natürlicher und einladender, wandeln Sie digitale Texte wie E-Books in Audiobooks um, und verpassen Sie Ihrem Navigationssystem im Auto ein Upgrade.

Neuronale Text-to-Speech-Funktionen in Aktion

Englisch (USA): Jessa

Satz Stimmbeispiel
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Englisch (USA): Guy

Satz Stimmbeispiel
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chinesisch (CN): Xiaoxiao

Satz Stimmbeispiel
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Deutsch (DE): Katja

Satz Stimmbeispiel
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italienisch (IT): Elsa

Satz Stimmbeispiel
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Möchten Sie dies erstellen?

Die Standardversion von Text-to-Speech kann in mehreren Sprachen mit Benutzern reden. Wählen Sie aus über 75 Stimmen in mehr als 45 Sprachen und Dialekten aus – einschließlich der Auswahl zwischen männlichen und weiblichen Stimmen. Passen Sie Parameter wie Geschwindigkeit, Tonhöhe, Lautstärke, Aussprache und zusätzliche Pausen an.

Standardversion von Text-to-Speech in Aktion

Klicken Sie auf „Abspielen“, um zu hören, wie leistungsfähig die Sprachsynthese ist.*

Sprache Beispieltext Stimmbeispiel
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Möchten Sie dies erstellen?

Text-to-Speech mit benutzerdefinierten Stimmmodellen

Möchten Sie Ihren Stimmen-Agent mit einer eindeutigen Stimme mit Wiedererkennungswert ausstatten? Die Text-to-Speech-Funktion für benutzerdefinierte Sprachsynthese macht das Erstellen einzigartiger Apps mit Sprachausgabe zum Kinderspiel.

Demo anzeigen

Sprache

Qualität

Beispieltext Stimmbeispiel

Möchten Sie Ihr eigenes Stimmmodell erstellen?

Einfacher Einstieg in Stimmmodelle

Wenn Sie Ihren Stimmen-Agent anpassen möchten, nehmen Sie Trainingsdaten auf, und laden Sie diese hoch. Der Dienst erstellt daraufhin eine einzigartige Voicefont, die auf Ihre Aufnahme abgestimmt ist. Bereits mit einer geringen Anzahl Daten können Sie einen Proof of Concept durchführen. Je mehr Daten zugeführt werden, desto natürlicher wirkt die Sprachsynthese – und das System bewältigt dies spielend.

Konsistent und integriert

Benutzerdefinierte Stimmmodelle sind vollständig in andere Sprachdienste von Cognitive Services integriert. Sie müssen nichts programmieren, sondern können Ihr benutzerdefiniertes Stimmmodell einfach für die API bereitstellen.

Schnell und sicher

Über einen eindeutigen API-Endpunkt und die sichere Authentifizierungsverwaltung können Sie Ihren Voicefont schnell in alle Plattformen integrieren. Sie steuern Ihre Modelle selbst.

Beispiel für ein Sprachszenario

Intelligenter Kiosk

Durch Sprachdienste in Kombination mit Language Understanding können Apps und Benutzer natürlich miteinander interagieren. Verwenden Sie die Spracherkennung, um die Frage eines Benutzers zu erfassen, Language Understanding, um die Absicht zu analysieren und eine entsprechende Antwort zu formulieren, und die Sprachsynthese, um den Text in eine gesprochene Antwort zu übertragen. Erstellen Sie Sprachkommunikationsschnittstellen für unterschiedlichste Szenarios wie Banking, Reise und Entertainment.

Commerce chatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel, and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional e-mail and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The Speech recognition service can be added to support voice commands.1234567
  1. Übersicht
  2. Ablauf

Kommerzieller Chatbot

Übersicht

Durch Azure Bot Service und Language Understanding Intelligent Service wird es Entwicklern ermöglicht, Gesprächsschnittstellen für verschiedene Szenarios wie Banking, Reisen und Unterhaltung zu erstellen. Der Concierge eines Hotels kann beispielsweise einen Bot verwenden, um die üblichen Interaktionen per E-Mail und Telefonanruf zu verbessern, indem Kunden über Azure Active Directory überprüft werden sowie durch das Verwenden von Cognitive Services, um Benutzeranforderung mithilfe von Text- und Spracheingabe besser und kontextbasiert verarbeiten zu können. Der Spracherkennungsdienst kann hinzugefügt werden, um Sprachbefehle zu unterstützen.

Ablauf

  1. 1 Der Kunde verwendet Ihre mobile App
  2. 2 Der Kunde authentifiziert sich mithilfe von Azure AD B2C
  3. 3 Der Kunde fordert Informationen mithilfe des benutzerdefinierten App-Bots an
  4. 4 Cognitive Services unterstützt das Verarbeiten der natürlichen Sprachanforderung
  5. 5 Die Antwort wird vom Kunden überprüft, der die Frage mithilfe natürlicher Konversation verfeinern kann
  6. 6 Sobald der Benutzer mit den Ergebnissen zufrieden ist, aktualisiert Application Bot die Reservierung des Kunden
  7. 7 Application Insights erfasst die Telemetrie der Runtime, um die Entwicklung der Bot-Leistung und -Nutzung zu unterstützen

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: CTO, roobo

Cognitive Services-APIs erkunden

Maschinelles Sehen

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennung

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Freihanderkennung VORSCHAU

Ein KI-Dienst zur Erkennung digitaler Freihandinhalte wie handschriftlicher Texte, Formen und Layouts geschriebener Dokumente

Videoindizierung

Informationen aus Videos erschließen

Custom Vision

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Formularerkennung VORSCHAU

Ein KI-basierter Dienst zur Dokumentextraktion, der Ihre Formulare auch wirklich versteht

Textanalysen

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Translator Text

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

QnA Maker

Verwandeln Sie Informationen in einfach zu findende Antworten.

Language Understanding

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Plastischer Reader VORSCHAU

Ermöglichen Sie Benutzern unabhängig von Alter und Fähigkeiten das Lesen und Verstehen von Texten

Sprachdienste

Vereinheitlichter Sprachdienst für Sprache-zu-Text, Text-zu-Sprache und Sprachübersetzung

Sprechererkennung VORSCHAU

Sprecher anhand ihrer Stimme Identifizieren und überprüfen

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Anomalieerkennung VORSCHAU

Fügen Sie Ihren Apps ganz einfach Funktionen zur Anomalieerkennung hinzu.

Personalisierung VORSCHAU

Ein KI-Dienst für eine personalisierte Benutzeroberfläche

Verwenden Sie das SDK für sprachaktivierte Geräte zum Erstellen von Ambient Devices und zum Festlegen eines benutzerdefinierten Codeworts.

Weitere Informationen