Text in Sprache umwandeln

Konvertieren von Sprachsynthesen zum Erstellen von natürlicheren, leicht bedienbaren Schnittstellen

Sprechen wie ein Mensch – nicht wie ein Roboter

Erstellen Sie Apps und Dienste, die auf natürliche Weise mit Benutzern sprechen, und verbessern Sie damit die Barrierefreiheit und die Benutzerfreundlichkeit. Wandeln Sie Text nahezu in Echtzeit in Audiosignale um, geben Sie sie wieder, und speichern Sie sie für die spätere Verwendung als Datei. Die Sprachsynthese ist jetzt als neuronale und als Standardversion verfügbar.

Durch Übernahme der neuesten Innovationen bei digitaler Sprache macht die neuronale Sprachsynthese die Stimmen Ihrer Sprach-Apps nahezu nicht von menschlichen Aufzeichnungen unterscheidbar. Der natürliche Tonfall und die deutliche Artikulation verringern die Hörermüdung bei der Interaktion mit KI-Systemen. Gestalten Sie mit der neuronalen Sprachsynthese Interaktionen mit Chatbots und virtuellen Helfern noch natürlicher und einladender, wandeln Sie digitale Texte wie E-Books in Audiobooks um, und verpassen Sie Ihrem Navigationssystem im Auto ein Upgrade.

Neuronale Sprachsynthese in Aktion

Englisch (USA): Jessa

Satz Stimmbeispiel
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Englisch (USA): Guy

Satz Stimmbeispiel
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chinesisch (CN): Xiaoxiao

Satz Stimmbeispiel
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Deutsch (DE): Katja

Satz Stimmbeispiel
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italienisch (IT): Elsa

Satz Stimmbeispiel
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Möchten Sie dies erstellen?

Die Standardversion der Sprachsynthese kann in mehreren Sprachen mit Benutzern reden. Wählen Sie aus über 75 Stimmen in mehr als 45 Sprachen und Dialekten aus – einschließlich der Auswahl zwischen männlichen und weiblichen Stimmen. Passen Sie Parameter wie Geschwindigkeit, Tonhöhe, Lautstärke, Aussprache und zusätzliche Pausen an.

Standard-Sprachsynthese in Aktion

Klicken Sie auf Wiedergabe, um zu erfahren, wie die Sprachsynthese funktioniert.*

Sprache Beispieltext Stimmbeispiel
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Möchten Sie dies erstellen?

Sprachsynthese mit benutzerdefinierten Stimmmodellen

Möchten Sie Ihren Stimmen-Agent mit einer eindeutigen Stimme mit Wiedererkennungswert ausstatten? Das Feature für die Anpassung der Stimme bei der Sprachsynthese erleichtert das Erstellen von einmaligen stimmaktivierten Apps, für die kein Fachwissen erforderlich ist.

Demo anzeigen

Sprache

Qualität

Beispieltext Stimmbeispiel

Möchten Sie Ihr eigenes Stimmmodell erstellen?

Einfacher Einstieg in Stimmmodelle

Wenn Sie Ihren Stimmen-Agent anpassen möchten, nehmen Sie Trainingsdaten auf, und laden Sie diese hoch. Der Dienst erstellt daraufhin eine einzigartige Voicefont, die auf Ihre Aufnahme abgestimmt ist. Starten Sie ein Proof of Concept mit einer kleinen Datenmenge. Das System skaliert diese nahtlos, wenn mehr Daten anfallen, und verbessert die Qualität der natürlichen Stimme.

Konsistent und integriert

Benutzerdefinierte Stimmmodelle sind vollständig in andere Sprachdienste von Cognitive Services integriert. Es ist kein Code erforderlich, und Sie können Ihr benutzerdefiniertes Stimmmodell einfach für die API bereitstellen.

Schnell und sicher

Über einen eindeutigen API-Endpunkt und die sichere Authentifizierungsverwaltung können Sie Ihre Voicefont schnell in alle Plattformen integrieren. Sie steuern Ihre Modelle selbst.

Beispiel für ein Sprachszenario

Intelligenter Kiosk

Durch Sprachdienste in Kombination mit Language Understanding können Apps und Benutzer natürlich miteinander interagieren. Verwenden Sie die Spracherkennung, um die Frage eines Benutzers zu erfassen, Language Understanding, um die Absicht zu analysieren und eine entsprechende Antwort zu formulieren, und die Sprachsynthese, um den Text in eine gesprochene Antwort zu übertragen. Erstellen Sie Schnittstellen für zahlreiche Unterhaltungsszenarios wie Banking, Reise und Entertainment.

Commerce chatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel, and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional e-mail and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The Speech recognition service can be added to support voice commands.1234567
  1. Übersicht
  2. Ablauf

Kommerzieller Chatbot

Übersicht

Durch Azure Bot Service und Language Understanding Intelligent Service wird es Entwicklern ermöglicht, Gesprächsschnittstellen für verschiedene Szenarios wie Banking, Reisen und Unterhaltung zu erstellen. Der Concierge eines Hotels kann beispielsweise einen Bot verwenden, um die üblichen Interaktionen per E-Mail und Telefonanruf zu verbessern, indem Kunden über Azure Active Directory überprüft werden sowie durch das Verwenden von Cognitive Services, um Benutzeranforderung mithilfe von Text- und Spracheingabe besser und kontextbasiert verarbeiten zu können. Der Spracherkennungsdienst kann hinzugefügt werden, um Sprachbefehle zu unterstützen.

Ablauf

  1. 1 Der Kunde verwendet Ihre mobile App
  2. 2 Der Kunde authentifiziert sich mithilfe von Azure AD B2C
  3. 3 Der Kunde fordert Informationen mithilfe des benutzerdefinierten App-Bots an
  4. 4 Cognitive Services unterstützt das Verarbeiten der natürlichen Sprachanforderung
  5. 5 Die Antwort wird vom Kunden überprüft, der die Frage mithilfe natürlicher Konversation verfeinern kann
  6. 6 Sobald der Benutzer mit den Ergebnissen zufrieden ist, aktualisiert Application Bot die Reservierung des Kunden
  7. 7 Application Insights erfasst die Telemetrie der Runtime, um die Entwicklung der Bot-Leistung und -Nutzung zu unterstützen

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: CTO, roobo

Cognitive Services-APIs erkunden

Maschinelles Sehen

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennung

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Freihanderkennung VORSCHAU

An AI service that recognizes digital ink content, such as handwriting, shapes, and ink document layout

Videoindizierung

Informationen aus Videos erschließen

Custom Vision

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Formularerkennung VORSCHAU

The AI-powered document extraction service that understands your forms

Textanalysen

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Translator Text

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

Bing-Rechtschreibprüfung

Ermitteln und korrigieren Sie Rechtschreibfehler in Ihrer App

QnA Maker

Verwandeln Sie Informationen in einfach zu findende Antworten.

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Language Understanding

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Sprachdienste

Vereinheitlichter Sprachdienst für Sprache-zu-Text, Text-zu-Sprache und Sprachübersetzung

Sprechererkennung VORSCHAU

Sprecher anhand ihrer Stimme Identifizieren und überprüfen

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Anomalieerkennung VORSCHAU

Fügen Sie Ihren Apps ganz einfach Funktionen zur Anomalieerkennung hinzu.

Personalisierung VORSCHAU

An AI service that delivers a personalized user experience

Verwenden Sie das SDK für sprachaktivierte Geräte zum Erstellen von Ambient Devices und zum Festlegen eines benutzerdefinierten Codeworts.

Weitere Informationen