Gestalten Sie Ihre Apps mit natürlichen Stimmen
Erstellen Sie Apps und Dienste, die eine natürliche Sprache verwenden. Heben Sie Ihre Marke mit einem angepassten, realistischen Sprachgenerator ab, und greifen Sie auf Stimmen mit unterschiedlichen Sprechstilen und emotionalen Tonfällen zu, passend für Ihren Anwendungsfall – von Textlesern und Sprechern bis hin zu Kundensupport-Chatbots.
Natürliche synthetisierte Sprache
Erzeugen Sie mit der Sprachsynthese flüssige, natürlich klingende Sprache, die die Intonation und Emotion menschlicher Stimmen nachbildet.
Anpassbare Text-Talker-Stimmen
Erstellen Sie einen einzigartigen KI-Sprachgenerator, der zu Ihrer Markenidentität passt.
Präzise Audio-Steuerelemente für Text-zu-Sprache
Nehmen Sie eine Feinabstimmung für Ihre Anwendungsfälle vor, indem Sie Geschwindigkeit, Tonhöhe, Aussprache und Sprechpausen an das jeweilige Szenario anpassen.
Flexible Bereitstellung
Ob in der Cloud, lokal oder containerbasiert im Edge – die Sprachsynthese lässt sich praktisch überall ausführen.
Sprachausgabe nach Maß
Passen Sie die Audioausgabe der Sprachsynthese an Ihr Szenario an. Legen Sie Lexika fest, und nutzen Sie SSML (Speech Synthesis Markup Language) oder das Werkzeug zum Erstellen von Audioinhalten, um Parameter wie Aussprache, Tonhöhe, Geschwindigkeit, Sprechpausen und Betonung anzupassen.
Ortsunabhängiges Bereitstellen, von der Cloud bis zum Edge
Nutzen Sie die Text-to-Speech-Funktionen, ganz gleich, wo sich Ihre Daten befinden. Integrieren Sie eine realistische Sprachsynthese in Anwendungen, die dank Containern für robuste Cloudfunktionen und den Edge optimiert ist.
Eine benutzerdefinierte Stimme für Ihre Marke
Heben Sie sich mit einer Custom Voice mit Wiedererkennungswert von anderen Marken ab. Entwickeln Sie mit der Funktion „Benutzerdefinierte neuronale Stimme“ realistische Stimmen für natürlichere Gesprächsfeatures. Zunächst können Sie Audiomaterial in einer Länge von 30 Minuten generieren. Hier sind einige Beispiele von Organisationen, die heute KI-Sprachgenerierung durchführen:
Vorantreiben von App-Innovationen mithilfe von KI-Clouddiensten
Lernen Sie fünf wichtige Möglichkeiten kennen, wie Ihre Organisation in KI einsteigen kann, um schnell einen Mehrwert zu erzielen.
Umfangreicher Datenschutz und umfassende Sicherheit
Dokumentation
Der Speech-Dienst ist Teil von Azure Cognitive Services und SOC-, FedRAMP-, PCI DSS-, HIPAA-, HITECH- und ISO-zertifiziert.
Sie können Ihre Custom Voice-Daten und Sprachsynthesemodelle jederzeit aufrufen und löschen. Ihre Daten werden im Speicher verschlüsselt.
Schulungen
Sie behalten die Kontrolle über Ihre Daten. Ihre Textdaten werden während der Datenverarbeitung oder der Sprachgenerierung nicht gespeichert.
Der Sprachdienst basiert auf der Azure-Infrastruktur und bietet Sicherheit, Verfügbarkeit, Compliance und Verwaltbarkeit auf Unternehmensniveau.
Integrierte umfassende Sicherheit und Compliance
-
Microsoft investiert über 1 Milliarde USD pro Jahr in die Forschung und Entwicklung der Cybersecurity.
-
Microsoft beschäftigt mehr als 3.500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.
-
Azure verfügt über mehr Zertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.
-
Flexible Preise für die gewünschte Leistung und Kontrolle
Sie zahlen nur für das, was Sie wirklich nutzen – ohne jegliche Vorabkosten. Text-to-Speech wird nutzungsbasiert abgerechnet. Als Grundlage dient die Anzahl der in Audiodaten konvertierten Zeichen.
Erste Schritte mit einem kostenlosen Azure-Konto
1
2
Nachdem Ihr Guthaben aufgebraucht ist, wechseln Sie zur nutzungsbasierten Zahlung, um Ihr Wachstum mit den gleichen kostenlosen Dienstleistungen voranzutreiben. Es fallen nur Gebühren an, wenn Sie die kostenlosen monatlichen Kontingente überschreiten.
3
Richtlinien für die verantwortungsbewusste Entwicklung synthetischer Stimmen
Weitere Informationen zum verantwortungsbewussten Einsatz
Synthetische Stimmen müssen für die Hörer vertrauenswürdig klingen. Informieren Sie sich über die Prinzipien zum Entwickeln einer künstlichen Sprachausgabe, die Vertrauen in Ihr Unternehmen und in Ihre Dienstleistungen schaffen.
Einholen einer Einwilligung von Sprechern
Erklären Sie Sprechern die neuronale Text-to-Speech-Funktion, und informieren Sie sich über empfohlene Einsatzzwecke.
Sorgen Sie für Transparenz
Transparenz ist eine wichtige Grundlage beim verantwortungsbewussten Einsatz von Sprachgeneratoren und synthetischer Stimmen. Für Benutzer muss offensichtlich sein, dass sie eine synthetische Stimme hören. Außerdem muss der Sprecher über die Verwendung seiner Stimme informiert werden. Weitere Informationen finden Sie in unseren Entwurfsrichtlinien für die Offenlegung.
Dokumentation und Ressourcen
Erste Schritte
Lesen Sie die Dokumentation
Am Microsoft Learn-Kurs teilnehmen
Codebeispiele erkunden
Den Beispielcode ansehen
Siehe Anpassungsressourcen
Passen Sie Ihre Speech-Lösung mit Speech Studio an. Dafür müssen Sie nicht programmieren können.