Passen Sie die Spracherkennung in Ihrer App für Ihre Domäne an – einschließlich des OpenAI Whisper-Modells – oder verleihen Sie Ihrem Copilot eine Markenstimme.
Entwickeln Sie generative KI-Apps mit Sprachmodellen
Transkribieren Sie Sprache in Text
Transkribieren Sie Callcenter- oder Besprechungsunterhaltungen. Setzen Sie auf eine globale Präsenz mit Audiountertiteln in mehr als 100 Sprachen.
Konvertieren Sie Text in Sprache
Erstellen Sie Bots, die natürlich sprechen. Heben Sie Ihre Marke durch angepasste, realistische Stimmen und Sprechstile ab.
Sprachanalyse
Analysieren Sie Audio- oder Videoanrufaufzeichnungen, um tiefe Einblicke zu erhalten. Fassen Sie wichtige Themen zusammen, und extrahieren oder bearbeiten Sie persönliche Identifikationsinformationen.
Transkribieren Sie Audio mit OpenAI Whisper
Transformieren Sie Ihre Callcenter mithilfe des neuesten OpenAI Whisper-Modells in Azure KI Speech oder Azure OpenAI Service.
Erstellen benutzerdefinierter Stimmen
Erstellen Sie natürlich klingende Stimmen mit Benutzerdefinierter Neuronaler Stimme.
Erstellen Sie Ihre Avatare
Erwecken Sie Ihre Marke mit vorgefertigten oder benutzerdefinierten Avataren mit natürlich klingenden Stimmen zum Leben.
Erkennen und verifizieren Sie Sprecher
Fügen Sie die Sprecherüberprüfung und -identifizierung zu Ihrer App hinzu, um die Identität von Personen zu bestätigen oder den Sprecher in einem Meeting zu erkennen.
Unterstützen Sie die mehrsprachige Kommunikation
Übersetzen Sie Audio- oder Videodaten aus und in unterstützte Sprachen aus eine ständig wachsende Liste. Passen Sie Übersetzungen an Ihre Branche an.
Embedded Speech
Verwenden Sie eingebettete Spracherkennung, um Sprache-in-Text- und Text-zu-Sprache-Szenarien auf Geräten zu aktivieren, wenn die Cloudkonnektivität zeitweilig oder nicht verfügbar ist.
Erstellen Sie umfassende Lösungen mit Azure KI Speech und anderen Azure KI-Produkten.
Azure OpenAI Service
Integrieren Sie die Multifunktionalität und verbessern Sie Apps mit Modellen, die mehrere Arten von Daten kombinieren, z. B. Text, Bilder, Video und Audio.
„Unser größter Anwendungsfall für Azure liegt in den Bereichen KI, Cognitive Services und Spracherkennung. Dies betrifft fast jeden einzelnen Teil unserer Plattform.“
Jeff Gallino, Mitgründer und Chief Technology Officer, CallMiner
„Hier in Brasilien waren wir Wegbereiter. Wir trafen die mutige Entscheidung, in die Verwendung einer neuronalen, synthetisierten Stimme zu investieren, als niemand sonst dies getan hat. Wir sprechen jedes Jahr mit Millionen von Kunden, daher ist das Ändern unserer Stimme ein mutiger Schritt.“
Olimpio Fernandes, Director of Cognitive Experience Center, TIM
„Es ist ziemlich schwierig, qualitativ hochwertige Stimmen im großen Stil anzubieten, aber Microsoft hat uns wirklich dabei geholfen, den Ball bei Text-zu-Sprache ins Rollen zu bringen und die Stimmen für unsere Kunden anzubieten."
Azure KI Speech bietet eine Reihe von Features und Funktionen, einschließlich Spracherkennung, Sprachsynthese und Sprachübersetzung. Diese werden über SDKs in mehreren Programmiersprachen angeboten, einschließlich C#, C++, Java und mehr.
Azure KI Speech unterstützt eine ständig wachsende Gruppe von Sprachen. Die aktuelle Liste der unterstützten Sprachen finden Sie in dieser Liste.
Kunden entwickeln interessante Anwendungen mit Azure KI Diensten. Erste Schritte mit Sprachanalyse in Azure KI Foundry für Unterhaltungs-KI, Analyse nach dem Anruf, Videozusammenfassung und weitere Anwendungsfälle.
Nächste Schritte
Wählen Sie das für Sie passende Azure-Konto aus
Bezahlen Sie im Voraus, oder testen Sie Azure bis zu 30 Tage lang kostenlos.
Durchsuchen Sie den Microsoft-Hub für Unternehmenslösungen, um die Produkte und Lösungen zu finden, die Ihrer Organisation helfen können, ihre Ziele zu erreichen.