Azure KI Speech
Ein verwalteter Dienst mit branchenführenden Sprach-Funktionen wie Spracherkennung, Sprachsynthese, Sprachübersetzung und Sprechererkennung.
Entwickeln Sie schnell hochwertige, sprachgesteuerte Apps
Erstellen Sie sprachaktivierte generative KI-Apps mit der Azure KI Speech zuverlässig und schnell. Transkribieren Sie gesprochene Sprache mit hoher Präzision in Text, generieren Sie natürlich klingende Stimmen für die Sprachsynthese, übersetzen Sie gesprochene Audioinhalte, und setzen Sie die Sprechererkennung bei Unterhaltungen ein. Erstellen Sie schneller mit vordefinierten und anpassbaren KI-Modellen in Azure KI Studio.
Branchenführende Qualität
Nutzen Sie modernste Spracherkennung, realistische Sprachsynthese und preisgekrönte Sprechererkennung.
Konform und sicher
Sie behalten die Kontrolle über Ihre Daten – Ihre Spracheingabe wird während der Verarbeitung nicht protokolliert.
Anpassbare Stimmen und Modelle
Erstellen Sie benutzerdefinierte Stimmen, fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Modelle.
Flexible Bereitstellung
Ob in der Cloud oder am Edge in Containern: Sie können Speech überall einsetzen.
Konvertieren Sie Sprache in Text
Lassen Sie Audioinhalte schnell und präzise in mehr als 100 Sprachen und Varianten transkribieren. Gewinnen Sie mit Transkriptionen von Callcentergesprächen Informationen zu Kunden, verbessern Sie Ihr Angebot durch sprachgesteuerte Assistenten, erfassen Sie wichtige Gesprächspunkte in Meetings – und vieles mehr.
Verleihen Sie Ihrer App eine Stimme
Verwenden Sie Sprachsynthese, um Apps und Dienste zu erstellen, die unterhaltungsaktiv sprechen. Erstellen Sie natürlich klingende Audioinhalte, verbessern Sie die Barrierefreiheit mit Vorlesefunktionen, und erstellen Sie benutzerdefinierte Sprach-Assistenten.
Sprachübersetzung in Echtzeit
Übersetzen Sie Audioinhalte aus mehr als 30 Sprachen, und passen Sie Übersetzungen an die unternehmensspezifische Terminologie an – in Ihrer bevorzugten Programmiersprache.
Erkennen und verifizieren Sie Sprecher
Fügen Sie die Sprecherüberprüfung und -identifizierung zu Ihrer App hinzu, um die Identität von Personen zu bestätigen oder den Sprecher in einem Meeting zu erkennen.
Aktivieren Sie Assistenten oder IoT-Geräte mit einem benutzerdefinierten Schlüsselwort
Erstellen Sie ein benutzerdefiniertes Schlüsselwort für IoT-Geräte und sprachaktivierte Assistenten, um Ihre Marke von anderen abzuheben und persönlicher, personalisierbar und sicher zu gestalten.
Sprachbefehle für Freisprechszenarios hinzufügen
Entwickeln Sie komplett sprachgesteuerte Assistenten für mehr Sicherheit und die Förderung der Rückkehr zum Arbeitsplatz.
Integrierte umfassende Sicherheit und Compliance
-
Microsoft investiert über 1 Milliarde USD pro Jahr in die Forschung und Entwicklung der Cybersecurity.
-
Microsoft beschäftigt mehr als 3.500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.
-
Flexible Preise für die gewünschte Leistung und Kontrolle
Profitieren Sie von einer nutzungsbasierten Bezahlung ohne Vorabkosten. Die nutzungsbasierte Bezahlung richtet sich bei Speech nach:
- Anzahl der Audiostunden, die bei der Spracherkennung oder Sprachübersetzung transkribiert oder übersetzt werden
- Anzahl der Zeichen, die bei der Sprachsynthese in Audio konvertiert werden
- Anzahl der Transaktionen für die Sprechererkennung
Erste Schritte mit einem kostenlosen Azure-Konto
1
Kostenlos starten. Sie erhalten ein Guthaben von 200 USD, das Sie innerhalb von 30 Tagen verwenden können. Solange Sie über Ihr Guthaben verfügen, können Sie viele unserer beliebtesten Dienste kostenlos nutzen. Außerdem erhalten Sie mehr als 55 weitere Dienste stets kostenlos.
2
Nachdem Ihr Guthaben aufgebraucht ist, wechseln Sie zur nutzungsbasierten Zahlung, um Ihr Wachstum mit den gleichen kostenlosen Dienstleistungen voranzutreiben. Es fallen nur Gebühren an, wenn Sie die kostenlosen monatlichen Kontingente überschreiten.
3
Die bewährte Lösung für Unternehmen jeder Größe
AT&T begeistert Kunden mit immersiven Umgebungen
AT&T präsentiert sein 5G-Netz mit einer immersiven Benutzerumgebung, in der sich Kunden direkt mit Bugs Bunny* unterhalten können.
* LOONEY TUNES und alle zugehörigen Charaktere und Elemente © & ™ Warner Bros. Entertainment Inc. (s21)
Progressive bringt Flo direkt zu seinen Kunden
Dank der Funktion „Benutzerdefinierte neuronale Stimme“ konnte Progressive eine natürliche, virtuelle Version der fiktiven Kundendienstmitarbeiterin Flo erstellen, die Kunden zum gesamten Produktportfolio berät, von einer kostenlosen Fahrzeugversicherung bis hin zu allgemeinen Versicherungsfragen.
KPMG optimiert die Transkription von Anrufen
KPMG nutzt die Spracherkennung, um Tausende Anrufe zu transkribieren und zu katalogisieren. So können die Compliancekosten für Kunden um bis zu 80 % reduziert werden.
Motorola macht wichtige Daten für Rettungskräfte zugänglich
Motorola Solutions unterstützt Rettungskräfte mit einem sprachgesteuerten virtuellen Assistant beim Zugriff auf entscheidende Gesundheitsdaten.
Dokumentation und Ressourcen zu Speech
Erste Schritte mit KI Speech
Durchsuchen Sie die Dokumentation
Absolvieren Sie den Speech-Kurs auf Microsoft Learn
Erkunden von beliebten Ressourcen für Entwickler
Speech Studio und Stack Overflow für die schnelle Erstellung von Sprachmodellen