Trace Id is missing
Zum Hauptinhalt wechseln

Azure KI Speech

Ein verwalteter Dienst mit branchenführenden Sprach-Funktionen wie Spracherkennung, Sprachsynthese, Sprachübersetzung und Sprechererkennung.

Entwickeln Sie schnell hochwertige, sprachgesteuerte Apps

Mit dem Speech SDK können Sie schnell und zuverlässig sprachgesteuerte Apps entwickeln. Transkribieren Sie gesprochene Sprache mit hoher Präzision in Text, generieren Sie natürlich klingende Stimmen für die Sprachsynthese, übersetzen Sie gesprochene Audioinhalte, und setzen Sie die Sprechererkennung bei Unterhaltungen ein. Erkunden Sie die Umgebung ohne Code, und erstellen Sie mit Speech Studio benutzerdefinierte Modelle, die auf Ihre App zugeschnitten sind.

KI ist eine Notwendigkeit, kein Luxus, sagen technische Führungskräfte. Lesen Sie den Blog.

Branchenführende Qualität

Nutzen Sie modernste Spracherkennung, realistische Sprachsynthese und preisgekrönte Sprechererkennung.

Konform und sicher

Sie behalten die Kontrolle über Ihre Daten – Ihre Spracheingabe wird während der Verarbeitung nicht protokolliert.

Anpassbare Stimmen und Modelle

Erstellen Sie benutzerdefinierte Stimmen, fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Modelle.

Flexible Bereitstellung

Ob in der Cloud oder am Edge in Containern: Sie können Speech überall einsetzen.

Konvertieren Sie Sprache in Text

Lassen Sie Audioinhalte schnell und präzise in mehr als 100 Sprachen und Varianten transkribieren. Gewinnen Sie mit Transkriptionen von Callcentergesprächen Informationen zu Kunden, verbessern Sie Ihr Angebot durch sprachgesteuerte Assistenten, erfassen Sie wichtige Gesprächspunkte in Meetings – und vieles mehr.

Verleihen Sie Ihrer App eine Stimme

Verwenden Sie Sprachsynthese, um Apps und Dienste zu erstellen, die unterhaltungsaktiv sprechen. Erstellen Sie natürlich klingende Audioinhalte, verbessern Sie die Barrierefreiheit mit Vorlesefunktionen, und erstellen Sie benutzerdefinierte Sprach-Assistenten.

Sprachübersetzung in Echtzeit

Übersetzen Sie Audioinhalte aus mehr als 30 Sprachen, und passen Sie Übersetzungen an die unternehmensspezifische Terminologie an – in Ihrer bevorzugten Programmiersprache.

Erkennen und verifizieren Sie Sprecher

Fügen Sie die Sprecherüberprüfung und -identifizierung zu Ihrer App hinzu, um die Identität von Personen zu bestätigen oder den Sprecher in einem Meeting zu erkennen.

Aktivieren Sie Assistenten oder IoT-Geräte mit einem benutzerdefinierten Schlüsselwort

Erstellen Sie ein benutzerdefiniertes Schlüsselwort für IoT-Geräte und sprachaktivierte Assistenten, um Ihre Marke von anderen abzuheben und persönlicher, personalisierbar und sicher zu gestalten.

Sprachbefehle für Freisprechszenarios hinzufügen

Entwickeln Sie komplett sprachgesteuerte Assistenten für mehr Sicherheit und die Förderung der Rückkehr zum Arbeitsplatz.

Integrierte umfassende Sicherheit und Compliance

Erste Schritte mit einem kostenlosen Azure-Konto

1

Kostenlos starten. Sie erhalten ein Guthaben von 200 USD, das Sie innerhalb von 30 Tagen verwenden können. Solange Sie über Ihr Guthaben verfügen, können Sie viele unserer beliebtesten Dienste kostenlos nutzen. Außerdem erhalten Sie mehr als 55 weitere Dienste stets kostenlos.

2

Nachdem Ihr Guthaben aufgebraucht ist, wechseln Sie zur nutzungsbasierten Zahlung, um Ihr Wachstum mit den gleichen kostenlosen Dienstleistungen voranzutreiben. Es fallen nur Gebühren an, wenn Sie die kostenlosen monatlichen Kontingente überschreiten.

3

Nach 12 Monaten erhalten Sie die über 55 Dienste weiterhin kostenlos und zahlen nur für die Nutzung über die monatlichen Freimengen hinaus.

Die bewährte Lösung für Unternehmen jeder Größe

AT&T begeistert Kunden mit immersiven Umgebungen

AT&T präsentiert sein 5G-Netz mit einer immersiven Benutzerumgebung, in der sich Kunden direkt mit Bugs Bunny* unterhalten können.

* LOONEY TUNES und alle zugehörigen Charaktere und Elemente © & ™ Warner Bros. Entertainment Inc. (s21)

Firstlight Media

Progressive bringt Flo direkt zu seinen Kunden

Dank der Funktion „Benutzerdefinierte neuronale Stimme“ konnte Progressive eine natürliche, virtuelle Version der fiktiven Kundendienstmitarbeiterin Flo erstellen, die Kunden zum gesamten Produktportfolio berät, von einer kostenlosen Fahrzeugversicherung bis hin zu allgemeinen Versicherungsfragen.

Progressive

KPMG optimiert die Transkription von Anrufen

KPMG nutzt die Spracherkennung, um Tausende Anrufe zu transkribieren und zu katalogisieren. So können die Compliancekosten für Kunden um bis zu 80 % reduziert werden.

KPMG

Motorola macht wichtige Daten für Rettungskräfte zugänglich

Motorola Solutions unterstützt Rettungskräfte mit einem sprachgesteuerten virtuellen Assistant beim Zugriff auf entscheidende Gesundheitsdaten.

Motorola Solutions
Zurück zu Registerkarten

Dokumentation und Ressourcen zu Speech

Erste Schritte mit KI Speech

Durchsuchen Sie die Dokumentation

Absolvieren Sie den Speech-Kurs auf Microsoft Learn

Erkunden von beliebten Ressourcen für Entwickler

Beispielcode und SDKs

Speech Studio und Stack Overflow für die schnelle Erstellung von Sprachmodellen

Erstellen mit KI Services beginnen

Speech kostenlos testen