Spracherkennung

Dieses Feature des Speech-Diensts konvertiert gesprochene Audiodaten präzise in Text.

Gesprochene Audioinhalte umsetzen lassen

Lassen Sie Sprache schnell und präzise in Text in mehr als 30 Sprachen transkribieren. Passen Sie Modelle an, um die Genauigkeit fachspezifischer Terminologie zu verbessern. Ziehen Sie größeren Nutzen aus gesprochenen Audioinhalten, indem Sie Such- oder Analysefunktionen für transkribierten Text aktivieren oder Maßnahmen bereitstellen – all das in Ihrer bevorzugten Programmiersprache.

Qualitativ hochwertige Transkriptionen

Die hochmoderne Spracherkennung liefert exakte Transkriptionen.

Anpassbare Modelle

Fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Modelle.

Flexible Bereitstellung

Ob in der Cloud oder am Edge in Containern – Sie können die Spracherkennung überall ausführen.

Bereit für die Produktion

Profitieren Sie von derselben zuverlässigen Technologie, die die Spracherkennung in allen Microsoft-Produkten unterstützt.

Testen Sie die Spracherkennung in dieser Demo-App, die auf unserem JavaScript SDK basiert

Um die Demo mit einem Mikrofon und Ihrer eigenen Stimme auszuprobieren, wechseln Sie in einen anderen Browser mit WebRTC-Unterstützung, z.B. eine aktuelle Version von Microsoft Edge, Firefox oder Chrome.

Ihre Sprachdaten werden nicht gespeichert.

Sprache von verschiedenen Quellen präzise transkribieren

Wandeln Sie Audioinhalte von verschiedenen Quellen, wie Mikrofonen, Audiodateien und Blob Storage, in Text um. Verwenden Sie die Sprecherdiarisierung, um festzustellen, wer wann was gesagt hat. Erhalten Sie lesbare Transkriptionen mit automatischer Formatierung und Zeichensetzung.

Sprachmodelle an spezifische Bedürfnisse anpassen

Passen Sie Ihre Sprachmodelle an, um unternehmens- und branchenspezifische Terminologie zu verstehen. Überwinden Sie Grenzen der Spracherkennung wie z. B. Hintergrundgeräusche, Akzente oder singuläre Vokabeln. Passen Sie Ihre Modelle an, indem Sie Audiodaten und -transkriptionen hochladen. Generieren Sie automatisch benutzerdefinierte Modelle mithilfe von Office 365-Daten, um die Genauigkeit der Spracherkennung für Ihr Unternehmen zu optimieren.

Bereitstellungen von der Cloud bis zum Edge

Nutzen Sie die Spracherkennung, ganz gleich, wo sich Ihre Daten befinden. Entwickeln Sie Sprachanwendungen, die sowohl für stabile Cloudfunktionen als auch unter Verwendung von Containern (Vorschau) für das Edge optimiert sind. Sprachcontainer unterstützen sowohl standardmäßige als auch benutzerdefinierte Spracheingaben.

Umfassende Datenschutz- und Sicherheitsfunktionen

  • Der Speech-Dienst ist Teil von Azure Cognitive Services und SOC-, FedRAMP-, PCI DSS-, HIPAA-, HITECH- und ISO-zertifiziert.
  • Sie behalten die Kontrolle über Ihre Daten. Ihre Audioeingabe- und Transkriptionsdaten werden während der Audioverarbeitung nicht protokolliert.
  • Sie können Ihre benutzerdefinierten Sprachdaten und -modelle jederzeit anzeigen und löschen. Ihre Daten werden im Speicher verschlüsselt.
  • Der Speech-Dienst basiert auf der Azure-Infrastruktur und überzeugt durch Sicherheit, Verfügbarkeit, Compliance und Verwaltbarkeit auf Unternehmensniveau.

Flexible Preise für die gewünschte Leistung und Kontrolle

Sie zahlen nur für Ressourcen, die Sie wirklich nutzen – ohne jegliche Vorabkosten. Die Spracherkennung wird nutzungsbasiert auf Grundlage der für die Audiotranskription aufgewendeten Stunden abgerechnet.

Dokumentation und Ressourcen

Codebeispiele erkunden

Anpassungsressourcen

Passen Sie Ihre Sprachlösung mit Speech Studio an. Kein Code erforderlich.

KPMG

KPMG nutzt die Anpassungsfunktionen der Spracherkennung, um die Transkription und Übersetzung von Telefongesprächen zu optimieren, und erzielt so eine Transkriptionsgenauigkeit von 90 Prozent und mehr.

Erste Schritte mit Speech