Spracherkennung

Dieses Feature des Speech-Diensts konvertiert gesprochene Audiodaten präzise in Text.

Gesprochene Audioinhalte umsetzen lassen

Lassen Sie Sprache schnell und präzise in Text in mehr als 40 Sprachen und Varianten transkribieren. Passen Sie Modelle an, um die Genauigkeit fachspezifischer Terminologie zu verbessern. Ziehen Sie größeren Nutzen aus gesprochenen Audioinhalten, indem Sie Such- oder Analysefunktionen für transkribierten Text aktivieren oder Maßnahmen bereitstellen – all das in Ihrer bevorzugten Programmiersprache.

Qualitativ hochwertige Transkriptionen

Die hochmoderne Spracherkennung liefert exakte Transkriptionen.

Anpassbare Modelle

Fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Modelle.

Flexible Bereitstellung

Ob in der Cloud oder am Edge in Containern – Sie können die Spracherkennung überall ausführen.

Bereit für die Produktion

Profitieren Sie von derselben zuverlässigen Technologie, die die Spracherkennung in allen Microsoft-Produkten unterstützt.

Testen Sie die Spracherkennung in dieser Demo-App, die auf unserem JavaScript SDK basiert

Um die Demo mit einem Mikrofon und Ihrer eigenen Stimme auszuprobieren, wechseln Sie in einen anderen Browser mit WebRTC-Unterstützung, z.B. eine aktuelle Version von Microsoft Edge, Firefox oder Chrome.

Ihre Sprachdaten werden nicht gespeichert.

Sprache von verschiedenen Quellen präzise transkribieren

Wandeln Sie Audioinhalte von verschiedenen Quellen, wie Mikrofonen, Audiodateien und Blob Storage, in Text um. Verwenden Sie die Sprecherdiarisierung, um festzustellen, wer wann was gesagt hat. Erhalten Sie lesbare Transkriptionen mit automatischer Formatierung und Zeichensetzung.

Sprachmodelle an spezifische Bedürfnisse anpassen

Passen Sie Ihre Sprachmodelle an, um unternehmens- und branchenspezifische Terminologie zu verstehen. Überwinden Sie Grenzen der Spracherkennung wie z. B. Hintergrundgeräusche, Akzente oder singuläre Vokabeln. Passen Sie Ihre Modelle an, indem Sie Audiodaten und -transkriptionen hochladen. Generieren Sie automatisch benutzerdefinierte Modelle mithilfe von Office 365-Daten, um die Genauigkeit der Spracherkennung für Ihr Unternehmen zu optimieren.

Bereitstellungen von der Cloud bis zum Edge

Nutzen Sie die Spracherkennung, ganz gleich, wo sich Ihre Daten befinden. Entwickeln Sie Sprachanwendungen, die sowohl für stabile Cloudfunktionen als auch unter Verwendung von Containern (Vorschau) für das Edge optimiert sind. Sprachcontainer unterstützen sowohl standardmäßige als auch benutzerdefinierte Spracheingaben.

Umfassende Datenschutz- und Sicherheitsfunktionen

  • Der Speech-Dienst ist Teil von Azure Cognitive Services und SOC-, FedRAMP-, PCI DSS-, HIPAA-, HITECH- und ISO-zertifiziert.
  • Sie behalten die Kontrolle über Ihre Daten. Ihre Audioeingabe- und Transkriptionsdaten werden während der Audioverarbeitung nicht protokolliert.
  • Sie können Ihre benutzerdefinierten Sprachdaten und -modelle jederzeit anzeigen und löschen. Ihre Daten werden im Speicher verschlüsselt.
  • Der Speech-Dienst basiert auf der Azure-Infrastruktur und überzeugt durch Sicherheit, Verfügbarkeit, Compliance und Verwaltbarkeit auf Unternehmensniveau.

Flexible Preise für die gewünschte Leistung und Kontrolle

Sie zahlen nur für Ressourcen, die Sie wirklich nutzen – ohne jegliche Vorabkosten. Die Spracherkennung wird nutzungsbasiert auf Grundlage der für die Audiotranskription aufgewendeten Stunden abgerechnet.

Dokumentation und Ressourcen

Codebeispiele erkunden

Anpassungsressourcen

Passen Sie Ihre Sprachlösung mit Speech Studio an. Kein Code erforderlich.

Mit Spracherkennung erstellt

KPMG optimiert die Transkription von Anrufen

KPMG nutzt die Spracherkennung, um Tausende Anrufe zu transkribieren und zu katalogisieren. So können die Compliancekosten für Kunden um bis zu 80 % reduziert werden.

Erfolgsstory lesen

KPMG

Motorola macht wichtige Daten mithilfe von Spracherkennung für Rettungskräfte zugänglich

Dank Motorola Solutions können Polizeibeamte und Rettungskräfte schneller auf wichtige Informationen zugreifen, indem sie den sprachgesteuerten virtuellen Assistenten nutzen.

Erfolgsstory lesen

Motorola Solutions

Universal Electronics bietet sprachgesteuerte Smart-Home-Funktionen

Universal Electronics unterstützt andere Unternehmen bei der Bereitstellung von sprachgesteuerten Navigations- und Steuerungsfunktionen für Haushaltsgeräte und trägt somit zur Benutzerfreundlichkeit der Geräte bei.

Erfolgsstory lesen

Universal Electronics

Hochtief dokumentiert Baumängel mithilfe von Spracherkennung

Hochtief unterstützt Projektmanager mit einem sprachfähigen virtuellen Assistenten dabei, Baumängel zu erkennen und zu dokumentieren.

Erfolgsstory lesen

Cheetah Mobile

NTT DATA beschleunigt die Entscheidungsfindung mithilfe von Meeting Insights

NTT DATA gewinnt Erkenntnisse aus Sprachdaten, indem Meetings in Echtzeit transkribiert werden. Mit Custom Speech kann das Unternehmen Spracherkennungsmodelle so anpassen, dass diese organisationsspezifische Begriffe verstehen.

Erfolgsstory lesen

NTTDATA

Einblicke ins Conversational Banking

Insight Enterprise unterstützt Banken mit einer auf Conversational-AI basierten Bankinglösung dabei, die Digitalisierung in ihren Filialen voranzubringen und die Prozesse zu vereinfachen. Die Spracherkennung konvertiert die Aussagen von Kunden in Daten, die verarbeitet und analysiert werden können, um zeitnah passende Antworten zu finden.

Erfolgsstory lesen

Insight Enterprise, Inc.

Erste Schritte mit Speech