Spracherkennung

Die Spracherkennungs-API ist Teil des Speech-Diensts von Azure Cognitive Services.

Eingaben mit Ihrer Stimme

Verwenden Sie die Spracherkennung (Teil des Speech-Diensts), um schnell Audioaufnahmen in Text von verschiedenen Quellen zu konvertieren. Passen Sie Modelle an, um häufige Probleme bei der Spracherkennung zu lösen, z. B. besonderes Vokabular, Sprechweisen und Hintergrundgeräusche. Machen Sie Audioaufnahmen besser zugänglich, indem Sie dazu beitragen, dass jeder in Echtzeit der Konversation folgen und an ihr teilnehmen kann.

Bahnbrechende Innovation

Profitieren Sie von der herausragenden Genauigkeit der Spracherkennung, die auf Deep-Neural-Network-Modellen basiert.

Einbindung in Echtzeit

Transkribieren Sie in Echtzeit Audioaufnahmen, damit alle Gesprächsteilnehmer mitreden können.

Angepasste Spracherkennung

Passen Sie die Spracherkennung an Sprechweisen und domänenspezifische Terminologie an.

Flexible Bereitstellung

Ob in der Cloud, lokal oder am Edge in Containern: Sie können die Spracherkennung überall ausführen.

Nutzen Sie bahnbrechende Sprachtechnologien

Enhance your apps with speech capabilities powered by decades of breakthrough research. Microsoft was the first to reach human parity on the Switchboard conversational speech recognition task, and continues to drive cutting-edge research in speech recognition.

Weitere Informationen zu menschenähnlichen Leistungen bei der Spracherkennung

Um die Demo mit einem Mikrofon und Ihrer eigenen Stimme auszuprobieren, wechseln Sie in einen anderen Browser mit WebRTC-Unterstützung, z.B. eine aktuelle Version von Microsoft Edge, Firefox oder Chrome.

Möchten Sie dies erstellen?

Die Spracherkennung mithilfe von individuellen Modellen optimieren

Passen Sie Ihre Spracherkennungsmodelle an, um häufige Probleme zu überwinden. Passen Sie Ihre Sprachmodelle an die Sprechweisen oder Akzente der Benutzer oder besonderes Vokabular wie Ortsnamen, Produkte und branchenspezifische Ausdrücke an. Generieren Sie automatische benutzerdefinierte Modelle mithilfe von Office 365-Daten, um die Genauigkeit Ihrer Spracherkennung für organisationsspezifische Begriffe zu optimieren.

Jetzt von Custom Speech profitieren

Beispielsätze

Baseline

Benutzerdefinierte Spracherkennung

Möchten Sie dies erstellen?

Erkenntnisse aus Konversationen sammeln

Transkribieren Sie in Echtzeit Konversationen mit mehreren Teilnehmern, damit sich alle beteiligen können. Ermitteln Sie, wer wann was gesagt hat, und legen Sie schnell die nächsten Schritte fest. Optimieren Sie die Funktionsweise für Geräte mit mehreren Mikrofonen. Aktivieren Sie Analysen für Ihren transkribierten Text, um noch mehr Erkenntnisse aus Ihren Konversationen zu sammeln.

Weitere Informationen zur Unterhaltungstranskription

Bereitstellungen von der Cloud bis zum Edge

Führen Sie die Spracherkennung in der Cloud oder lokal mit Containern aus, wenn Datensicherheit und niedrige Latenz von zentraler Bedeutung sind.

Weitere Informationen zu Speech in Containern

Sicherheit auf Unternehmensniveau

  • Microsoft investiert über 1 Milliarde US-Dollar pro Jahr in die Forschung und Entwicklung der Cybersecurity.

  • Microsoft beschäftigt mehr als 3.500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.

  • Azure verfügt über mehr Compliancezertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.

Leistung, Steuerung und Anpassungsmöglichkeiten nach Bedarf mit flexibler Preisgestaltung

Sie zahlen nur für Ressourcen, die Sie wirklich nutzen – ohne jegliche Vorabkosten. Sie zahlen nur für die Spracherkennung, wenn Sie sie auch wirklich nutzen. Die Abrechnung erfolgt anhand der transkribierten Audioaufnahmen (in Stunden).

Informationen zu den Preisen für die Spracherkennung

In nur drei Schritten die Spracherkennung aktivieren

Wenn Sie sich für ein kostenloses Azure-Konto registrieren, erhalten Sie sofortigen Zugriff und eine Gutschrift von 200 US-Dollar.
Melden Sie sich beim Azure-Portal an, und fügen Sie Speech hinzu.
Weitere Informationen dazu, wie Sie die Spracherkennung einbetten können, erhalten Sie im Tutorial und der Dokumentation.

Entwicklerressourcen für die Spracherkennung

Dokumentation und Tutorials

Erste Schritte mit der Spracherkennung

Kurse

Nehmen Sie an einem Pluralsight-Kurs teil, in dem die Verwendung der Spracherkennung ausführlich beschrieben wird.

Anwendungsfälle

Erfahren Sie mehr über Spracherkennungsszenarios wie Konversationen und Callcentertranskription.

Häufig gestellte Fragen zur Spracherkennung

  • Eine vollständige Liste der von der Spracherkennung unterstützten Sprachen finden Sie in unserer Dokumentation.
  • Mit dem Speech SDK und den REST-APIs können Sie ganz einfach Tonaufnahmen eines Mikrofons erfassen, aus einem Stream lesen und auf Audiodateien in einem Speicher zugreifen. Das Speech SDK unterstützt für die Spracherkennung 16-Bit-WAV/PCM-Einkanalaudiodateien mit einer Frequenz von 16 kHz/8 kHz. Zusätzliche Audioformate werden über den Spracherkennungs-REST-Endpunkt oder den Batchtranskriptionsdienst unterstützt.
  • Überprüfen Sie die regionale Verfügbarkeit.

Erste Schritte mit der Spracherkennung