Navigation überspringen

Bing-Spracheingabe

Audio in Text umwandeln, die Absicht verstehen und Text zurück in Sprache umwandeln, um eine natürliche Reaktion zu erzielen

Spracherkennung

Konvertieren Sie Sprache in Text. Die API kann so eingerichtet werden, dass sie Folgendes erkennt: Audioeingaben aus dem Mikrofon in Echtzeit, Audioeingaben aus einer anderen Echtzeitaudioquelle oder Audioeingaben aus einer Datei. In allen Fällen ist Echtzeitstreaming möglich, wobei Audioinhalte an den Server gesendet und Teilergebnisse zurückgegeben werden.

Mit der Spracherkennungs-API können Sie intelligente Apps erstellen, die auf Spracheingaben reagieren. Um die Funktionsweise zu testen, wählen Sie Ihre Zielsprache aus, klicken auf das Mikrofon und beginnen zu sprechen. Oder klicken Sie einfach auf einen der Beispielsätze, um zu erleben, wie die Spracherkennung funktioniert. Wenn Sie diese Demo verwenden, erklären Sie sich damit einverstanden, Microsoft Ihre Spracheingabedaten zum Zweck der Verbesserung des Diensts zur Verfügung zu stellen.

Demo anzeigen

Um die Demo mit einem Mikrofon und Ihrer eigenen Stimme auszuprobieren, wechseln Sie in einen anderen Browser mit WebRTC-Unterstützung, z.B. eine aktuelle Version von Microsoft Edge, Firefox oder Chrome.

Möchten Sie dies erstellen?

Text in Sprache umwandeln

Wandeln Sie Text in eine Sprachausgabe um. Wenn Anwendungen mit ihren Benutzern „sprechen“ müssen, kann diese API verwendet werden, um den von der App generierten Text in eine Sprachausgabe umzuwandeln, die für den Benutzer wiedergegeben werden kann.

Mit der Text-to-Speech-API können Sie intelligente Apps erstellen, die „sprechen“ können. Testen Sie die API jetzt: Wählen Sie einfach Ihre Zielsprache aus, fügen Sie einige Sätze ein, und klicken Sie auf die Schaltfläche zum Abspielen, um zu erleben, wie die Umwandlung in Sprache funktioniert. Wenn Sie diese Demo verwenden, erklären Sie sich damit einverstanden, Microsoft Ihre Spracheingabedaten zum Zweck der Verbesserung des Diensts zur Verfügung zu stellen.

Demo anzeigen

500 Zeichen übrig

Möchten Sie dies erstellen?

Cognitive Services-APIs erkunden

Maschinelles Sehen

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennung

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Videoindizierung

Informationen aus Videos erschließen

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Custom Vision VORSCHAU

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Textanalysen

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Translator Text

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

Bing-Rechtschreibprüfung

Ermitteln und korrigieren Sie Rechtschreibfehler in Ihrer App

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Language Understanding

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Sprechererkennung VORSCHAU

Sprecher anhand ihrer Stimme Identifizieren und überprüfen

Sprachdienste

Vereinheitlichter Sprachdienst für Sprache-zu-Text, Text-zu-Sprache und Sprachübersetzung

QnA Maker

Verwandeln Sie Informationen in einfach zu findende Antworten.

Bereit, Ihrer App neuen Schwung zu verleihen?