Navigation überspringen

Bing-Spracheingabe

Audio in Text umwandeln, die Absicht verstehen und Text zurück in Sprache umwandeln, um eine natürliche Reaktion zu erzielen

Spracherkennung

Konvertieren Sie Sprache in Text. Die API kann so eingerichtet werden, dass sie Folgendes erkennt: Audioeingaben aus dem Mikrofon in Echtzeit, Audioeingaben aus einer anderen Echtzeitaudioquelle oder Audioeingaben aus einer Datei. In allen Fällen ist Echtzeitstreaming möglich, wobei Audioinhalte an den Server gesendet und Teilergebnisse zurückgegeben werden.

Mit der Spracherkennungs-API können Sie intelligente Apps erstellen, die auf Spracheingaben reagieren. Um die Funktionsweise zu testen, wählen Sie Ihre Zielsprache aus, klicken auf das Mikrofon und beginnen zu sprechen. Oder klicken Sie einfach auf einen der Beispielsätze, um zu erleben, wie die Spracherkennung funktioniert. Wenn Sie diese Demo verwenden, erklären Sie sich damit einverstanden, Microsoft Ihre Spracheingabedaten zum Zweck der Verbesserung des Diensts zur Verfügung zu stellen.

Demo anzeigen

Um die Demo mit einem Mikrofon und Ihrer eigenen Stimme auszuprobieren, wechseln Sie in einen anderen Browser mit WebRTC-Unterstützung, z.B. eine aktuelle Version von Microsoft Edge, Firefox oder Chrome.

Durch Hochladen von Daten für diese Demoversion stimmen Sie zu, dass Microsoft diese Daten speichern und zur Verbesserung von Microsoft-Diensten wie z.B. dieser API verwenden darf. Zum Schutz Ihrer Privatsphäre ergreifen wir Maßnahmen, um Ihre Daten zu anonymisieren und sicher zu speichern. Wir werden Ihre Daten nicht veröffentlichen oder anderen Personen die Nutzung Ihrer Daten gestatten.

Möchten Sie dies erstellen?

Text in Sprache umwandeln

Wandeln Sie Text in eine Sprachausgabe um. Wenn Anwendungen mit ihren Benutzern „sprechen“ müssen, kann diese API verwendet werden, um den von der App generierten Text in eine Sprachausgabe umzuwandeln, die für den Benutzer wiedergegeben werden kann.

Mit der Text-to-Speech-API können Sie intelligente Apps erstellen, die „sprechen“ können. Testen Sie die API jetzt: Wählen Sie einfach Ihre Zielsprache aus, fügen Sie einige Sätze ein, und klicken Sie auf die Schaltfläche zum Abspielen, um zu erleben, wie die Umwandlung in Sprache funktioniert. Wenn Sie diese Demo verwenden, erklären Sie sich damit einverstanden, Microsoft Ihre Spracheingabedaten zum Zweck der Verbesserung des Diensts zur Verfügung zu stellen.

Demo anzeigen

500 Zeichen übrig

Durch Hochladen von Daten für diese Demoversion stimmen Sie zu, dass Microsoft diese Daten speichern und zur Verbesserung von Microsoft-Diensten wie z.B. dieser API verwenden darf. Zum Schutz Ihrer Privatsphäre ergreifen wir Maßnahmen, um Ihre Daten zu anonymisieren und sicher zu speichern. Wir werden Ihre Daten nicht veröffentlichen oder anderen Personen die Nutzung Ihrer Daten gestatten.

Möchten Sie dies erstellen?

Cognitive Services-APIs erkunden

Maschinelles Sehen

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennung

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Videoindizierung VORSCHAU

Informationen aus Videos erschließen

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Custom Vision VORSCHAU

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Textanalysen

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Translator Text

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

Bing-Rechtschreibprüfung

Ermitteln und korrigieren Sie Rechtschreibfehler in Ihrer App

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Language Understanding

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Bing-Spracheingabe

Wandeln Sie Sprache in Text um und umgekehrt, um die Absicht Ihrer Benutzer zu verstehen

Sprechererkennung VORSCHAU

Sprecher anhand ihrer Stimme Identifizieren und überprüfen

Sprachübersetzung

Sprachübersetzungen in Echtzeit mit einem einfachen REST-API-Aufruf

Benutzerdefinierte Spracherkennung VORSCHAU

Grenzen der Spracherkennung wie z.B. Sprachstil, Hintergrundgeräusche und Vokabular überwinden

Sprachdienste VORSCHAU

Vereinheitlichter Sprachdienst für Sprache-zu-Text, Text-zu-Sprache und Sprachübersetzung

QnA Maker

Verwandeln Sie Informationen in einfach zu findende Antworten.

Custom Decision VORSCHAU

Eine cloudbasierte, kontextbasierte API für das Treffen von Entscheidungen, die aus Erfahrungen lernt und sich selbst optimiert.

Bereit, Ihrer App neuen Schwung zu verleihen?