Sprechererkennung

Erkennen Sie einzelne Sprecher, oder nutzen Sie die menschliche Stimme zum Identitätsnachweis

Sprecheridentifizierung

Identifizieren Sie einen Sprecher/eine Sprecherin. Die API kann verwendet werden, um die Identität eines unbekannten Sprechers zu ermitteln. Die Audiodaten des unbekannten Sprechers werden mit einer Gruppe ausgewählter Sprecher abgeglichen, und im Fall einer Übereinstimmung wird die Identität des Sprechers zurückgegeben.

Wir haben sechs verschiedene US-Präsidenten ausgewählt und sie anhand einer der von ihnen gehaltenen Reden beim Dienst registriert. Um auszuprobieren, wie die Demo automatisch den jeweiligen Präsidenten identifiziert, wählen Sie die Rede eines Präsidenten aus, indem Sie auf eine der Beispielaudiodateien unten klicken. Sie können auch eine eigene Audiodatei hochladen.

Demo anzeigen

Präsident Barack Obama
Präsident George W. Bush
Präsident William J. Clinton
Präsident George H. W. Bush
Präsident Ronald Reagan
Präsident Jimmy Carter

Beeindruckt? Das können Sie auch.

Cognitive Services-APIs erkunden

Maschinelles Sehen

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennung

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Freihanderkennung

Ein KI-Dienst zur Erkennung digitaler Freihandinhalte wie handschriftlicher Texte, Formen und Layouts geschriebener Dokumente

Videoindizierung

Informationen aus Videos erschließen

Custom Vision

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Formularerkennung

Ein KI-basierter Dienst zur Dokumentextraktion, der Ihre Formulare auch wirklich versteht

Textanalysen

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Translator Text

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

QnA Maker

Verwandeln Sie Informationen in einfach zu findende Antworten.

Language Understanding

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Plastischer Reader

Ermöglichen Sie Benutzern unabhängig von Alter und Fähigkeiten das Lesen und Verstehen von Texten

Sprachdienste

Vereinheitlichter Sprachdienst für Spracherkennung, Sprachsynthese und Sprachübersetzung

Sprechererkennung

Sprecher anhand ihrer Stimme identifizieren und verifizieren

Sprachübersetzung

Mühelos Echtzeitsprachübersetzung in Ihre App integrieren

Spracherkennung

Natürliche Interaktionen durch Konvertierung von gesprochener Sprache in Text

Text-to-Speech

Erstellen natürlicher und intuitiver Benutzeroberflächen mithilfe von Sprachsynthese

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Anomalieerkennung

Fügen Sie Ihren Apps ganz einfach Funktionen zur Anomalieerkennung hinzu.

Personalisierung

Ein KI-Dienst für eine personalisierte Benutzeroberfläche

Bereit, Ihrer App neuen Schwung zu verleihen?