Navigation überspringen

Sprachdienste

Konvertieren von Sprache in Text, Ausführen von Sprachübersetzung und Sprachsynthese mit den vereinheitlichten Sprachdiensten

Spracherkennung: Konvertieren von Sprachausgabe in Text für intuitive Interaktion

Fügen Sie mühelos die Konvertierung von Sprache zu Text in Echtzeit zu Ihrer Anwendungen hinzu, z.B. für Sprachbefehle, Echtzeittranskriptionen oder die Analyse von Call Center-Protokollen.

Passen Sie Ihre Spracherkennungsmodelle an, um dem Sprachstil, den Ausdrücken oder dem einzigartigen Vokabular von Benutzern zu entsprechen und spezifischen Hintergrundgeräuschen, Akzenten und Stimmmustern je nach Szenario entgegenzukommen.

Weitere Informationen
Spracherkennung

Sprachsynthese: Verleihen Sie Ihren Apps eine natürliche Stimme

Erstellen Sie intelligente Apps und Dienste, die mithilfe des Sprachsynthesediensts mit Benutzern „natürlich sprechen“. Konvertieren Sie Text nahezu in Echtzeit in Sprache, und passen Sie u.a. die Geschwindigkeit, Tonhöhe und Lautstärke.

Verleihen Sie Ihrer Anwendung eine einzigartige erkennbare Markenstimme mithilfe von benutzerdefinierten Stimmmodellen. Nehmen Sie Trainingsdaten einfach auf, und laden Sie diese hoch. Der Dienst erstellt daraufhin einen einzigartigen Voicefont, der auf Ihre Aufnahme abgestimmt ist.

Weitere Informationen
Text in Sprache umwandeln

Sprachübersetzung

Erweitern Sie Ihre App um Echtzeit-Sprachübersetzungsfunktionen in allen unterstützten Sprachen, und erhalten Sie eine Übersetzung in Text oder Sprache. Die Modelle der Sprachübersetzung basieren auf führenden Spracherkennungs- und neuronalen maschinellen Übersetzungstechnologien (NMT). Sie sind dafür optimiert, die Art und Weise zu verstehen, in der Personen im echten Leben reden, und Übersetzungen von herausragender Qualität zu erstellen.

Weitere Informationen
Sprachübersetzung
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Cognitive Services-APIs erkunden

Maschinelles Sehen

Nützliche Informationen aus Bildern herausfiltern

Gesichtserkennung

Gesichter auf Fotos erkennen, analysieren, organisieren und markieren

Videoindizierung

Informationen aus Videos erschließen

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Custom Vision VORSCHAU

Passen Sie Ihre eigenen hochmodernen Modelle für maschinelles Sehen ganz einfach an Ihre speziellen Anforderungen an.

Textanalysen

Werten Sie ganz einfach Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen

Translator Text

Einfach durchzuführende maschinelle Übersetzung mit einem einfachen REST-API-Aufruf

Bing-Rechtschreibprüfung

Ermitteln und korrigieren Sie Rechtschreibfehler in Ihrer App

Content Moderator

Automatisierte Bild-, Text- und Videomoderation

Language Understanding

Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen

Sprachdienste

Vereinheitlichter Sprachdienst für Sprache-zu-Text, Text-zu-Sprache und Sprachübersetzung

Sprechererkennung VORSCHAU

Sprecher anhand ihrer Stimme Identifizieren und überprüfen

QnA Maker

Verwandeln Sie Informationen in einfach zu findende Antworten.

Bereit, Ihrer App neuen Schwung zu verleihen?