Navigation überspringen

Sprachdienste

Konvertieren von Sprache in Text, Ausführen von Sprachübersetzung und Sprachsynthese mit den vereinheitlichten Sprachdiensten

Schnelles Entwickeln von qualitativ wertvollen sprachfähigen Apps

Erstellen Sie mithilfe der Speech SDK sprachgesteuerte Apps sicher und schnell. Transkribieren Sie Sprache in Text mit hoher Genauigkeit, erzeugen Sie natürlich klingende Text-zu-Sprache-Stimmen, übersetzen Sie gesprochene Sprache, und verwenden Sie die Spracherkennung während Unterhaltungen. Erkunden Sie Möglichkeiten ohne auf Code angewiesen zu sein, und erstellen Sie mithilfe von Speech Studio benutzerdefinierte Modelle, die perfekt auf Ihre App zugeschnitten sind.

Branchenführende Qualität

Erzielen Sie moderne Spracherkennung, lebensechte Text-zu-Sprache und die auszeichnungsreiche Sprechererkennung.

Konform und sicher

Ihre Daten bleiben Ihre – Spracheingaben werden während der Verarbeitung nicht protokolliert.

Anpassbare Stimmen und Modelle

Erstellen Sie benutzerdefinierte Stimmen, fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Modelle.

Flexible Bereitstellung

Führen Sie Speech überall aus – in der Cloud oder am Edge in Containern.

Sprache in Text konvertieren

Transkribieren Sie Audiodaten schnell und präzise in mehr als 100 Sprachen und Sprachvarianten. Gewinnen Sie per Transkription von Callcentergesprächen Erkenntnisse zu Kunden, verbessern Sie Benutzerfunktionen mit sprachfähigen Assistenten, erfassen Sie wichtige Diskussionen in Besprechungen und vieles mehr.

Geben Sie Ihrer App eine Stimme

Verwenden Sie Text-zu-Sprache, um Apps und Dienste zu erstellen, die gesprochene Sprache verwenden. Erstellen Sie natürlich klingende Audioinhalte, verbessern Sie die Barrierefreiheit mit laut vorgelesenen Funktionen, und erstellen Sie benutzerdefinierte Sprachassistenten.

Sprache in Echtzeit übersetzen

Übersetzen Sie Audio aus mehr als 30 Sprachen, und passen Sie Übersetzungen für die spezifischen Begriffe Ihrer Organisation an – alles in Ihrer bevorzugten Programmiersprache.

Lautsprecher überprüfen und erkennen

Bestätigen Sie die Identität einer Person, oder erkennen Sie an, wer in einer Besprechung spricht, indem Sie Ihrer App Sprecherüberprüfung und Identifikation hinzufügen.

Aktivieren Sie Ihren Assistenten oder Ihr IoT-Gerät mit einem benutzerdefinierten Schlüsselwort.

Erstellen Sie ein benutzerdefiniertes Schlüsselwort für IoT-Geräte und sprachfähige Assistenten, um Ihre Marke von anderen abzuheben und so persönlicher, personalisierter und sicherer zu machen.

Sprachbefehle für freihändige Szenarien hinzufügen

Erstellen Sie eine berührungslose Spracherfahrung, um die Sicherheit zu verbessern und Back-to-Work-Szenarien zu unterstützen.

Umfassende Sicherheit und Compliance, integriert

  • Microsoft investiert jedes Jahr mehr als USD 1 Mrd. in die Forschung und Entwicklung der Cybersecurity.

  • Wir beschäftigen mehr als 3,500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.

  • Azure verfügt über mehr Zertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.

Flexible Preise für die gewünschte Leistung und Kontrolle

Zahlen Sie nur für das, was Sie verwenden, ohne Vorabkosten. Bei Speech erfolgt die nutzungsbasierte Zahlung basierend auf:

  • Die Anzahl der Stunden von Audio, die Sie für Spracherkennung und Sprachübersetzung transkribieren oder übersetzen.
  • Die Anzahl der Zeichen, die Sie für Text-zu-Sprache in Audio konvertieren
  • Die Anzahl der Transaktionen für Sprechererkennung

Sprachdokumentation und Ressourcen

Erste Schritte mit dem Speech-Dienst

Sehen Sie die Dokumentationan.

Nehmen Sie an dem Microsoft Learn Speech-Kurs teil.

Beliebte Entwicklerressourcen erkunden

Sehen Sie sich unseren Beispielcode und SDKs an

Erstellen Sie Sprachmodellen schnell mit Speech Studio Stack Overflow

Von Unternehmen aller Größen als vertrauenswürdig eingestuft

AT&T begeistert Kunden mit immersiven Erfahrungen

AT&T zeigt ihr 5G-Netzwerk mit einem immersiven Erlebnis, das Kunden ermöglicht, direkt mit Bugs Bunny zu sprechen.*

*LOONEY TUNES und alle zugehörigen Zeichen und Elemente © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

Progressive bringt Flo direkt zum Kunden

Progressive verwendete benutzerdefinierte neuronale Stimme, um eine natürlich klingende, virtuelle Version von Flo zu erstellen, um Kunden bei allen Fragen zu unterstützen, von der kostenlosen Autoversicherung bis hin zu allgemeinen Versicherungsfragen.

Progressive

KPMG optimiert die Transkription von Anrufen

KPMG verwendet Spracherkennung, um Tausende von Aufrufen zu transkribieren und zu katalogisieren, wodurch die Konformitätskosten für die Clients um bis zu 80 Prozent reduziert werden.

KPMG

Motorola hilft Ersthelfern beim Zugriff auf wichtige Daten

Motorola Solutions hilft Erstbeantworter im Außendienst mit einem sprachgesteuerten virtuellen Assistenten beim Zugriff auf wichtige Informationen.

Motorola Solutions

Hochtief dokumentiert Baumängel mithilfe von Spracherkennung

Ein sprachaktivierter virtueller Assistent hilft Bauprojektleitern beim Identifizieren und Dokumentieren von Mängeln auf Baustellen.

HOCHTIEF

Zencity verbessert Lebensqualität mit KI-Lösungen

Das Daten- und Analyse-Startup Zencity nutzt die Sprachübersetzung, um Daten aus einer Vielzahl von Quellen – soziale Medien, Wartungsanfragen und vieles mehr – zu analysieren und Behörden dabei zu helfen, datengestützte Entscheidungen zu treffen, die ihren Bürgern bessere Dienstleistungen bieten.

Zencity

Speech-Updates, Blogs und Ankündigungen

Sind Sie bereit? Dann richten Sie Ihr kostenloses Azure-Konto ein.

Können wir Ihnen helfen?