Sprachdienste
Konvertieren von Sprache in Text, Ausführen von Sprachübersetzung und Sprachsynthese mit den vereinheitlichten Sprachdiensten
Schnelles Entwickeln von qualitativ wertvollen sprachfähigen Apps
Erstellen Sie mithilfe der Speech SDK sprachgesteuerte Apps sicher und schnell. Transkribieren Sie Sprache in Text mit hoher Genauigkeit, erzeugen Sie natürlich klingende Text-zu-Sprache-Stimmen, übersetzen Sie gesprochene Sprache, und verwenden Sie die Spracherkennung während Unterhaltungen. Erkunden Sie Möglichkeiten ohne auf Code angewiesen zu sein, und erstellen Sie mithilfe von Speech Studio benutzerdefinierte Modelle, die perfekt auf Ihre App zugeschnitten sind.
Branchenführende Qualität
Erzielen Sie moderne Spracherkennung, lebensechte Text-zu-Sprache und die auszeichnungsreiche Sprechererkennung.
Konform und sicher
Ihre Daten bleiben Ihre – Spracheingaben werden während der Verarbeitung nicht protokolliert.
Anpassbare Stimmen und Modelle
Erstellen Sie benutzerdefinierte Stimmen, fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Modelle.
Flexible Bereitstellung
Führen Sie Speech überall aus – in der Cloud oder am Edge in Containern.

Sprache in Text konvertieren
Transkribieren Sie Audiodaten schnell und präzise in mehr als 100 Sprachen und Sprachvarianten. Gewinnen Sie per Transkription von Callcentergesprächen Erkenntnisse zu Kunden, verbessern Sie Benutzerfunktionen mit sprachfähigen Assistenten, erfassen Sie wichtige Diskussionen in Besprechungen und vieles mehr.

Geben Sie Ihrer App eine Stimme
Verwenden Sie Text-zu-Sprache, um Apps und Dienste zu erstellen, die gesprochene Sprache verwenden. Erstellen Sie natürlich klingende Audioinhalte, verbessern Sie die Barrierefreiheit mit laut vorgelesenen Funktionen, und erstellen Sie benutzerdefinierte Sprachassistenten.

Sprache in Echtzeit übersetzen
Übersetzen Sie Audio aus mehr als 30 Sprachen, und passen Sie Übersetzungen für die spezifischen Begriffe Ihrer Organisation an – alles in Ihrer bevorzugten Programmiersprache.

Lautsprecher überprüfen und erkennen
Bestätigen Sie die Identität einer Person, oder erkennen Sie an, wer in einer Besprechung spricht, indem Sie Ihrer App Sprecherüberprüfung und Identifikation hinzufügen.

Aktivieren Sie Ihren Assistenten oder Ihr IoT-Gerät mit einem benutzerdefinierten Schlüsselwort.
Erstellen Sie ein benutzerdefiniertes Schlüsselwort für IoT-Geräte und sprachfähige Assistenten, um Ihre Marke von anderen abzuheben und so persönlicher, personalisierter und sicherer zu machen.

Sprachbefehle für freihändige Szenarien hinzufügen
Erstellen Sie eine berührungslose Spracherfahrung, um die Sicherheit zu verbessern und Back-to-Work-Szenarien zu unterstützen.
Umfassende Sicherheit und Compliance, integriert
-
Microsoft investiert jedes Jahr mehr als USD 1 Mrd. in die Forschung und Entwicklung der Cybersecurity.
-
Wir beschäftigen mehr als 3,500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.
-
Azure verfügt über mehr Zertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.
Flexible Preise für die gewünschte Leistung und Kontrolle
Zahlen Sie nur für das, was Sie verwenden, ohne Vorabkosten. Bei Speech erfolgt die nutzungsbasierte Zahlung basierend auf:
- Die Anzahl der Stunden von Audio, die Sie für Spracherkennung und Sprachübersetzung transkribieren oder übersetzen.
- Die Anzahl der Zeichen, die Sie für Text-zu-Sprache in Audio konvertieren
- Die Anzahl der Transaktionen für Sprechererkennung
Sprachdokumentation und Ressourcen
Erste Schritte mit dem Speech-Dienst
Sehen Sie die Dokumentationan.
Nehmen Sie an dem Microsoft Learn Speech-Kurs teil.
Beliebte Entwicklerressourcen erkunden
Sehen Sie sich unseren Beispielcode und SDKs an
Erstellen Sie Sprachmodellen schnell mit Speech Studio Stack Overflow
Von Unternehmen aller Größen als vertrauenswürdig eingestuft
AT&T begeistert Kunden mit immersiven Erfahrungen
AT&T zeigt ihr 5G-Netzwerk mit einem immersiven Erlebnis, das Kunden ermöglicht, direkt mit Bugs Bunny zu sprechen.*
*LOONEY TUNES und alle zugehörigen Zeichen und Elemente © & ™ Warner Bros. Entertainment Inc. (s21)

Progressive bringt Flo direkt zum Kunden
Progressive verwendete benutzerdefinierte neuronale Stimme, um eine natürlich klingende, virtuelle Version von Flo zu erstellen, um Kunden bei allen Fragen zu unterstützen, von der kostenlosen Autoversicherung bis hin zu allgemeinen Versicherungsfragen.

KPMG optimiert die Transkription von Anrufen
KPMG verwendet Spracherkennung, um Tausende von Aufrufen zu transkribieren und zu katalogisieren, wodurch die Konformitätskosten für die Clients um bis zu 80 Prozent reduziert werden.

Motorola hilft Ersthelfern beim Zugriff auf wichtige Daten
Motorola Solutions hilft Erstbeantworter im Außendienst mit einem sprachgesteuerten virtuellen Assistenten beim Zugriff auf wichtige Informationen.

Hochtief dokumentiert Baumängel mithilfe von Spracherkennung
Ein sprachaktivierter virtueller Assistent hilft Bauprojektleitern beim Identifizieren und Dokumentieren von Mängeln auf Baustellen.

Zencity verbessert Lebensqualität mit KI-Lösungen
Das Daten- und Analyse-Startup Zencity nutzt die Sprachübersetzung, um Daten aus einer Vielzahl von Quellen – soziale Medien, Wartungsanfragen und vieles mehr – zu analysieren und Behörden dabei zu helfen, datengestützte Entscheidungen zu treffen, die ihren Bürgern bessere Dienstleistungen bieten.

Speech-Updates, Blogs und Ankündigungen
-
AKTUALISIEREN
Public preview: Azure Applied AI Services enhancements -
AKTUALISIEREN
Public preview: Azure Cognitive Services updates