Gesprochene Audioinhalte umsetzen lassen
Transkribieren Sie Audiodaten schnell und präzise in Text in mehr als 100 Sprachen und Varianten. Passen Sie Modelle an, um die Genauigkeit fachspezifischer Terminologie zu verbessern. Ziehen Sie größeren Nutzen aus gesprochenen Audioinhalten, indem Sie Such- oder Analysefunktionen für transkribierten Text aktivieren oder Maßnahmen bereitstellen – all das in Ihrer bevorzugten Programmiersprache.
Qualitativ hochwertige Transkriptionen
Die hochmoderne Spracherkennung liefert präzise Transkriptionen von Audiodaten in Text.
Anpassbare Modelle
Fügen Sie Ihrem Basisvokabular bestimmte Wörter hinzu, oder erstellen Sie Ihre eigenen Spracherkennungsmodelle.
Flexible Bereitstellung
Ob in der Cloud oder am Edge in Containern – Sie können die Spracherkennung überall ausführen.
Bereit für die Produktion
Profitieren Sie von derselben zuverlässigen Technologie, die die Spracherkennung in allen Microsoft-Produkten unterstützt.
Präzises Transkribieren von Sprache aus verschiedenen Quellen
Wandeln Sie Audioinhalte von verschiedenen Quellen, wie Mikrofonen, Audiodateien und Blob Storage, in Text um. Verwenden Sie die Sprecher-Zeiterfassung, um zu ermitteln, wer wann was gesagt hat. Erhalten Sie lesbare Transkriptionen mit automatischer Formatierung und Zeichensetzung.
Sprachmodelle an spezifische Bedürfnisse anpassen
Passen Sie Ihre Sprachmodelle an, um unternehmens- und branchenspezifische Terminologie zu verstehen. Überwinden Sie Grenzen der Spracherkennung wie z. B. Hintergrundgeräusche, Akzente oder singuläre Vokabeln. Dokumentation zum Anpassen Ihrer Modelle Passen Sie Ihre Modelle an, indem Sie Audiodaten und Transkripte hochladen. Generieren Sie benutzerdefinierte Modelle mithilfe von Office 365-Daten automatisch, um die Genauigkeit der Spracherkennung für Ihre Organisation zu optimieren.
Überall bereitstellen
Nutzen Sie die Spracherkennung, ganz gleich, wo sich Ihre Daten befinden. Erstellen Sie Sprachanwendungen, die für robuste Cloudfunktionen und lokale Nutzung optimiert sind, indem Sie Container verwenden.
Vorantreiben von App-Innovationen mithilfe von KI-Clouddiensten
Lernen Sie fünf wichtige Möglichkeiten kennen, wie Ihre Organisation in KI einsteigen kann, um schnell einen Mehrwert zu erzielen.
Umfassender Datenschutz und umfassende Sicherheit
-
KI Speech ist Teil von Azure KI Services und ist von SOC, FedRAMP, PCI DSS, HIPAA, HITECH und ISO zertifiziert .
-
Sie können Ihre benutzerdefinierten Sprachdaten und -modelle jederzeit anzeigen und löschen. Ihre Daten werden im Speicher verschlüsselt.
-
Sie behalten die Kontrolle über Ihre Daten. Ihre Audioeingabe- und Transkriptionsdaten werden während der Audioverarbeitung nicht protokolliert.
-
KI Speech basiert auf der Azure-Infrastruktur und bietet Sicherheit, Verfügbarkeit, Compliance und Verwaltbarkeit auf Unternehmensniveau.
Integrierte umfassende Sicherheit und Compliance
-
Microsoft investiert über 1 Milliarde USD pro Jahr in die Forschung und Entwicklung der Cybersecurity.
-
Microsoft beschäftigt mehr als 3.500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.
-
Azure verfügt über mehr Zertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.
-
Flexible Preise für die gewünschte Kontrolle
Bei der Spracherkennung werden die Kosten nutzungsbasiert auf Grundlage der Länge des transkribierten Audiomaterials in Stunden abgerechnet. Es fallen keine Vorabkosten an.
Erste Schritte mit einem kostenlosen Azure-Konto
1
2
Nachdem Ihr Guthaben aufgebraucht ist, wechseln Sie zur nutzungsbasierten Zahlung, um Ihr Wachstum mit den gleichen kostenlosen Dienstleistungen voranzutreiben. Es fallen nur Gebühren an, wenn Sie die kostenlosen monatlichen Kontingente überschreiten.
3
Dokumentation und Ressourcen
Erste Schritte
Durchsuchen Sie die Dokumentation
Erstellen eines KI Speech-Diensts mit dem Microsoft Learn-Kurs
Codebeispiele erkunden
Sehen Sie sich unseren Beispielcodean
Siehe Anpassungsressourcen
Erkunden und passen Sie Ihre Spracherkennungslösung mit Speech Studio an. Dafür müssen Sie nicht programmieren können.
Häufig gestellte Fragen zur Spracherkennung
-
Hierbei handelt es sich um ein Feature des Speech-Diensts, das Audiodaten präzise und schnell in Text transkribiert.
-
KI-DiensteKI Services sind eine Sammlung anpassbarer, vordefinierter KI-Modelle, die zum Hinzufügen von KI zu Anwendungen verwendet werden können. Sie decken viele verschiedene Bereiche ab, z. B. gesprochene Sprache, Entscheidungen, Sprachen und Sehen. Die Spracherkennung ist ein Feature des KI Speech-Diensts. Andere Sprachfeatures umfassen Text-zu-Sprache, Sprachübersetzungund Sprechererkennung. Ein Beispiel für einen Entscheidungsdienst ist Personalizer, mit dem Sie personalisierte, relevante Erfahrungen bereitstellen können. Beispiele für KI-Sprachdienste sind Language Understanding, Textanalyse für die Verarbeitung natürlicher Sprache, QnA Maker für häufig gestellte Fragen, und Translator für die Sprachübersetzung.