Navigation überspringen
JETZT VERFÜGBAR

Neu: Ingestion Client für Azure Speech

Veröffentlichungsdatum: 28 Juni, 2021

Speech ist ein Azure Cognitive Services-Dienst, mit dem Sie skalierbare Lösungen zur Verarbeitung verschiedener sprachbezogener Tasks entwickeln können, zum Beispiel für die Transkription von Audiodateien, die Generierung natürlich klingender Stimmen, die Sprechererkennung und die Sprachübersetzung.

Heute kündigen wir mit dem Ingestion Client eine neue Azure-Lösung an, die Ihren dedizierten Azure Storage-Container überwacht, damit dort abgelegte Audiodateien automatisch transkribiert werden.

Wir haben dieses Tool entwickelt, damit Sie eine vollständige, skalierbare und sichere Transkriptionspipeline einrichten können – und das mit einfacher Konfiguration ohne jeglichen Entwicklungsaufwand. Der Ingestion Client beinhaltet Best Practices, damit die Skalierung (auf bis zu Hunderttausende Dateien), Fehlerverwaltung, Wiederholungslogik und andere Optimierungen für Transkriptionsanforderungen reibungslos erfolgen können. Die Einrichtung erfolgt über eine ARM-Bereitstellung. Die Architektur der von dieser ARM-Vorlage bereitgestellten Lösung wird auf der folgenden Abbildung dargestellt.

 

Grafische Benutzeroberfläche, Diagramm, Anwendung

Automatisch generierte Beschreibung

Wenn ein Benutzer eine Audiodatei in den dedizierten Azure Storage-Container hochlädt, wählt eine durch einen Timer ausgelöste Azure Functions-Funktion diese Datei aus und erstellt eine Transkriptionsanforderung über die Spracherkennungs-REST-API 3.0 oder das Speech-SDK (Benutzerauswahl). Wenn die Transkription erfolgreich abgeschlossen wurde, schreibt die Lösung das Transkript in die Container, aus denen die Audiodatei abgerufen wurde. Darüber hinaus können Benutzer mithilfe der zusätzlich über die ARM-Vorlage bereitgestellten Ressourcen die Transkripte analysieren und Berichte generieren oder bearbeiten.

In unserem Leitfaden finden Sie weitere Informationen zum Tool und zur Installation. Den Code können Sie aus diesem GitHub-Repository herunterladen.

  • Spracherkennung
  • Sprachdienste
  • Operating System
  • SDK and Tools