Ignora esplorazione
ORA DISPONIBILE

Presentazione di Ingestion Client per Voce di Azure

Data di pubblicazione: 28 giugno, 2021

Voce è uno dei Servizi cognitivi di Azure e ti permette di creare soluzioni scalabili in grado di gestire svariate attività correlate alla voce, tra cui trascrizione di audio, produzione di voci realistiche, riconoscimento del parlante e gestione della traduzione vocale.

È oggi disponibile Ingestion Client, una soluzione di Azure che monitorerà il tuo contenitore dedicato di Archiviazione di Azure in modo che i file audio salvati in tale area di archiviazione vengano trascritti automaticamente.

Abbiamo creato questo strumento per aiutarti a configurare una pipeline di trascrizione completa, scalabile e sicura tramite una semplice configurazione e senza attività di sviluppo. Ingestion Client incorpora le procedure consigliate per ottimizzare le richieste di trascrizione a livello di scalabilità (fino a centinaia di migliaia di file), la gestione degli errori, la logica di ripetizione dei tentativi e diversi altri aspetti. La configurazione viene eseguita tramite la distribuzione di Azure Resource Manager. L'architettura della soluzione distribuita da questo modello di Azure Resource Manager viene descritta nella figura seguente.

 

Interfaccia utente grafica, diagramma, applicazione

Descrizione generata automaticamente

Quando un utente carica un file audio nel contenitore dedicato di Archiviazione di Azure, il servizio Funzioni di Azure attivato da timer seleziona il file e crea una richiesta di trascrizione usando l'API REST Riconoscimento vocale v3.0 o Speech SDK, in base alla preferenza dell'utente. Dopo il completamento della trascrizione, la soluzione scrive la trascrizione nei contenitori da cui è stato ottenuto il file audio. Gli utenti possono inoltre scegliere di applicare l'analisi alla trascrizione, produrre report o apportare correzioni. Tutte queste operazioni sono il risultato della distribuzione di risorse aggiuntive tramite il modello di Azure Resource Manager.

Per altre informazioni sullo strumento e note sull'installazione, esplora la guida e scarica il codice da questo repository di Github.

  • Speech to Text
  • Servizi Voce
  • Operating System
  • SDK and Tools