Hoppa över navigering
TILLGÄNGLIGT NU

Vi presenterar Ingestion Client för Azure Speech

Publiceringsdatum: 28 juni, 2021

Speech är en kognitiv Azure-tjänst som gör att du kan skapa skalbara lösningar som kan hantera en rad olika talrelaterade uppgifter, till exempel transkribera ljud, skapa naturliga röster, känna igen vem som talar och hantera talöversättning.

Idag lanserar vi Ingestion Client, en Azure-lösning som övervakar din Azure Storage-container och automatiskt transkriberar de ljudfiler som hamnar i lagringen.

Vi har skapat det här verktyget för att hjälpa dig att skapa en komplett, skalbar och säker transkriptionspipeline med enkel konfiguration och utan utvecklingsarbete. Ingestion Client använder bästa praxis för att maximera transkriptionsbegäranden avseende skalning (till hundratusentals filer), felhantering, logik för omprövning och andra typer av optimeringar. Installationen utförs via ARM-distribution. På bilden nedan beskrivs arkitekturen för den lösning som distribueras med ARM-mallen.

 

Grafiskt användargränssnitt, diagram, program

Beskrivning som genereras automatiskt

När en användare laddar upp en ljudfil till den dedikerade Azure Storage-containern hämtar Azure Functions (som utlöses av en timer) filen och skapar en transkriptionsbegäran med antingen Speech-to-text REST API v3.0 eller Speech SDK (användaren får välja). När transkriptionen har slutförts skriver lösningen transkriptet till de containrar som ljudfilen hämtades från. Dessutom kan användarna välja att utföra analyser på transkriptet, skapa rapporter eller redigera med hjälp av ytterligare resurser som distribueras via ARM-mallen.

Utforska vår guide för mer information om verktyget och installationsanmärkningar och ladda ned koden från den här Github-lagringsplatsen.

  • Tal till text
  • Taltjänster
  • Operating System
  • SDK and Tools