Vi introduserer inntaksklienten for Azure Speech
Publiseringsdato: 28 juni, 2021
Speech er en Azure Cognitive Service som lar deg bygge skalerbare løsninger som kan håndtere en rekke talerelaterte oppgaver, som å transkribere lyd, lage stemmer som høres naturlige ut, gjenkjenne hvem som snakker og håndtere taleoversettelse.
I dag introduserer vi inntaksklienten, en Azure-løsning som vil overvåke din dedikerte Azure Storage-beholder, slik at lydfiler som havner i lagringen automatisk transkriberes.
Vi laget dette verktøyet for å hjelpe deg til å konfigurere et fullt, skalerbart og sikkert transkripsjonsdatasamlebånd gjennom enkel konfigurasjon og uten noen utviklingsinnsats. Inntaksklienten bruker anbefalte fremgangsmåter for å maksimere antall transkripsjonsforespørsler for skalering (til hundretusenvis av filer), feilhåndtering, logikk for å gjenta forsøk og diverse andre optimaliseringer. Konfigurasjonen blir utført gjennom ARM-utrulling. Arkitekturen for løsningen denne ARM-malen ruller ut er beskrevet i figuren nedenfor.
Når en bruker laster opp en lydfil til den dedikerte Azure Storage-beholderen, plukker timerutløste Azure Functions opp filen og oppretter en transkripsjonsforespørsel med enten REST-API for tale-til-tekst v3.0 eller Speech SDK (brukervalg). Når transkripsjonen er fullført, skriver løsningen transkripsjonen til beholderne lydfilen ble hentet fra. I tillegg kan brukere velge å bruke analyse på transkripsjonen, lage rapporter eller redigere – alt dette som et resultat av at ytterligere ressurser blir rullet ut gjennom ARM-malen.
Utforsk veiledningen for mer informasjon om verktøyet og installasjonsmerknader, og last ned koden fra dette Github-repositoriet.