Gå til hovedindhold
FÅS NU

Introduktion af dataindtagelsesklienten til Azure Tale

Dato for publicering: 28 juni, 2021

Tale er en Azure Cognitive Service, der giver dig mulighed for at bygge skalerbare løsninger, der kan håndtere en række talerelaterede opgaver, f.eks. transskribering af lyd, skabelse af stemmer, der lyder naturlige, genkendelse af den talende samt håndtering af taleoversættelse.

I dag introducerer vi indtagelsesklienten, der er en Azure-løsning, som overvåger din dedikerede Azure Storage-objektbeholder, så lydfiler, der lander i det pågældende lager, automatisk transskriberes.

Vi har oprettet dette værktøj for at hjælpe dig med at oprette en komplet, skalerbar og sikker transskriptionspipeline ved hjælp af simpel konfiguration, og uden at der er behov for udvikling. Indtagelsesklienten omfatter bedste praksis for at maksimere transskriptionsanmodninger i forbindelse med skalering (til hundredtusindvis af filer), fejlhåndtering, logik for nye forsøg samt forskellige andre optimeringer. Opsætningen sker via ARM-udrulning. Arkitekturen for den løsning, som denne ARM-skabelon udruller, er beskrevet i figuren nedenfor.

 

Grafisk brugergrænseflade, diagram, program

Beskrivelse genereres automatisk

Når en bruger uploader en lydfil til den dedikerede Azure Storage-objektbeholder, vælger den timerudløste Azure Functions denne fil og opretter en transskriptionsanmodning enten ved hjælp af Speech-to-text REST API v3.0 eller Speech SDK (brugerens valg). Når transskriptionen er fuldført, skriver løsningen transskriptionen til de objektbeholdere, lydfilen blev hentet fra. Brugerne kan desuden vælge at anvende analyser på transskriptionen, producere rapporter eller redigere. Alle disse løsninger er et resultat af, at yderligere ressourcer udrulles via ARM-skabelonen.

Se mere i vores vejledning for at få flere oplysninger om værktøjet og installationsbemærkninger, og download koden fra dette GitHub-lager.

  • Tale til tekst
  • Azure AI Tale
  • Operating System
  • SDK and Tools