Tal till text

Konvertera talljud till text för att skapa mer naturliga interaktioner

Avancerad taligenkänning

Använd Tal till text – som ingår i Speech-tjänsten – för att snabbt konvertera ljud till text från en mängd olika källor. Anpassa modeller för att övervinna vanliga hinder för taligenkänning såsom unika vokabulärer, samtalsstilar eller bakgrundsljud. Gör ljudet mer tillgängligt genom att hjälpa alla att följa med och delta i konversationer i realtid.

Innovation vid teknikens framkant

Få förstklassig noggrannhet för taligenkänning som drivs av modeller för djupt neuralt nätverk.

Deltagande i realtid

Transkribera ljud till text i realtid så att alla deltagare i en konversation kan följa den.

Anpassad taligenkänning

Anpassa taligenkänning till samtalsstilar och domänspecifik terminologi.

Flexibel distribution

Kör Tal till text var som helst – i molnet, lokalt eller vid gränsen i containrar.

Använd banbrytande talteknik

Förbättra dina appar med talfunktioner som drivs av åratals banbrytande forskning. Microsoft var först med att nå mänsklig paritet i Switchboard-uppgiften med taligenkänning för konversationer och fortsätter att bedriva forskning i framkanten inom taligenkänning.

Läs mer om framsteg inom taligenkänning

För att kunna prova demon med din egen röst via en mikrofon måste du byta till en annan webbläsare som stöder WebRTC, till exempel en senare version av Microsoft Edge, Firefox eller Chrome.

Vill du skapa det här?

Optimera taligenkänning med anpassade modeller

Anpassa dina taligenkänningsmodeller för att övervinna vanliga hinder för taligenkänning. Anpassa språkmodellerna till användarnas samtalsstilar, dialekter eller unika vokabulärer, till exempel namn på platser, produkter och branschspecifika uttryck. Generera automatiskt anpassade modeller med hjälp av dina Office 365-data för att optimera noggrannheten hos taligenkänning för organisationsspecifika termer.

Börja använda Anpassat tal

Exempelmeningar

Baslinje

Custom Speech

Vill du skapa det här?

Få insikter utifrån dina konversationer

Transkribera konversationer med flera användare i realtid så att deltagarna kan fokusera på diskussionen. Identifiera vem som sa vad och när, och följ snabbt upp med kommande steg. Optimera upplevelsen för enheter med flera mikrofoner. Möjliggör analys av transkriberad text och få ännu fler insikter från dina konversationer.

Läs mer om funktioner för samtalstranskription

Distribuera var som helst, från molnet till gränsen

Kör Tal till text i molnet eller lokalt med containrar för scenarier där datasäkerhet och låg svarstid är av största vikt.

Läs mer om Speech i containrar

Säkerhet för företaget

  • Microsoft investerar över 1 miljard USD varje år på forskning och utveckling av cybersäkerhet.

  • Vi sysselsätter fler än 3 500 säkerhetsexperter som arbetar helt och hållet med din datasäkerhet och sekretess.

  • Azure har fler efterlevnadscertifieringar än någon annan molnleverantör. Visa den fullständiga listan.

Få den kraft, kontroll och anpassning du behöver med flexibel prissättning

Betala endast för det du använder – utan startkostnader. Med Tal till text betalar du per användning baserat på antalet transkriberade ljudtimmar.

Se prissättning för Tal till text

Kom igång med Tal till text via tre steg

Få direktåtkomst och en kredit på 200 USD genom att registrera dig för ett kostnadsfritt Azure-konto.
Logga in på Azure-portalen och lägg till Speech.
Lär dig hur du bäddar in Tal till text med hjälp av snabbstarterna och dokumentationen.

Utvecklarresurser för Tal till text

Dokumentation och självstudier

Kom igång med Tal till text.

Kurser

Gå en Pluralsight-kurs som vägleder dig genom användning av Tal till text.

Användningsfall

Lär dig mer om scenarier för Tal till text, till exempel transkription av konversationer och kundtjänst.

Vanliga frågor och svar om Tal till text

  • En fullständig lista över språk som stöds i Tal till text finns i vår dokumentation.
  • Spela enkelt in ljud från en mikrofon, läs från en ström eller använd ljudfiler från lagring med Speech-SDK och REST-API:er. Speech-SDK stöder ljud med en kanal i formatet WAV/PCM 16-bitars, 16 kHz/8 kHz för taligenkänning. Ytterligare ljudformat stöds via REST-slutpunkten för tal-till-text eller tjänsten för batchtranskription.

Kom igång med Tal till text