Hoppa över navigering

Tal till text

En funktion i tjänsten Speech som konverterar talat ljud till text på ett korrekt sätt

Fatta beslut utifrån talat ljud

Transkribera snabbt och korrekt ljud till text på fler än 100 språk och varianter. Anpassa modeller för att förbättra noggrannheten för domänspecifik terminologi. Få ut mer värde av talat ljud genom att aktivera sökning eller analys av transkriberad text eller underlätta åtgärder, allt på det programmeringsspråk du föredrar.

Högkvalitativ transkription

Få korrekta ljud till text-transkriptioner med den senaste taligenkänningen.

Anpassningsbara modeller

Lägg till specifika ord i basordförrådet eller skapa egna tal till text-modeller.

Flexibel distribution

Kör Tal till text var som helst – i molnet eller på gränsenheter i containrar.

Produktionsklar

Använd samma robusta teknik som taligenkänningen i Microsofts produkter.

Prova Tal till text med den här demoappen som bygger på vårt JavaScript-SDK

För att kunna prova demon med din egen röst via en mikrofon måste du byta till en annan webbläsare som stöder WebRTC, till exempel en senare version av Microsoft Edge, Firefox eller Chrome.

Dina taldata lagras inte

Transkribera tal korrekt från olika källor

Konvertera ljud till text från en rad olika källor som mikrofoner, ljudfiler och bloblagring. Använd diarieföring av talare till att avgöra vem som sade vad och när. Få läsbara transkriptioner med automatisk formatering och interpunktion.

Anpassa talmodellerna efter dina behov

Skräddarsy dina talmodeller så att de förstår terminologi som är specifik för organisationen eller branschen. Övervinn hinder för taligenkänning som bakgrundsljud, dialekter eller specifik terminologi. Anpassa dina modeller genom att ladda upp ljuddata och transkriptioner. Generera automatiskt anpassade modeller med hjälp av Office 365-data för att optimera noggrannheten i taligenkänningen för din organisation.

Distribuera överallt

Kör Tal till text oavsett var dina data finns. Bygg talprogram som är optimerade för robusta molnfunktioner och lokal användning med hjälp av containrar.

Fuel App Innovation with Cloud AI Services

Learn 5 key ways your organization can get started with AI to realize value quickly.

Omfattande sekretess och säkerhet

  • Tjänsten Speech ingår i Azure Cognitive Services och är certifierad av SOC, FedRAMP, PCI DSS, HIPAA, HITECH och ISO.
  • Dina data förblir dina. Dina ljudindata och transkriptioner loggas inte under bearbetningen.
  • Visa och ta bort dina anpassade taldata och modeller när som helst. Dina data är krypterade under lagring.
  • Tjänsten Speech bygger på Azures infrastruktur och ger dig säkerhet, tillgänglighet, regelefterlevnad och hanteringsfunktioner i företagsklass.

Den flexibla prissättningen ger dig den kontroll du behöver

Med Tal till text betalar du per användning baserat på antalet transkriberade ljudtimmar, utan startavgifter.

Dokumentation och resurser

Kom igång

Bläddra i dokumentationen

Skapa en taltjänst med den här Microsoft Learn-kursen

Utforska kodexempel

Ta en titt på vår exempelkod

Se anpassningsresurser

Utforska och anpassa din röst-till-text-lösning med Speech Studio. Ingen kod krävs.

Företag som använder Tal till text

KPMG effektiviserar samtalstranskriptionen

KPMG använder Tal till text för att transkribera och katalogisera tusentals samtalstimmar, vilket minskar klienternas efterlevnadskostnader med så mycket som 80 procent.

KPMG

Motorola hjälper blåljuspersonalen att få tillgång till kritiska data med hjälp av röstfunktioner

Motorola Solutions hjälper poliser och annan blåljuspersonal att få tillgång till viktig information snabbare med hjälp av en röststyrd virtuell assistent.

Motorola Solutions

Universal Electronics erbjuder röstaktiverade funktioner för smarta hem

Universal Electronics hjälper företag att leverera röstaktiverade navigerings- och kontrollfunktioner mellan enheter i hemmet – och ger en riktigt unik konsumentupplevelse.

Universal Electronics

Hochtief dokumenterar konstruktionsfel med röstfunktioner

Hochtief hjälper projektledare att identifiera och dokumentera konstruktionsfel på projektwebbplatser med en röstaktiverad virtuell assistent.

Cheetah Mobile

NTT DATA ger ett snabbare beslutsfattande med mötesinsikter

NTT DATA analyserar taldata med mötestranskriptioner i realtid. Med Custom Speech kan de anpassa taligenkänningsmodeller till företagsspecifika termer.

NTTDATA

Insight hanterar konversationsupplevelser för banker

Insight Enterprises hjälper banker att få en digitalt snabbare och mer lättanvänd verksamhet med hjälp av en AI-styrd konversationslösning. Tal till text omvandlar det som kunderna säger till data som kan bearbetas och analyseras, för att kunderna ska kunna få snabba och relevanta svar.

Insight Enterprise, Inc.

Vanliga frågor och svar om Tal till text

  • Det är en funktion i tjänsten Speech som korrekt och snabbt transkriberar ljud till text.
  • Cognitive Services är en samling anpassningsbara, fördefinierade AI-modeller som kan användas för att lägga till AI i program. Det finns flera olika tjänster, till exempel Tal, Beslut, Språk och Visuellt innehåll. Tal till text är en funktion i Tal-tjänsten. Det finns också andra talrelaterade funktioner som Text till tal, Talöversättningoch Talarigenkänning. Ett exempel på en beslutstjänst är Personanpassning, som gör att du kan leverera personliga, relevanta upplevelser. Exempel på språktjänster är Språkförståelse, Textanalys för bearbetning av naturligt språk, QnA Maker för vanliga frågor och svar och Translator för språköversättning.

Kom igång med Speech

Kan vi hjälpa dig?