Převod řeči na text

A Speech service feature that accurately transcribes spoken audio to text

Make spoken audio actionable

Zvuk můžete na text rychle a přesně přepisovat ve více než 85 jazycích a variantách. Přizpůsobením modelů zvýšíte přesnost terminologie v konkrétním oboru. Povolením prohledávání či analýzy přepsaného textu nebo podporou akcí získáte ze záznamu řeči větší hodnotu – to vše ve vámi preferovaném programovacím jazyce.

Vysoce kvalitní přepis

Get accurate audio to text transcriptions with state-of-the-art speech recognition.

Přizpůsobitelné modely

Add specific words to your base vocabulary or build your own speech-to-text models.

Flexibilní nasazení

Službu Převod řeči na text můžete provozovat kdekoli – v cloudu nebo v kontejnerech na hraničních zařízeních.

Připravené pro produkční prostředí

Získejte přístup ke stejné robustní technologii, která stojí za rozpoznáváním řeči v produktech Microsoftu.

Vyzkoušejte si převod řeči na text s touto ukázkovou aplikací vytvořenou s použitím sady JavaScript SDK.

Pokud si chcete ukázku vyzkoušet s vlastním hlasem s použitím mikrofonu, použijte jiný prohlížeč s podporou WebRTC, jako je aktuální verze Microsoft Edge, Firefox nebo Chrome.

Vaše hlasová data se neuloží.

Accurately transcribe speech from various sources

Convert audio to text from a range of sources, including microphones, audio files, and blob storage. Use speaker diarisation to determine who said what and when. Get readable transcripts with automatic formatting and punctuation.

Přizpůsobení modelů řeči vašim potřebám

Tailor your speech models to understand organization- and industry-specific terminology. Overcome speech recognition barriers such as background noise, accents, or unique vocabulary. Customize your models by uploading audio data and transcripts. Automatically generate custom models using Office 365 data to optimize speech recognition accuracy for your organization.

Deploy anywhere

Run Speech to Text wherever your data resides. Build speech applications that are optimized for robust cloud capabilities and on-premises using containers.

Dokonalá ochrana osobních údajů a zabezpečení

  • Služba Speech, která je součástí služby Azure Cognitive Services, je certifikována organizacemi SOC, FedRAMP, PCI DSS, HIPAA, HITECH a ISO.
  • Your data remains yours. Your audio input and transcription data aren't logged during audio processing.
  • Svá vlastní řečová data a modely můžete kdykoli zobrazit a odstranit. Vaše data jsou v úložišti zašifrována.
  • Služba Speech využívá infrastrukturu Azure a nabízí zabezpečení, dostupnost, dodržování předpisů a možnosti správy na podnikové úrovni.

Flexible pricing gives you the control you need

With Speech to Text, pay as you go based on the number of hours of audio you transcribe, with no upfront costs.

Dokumentace a zdroje informací

Začínáme

Browse the documentation

Create a speech service with the Microsoft Learn course

Prozkoumejte ukázky kódu

Check out our sample code

Prohlédněte si materiály k přizpůsobení

Customize your voice-to-text solution with Speech Studio. No code required.

Businesses that trust Speech to Text

KPMG zjednodušuje přepis volání

KPMG využívá Převod řeči na text k přepisu a katalogizaci tisíců hodin volání a snižuje tak pro své klienty náklady na dodržování předpisů až o 80 procent.

KPMG

Motorola pomáhá složkám záchranného systému získat přístup k důležitým datům pomocí hlasu

Motorola Solutions pomáhá policistům a dalším složkám záchranného systému rychleji získat přístup k důležitým informacím pomocí virtuálního asistenta s podporou hlasových služeb.

Motorola Solutions

Universal Electronics nabízí inteligentní domácí prostředí s podporou hlasu

Universal Electronics pomáhá značkovým firmám poskytovat funkce pro hlasovou navigaci a ovládání, které fungují v domácích zařízeních každodenního života, a nabízí tak skutečně unikátní zákaznické prostředí.

Universal Electronics

Hochtief dokumentuje konstrukční vady pomocí hlasových služeb

Hochtief pomáhá projektovým manažerům identifikovat a dokumentovat konstrukční vady na staveništích pomocí virtuálního pomocníka s podporou hlasových služeb.

Cheetah Mobile

NTT DATA urychlují rozhodování pomocí přehledů ze schůzí

NTT DATA poskytuje přehledy z hlasových dat pomocí přepisů schůzí v reálném čase. Pomocí služby Custom Speech můžou přizpůsobit modely rozpoznávání řeči, aby rozuměli termínům pro konkrétní organizaci.

NTTDATA

Insight nabízí bankovní prostředí založené na konverzaci

Insight Enterprises pomáhá bankám přinést digitální rychlost a pohodlí na jejich pobočky pomocí bankovního řešení, které používá konverzační služby založené na umělé inteligenci. Převod řeči na text převede to, co řekne zákazník, na data, která se dají zpracovávat a analyzovat, aby zákazníci mohli dostat včasné a relevantní odpovědi.

Insight Enterprise, Inc.

Frequently asked questions about Speech to Text

  • It is a feature within the Speech service that accurately and quickly transcribes audio to text.
  • Cognitive Services are a collection of customizable, prebuilt AI models that can be used to add AI to applications. There are a variety of domains, including Speech, Decision, Language, and Vision. Speech to Text is one feature within the Speech service. Other Speech related features include Text to Speech, Speech Translation, and Speaker Recognition. An example of a Decision service is Personalizer, which allows you to deliver personalized, relevant experiences. Examples of Language services include Language Understanding, Text Analytics for natural language processing, QnA Maker for FAQ experiences, and Translator for language translation.

Začínáme se službou Speech