Conversão de Voz em Texto

A Speech service feature that accurately transcribes spoken audio to text

Make spoken audio actionable

Transcreva áudio em texto em mais de 85 idiomas e variantes com rapidez e precisão. Personalize modelos para melhorar a precisão de terminologia de domínios específicos. Permita pesquisas ou análises nos textos transcritos ou facilite ações, tudo na sua linguagem de programação preferida, para obter mais valor do áudio falado.

Transcrição de alta qualidade

Get accurate audio to text transcriptions with state-of-the-art speech recognition.

Modelos personalizáveis

Add specific words to your base vocabulary or build your own speech-to-text models.

Implementação flexível

Execute a Voz em Texto em qualquer local, seja na cloud ou no edge em contentores.

Pronta para produção

Aceda à mesma tecnologia robusta que alimenta o reconhecimento de voz em todos os produtos Microsoft.

Experimente a Conversão de Voz em Texto com esta aplicação de demonstração, criada no nosso JavaScript SDK

Para experimentar a demonstração com a sua voz através de um microfone, altere para um browser diferente com suporte WebRTC, por exemplo, uma versão recente do Microsoft Edge, do Firefox ou do Chrome.

Os seus dados de voz não serão armazenados

Accurately transcribe speech from various sources

Convert audio to text from a range of sources, including microphones, audio files, and blob storage. Use speaker diarisation to determine who said what and when. Get readable transcripts with automatic formatting and punctuation.

Personalize os modelos de voz de acordo com as suas necessidades

Tailor your speech models to understand organization- and industry-specific terminology. Overcome speech recognition barriers such as background noise, accents, or unique vocabulary. Customize your models by uploading audio data and transcripts. Automatically generate custom models using Office 365 data to optimize speech recognition accuracy for your organization.

Deploy anywhere

Run Speech to Text wherever your data resides. Build speech applications that are optimized for robust cloud capabilities and on-premises using containers.

Privacidade e segurança abrangente

  • O Serviço de Voz, que faz parte dos Serviços Cognitivos do Azure, tem as certificações SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • Your data remains yours. Your audio input and transcription data aren't logged during audio processing.
  • Veja e elimine os seus dados e modelos de voz personalizados a qualquer altura. Os dados são encriptados enquanto estão no armazenamento.
  • Apoiado pela infraestrutura do Azure, o Serviço de Voz oferece segurança, disponibilidade, conformidade e capacidade de gestão de nível empresarial.

Flexible pricing gives you the control you need

With Speech to Text, pay as you go based on the number of hours of audio you transcribe, with no upfront costs.

Documentação e recursos

Começar

Browse the documentation

Create a speech service with the Microsoft Learn course

Explore os exemplos de código

Check out our sample code

Veja os recursos de personalização

Customize your voice-to-text solution with Speech Studio. No code required.

Businesses that trust Speech to Text

KPMG simplifica a transcrição de chamadas

A KPMG utiliza a Conversão de Voz em Texto para transcrever e catalogar milhares de horas de chamadas, o que permite reduzir os custos de conformidade dos seus clientes até 80%.

KPMG

A Motorola ajuda socorristas a aceder a dados vitais com voz

A Motorola Solutions está a ajudar os agentes da polícia e outros socorristas de emergência a terem acesso mais rápido a informações importantes com um assistente virtual com tecnologia de voz.

Motorola Solutions

Universal Electronics proporciona experiências de casa inteligente preparadas para voz

A Universal Electronics está a ajudar as marcas a fornecer capacidades de navegação e controlo preparadas para voz, que funcionam em dispositivos do dia a dia em casa — oferecendo uma experiência de consumo verdadeiramente única.

Universal Electronics

Hochtief utiliza a voz para documentar defeitos de construção

A Hochtief está a ajudar os gestores de projetos a identificar e documentar defeitos de construção em locais de projetos com um assistente virtual preparado para voz.

Cheetah Mobile

NTT DATA acelera tomada de decisões com informações de reuniões

O NTT DATA está a revelar informações a partir de dados de voz com a transcrição de reuniões em tempo real. Com o Discurso Personalizado, são capazes de personalizar modelos de reconhecimento de voz para entender termos específicos da organização.

NTTDATA

Insight potencia experiências bancárias de conversação

A Insight Enterprises está a ajudar os bancos a integrar velocidade e conveniência digitais nas suas agências com uma solução bancária com tecnologia de IA de conversação. A Conversão de Voz em Texto converte o que os clientes dizem em dados que podem ser processados e analisados para que os clientes possam obter respostas oportunas e relevantes.

Insight Enterprise, Inc.

Frequently asked questions about Speech to Text

  • It is a feature within the Speech service that accurately and quickly transcribes audio to text.
  • Cognitive Services are a collection of customizable, prebuilt AI models that can be used to add AI to applications. There are a variety of domains, including Speech, Decision, Language, and Vision. Speech to Text is one feature within the Speech service. Other Speech related features include Text to Speech, Speech Translation, and Speaker Recognition. An example of a Decision service is Personalizer, which allows you to deliver personalized, relevant experiences. Examples of Language services include Language Understanding, Text Analytics for natural language processing, QnA Maker for FAQ experiences, and Translator for language translation.

Introdução à Voz