Conversão de Voz em Texto

Uma funcionalidade do serviço de Voz que converte com precisão áudio falado em texto

Torne o áudio falado acionável

Transcreva áudio em texto em mais de 30 idiomas com rapidez e precisão. Personalize modelos para melhorar a precisão de terminologia de domínios específicos. Permita pesquisas ou análises nos textos transcritos ou facilite ações, tudo na sua linguagem de programação preferida, para obter mais valor do áudio falado.

Transcrição de alta qualidade

Obtenha transcrições precisas com o reconhecimento de voz de última geração.

Modelos personalizáveis

Adicione palavras específicas ao vocabulário de base ou compile os seus próprios modelos.

Implementação flexível

Execute a Voz em Texto em qualquer local, seja na cloud ou no edge em contentores.

Pronta para produção

Aceda à mesma tecnologia robusta que alimenta o reconhecimento de voz em todos os produtos Microsoft.

Experimente a Conversão de Voz em Texto com esta aplicação de demonstração, criada no nosso JavaScript SDK

Para experimentar a demonstração com a sua voz através de um microfone, altere para um browser diferente com suporte WebRTC, por exemplo, uma versão recente do Microsoft Edge, do Firefox ou do Chrome.

Os seus dados de voz não serão armazenados

Transcreva discursos de várias fontes com precisão

Converta áudio em texto a partir de várias fontes, entre as quais microfones, ficheiros de áudio e armazenamento de blob. Utilize a diarização do orador para determinar quem disse o quê e quando. Obtenha transcrições legíveis com a formatação e a pontuação automática.

Personalize os modelos de voz de acordo com as suas necessidades

Adapte os seus modelos de voz para compreenderem terminologia específica da organização e da indústria. Ultrapasse as barreiras do reconhecimento de voz, como o barulho de fundo, pronúncias ou vocabulário próprio. Carregue dados e transcrições de áudio para personalizar os seus modelos. Gere automaticamente modelos personalizados com os dados do Office 365 para otimizar a precisão do reconhecimento de voz para a sua organização.

Implemente em qualquer lado, desde a cloud à periferia

Execute a Voz em Texto onde quer que os seus dados estejam. Compile aplicações de voz otimizadas tanto para capacidades de cloud robustas como para localidade de edge mediante a utilização de contentores (pré-visualização). Os contentores de voz suportam tanto as vozes padrão como as vozes personalizadas.

Privacidade e segurança abrangente

  • O Serviço de Voz, que faz parte dos Serviços Cognitivos do Azure, tem as certificações SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • A titularidade dos dados é sua. As entradas de áudio e os dados de transcrição de áudio não são registados durante o processamento de áudio.
  • Veja e elimine os seus dados e modelos de voz personalizados a qualquer altura. Os dados são encriptados enquanto estão no armazenamento.
  • Apoiado pela infraestrutura do Azure, o Serviço de Voz oferece segurança, disponibilidade, conformidade e capacidade de gestão de nível empresarial.

Os preços flexíveis dão-lhe o poder e controlo de que precisa

Pague apenas pelo que utilizar, sem custos à cabeça. Com a Voz em Texto, paga à medida que utiliza com base no número de horas de áudio transcrito.

Documentação e recursos

Explore os exemplos de código

Veja os recursos de personalização

Personalize a sua solução de voz com o Speech Studio. Não é necessária programação.

KPMG

A KPMG utiliza as capacidades de personalização da Voz em Texto para uniformizar a transcrição e tradução de chamadas, beneficiando de uma precisão das transcrições de 90 por cento ou mais.

Introdução à Voz