Conversão de Voz em Texto

Uma funcionalidade do serviço de Voz que converte com precisão áudio falado em texto

Torne o áudio falado acionável

Quickly and accurately transcribe audio to text in more than 85 languages and variants. Customize models to enhance accuracy for domain-specific terminology. Get more value from spoken audio by enabling search or analytics on transcribed text or facilitating action—all in your preferred programming language.

Transcrição de alta qualidade

Obtenha transcrições precisas com o reconhecimento de voz de última geração.

Modelos personalizáveis

Adicione palavras específicas ao vocabulário de base ou compile os seus próprios modelos.

Implementação flexível

Execute a Voz em Texto em qualquer local, seja na cloud ou no edge em contentores.

Pronta para produção

Aceda à mesma tecnologia robusta que alimenta o reconhecimento de voz em todos os produtos Microsoft.

Experimente a Conversão de Voz em Texto com esta aplicação de demonstração, criada no nosso JavaScript SDK

Para experimentar a demonstração com a sua voz através de um microfone, altere para um browser diferente com suporte WebRTC, por exemplo, uma versão recente do Microsoft Edge, do Firefox ou do Chrome.

Os seus dados de voz não serão armazenados

Transcreva discursos de várias fontes com precisão

Converta áudio em texto a partir de várias fontes, entre as quais microfones, ficheiros de áudio e armazenamento de blob. Utilize a diarização do orador para determinar quem disse o quê e quando. Obtenha transcrições legíveis com a formatação e a pontuação automática.

Personalize os modelos de voz de acordo com as suas necessidades

Adapte os seus modelos de voz para compreenderem terminologia específica da organização e da indústria. Ultrapasse as barreiras do reconhecimento de voz, como o barulho de fundo, pronúncias ou vocabulário próprio. Carregue dados e transcrições de áudio para personalizar os seus modelos. Gere automaticamente modelos personalizados com os dados do Office 365 para otimizar a precisão do reconhecimento de voz para a sua organização.

Implemente em qualquer lado, desde a cloud à periferia

Run Speech to Text wherever your data resides. Build speech applications that are optimized for both robust cloud capabilities and edge locality using containers and language detection (preview). Speech containers support both standard and custom speech.

Privacidade e segurança abrangente

  • O Serviço de Voz, que faz parte dos Serviços Cognitivos do Azure, tem as certificações SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • A titularidade dos dados é sua. As entradas de áudio e os dados de transcrição de áudio não são registados durante o processamento de áudio.
  • Veja e elimine os seus dados e modelos de voz personalizados a qualquer altura. Os dados são encriptados enquanto estão no armazenamento.
  • Apoiado pela infraestrutura do Azure, o Serviço de Voz oferece segurança, disponibilidade, conformidade e capacidade de gestão de nível empresarial.

Os preços flexíveis dão-lhe o poder e controlo de que precisa

Pague apenas pelo que utilizar, sem custos à cabeça. Com a Voz em Texto, paga à medida que utiliza com base no número de horas de áudio transcrito.

Documentação e recursos

Introdução

Leia a nossa documentação

Fazer o curso do Microsoft Learn

Explore os exemplos de código

Veja o nosso código de exemplo

Veja os recursos de personalização

Personalize a sua solução de voz com o Speech Studio. Não é necessária programação.

Criado com Conversão de Voz em Texto

KPMG simplifica a transcrição de chamadas

A KPMG utiliza a Conversão de Voz em Texto para transcrever e catalogar milhares de horas de chamadas, o que permite reduzir os custos de conformidade dos seus clientes até 80%.

KPMG

A Motorola ajuda socorristas a aceder a dados vitais com voz

A Motorola Solutions está a ajudar os agentes da polícia e outros socorristas de emergência a terem acesso mais rápido a informações importantes com um assistente virtual com tecnologia de voz.

Motorola Solutions

Universal Electronics proporciona experiências de casa inteligente preparadas para voz

A Universal Electronics está a ajudar as marcas a fornecer capacidades de navegação e controlo preparadas para voz, que funcionam em dispositivos do dia a dia em casa — oferecendo uma experiência de consumo verdadeiramente única.

Universal Electronics

Hochtief utiliza a voz para documentar defeitos de construção

A Hochtief está a ajudar os gestores de projetos a identificar e documentar defeitos de construção em locais de projetos com um assistente virtual preparado para voz.

Cheetah Mobile

NTT DATA acelera tomada de decisões com informações de reuniões

O NTT DATA está a revelar informações a partir de dados de voz com a transcrição de reuniões em tempo real. Com o Discurso Personalizado, são capazes de personalizar modelos de reconhecimento de voz para entender termos específicos da organização.

NTTDATA

Insight potencia experiências bancárias de conversação

A Insight Enterprises está a ajudar os bancos a integrar velocidade e conveniência digitais nas suas agências com uma solução bancária com tecnologia de IA de conversação. A Conversão de Voz em Texto converte o que os clientes dizem em dados que podem ser processados e analisados para que os clientes possam obter respostas oportunas e relevantes.

Insight Enterprise, Inc.

Introdução à Voz