Ignorar Navegação

Conversão de Voz em Texto

Uma funcionalidade do serviço de Voz que transcreve áudio falado em texto com precisão

Torne o áudio falado acionável

Transcreva de forma rápida e precisa áudio em texto em mais de 100 idiomas e variantes. Personalize modelos para melhorar a precisão da terminologia específica do domínio. Obtenha mais valor do áudio falado ao ativar a pesquisa ou análise em texto transcrito ou facilitando a ação — tudo na sua linguagem de programação preferida.

Transcrição de alta qualidade

Obtenha transcrições de áudio para texto precisas com o reconhecimento de voz de última geração.

Modelos personalizáveis

Adicione palavras específicas ao vocabulário de base ou compile os seus próprios modelos de voz em texto.

Implementação flexível

Execute a Voz em Texto em qualquer local, seja na cloud ou no edge em contentores.

Pronta para produção

Aceda à mesma tecnologia robusta que alimenta o reconhecimento de voz em todos os produtos Microsoft.

Experimente a Conversão de Voz em Texto com esta aplicação de demonstração, criada no nosso JavaScript SDK

Para experimentar a demonstração com a sua voz através de um microfone, altere para um browser diferente com suporte WebRTC, por exemplo, uma versão recente do Microsoft Edge, do Firefox ou do Chrome.

Os seus dados de voz não serão armazenados

Transcreva voz de várias fontes com precisão

Converta áudio em texto a partir de várias fontes, entre as quais microfones, ficheiros de áudio e armazenamento de blob. Utilize a diarização do orador para determinar quem disse o quê e quando. Obtenha transcrições legíveis com a formatação e a pontuação automática.

Personalize os modelos de voz de acordo com as suas necessidades

Adapte os seus modelos de voz para compreenderem terminologia específica da organização e da indústria. Ultrapasse as barreiras do reconhecimento de voz, como o barulho de fundo, pronúncias ou vocabulário próprio. Carregue dados e transcrições de áudio para personalizar os seus modelos. Gere automaticamente modelos personalizados com os dados do Office 365 para otimizar a precisão do reconhecimento de voz para a sua organização.

Implementar em qualquer local

Execute a Voz em Texto onde quer que os seus dados estejam. Compile aplicações de voz otimizadas para capacidades de cloud robustas e no local com contentores.

Impulsionar a Inovação de Aplicações com os Serviços de IA na Cloud

Conheça as 5 principais formas de a sua organização começar a trabalhar com IA para obter valor rapidamente.

Privacidade e segurança abrangente

  • O serviço de Voz, que faz parte dos Serviços Cognitivos do Azure, tem as certificações SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • A titularidade dos dados é sua. As entradas de áudio e os dados de transcrição não são registados durante o processamento de áudio.
  • Veja e elimine os seus dados e modelos de voz personalizados a qualquer altura. Os dados são encriptados enquanto estão no armazenamento.
  • Apoiado pela infraestrutura do Azure, o serviço de Voz oferece segurança, disponibilidade, conformidade e capacidade de gestão de nível empresarial.

Os preços flexíveis dão-lhe o controlo de que precisa

Com a Voz em Texto, paga à medida que utiliza com base no número de horas de áudio transcrito, sem custos iniciais.

Documentação e recursos

Começar

Procure na documentação

Crie um serviço de voz com o curso do Microsoft Learn

Explore os exemplos de código

Veja o nosso código de exemplo

Veja os recursos de personalização

Explore e personalize a sua solução de conversão de voz em texto com o Speech Studio. Não é necessário código.

Empresas que confiam na Voz em Texto

A KPMG simplifica transcrição de chamadas

A KPMG utiliza a Conversão de Voz em Texto para transcrever e catalogar milhares de horas de chamadas, o que permite reduzir os custos de conformidade dos seus clientes até 80%.

KPMG

A Motorola ajuda socorristas a aceder a dados vitais com voz

A Motorola Solutions está a ajudar os agentes da polícia e outros socorristas de emergência a terem acesso mais rápido a informações importantes com um assistente virtual com tecnologia de voz.

Motorola Solutions

Universal Electronics proporciona experiências de casa inteligente preparadas para voz

A Universal Electronics está a ajudar as marcas a fornecer capacidades de navegação e controlo preparadas para voz, que funcionam em dispositivos do dia a dia em casa — oferecendo uma experiência de consumo verdadeiramente única.

Universal Electronics

A Hochtief documenta defeitos de construção com voz

A Hochtief está a ajudar os gestores de projetos a identificar e documentar defeitos de construção em locais de projetos com um assistente virtual preparado para voz.

Cheetah Mobile

NTT DATA acelera tomada de decisões com informações de reuniões

O NTT DATA está a revelar informações a partir de dados de voz com a transcrição de reuniões em tempo real. Com o Discurso Personalizado, são capazes de personalizar modelos de reconhecimento de voz para entender termos específicos da organização.

NTTDATA

Insight potencia experiências bancárias de conversação

A Insight Enterprises está a ajudar os bancos a integrar velocidade e conveniência digitais nas suas agências com uma solução bancária com tecnologia de IA de conversação. A Conversão de Voz em Texto converte o que os clientes dizem em dados que podem ser processados e analisados para que os clientes possam obter respostas oportunas e relevantes.

Insight Enterprise, Inc.

Perguntas mais frequentes sobre a Voz em Texto

  • É uma funcionalidade do serviço de Voz que transcreve áudio em texto com precisão e rapidez.
  • Os Serviços Cognitivos são uma coleção de modelos de IA personalizáveis predefinidos que podem ser utilizados para adicionar IA às aplicações. Existe uma variedade de domínios, incluindo Voz, Decisão, Idioma e Visão. A Voz em Texto é uma funcionalidade no serviço de Voz. Outras funcionalidades relacionadas com o serviço de Voz incluem Conversão de Texto em Voz, Tradução de Voz e Reconhecimento de Orador. Um exemplo de um serviço de Decisão é o Personalizador, que permite proporcionar experiências personalizadas e relevantes. Os exemplos de serviços de Idioma incluem Language Understanding, Análise de Texto para processamento de linguagem natural, Criador de FAQ para experiências de FAQ e Tradutor para tradução de idiomas.

Introdução à Voz

Como podemos ajudá-lo?