Conversão de Fala em Texto

Um recurso do serviço de Fala que converte com precisão áudio em texto

Torne o áudio falado acionável

Transcreva um áudio em texto com rapidez e precisão em mais de 40 idiomas e variantes. Personalize modelos para aumentar a precisão da terminologia específica do domínio. Obtenha mais valor do áudio falado habilitando a pesquisa ou a análise de texto transcrito ou facilitando a ação, tudo em sua linguagem de programação preferida.

Transcrição de alta qualidade

Obtenha transcrições precisas com o reconhecimento de fala com tecnologia de ponta.

Modelos personalizáveis

Adicione palavras específicas ao vocabulário base ou crie seus próprios modelos.

Implantação flexível

Execute a Conversão de Fala em Texto em qualquer lugar: na nuvem ou na borda, em contêineres.

Pronto para produção

Acesse a mesma tecnologia robusta que capacita o reconhecimento de fala entre os produtos da Microsoft.

Experimente a Conversão de Fala em Texto com este aplicativo de demonstração, baseado no nosso SDK do JavaScript

Para experimentar a demonstração com sua própria voz usando um microfone, mude para um navegador diferente com suporte a WebRTC, por exemplo, uma versão recente do Microsoft Edge, Firefox ou Chrome.

Os seus dados de fala não serão armazenados

Transcrever a fala com precisão de várias fontes

Converta áudio em texto de uma variedade de fontes, incluindo microfones, arquivos de áudio e armazenamento de blobs. Use a diarização do locutor para determinar quem disse o que e quando isso foi dito. Obtenha transcrições legíveis com formatação e pontuação automáticas.

Personalize os modelos de fala segundo as suas necessidades

Personalize seus modelos de fala para entender a terminologia específica da organização e do setor. Supere as barreiras do reconhecimento de fala, como ruído de fundo, sotaques ou vocabulário exclusivo. Personalize seus modelos carregando dados de áudio e transcrições. Gere automaticamente modelos personalizados usando dados do Office 365 para otimizar a precisão do reconhecimento de fala para sua organização.

Implante em qualquer lugar, da nuvem à borda

Execute a Conversão de Fala em Texto onde quer que os dados estejam localizados. Crie aplicativos de fala otimizados para funcionalidades de nuvem robustas e localidade de borda usando contêineres (versão prévia). Os contêineres de Fala são compatíveis com fala padrão e personalizada.

Privacidade e segurança abrangentes

  • O serviço de Fala, parte dos Serviços Cognitivos do Azure, é certificado por SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • Os seus dados permanecem sendo seus. Os seus dados de entrada e de transcrição de áudio não são registrados durante o processamento de áudio.
  • Veja e exclua seus modelos e dados de fala personalizada a qualquer momento. Seus dados permanecem criptografados enquanto estão no armazenamento.
  • Com o suporte da infraestrutura do Azure, o serviço de Fala oferece segurança, disponibilidade conformidade e capacidade de gerenciamento de nível empresarial.

O preço flexível oferece a você o poder e o controle de que você precisa

Pague apenas pelo que usar, sem custos iniciais. Com a Conversão de Fala em Texto, você paga conforme o uso, com base no número de horas de áudio que transcreve.

Documentação e recursos

Explore os exemplos de código

Confira os recursos de personalização

Personalize sua solução de fala com o Speech Studio. Não requer código.

Criado com a Conversão de Fala em Texto

A KPMG simplifica a transcrição da chamada

A KPMG usa a Conversão de Fala em Texto para transcrever e catalogar milhares de horas de chamadas, reduzindo os custos de conformidade para os clientes em até 80%.

Leia a história

KPMG

A Motorola ajuda socorristas a acessar dados vitais usando a voz

A Motorola Solutions está ajudando policiais e outros socorristas a obter acesso a informações importantes mais rapidamente com um assistente virtual acionado por voz.

Leia a história

Motorola Solutions

A Universal Electronics fornece experiências de casas inteligentes habilitadas para voz

A Universal Electronics está ajudando as marcas a fornecerem funcionalidades de navegação e de controle habilitadas para voz que funcionam entre os dispositivos do dia a dia encontrados em casa, oferecendo uma experiência de consumidor verdadeiramente única.

Leia a história

Universal Electronics

Defeitos de construção de documentos da Hochtief usando voz

A Hochtief está ajudando os gerentes de projetos a identificar e documentar defeitos de construção em sites de projetos com um assistente virtual habilitado para voz.

Leia a história

Cheetah Mobile

A NTT DATA acelera a tomada de decisão com insights da reunião

A NTT DATA está descobrindo insights de dados de fala com a transcrição de reuniões em tempo real. Com a Fala Personalizada, eles podem personalizar os modelos de reconhecimento de fala para entender os termos específicos da organização.

Leia a história

NTTDATA

Os insights impulsionam experiências bancárias de conversação

A Insight Enterprises está ajudando os bancos a trazer a velocidade e a conveniência digital para as suas filiais com uma solução bancária habilitada por IA de conversação. A Conversão de Fala em Texto converte o que os clientes falam em dados que podem ser processados e analisados para que os clientes possam obter respostas oportunas e relevantes.

Leia a história

Insight Enterprise, Inc.

Introdução à Conversão de Fala