Ignorar navegação

Conversão de Fala em Texto

Um recurso do serviço de Fala que transcreve com precisão áudio em texto

Torne o áudio falado acionável

Transcreva áudio para texto de forma rápida e precisa em mais de 100 idioma e variantes. Personalize modelos para aprimorar a precisão da terminologia específica do domínio. Obtenha mais valor do áudio falado ativando a pesquisa ou a análise de texto transcrito ou facilitando a ação, tudo na sua linguagem de programação preferida.

Transcrição de alta qualidade

Obtenha transcrições precisas de áudio para texto com o reconhecimento de fala com tecnologia de ponta.

Modelos personalizáveis

Adicione palavras específicas ao seu vocabulário base ou crie seus próprios modelos de conversão de fala em texto.

Implantação flexível

Execute a Conversão de Fala em Texto em qualquer lugar: na nuvem ou na borda, em contêineres.

Pronto para produção

Acesse a mesma tecnologia robusta que capacita o reconhecimento de fala entre os produtos da Microsoft.

Experimente a Conversão de Fala em Texto com este aplicativo de demonstração, baseado no nosso SDK do JavaScript

Para experimentar a demonstração com sua própria voz usando um microfone, mude para um navegador diferente com suporte a WebRTC, por exemplo, uma versão recente do Microsoft Edge, Firefox ou Chrome.

Os seus dados de fala não serão armazenados

Transcrever a fala com precisão de várias fontes

Converter áudio para texto de uma variedade de fontes, incluindo microfones, arquivos de áudio, e armazenamento de blobs. Use a diarização do locutor para determinar quem disse o quê e quando isso foi dito. Obtenha transcrições legíveis com formatação e pontuação automáticas.

Personalize os modelos de fala segundo as suas necessidades

Adapte seus modelos de fala para entender a terminologia específica da organização e do setor. Supere barreiras de reconhecimento de fala, tais como ruído de fundo, sotaques ou vocabulário único. Personalize seus modelos carregando dados de áudio e transcrições. Gere automaticamente modelos personalizados usando dados do Office 365 para otimizar a precisão do reconhecimento de fala para sua organização.

Implantar em qualquer lugar

Execute a Conversão de Fala em Texto onde quer que seus dados residam. Compile aplicativos de fala que são otimizados para capacidades robustas em nuvem e no local usando contêineres.

Impulsione a inovação de aplicativos com os Serviços de IA de Nuvem

Conheça 5 maneiras principais pelas quais sua organização pode começar a usar a IA para obter valor rapidamente.

Privacidade e segurança abrangentes

  • O serviço de Fala, parte dos Serviços Cognitivos do Azure, é certificado por SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • Os seus dados permanecem sendo seus. Os seus dados de entrada e de transcrição de áudio não são registrados durante o processamento de áudio.
  • Veja e exclua seus modelos e dados de fala personalizada a qualquer momento. Seus dados permanecem criptografados enquanto estão no armazenamento.
  • Com o suporte da infraestrutura do Azure, o serviço de Fala oferece segurança, disponibilidade, conformidade e capacidade de gerenciamento de nível empresarial.

O preço flexível oferece a você o controle de que precisa

Você paga a Conversão de Fala em Texto conforme o uso, com base no número de horas de áudio que transcreve, sem custos antecipados.

Documentação e recursos

Primeiros passos

Navegar pela documentação

Crie um serviço de fala com o curso do Microsoft Learn

Explore os exemplos de código

Confira nosso exemplo de código

Confira os recursos de personalização

Explore e personalize sua solução de voz para texto com o Speech Studio. Nenhum código é necessário.

Empresas que confiam na Conversão de Fala em Texto

A KPMG simplifica a transcrição da chamada

A KPMG usa a Conversão de Fala em Texto para transcrever e catalogar milhares de horas de chamadas, reduzindo os custos de conformidade para os clientes em até 80%.

KPMG

A Motorola ajuda socorristas a acessar dados vitais usando a voz

A Motorola Solutions está ajudando policiais e outros socorristas a obter acesso a informações importantes mais rapidamente com um assistente virtual acionado por voz.

Motorola Solutions

A Universal Electronics fornece experiências de casas inteligentes habilitadas para voz

A Universal Electronics está ajudando as marcas a fornecerem funcionalidades de navegação e de controle habilitadas para voz que funcionam entre os dispositivos do dia a dia encontrados em casa, oferecendo uma experiência de consumidor verdadeiramente única.

Universal Electronics

O Hochtief documenta defeitos de construção usando a voz

A Hochtief está ajudando os gerentes de projetos a identificar e documentar defeitos de construção em sites de projetos com um assistente virtual habilitado para voz.

Cheetah Mobile

A NTT DATA acelera a tomada de decisão com insights da reunião

A NTT DATA está descobrindo insights de dados de fala com a transcrição de reuniões em tempo real. Com a Fala Personalizada, eles podem personalizar os modelos de reconhecimento de fala para entender os termos específicos da organização.

NTTDATA

Os insights impulsionam experiências bancárias de conversação

A Insight Enterprises está ajudando os bancos a trazer a velocidade e a conveniência digital para as suas filiais com uma solução bancária habilitada por IA de conversação. A Conversão de Fala em Texto converte o que os clientes falam em dados que podem ser processados e analisados para que os clientes possam obter respostas oportunas e relevantes.

Insight Enterprise, Inc.

Perguntas frequentes sobre Conversão de Fala em Texto

  • É um recurso dentro do serviço de Fala que, com precisão e rapidez, transcreve áudio para texto.
  • Os Serviços Cognitivos são uma coleção de modelos de IA personalizáveis e predefinidos que podem ser usados para adicionar IA aos aplicativos. Há uma variedade de domínios, incluindo Fala, Decisão, Idioma e Visão. A Conversão de Fala em Texto é um recurso no serviço de Fala. Outros recursos relacionados à Fala incluem Conversão de Texto em Fala, a Tradução de Fala e o Reconhecimento do Locutor. Um exemplo de serviço de Decisão é o Personalizador, que permite que você forneça experiências personalizadas e relevantes. Os exemplos de serviços de linguagem incluem o Reconhecimento Vocal, a Análise de Texto para processamento de linguagem natural, o QnA Maker para experiências de perguntas frequentes e o Tradutor para tradução de linguagem.

Introdução à Conversão de Fala

Podemos ajudar você?