Tipos de serviços de API de fala

Você pode usar o serviço de Fala dos Serviços Cognitivos do Azure para executar transformações de idioma falado, incluindo conversão de fala em texto, conversão de texto em fala, tradução de fala e reconhecimento do locutor.

Observação

Use o Serviço Cognitivo do Azure para Idioma se quiser coletar insights sobre termos ou frases ou obter uma análise contextual detalhada da linguagem falada ou escrita.

Serviços

Como escolher um serviço

Este fluxograma pode ajudar você a escolher o serviço de fala que atenda às suas necessidades:

Diagram that shows how to choose a speech service.

O lado esquerdo do diagrama ilustra processos de áudio para áudio ou áudio para texto.

  • A conversão de fala em texto é usada para converter fala de uma fonte de áudio em um formato de texto.
  • A conversão de fala em fala é usada para traduzir fala em um idioma para fala em outro idioma.

O lado direito do diagrama ilustra processos de conversão de texto em áudio.

  • A conversão de texto em fala é usada para gerar áudio falado com base em uma fonte de texto.

Casos de uso comuns

A tabela a seguir recomenda serviços para alguns casos de uso comuns.

Caso de uso Serviço usado
Fornecer legendas ocultas para vídeos gravados ou ao vivo Conversão de fala em texto
Criar uma transcrição de uma chamada telefônica ou de uma reunião Conversão de fala em texto
Implementar ditado de notas automatizado Conversão de fala em texto
Determinar a entrada do usuário pretendida para obter um processamento adicional Conversão de fala em texto
Gerar respostas faladas para a entrada do usuário Conversão de texto em fala
Criar menus de vozes para sistemas telefônicos Conversão de texto em fala
Ler mensagens de email ou de texto em voz alta em cenários de mãos livres Conversão de texto em fala
Transmitir anúncios em locais públicos, como estações ferroviárias ou aeroportos Conversão de texto em fala
Gerar legendas ocultas em tempo real de uma fala ou tradução bidirecional simultânea de uma conversa falada. Conversão de fala em texto

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Principais autores:

Outros colaboradores:

Para ver perfis não públicos no LinkedIn, entre no LinkedIn.

Próximas etapas