Pular para o conteúdo principal
JÁ DISPONÍVEL

Apresentando o cliente de ingestão para Fala do Azure

Data da publicação: 28 junho, 2021

O Fala é um serviço cognitivo do Azure que permite que você crie soluções escalonáveis que podem lidar com uma variedade de tarefas relacionadas à fala, como transcrever áudio, produzir vozes que soam naturais, reconhecer quem está falando e lidar com a tradução de fala.

Hoje, estamos introduzindo o cliente de ingestão, uma solução do Azure que monitorará seu contêiner dedicado de Armazenamento do Azure para que os arquivos de áudio salvos nesse armazenamento sejam automaticamente transcritos.

Criamos essa ferramenta para ajudá-lo a configurar um pipeline de transcrição completo, escalonável e seguro por meio de uma configuração simples e sem nenhum esforço de desenvolvimento. O cliente de ingestão incorpora as melhores práticas para maximizar as solicitações de transcrição em termos de colocação em escala (para centenas de milhares de arquivos), gerenciamento de erros, lógica de repetição e várias outras otimizações. A configuração é realizada com a implantação ARM. A arquitetura da solução que esse modelo do ARM implanta está descrita na figura abaixo.

 

Interface gráfica do usuário, diagrama, aplicativo

Descrição gerada automaticamente

Quando um usuário carrega um arquivo de áudio para o contêiner dedicado de Armazenamento do Azure, o Azure Functions disparado por temporizador seleciona esse arquivo e cria uma solicitação de transcrição usando a API REST de conversão de fala em texto v3.0 ou SDK de fala (opção do usuário). Quando a transcrição for concluída com êxito, a solução gravará a transcrição nos contêineres onde o arquivo de áudio foi obtido. Além disso, os usuários podem optar por aplicar análises na transcrição, produzir relatórios ou redigir, todos são o resultado de recursos adicionais sendo implantados com o modelo do ARM.

Explore nosso guia para obter mais informações sobre a ferramenta e as notas de instalação e baixe o código desse repositório github.

  • Conversão de Fala em Texto
  • Fala de IA do Azure
  • Operating System
  • SDK and Tools