Ignorar navegação

Serviços de fala

Converta áudio em texto, execute a tradução de fala e a conversão de texto em fala com os serviços de Fala unificados

Desenvolva rapidamente aplicativos habilitados para voz de alta qualidade

Crie aplicativos habilitados para voz com confiança e rapidez com o SDK de Fala. Transcreva o reconhecimento de fala com alta precisão, produza vozes de texto para fala com som natural, traduza o áudio falado e use o reconhecimento de locutor durante as conversas. Explore com uma experiência sem código e crie modelos personalizados para seu aplicativo com o Speech Studio.

Qualidade líder do setor

Obtenha uma conversão de fala em texto de última geração, conversão de texto em fala realista e o reconhecimento de locutor premiado.

Conformidade e segurança

Seus dados permanecem seus — sua entrada de fala não é registrada durante o processamento.

Vozes e modelos personalizáveis

Crie vozes personalizadas, adicione palavras específicas ao vocabulário base ou crie seus próprios modelos.

Implantação flexível

Execute a Fala em qualquer lugar, na nuvem ou na borda em contêineres.

Converter fala em texto

Transcreva áudio de forma rápida e precisa em mais de 100 idioma e variantes. Obtenha insights do cliente com a transcrição do call center, melhore as experiências com assistentes habilitados para voz, capture discussões importantes em reuniões e muito mais.

Dê voz ao seu aplicativo

Use a conversão de texto em fala para criar aplicativos e serviços que falam de forma coloquial. Crie conteúdos de áudio com som natural, melhore a acessibilidade com a funcionalidade de leitura em voz alta e crie assistentes de voz personalizados.

Traduzir fala em tempo real

Traduza áudio de mais de 30 idiomas e personalize as traduções com os termos específicos da sua organização - tudo em sua linguagem de programação preferencial.

Verifique e reconheça os locutores

Confirme a identidade de uma pessoa ou reconheça quem está falando em uma reunião adicionando a verificação e a identificação do locutor ao seu aplicativo.

Ative seu assistente ou dispositivo de IoT com uma palavra-chave personalizada

Crie uma palavra-chave personalizada para dispositivos IoT e assistentes habilitados para voz para separar sua marca-tornando-a mais pessoal, personalizada e segura.

Adicionar comandos de voz para cenários de mãos livres

Crie uma experiência sem toque que prioriza a voz para melhorar a segurança e dar suporte a cenários de volta ao trabalho.

Segurança e conformidade abrangentes, internas

  • A Microsoft investe mais de USD 1 bilhão anualmente em pesquisa e desenvolvimento de segurança cibernética.

  • Contamos com mais de 3,500 especialistas em segurança dedicados à privacidade e à segurança de dados.

  • O Azure tem mais certificações de conformidade que qualquer outro provedor de nuvem. Veja a lista completa.

O preço flexível oferece a você o poder e o controle de que precisa

Pague apenas pelo que você usa, sem custos antecipados. Com a Fala, pague conforme o uso com base em:

  • O número de horas de áudio que você transcreve ou traduz para converter de fala em texto e fala.
  • O número de caracteres que você converte em áudio para a conversão de texto em fala
  • O número de transações para Reconhecimento do Locutor

Documentação e recursos de fala

Introdução aos Serviços de Fala

Procure a documentação

Faça o curso de Fala do Microsoft Learn

Explorar recursos populares do desenvolvedor

Confira nosso código de exemplo e SDKs

Crie modelos de fala rapidamente com Speech Studio Stack Overflow

Confiável para empresas de todos os tamanhos

A AT&T encanta os clientes com experiências imersivas

A AT&T do apresenta sua rede 5G com uma experiência imersiva que permite que os clientes conversem diretamente com o Pernalonga.*

*LOONEY TUNES e todos os personagens e elementos da © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

O progressivo leva o Flo diretamente aos clientes

Uso progressivo da Sintetização de Voz Personalizada para criar uma versão virtual e natural do Flo para ajudar os clientes com tudo, desde obter uma cotação de seguro de carro gratuita a perguntas gerais sobre o seguro.

Progressive

A KPMG simplifica a transcrição da chamada

O KPMG usa a Conversão de Fala em Texto para transcrever e catalogar milhares de chamadas, reduzindo os custos de conformidade dos seus clientes em até 80%.

KPMG

A Motorola ajuda os socorristas a acessarem dados vitais

O Motorola Solutions ajuda os socorristas em campo a acessarem informações vitais com um assistente virtual de primeira voz.

Motorola Solutions

Defeitos de construção de documentos da Hochtief usando voz

Um assistente virtual habilitado por voz ajuda os gerentes de projetos de construção a identificar e documentar defeitos nos sites em construção.

HOCHTIEF

A Zencity melhora a qualidade da vida usando as soluções de IA

A inicialização de dados e análises do Zencity usa o Tradução de Fala para analisar dados de uma variedade de fontes - mídia social, solicitações de manutenção e muito mais - ajudando a tomar decisões baseadas em dados que fornecem melhores serviços para seus residentes.

Zencity

Atualizações de fala, blogs e comunicados

Estamos prontos para começar – vamos configurar sua conta gratuita do Azure

Podemos ajudar você?