Conversão de Voz em Texto

Converta áudio falado em texto para interações mais naturais

Reconhecimento de voz avançado

Utilize a Voz em Texto, que faz parte do serviço de Voz, para converter rapidamente áudio em texto a partir das mais variadas origens. Personalize modelos para ultrapassar barreiras comuns do reconhecimento de voz, como vocabulários únicos, estilos de fala ou ruído de fundo. Ajude todos os participantes a acompanhar e participar nas conversas em tempo real para tornar o áudio mais acessível.

Inovação de ponta

Beneficie de uma precisão de reconhecimento de voz de ponta, alimentada por modelos de rede neural profunda.

Interação em tempo real

Transcreva áudio em texto em tempo real para que todos os participantes numa conversa possam interagir confortavelmente.

Reconhecimento de voz personalizado

Ajuste o reconhecimento de voz a estilos de fala e a terminologia de domínios específicos.

Implementação flexível

Execute a Voz em Texto em qualquer local, seja na cloud, no local ou no edge em contentores.

Utilize tecnologia de voz inovadora

Melhore as aplicações com as capacidades de voz apoiadas por décadas de investigação inovadora. A Microsoft foi a primeira a alcançar a paridade humana na tarefa de reconhecimento de voz conversacional da Switchboard e continua a desenvolver investigações de ponta na área do reconhecimento de voz.

Saiba mais sobre os avanços na área da tecnologia de voz

Para experimentar a demonstração com a sua voz através de um microfone, altere para um browser diferente com suporte WebRTC, por exemplo, uma versão recente do Microsoft Edge, do Firefox ou do Chrome.

Quer criá-lo?

Otimize o reconhecimento de voz com modelos adaptados

Personalize os modelos de reconhecimento de voz para ultrapassar barreiras comuns do reconhecimento de voz. Ajuste os modelos de idioma para que se adaptem aos estilos de fala, à pronúncia ou ao vocabulário único, como nomes de locais, produtos e expressões de indústrias específicas dos seus utilizadores. Gere automaticamente modelos personalizados com os dados do Office 365 para otimizar a precisão do reconhecimento de voz para termos específicos da organização.

Comece a utilizar a Voz Personalizada

Frases de Exemplo

Linha de base

Voz Personalizada

Quer criá-lo?

Obtenha informações das conversas

Transcreva conversas entre vários utilizadores em tempo real, para que os participantes se concentrem na discussão. Identifique quem disse o quê e quando e acompanhe rapidamente os próximos passos. Otimize a experiência para dispositivos com vários microfones. Ative as análises no texto transcrito para extrair mais informações das conversas.

Saiba mais sobre a capacidade de Transcrição de Conversas

Implemente em qualquer lado, desde a cloud à periferia

Execute a Voz em Texto na cloud ou no local com contentores em cenários nos quais a segurança dos dados e a baixa latência são fundamentais.

Saiba mais sobre a Voz em contentores

Segurança para a empresa

  • A Microsoft investe mais de mil milhões de dólares anualmente em investigação e desenvolvimento da cibersegurança.

  • Empregamos mais de 3500 especialistas em segurança totalmente dedicados à segurança e privacidade dos seus dados.

  • O Azure tem mais certificações de conformidade do que qualquer outro fornecedor de cloud. Veja a lista completa.

Obtenha o poder, controlo e personalização de que necessita com preços flexíveis

Pague apenas pelo que utilizar, sem custos à cabeça. Com a Voz em Texto, obtém o crédito pré-pago, tendo por base as horas de áudio transcrito.

Ver os preços da Voz em Texto

Introdução à Voz em Texto em três passos

Inscreva-se numa conta gratuita do Azure e obtenha acesso instantâneo e um crédito de 200 $.
Inicie sessão no portal do Azure e adicione a Voz.
Saiba como incorporar a Voz em Texto com a ajuda de guias de introdução e da documentação.

Recursos para programadores para a Voz em Texto

Documentação e tutoriais

Comece a utilizar a Voz em Texto.

Cursos

Faça um curso da Pluralsight que mostra como utilizar a Voz em Texto.

Casos de utilização

Saiba mais sobre os cenários da Voz em Texto, como transcrição de conversas e de chamadas para centros de atendimento.

Perguntas mais frequentes sobre a Voz em Texto

  • Para obter a lista completa dos idiomas que a Voz em Texto suporta, veja a nossa documentação.
  • Grave facilmente áudio de um microfone, leia a partir de um fluxo ou aceda a ficheiros de áudio no armazenamento com o SDK de Voz e as APIs REST. O SDK de Voz suporta áudio de canal único WAV/PCM 16 bits, 16 kHz/8 kHz para reconhecimento de voz. São suportados formatos de áudio adicionais com o ponto final REST de voz em texto ou o serviço de transcrição em lote.

Introdução à Voz em Texto