Torne o áudio falado acionável
Transcreva áudio para texto de forma rápida e precisa em mais de 100 idiomas e variantes. Personalize modelos para melhorar a precisão de terminologia de domínios específicos. Permita pesquisa ou análise nos textos transcritos ou facilite ações, tudo na sua linguagem de programação preferida, para obter mais valor do áudio falado.
Transcrição de alta qualidade
Obtenha transcrições de áudio para texto precisas com reconhecimento de voz de ponta.
Modelos personalizáveis
Adicione palavras específicas ao seu vocabulário de base ou crie os seus próprios modelos de conversão de voz em texto.
Implementação flexível
Execute a Conversão de Voz em Texto em qualquer local, seja na cloud ou no edge em contentores.
Pronto para produção
Aceda à mesma tecnologia robusta que alimenta o reconhecimento de voz em todos os produtos Microsoft.
Transcreva voz de várias fontes com precisão
Converta áudio em texto a partir de várias fontes, incluindo microfones, ficheiros de áudioe armazenamento de blobs. Utilize a divisão de oradores para determinar quem disse o quê e quando. Obtenha transcrições legíveis com a formatação e a pontuação automáticas.
Personalize os modelos de voz de acordo com as suas necessidades
Ajuste os seus modelos de voz para compreenderem terminologia específica da organização e da indústria. Ultrapasse as barreiras do reconhecimento de voz, como ruído de fundo, sotaques ou vocabulário próprio. Personalize os seus modelos ao carregar dados e transcrições de áudio. Gere modelos personalizados com dados do Office 365 de forma automática para otimizar a precisão do reconhecimento de voz para a sua organização.
Implementar em qualquer local
Execute a Conversão de Voz em Texto onde quer que os seus dados estejam. Crie aplicações de voz otimizadas para capacidades de cloud robustas e para no local com contentores.
Impulsione a Inovação de Aplicações com Serviços de IA na Cloud
Aprenda as cinco formas principais que a sua organização pode começar a utilizar com IA para obter valor rapidamente.
Privacidade e segurança abrangentes
-
O serviço de Voz, que faz parte dos Serviços Cognitivos do Azure, tem as certificações SOC, FedRamp, PCI DSS, HIPAA, HITECH e ISO.
-
Veja e elimine os seus dados e modelos de voz personalizados a qualquer altura. Os dados são encriptados enquanto estão no armazenamento.
-
A titularidade dos dados permanece sua. A entrada de áudio e os dados de transcrição não são registados durante o processamento de áudio.
-
Apoiado pela infraestrutura do Azure, o serviço de Voz oferece segurança, disponibilidade, conformidade e capacidade de gestão de nível empresarial.
Segurança e conformidade abrangentes e incorporadas
-
A Microsoft investe mais de 1 mil milhões de USD anualmente em investigação e desenvolvimento da cibersegurança.
-
Empregamos mais de 3500 peritos em segurança dedicados à segurança e privacidade dos dados.
-
O Azure tem mais certificações do que qualquer outro fornecedor de serviços em nuvem. Veja a lista completa.
-
Os preços flexíveis dão-lhe o controlo de que precisa
Com a Conversão de Voz em Texto, paga à medida que utiliza com base no número de horas de áudio que transcreve, sem custos adiantados.
Começar a utilizar uma conta gratuita do Azure
1
2
Após o crédito, mude para pay as you go para continuar a criar com os mesmos serviços gratuitos. Só paga se utilizar mais do que os serviços mensais gratuitos.
3
Empresas que confiam na Conversão de Voz em Texto
A Motorola ajuda unidades de intervenção primária a aceder a dados vitais com voz
A Motorola Solutions está a ajudar os agentes da polícia e outros socorristas de emergência a obter acesso mais rápido a informações importantes com um assistente virtual com tecnologia de voz.
Documentação e recursos
Começar
Consulte a documentação
Crie um serviço de voz com o curso do Microsoft Learn
Explore os exemplos de código
Veja o nosso código de exemplo
Veja os recursos de personalização
Explore e personalize a sua solução de conversão de voz em texto com o Speech Studio. Não é necessária programação.
Perguntas mais frequentes sobre a Conversão de Voz em Texto
-
É uma funcionalidade no serviço de Voz que transcreve áudio em texto com precisão e rapidez.
-
OsServiços Cognitivos são uma coleção de modelos de IA personalizáveis pré-criados que podem ser utilizados para adicionar IA a aplicações. Existe uma variedade de domínios, incluindo Voz, Decisão, Idioma e Visão. A Conversão de Voz em Texto é uma funcionalidade no serviço de Voz. Outras funcionalidades relacionadas com Voz incluem Conversão de Texto em Voz, Tradução de Voze Reconhecimento de Orador. Um exemplo de um serviço de Decisão é o Personalizador, que lhe permite proporcionar experiências personalizadas e relevantes. Os exemplos de serviços de Idioma incluem Language Understanding, Análise de Texto para processamento de linguagem natural, Criador de FAQ para experiências de FAQ e Tradutor para tradução de idiomas.