Conversão de Texto em Voz

Converta texto em voz para criar interfaces mais naturais e acessíveis

Fale a língua dos humanos, não a dos robôs

Crie aplicações e serviços que falem com os utilizadores com naturalidade, melhorando a acessibilidade e a utilização. Converta texto em áudio em tempo quase real, reproduza-o e guarde-o como ficheiro para utilizar mais tarde. A Conversão de Texto em Voz está disponível tanto na versão Neural como na Standard.

A capacidade de Conversão de Texto em Voz Neural, com a tecnologia mais recente de voz digital, torna as vozes das suas aplicações quase indistinguíveis de gravações de pessoas reais. A flexão natural e a dicção clara reduzem significativamente a fadiga de audição que resulta da interação com sistemas de IA. Utilize a Conversão de Texto em Voz Neural para tornar as interações com os chatbots e assistentes virtuais mais naturais e interessantes, converter texto digital como e-books em audiolivros e para melhorar os sistemas de navegação dos veículos.

Conversão de Texto em Voz Neural em ação

Inglês (Estados Unidos): Jessa

Frase Exemplo de Voz
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Inglês (Estados Unidos): Guy

Frase Exemplo de Voz
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chinês (CN): Xiaoxiao

Frase Exemplo de Voz
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Alemão (DE): Katja

Frase Exemplo de Voz
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italiano (Itália): Elsa

Frase Exemplo de Voz
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Quer criá-lo?

A capacidade de Conversão de Texto em Voz Standard fala aos utilizadores em vários idiomas. Escolha de entre mais de 75 vozes em mais de 45 idiomas ou regiões, incluindo opções para vozes masculinas e femininas. Ajuste parâmetros como velocidade, entoação, volume, pronunciação e pausas adicionais.

Conversão de Texto em Voz Standard em ação

Para ver como funciona a sintetização de voz, clique em Reproduzir.*

Idioma Texto de Exemplo Exemplo de Voz
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Quer criá-lo?

Conversão de Texto em Voz com modelos de voz personalizada

Precisa que o seu agente de voz tenha uma voz única e reconhecível associada à sua marca? A funcionalidade de personalização de voz de Conversão de Texto em Voz permite-lhe criar com toda a facilidade aplicações únicas e com voz, sem precisar de conhecimentos técnicos.

Veja-o em ação

Idioma

Qualidade

Texto de Exemplo Exemplo de Voz

Quer começar a criar o seu próprio modelo de voz?

Modelos de voz fáceis de criar

Para personalizar o seu agente de voz, só tem de gravar e carregar os dados de preparação para que o serviço crie um tipo de voz único otimizado para a sua gravação. Inicie uma prova de conceito com uma pequena quantidade de dados. O sistema dimensiona facilmente à medida que a quantidade de dados aumenta, o que melhora a qualidade da voz natural.

Consistente e integrado

Os modelos de voz personalizada estão totalmente integrados com outros serviços de voz dos Serviços Cognitivos. Não precisa de código e pode implementar facilmente o seu modelo de voz personalizada na API.

Rápido e seguro

Através de um ponto final de API exclusivo e da gestão de autenticação segura, pode introduzir os seus tipos de voz rapidamente em todas as plataformas. O controlo dos seus modelos está nas suas mãos.

Explore um Cenário de Voz

Quiosque inteligente

Os serviços de voz combinados com o Language Understanding permite a interação natural entre as aplicações e os utilizadores. Utilize a Conversão de Voz em Texto para capturar a pergunta de um utilizador, o Language Understanding para analisar a intenção e formular a resposta adequada e a Conversão de Texto em Voz para sintetizar o texto numa resposta de voz. Crie interfaces de conversação para diferentes cenários como banca, viagens e entretenimento.

Commerce ChatbotJuntos, o Azure Bot Service e o serviço de Compreensão de Idiomas permitem aos programadores criar interfaces conversacionais para vários cenários como banca, turismo e entretenimento. Por exemplo, o funcionário de um hotel pode utilizar um bot para melhorar as interações tradicionais por e-mail e telefone ao validar um cliente através do Azure Active Directory e com os Serviços Cognitivos para processar melhor contextualmente os pedidos dos clientes com texto e voz. O serviço de reconhecimento de Voz pode ser adicionado para suportar os comandos de voz.1234567
  1. Descrição geral
  2. Fluxo

Commerce Chatbot

Descrição geral

Juntos, o Azure Bot Service e o serviço de Compreensão de Idiomas permitem aos programadores criar interfaces conversacionais para vários cenários como banca, turismo e entretenimento. Por exemplo, o funcionário de um hotel pode utilizar um bot para melhorar as interações tradicionais por e-mail e telefone ao validar um cliente através do Azure Active Directory e com os Serviços Cognitivos para processar melhor contextualmente os pedidos dos clientes com texto e voz. O serviço de reconhecimento de Voz pode ser adicionado para suportar os comandos de voz.

Fluxo

  1. 1 O cliente utiliza a sua aplicação móvel
  2. 2 Com o Azure AD B2C, o utilizador autentica-se
  3. 3 Com o Application Bot personalizado, o utilizador solicita informações
  4. 4 Os Serviços Cognitivos ajudam a processar o pedido de linguagem natural
  5. 5 A resposta é revista pelo cliente que pode ajustar a questão com conversa natural
  6. 6 Quando o utilizador estiver satisfeito com os resultados, o Application Bot atualiza a reserva do cliente
  7. 7 O Application Insights recolhe telemetria do runtime para apoiar o desenvolvimento com o desempenho e utilização do Bot

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: Diretor Tecnológico da roobo

Explore as APIs Serviços Cognitivos

Imagem Digitalizada

Separe informações acionáveis de imagens

Face

Detete, identifique, analise, organize e assinale rostos em fotos

Reconhecedor de Tinta Digital PRÉ-VISUALIZAÇÃO

Um serviço de IA que reconhece conteúdo de tinta digital, como escrita manual, formas e esquemas de documentos com tinta

Indexador de Vídeo

Desbloqueie informações de vídeo

Visão Personalizada

Personalize facilmente os seus modelos de imagem digitalizada de ponta para o seu cenário de utilização específico

Reconhecedor de Formato PRÉ-VISUALIZAÇÃO

O serviço de extração de documentos com suporte da IA que compreende os seus formulários

Análise de Texto

Avalie sentimentos e tópicos facilmente, de modo a compreender o que os utilizadores querem

Texto do Tradutor

Realize facilmente traduções automática com uma simples chamada à API REST

QnA Maker

Converta informações em respostas de conversação fáceis de navegar

Language Understanding

Ensine as suas aplicações a compreender comandos dados pelos utilizadores

Leitura Avançada PRÉ-VISUALIZAÇÃO

Capacitar os utilizadores de todas as idades e níveis de capacidade para os ajudar a ler e compreender textos

Serviços de Voz

Serviços de voz unificados para conversão de voz para texto, texto para voz e tradução de voz

Reconhecimento de Orador PRÉ-VISUALIZAÇÃO

Utilize a voz para identificar e verificar oradores individuais

Content Moderator

Moderação automática de imagens, texto e vídeo

Detetor de Anomalias PRÉ-VISUALIZAÇÃO

Adicione facilmente capacidades de deteção de anomalias às suas aplicações.

Personalizador PRÉ-VISUALIZAÇÃO

Um serviço de IA que proporciona uma experiência de utilizador personalizada

Utilize o SDK de Dispositivos de Voz para criar um dispositivo de ambiente e criar uma palavra personalizada para iniciar a interação

Saber mais