Conversão de Texto em Fala

Converta texto em fala para criar interfaces mais naturais e acessíveis

Fale como humano e não como robô

Crie aplicativos e serviços que falem naturalmente com os usuários, aprimorando a acessibilidade e a usabilidade. Converta texto em áudio quase em tempo real, reproduza-o e salve-o como um arquivo para uso posterior. A Conversão de Texto em Fala está disponível nas versões Neural e Standard.

Ao aplicar o que há de mais recente na inovação de fala digital, o recurso Conversão de Texto em Fala Neural torna as vozes de seus aplicativos quase indissociáveis das gravações de vozes humanas. A inflexão natural e a clara articulação reduzem significativamente a fadiga auditiva ao interagir com sistemas de inteligência artificial. Use a Conversão de Texto em Fala Neural para interagir com chatbots e assistentes virtuais de forma mais natural e participativa, para converter textos digitais, como livros eletrônicos, em audiolivros e para aprimorar sistemas de navegação em carros.

Conversão de Texto em Fala Neural em ação

Inglês (EUA): Jessa

Frase Voz de exemplo
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Inglês (EUA): Guy

Frase Voz de exemplo
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chinês (CHN): Xiaoxiao

Frase Voz de exemplo
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Alemão (DE): Katja

Frase Voz de exemplo
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italiano (IT): Elsa

Frase Voz de exemplo
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Want to build this?

A funcionalidade Conversão de Texto em Fala Standard fala com os usuários em diversos idiomas. Escolha entre mais de 75 vozes em mais de 45 idiomas ou localidades, incluindo opções para vozes masculinas e femininas. Ajuste parâmetros como velocidade, tom, volume, pronúncia e pausas adicionais.

Conversão de Texto em Fala Standard em ação

Para ver como a síntese de fala funciona, clique em Reproduzir.*

Idioma Texto de exemplo Voz de exemplo
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Want to build this?

Conversão de Texto em Fala com modelos de voz personalizados

Você precisa dar ao seu narrador uma voz marcante, exclusiva e reconhecível? O recurso de personalização de voz da Conversão de Texto em Fala facilita a criação de aplicativos únicos, habilitados por voz, sem a necessidade de expertise.

Conheça o recurso

Idioma

Qualidade

Texto de exemplo Voz de exemplo

Deseja começar a criar seu próprio modelo de voz?

Modelos de voz mais fáceis

Para personalizar seu narrador, grave e carregue os dados de treinamento e o serviço criará uma fonte de voz exclusiva ajustada para sua gravação. Inicie uma prova de conceito com uma pequena quantidade de dados. O sistema é escalado continuamente conforme os dados aumentam, aprimorando a qualidade natural da voz.

Consistente e integrado

Os modelos de voz personalizados são totalmente integrados a outros serviços de fala dos Serviços Cognitivos. Nenhuma codificação é necessária e você pode implantar com facilidade seu modelo de voz personalizado na API.

Rápido e seguro

Por meio de um ponto de extremidade de API exclusivo e do gerenciamento de autenticação segura, você pode conectar suas fontes de voz rapidamente em todas as plataformas. Seus modelos estão sob seu controle.

Conheça um cenário de fala

Quiosque inteligente

Os serviços de fala combinados com o Reconhecimento Vocal permitem que aplicativos e usuários interajam naturalmente. Use a Conversão de Fala em Texto para capturar a pergunta de um usuário, o Reconhecimento Vocal para analisar a intenção e formular uma resposta apropriada e a Conversão de Texto em Fala para sintetizar o texto em uma resposta falada. Crie interfaces conversacionais para vários cenários, como serviços bancários, viagens e entretenimento.

Commerce ChatbotJuntos, o Azure Bot Service e o serviço de Compreensão de Idiomas permitem aos programadores criar interfaces conversacionais para vários cenários como banca, turismo e entretenimento. Por exemplo, o funcionário de um hotel pode utilizar um bot para melhorar as interações tradicionais por e-mail e telefone ao validar um cliente através do Azure Active Directory e com os Serviços Cognitivos para processar melhor contextualmente os pedidos dos clientes com texto e voz. O serviço de reconhecimento de Voz pode ser adicionado para suportar os comandos de voz.1234567
  1. Visão geral
  2. Fluxo

Chatbot de comércio

Visão geral

Juntos, o Serviço de Bot do Azure e o serviço de Reconhecimento Vocal permitem que os desenvolvedores criem interfaces de conversação para vários cenários, como bancos, viagens e entretenimento. Por exemplo, o concierge de um hotel pode usar um bot para aprimorar as interações tradicionais de email e chamada telefônica ao validar um cliente por meio do Azure Active Directory e usar os Serviços Cognitivos para melhor processar as solicitações dos clientes de forma contextual usando texto e voz. O serviço de reconhecimento de fala pode ser adicionado para dar suporte a comandos de voz.

Fluxo

  1. 1 O cliente usa seu aplicativo móvel
  2. 2 Usando o Azure AD B2C, o usuário autentica
  3. 3 Usando o Bot de Aplicativo personalizado, o usuário solicita as informações
  4. 4 Os Serviços Cognitivos ajudam a processar a solicitação de linguagem natural
  5. 5 A resposta é revisada pelo cliente, que pode refinar a pergunta usando uma conversa natural
  6. 6 Assim que o usuário ficar satisfeito com os resultados, o Bot de Aplicativo atualiza a reserva do cliente
  7. 7 O Application Insights reúne a telemetria do tempo de execução para ajudar o desenvolvimento com o desempenho e uso do Bot

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: CTO, roobo

Explore a API de Serviços Cognitivos

Visual Computacional

Extraia informações acionáveis de imagens

Face

Detectar, identificar, analisar, organizar e marcar rostos em fotos

Reconhecimento de Tinta Digital VISUALIZAÇÃO

Um serviço de IA que reconhece conteúdo de tinta digital, como manuscrito, formas e layout de documento de tinta

Video Indexer

Obtenha insights para vídeos

Visão Personalizada

Personalize facilmente seus próprios modelos visuais de computação modernos de acordo com o seu caso de uso exclusivo

Reconhecimento de Formulários VISUALIZAÇÃO

O serviço de extração de documento com o poder da IA e que entende seus formulários

Análises de texto

Avalie sentimentos e tópicos com facilidade para entender o que os usuários querem

Tradução de Texto

Faça traduções automáticas com uma simples chamada à API REST

QnA Maker

Transforme informações em respostas com formato de conversação e de fácil navegação

Reconhecimento Vocal

Ensine seus aplicativos a entenderem comandos dos usuários

Leitura Avançada VISUALIZAÇÃO

Incentive usuários de todas as idades e níveis de capacidade a ler e compreender textos

Serviços de Fala

Serviços de fala unificados para conversão de fala em texto, conversão de texto em fala e tradução de fala

Reconhecimento do Locutor VISUALIZAÇÃO

Use a fala para identificar e verificar locutores individuais

Content Moderator

Moderação automática de vídeo, texto e imagem

Detector de Anomalias VISUALIZAÇÃO

Adicione funcionalidades de detecção de anomalias facilmente aos seus aplicativos.

Personalizador VISUALIZAÇÃO

Um serviço de IA que oferece uma experiência do usuário personalizada

Use o SDK de Dispositivos de Fala para criar um dispositivo ambiente e uma palavra de ativação personalizada

Saiba mais