Conversão de Texto em Voz

Converta texto em voz semelhante à humana para oferecer interfaces mais naturais

Fale a língua dos humanos, não a dos robôs

Utilize a funcionalidade Conversão de Texto em Voz, que faz parte do serviço de Voz, para criar aplicações e serviços que falem de forma natural. Dê vida às suas soluções com dezenas de vozes disponíveis num vasto leque de idiomas. Crie vozes semelhantes às humanas com a funcionalidade Conversão de Texto em Voz Neural desenvolvida com base em investigação inovadora no domínio da tecnologia de sintetização de voz. Personalize os modelos de modo a criar uma voz única para a sua solução e a sua marca.

Voz semelhante à humana

Produza uma voz fluida e natural que iguale os padrões de acentuação e entoação da voz humana.

Cativação à escala global

Atraia audiências de todo o mundo com as mais de 80 vozes e 45 idiomas e variantes disponíveis.

Experiências personalizadas

Crie vozes de marca únicas para as suas aplicações, tendo como ponto de partida alguns minutos de dados de preparação.

Áudio otimizado

Otimize a saída de voz para os seus cenários ajustando facilmente atributos como a velocidade, o volume e a pronúncia.

Produza voz que soe natural

Confira uma nova voz às suas aplicações, dotada de uma articulação clara com uma entoação humana e natural. Ao utilizar redes neurais profundas, a Conversão de Texto em Voz confere expressividade às vozes computorizadas, tornando-as quase indistintas das vozes faladas naturais.

Inglês (Estados Unidos): Jessa

Frase Exemplo de Voz
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Inglês (Estados Unidos): Guy

Frase Exemplo de Voz
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chinês (CN): Xiaoxiao

Frase Exemplo de Voz
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Alemão (DE): Katja

Frase Exemplo de Voz
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italiano (Itália): Elsa

Frase Exemplo de Voz
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Quer criá-la

Interaja com audiências do mundo inteiro em tempo real

Converta texto em áudio em tempo real, criando experiências nas quais a conversa flui naturalmente. Interaja com audiências do mundo inteiro através das mais de 80 vozes e 45 idiomas e variantes disponíveis.

Idioma Texto de Exemplo Exemplo de Voz
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (TR) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Quer criá-la

Crie uma voz de marca única

Crie a sua voz exclusiva sem uma única linha de código, tendo como ponto de partida alguns minutos de áudio de preparação. Desenvolva uma voz personalizada semelhante à humana altamente realista através da utilização de modelos de redes neurais profundas com a funcionalidade Voz Neural Personalizada, a qual pode ser utilizada para cenários em tempo real e a sintetização de conteúdos de áudio em formato de longa duração.

Idioma

Qualidade

Texto de Exemplo Exemplo de Voz

Quer começar a criar o seu próprio modelo de voz?

Adapte facilmente a saída de áudio

Otimize a conversão de texto em áudio em tempo real ao controlar parâmetros como a velocidade, a pronúncia, o tom, o volume, a entoação e as pausas. As vozes neurais permitem-lhe ajustar o estilo de discurso de modo a exprimir emoções, como entusiamo ou empatia, ou para o adequar a cenários específicos, como uma conversa para um tom informal ou um noticiário para um tom formal.

Saiba mais sobre a otimização de voz

Implemente em qualquer lado, desde a cloud à periferia

Execute a Conversão de Texto em Voz na cloud ou no local com contentores para cenários nos quais a segurança dos dados e a baixa latência são fundamentais. Agora, os contentores de voz já suportam tanto as vozes padrão como as vozes personalizadas.

Saiba mais sobre a Voz em contentores

Segurança para a empresa

  • A Microsoft investe mais de USD 1 billion anualmente na área da investigação e desenvolvimento da cibersegurança.

  • Empregamos mais de 3500 especialistas em segurança cuja única missão é proteger os seus dados e privacidade.

  • O Azure tem mais certificações do que qualquer outro fornecedor de cloud. Veja a lista completa.

Obtenha o poder, controlo e personalização de que necessita com preços flexíveis

Pague apenas pelo que utilizar, sem custos à cabeça. Com a Conversão de Texto em Voz, paga aquilo que utiliza (segundo o modelo pay as you go) com base no número de carateres que converte em áudio.

Diretrizes para vozes neurais responsáveis

Informe-se sobre a implementação responsável de vozes sintetizadas

As vozes sintetizadas têm de ser desenvolvidas de forma a inspirar a confiança de outras pessoas. Saiba quais são os princípios para a criação de vozes sintetizadas que fomentam a confiança na sua empresa e serviços.

Leia as nossas diretrizes em matéria de implementação responsável

Obtenha consentimento do profissional de dobragem

Ajude o profissional de dobragem a compreender como funciona a Conversão de Texto em Voz neural e como pode ser utilizada depois de concluir o processo de gravação de áudio.

Leia as nossas diretrizes de divulgação para profissionais de dobragem

Aja de forma transparente

Certifique-se de que os utilizadores compreendem quando estão a ouvir uma voz sintetizada e que o profissional de dobragem está ciente de como a sua voz irá ser utilizada.

Consulte as nossas diretrizes sobre divulgação Informe-se sobre a nossa lógica de responsabilidade

Contacte-nos

A funcionalidade Voz Neural Personalizada está em pré-visualização controlada. Saiba mais acerca do processo de proteção e como obter acesso aqui.

Introdução à Conversão de Texto em Voz em três passos

Inscreva-se numa conta gratuita do Azure e obtenha acesso instantâneo e um crédito de $200.
Inicie sessão no portal do Azure e adicione Voz.
Saiba como incorporar a Conversão de Texto em Voz com a ajuda de guias de introdução e da documentação.

Recursos para programadores para a Conversão de Texto em Voz

Documentação e tutorial

Introdução à Conversão de Texto em Voz.

Cursos

Faça um curso da Pluralsight que mostra como utilizar a Conversão de Texto em Voz.

Fazer o curso

Perguntas mais frequentes sobre a Conversão de Texto em Voz

  • As vozes padrão são criadas através da utilização de técnicas de síntese paramétrica estatística e síntese de concatenação. Estas vozes são altamente percetíveis e soam natural ao ouvido. Além disso, podem ser utilizadas para colocar as suas aplicações a falar em mais de 45 idiomas com um vasto leque de opções de voz.

    As vozes neurais utilizam redes neurais profundas para superar os limites dos sistemas de conversão de texto em voz tradicionais ao nível da correspondência de padrões de acentuação e entoação da linguagem falada e da sintetização de unidades de voz numa voz computorizada. A conversão de texto em voz padrão divide a prosódia em etapas separadas para análise linguística e predição acústica regidas por modelos independentes, o que pode dar origem a uma sintetização de voz abafada. A nossa funcionalidade neural leva a cabo a predição da prosódia e a sintetização de voz em simultâneo, produzindo uma voz mais fluida e natural.
  • Consulte a documentação para obter uma lista completa.
  • Verifique a disponibilidade regional.

Introdução ao serviço de Voz