Text to Speech

Convierta el texto en un lenguaje más real para obtener interfaces más naturales

Hable a humanos, no a robots

Use Text to Speech (parte del servicio Voz) para crear aplicaciones y servicios que se expresen de una forma natural. Dé vida a sus soluciones con gran variedad de voces en una amplia gama de idiomas. Cree voces reales con la funcionalidad Texto a voz neuronal integrada en la investigación avanzada en tecnología de síntesis de voz. Personalice los modelos a fin de crear una voz única para su solución y marca.

Voz natural

Habilite una voz natural y fluida que coincida con los patrones de acentuación y entonación de las voces humanas.

Compromiso global

Llegue al público global con más de 80 voces y 45 idiomas y variantes.

Experiencias personalizadas

Cree voces únicas y distintivas para sus aplicaciones, empezando con tan solo unos minutos de datos de entrenamiento.

Audio optimizado

Adapte la salida de voz a sus escenarios simplemente con el ajuste de atributos como la velocidad, el volumen y la pronunciación.

Genere una voz que suene natural

Proporcione a sus aplicaciones una nueva voz con entonación humana real y una articulación clara. Con las redes neuronales profundas, Text to Speech hace que las voces de los equipos suenen expresivas y casi indistinguibles de la voz natural.

Inglés (EE. UU.): Jessa

Frase Muestra de voz
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Inglés (EE. UU.): Guy

Frase Muestra de voz
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chino (CN): Xiaoxiao

Frase Muestra de voz
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Alemán (DE): Katja

Frase Muestra de voz
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italiano (IT): Elsa

Frase Muestra de voz
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

¿Desea crear esto?

Llegue al público global en tiempo real

Convierta el texto en audio en tiempo real mediante la creación de experiencias conversacionales fluidas. Llegue al público global con más de 80 voces y 45 idiomas y variantes.

Lenguaje Texto de ejemplo Muestra de voz
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

¿Desea crear esto?

Cree una voz de marca única

Cree una voz única sin una sola línea de código, empezando con tan solo unos minutos de audio de entrenamiento. Desarrolle una voz humana personalizada totalmente realista mediante los modelos de red neuronal profunda con la funcionalidad Voz neuronal personalizada, que puede usarse en escenarios en tiempo real y para sintetizar contenido de audio en formato largo.

Lenguaje

Calidad

Texto de ejemplo Muestra de voz

¿Quiere empezar a compilar su propio modelo de voz?

Personalice fácilmente la salida de audio

Ajuste la salida de texto a audio en tiempo real mediante el control de parámetros tales como la velocidad, la pronunciación, el tono, el volumen, la entonación y las pausas. Con las voces neuronales, puede ajustar el estilo de habla para expresar emociones como alegría o empatía, o bien adaptarlo a escenarios específicos como una charla, en tono casual, o la difusión de noticias, en tono formal.

Más información sobre el ajuste de voz

Implemente soluciones en cualquier parte, desde la nube hasta el perímetro

Ejecute Text to Speech en la nube o en el entorno local con contenedores para escenarios donde la seguridad de los datos y una baja latencia son fundamentales. Ahora, los contenedores de voz admiten tanto voces estándar como personalizadas.

Más información acerca del servicio Voz

Seguridad para la empresa

  • Microsoft invierte más de USD 1 billion anualmente en la investigación y el desarrollo de la ciberseguridad.

  • Contamos con más de 3500 expertos en seguridad que se dedican exclusivamente a proteger sus datos y su privacidad.

  • Azure tiene más certificaciones que otro proveedor en la nube. Vea la lista completa.

Obtenga el potencial, el control y el nivel de personalización que necesita con precios flexibles

Pague solo por lo que usa, sin costos por adelantado. Con Text to Speech se paga por uso, en función del número de caracteres que convierta en audio.

Directrices para crear voces neuronales responsables

Obtenga información sobre la implementación responsable de las voces sintéticas

Las voces sintéticas deben diseñarse de modo que se ganen la confianza de los usuarios. Aprenda los principios para crear voces sintéticas que generen confianza en su empresa y servicios.

Lea nuestras directrices para la implementación responsable

Obtención del consentimiento del actor de voz

Ayude a los actores de voz a comprender cómo funciona Text To Speech neuronal y cómo se puede usar una vez que completen el proceso de grabación de audio.

Lea nuestra guía de divulgación para el actor de voz

Sea transparente

Asegúrese de que los usuarios entienden cuándo escuchan una voz sintética y que el actor de voz está al tanto del uso que se va a hacer de su voz.

Consulte nuestras directrices de divulgación Obtenga información sobre nuestro enfoque responsable

Contacto

La funcionalidad Voz neuronal personalizada está en versión preliminar restringida. Obtenga más información sobre el proceso de validación y cómo acceder aquí.

Comience a usar Text to Speech en tres pasos

Consiga acceso inmediato y un crédito por valor de $200 al registrarse para obtener una cuenta gratuita de Azure.
Inicie sesión en Azure Portal y agregue Voz.
Consulte las guías de inicio rápido y la documentación para aprender a insertar Text to Speech.

Recursos de Text to Speech para desarrolladores

Cursos

Realice un curso de Pluralsight para aprender a usar Text to Speech.

Hacer el curso

Preguntas más frecuentes sobre Text to Speech

  • Las voces estándar se crean mediante técnicas de síntesis paramétrica estadística y de síntesis de concatenación. Estas voces son totalmente inteligibles, suenan muy naturales y se pueden usar para que sus aplicaciones hablen en más de 45 idiomas, con una amplia gama de opciones de voz.

    Las voces neuronales usan redes neuronales profundas para superar los límites de los sistemas tradicionales de texto a voz y así poder hacer coincidir los patrones de acentuación y entonación en el lenguaje hablado y sintetizar las unidades del habla en una voz del equipo. La conversión de texto a voz estándar divide la prosodia en pasos separados para el análisis lingüístico y la predicción acústica, que se rigen por modelos independientes, lo que puede resultar en una síntesis de voz que se oye amortiguada. La capacidad neuronal se encarga de la predicción de la prosodia y la síntesis de voz simultáneamente, lo que resulta en una voz más fluida y natural.
  • Consulte la documentación para obtener una lista completa.
  • Consulte la disponibilidad regional.

Comience a usar Voz