Omitir navegación

Text to Speech

A Speech service feature that converts text to lifelike speech

Dé vida a sus aplicaciones con voces naturales

Cree aplicaciones y servicios que hablen de forma natural. Diferencie su marca con un generador de voz personalizado y realista y acceda a voces con diferentes estilos de habla y tonos emocionales para ajustarse a su caso de uso: desde lectores de texto y habladores hasta bots de chat de atención al cliente.

Voz sintetizada realista

Logre una conversión de texto a voz fluida y natural que se adapte a la entonación y la emoción de las voces humanas.

Voces personalizables para lectores de texto

Cree un generador de voz de IA único que refleje la identidad de su marca.

Controles de audio de texto a voz muy precisos

Ajuste la salida de voz de sus escenarios controlando fácilmente la velocidad, el tono, la pronunciación, las pausas, etc.

Implementación flexible

Ejecute Text to Speech en cualquier lugar: en la nube, en el entorno local o en el perímetro en contenedores.

Acceda a una gran variedad de voces para cada escenario

Utilice 400 voces neuronales en 140 idiomas y dialectos para atraer a audiencias internacionales. Dé vida a sus escenarios con lectores de texto y asistentes habilitados para voz con voces muy expresivas y similares a las humanas. El Texto a Voz neuronal admite varios estilos de habla como noticias, servició de atención al cliente, gritos, susurros y emociones como la alegría y la tristeza.

Pruebe Text to Speech con esta aplicación de demostración, creada con nuestro SDK de JavaScript

Nota: Los datos no se almacenan.

Vea cómo crear esto

Nota: Los datos no se almacenan.

Vea cómo crear esto

Personalice la salida de voz

Ajuste el audio de voz sintetizado para que encaje con su escenario. Defina léxicos y controle parámetros de voz como la pronunciación, el tono, la velocidad, las pausas y la entonación con el Lenguaje de marcado de síntesis de voz (SSML) o con la herramienta de creación de contenido de audio.

Implemente Text to Speech en cualquier lugar, desde la nube hasta Edge

Ejecute Text to Speech donde tenga los datos. Cree una síntesis de voz realista en aplicaciones optimizadas para funcionalidades de nube sólidas y localidad perimetral con contenedores.

Cree una voz personalizada para su marca

Diferencie su marca con una única voz personalizada. Desarrolle una voz muy realista para interfaces conversacionales más naturales mediante la funcionalidad de Voz neuronal personalizada, empezando por 30 minutos de audio. Estos son algunos ejemplos de organizaciones que están realizando la generación de voz de inteligencia artificial hoy en día:

Swisscom mejora las experiencias de los clientes con asistente de voz multilingüe

Swisscom utilizó Azure Cognitive Service para voz para crear un asistente de voz de texto a voz personalizado con un sonido natural y personajes de voz exclusivos de Swisscom en inglés, francés, alemán e italiano.

Lea el artículo

AT&T deleita a sus clientes con experiencias envolventes

AT&T está mostrando el poder de su red 5G con una experiencia inmersiva que permite a sus clientes hablar directamente con Bugs Bunny.*

*LOONEY TUNES y todos los personajes y elementos relacionados con © & ™ Warner Bros. Entertainment Inc. (s21)

Ver el vídeo

Progressive ofrece Flo directamente a sus clientes

Progressive usó Voz neuronal personalizada para crear una versión virtual de Flo que suena natural, para que ayude a los clientes en todo, desde conseguir un presupuesto gratuito de un seguro de automóvil hasta preguntas generales sobre seguros.

Lea el artículo

Impulsar la innovación en aplicaciones con Cloud AI Services

Obtenga información sobre cinco formas clave en las que su organización puede empezar a usar la inteligencia artificial para obtener valor rápidamente.

Privacidad y seguridad completas

  • El servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • Sus datos siguen siendo suyos. Los datos de texto no se almacenan durante el procesamiento de datos ni la generación de voz de audio.
  • Puede ver y eliminar sus datos de voz personalizados y modelos de voz sintetizada en cualquier momento. Los datos se cifran mientras están en el almacenamiento.
  • Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.

Los precios flexibles ofrecen la capacidad y el control que necesita

Pague solo por lo que usa, sin costos por adelantado. Con Text to Speech, solo paga por lo que usa en función del número de caracteres que convierta en audio.

Directrices para la creación de voces sintéticas responsables

Más información sobre la implementación responsable

Las voces sintéticas deben diseñarse para ganarse la confianza de otros. Conozca los principios de creación de voces sintetizadas que creen confianza en su empresa y sus servicios.

Obtención del consentimiento del actor de voz

Ayude a los actores de voz a entender cómo funciona la conversión de texto en voz (TTS) neuronal y obtenga información sobre los casos de uso recomendados.

Sea transparente

La transparencia es fundamental para el uso responsable de los generadores de voz por ordenador y las voces sintéticas. Ayude a garantizar que los usuarios comprendan cuándo están escuchando una voz sintética y que los locutores sean conscientes de cómo se utilizará su voz. Obtenga más información con nuestras directrices de diseño de divulgación.

Documentación y recursos

Explore ejemplos de código

Eche un vistazo al código de ejemplo

Vea recursos de personalización

Personalice su solución de voz con Speech Studio. No requiere trabajo de programación.

Creado con Text to Speech

La BBC innova en la forma de ofrecer contenido de confianza

La BBC utilizó Azure Cognitive Services y Azure Bot Service para crear un asistente de voz digital personalizado de principio a fin que capta su identidad de marca y establece una relación conversacional con su amplia audiencia.

BBC

Swisscom mejora la experiencia del cliente con un asistente de voz multilingüe

Swisscom usó el servicio de voz para crear un asistente de voz personalizado con voces exclusivas de Swisscom que suenan muy realistas en inglés, francés, alemán e italiano.

Swisscom

Motorola ayuda a los servicios de emergencia a acceder a datos vitales

Motorola Solutions ayuda a la policía y a otros servicios de emergencia a acceder a información importante con más rapidez mediante un asistente virtual con reconocimiento de voz.

Motorola Solutions

Universal Electronics impulsa los hogares inteligentes conectados

Universal Electronics ayuda a los fabricantes a ofrecer características de navegación y control mediante la voz que funcionan en dispositivos domésticos inteligentes.

Universal Electronics

Cheetah Mobile amplía la traducción internacional

Cheetah Mobile, una empresa de Internet móvil con usuarios de aplicaciones en más de 200 países y regiones, utiliza Text to Speech para ampliar la accesibilidad de su dispositivo y aplicación de traducción a los mercados internacionales.

Cheetah Mobile

Cuando quiera, podemos configurar su cuenta gratuita de Azure

¿Podemos ayudarle?