Saltar al contenido principal

Texto a voz

Característica de los servicios de voz que convierte texto en voz realista.

Dé vida a sus aplicaciones con voces naturales

Cree aplicaciones y servicios que hablen de forma natural. Diferencie su marca con una voz personalizada y realista y acceda a voces con diferentes estilos de discurso y tonos emocionales para ajustar su uso: desde lectores de texto hasta bots de chat de soporte al cliente.

Voz sintetizada realista

Habilite una voz natural y fluida para la conversión de texto en voz que coincida con los patrones y la entonación de las voces humanas.

Voces personalizables para lectores de texto

Cree una voz única generada por IA que refleje la identidad de su marca.

Controles de audio de texto a habla específicos

Ajuste la salida de voz de sus escenarios controlando fácilmente la velocidad, el tono, la pronunciación, las pausas, etc.

Implementación flexible

Ejecute Text to Speech en cualquier lugar: en la nube, en el entorno local o en el perímetro en contenedores.

Personalice la salida de voz

Ajuste el audio obtenido con síntesis de voz para adaptarlo a su escenario. Defina léxicos y controle los parámetros de voz, como la pronunciación, el tono, la velocidad, las pausas y la entonación, con el lenguaje de marcado de síntesis de voz (SSML) o con la herramienta de creación de contenido de audio.

Implemente Texto a voz en cualquier lugar, desde la nube hasta el perímetro

Ejecute Texto a voz donde residan los datos. Integre una síntesis de voz realista en aplicaciones que estén optimizadas tanto para ofrecer una sólida funcionalidad en la nube como para ejecutarse en el perímetro usando contenedores.

Cree una voz personalizada para su marca

Diferencie su marca con una voz personalizada única. Desarrolle una voz muy realista para lograr interfaces de conversación más naturales usando la característica Voz neuronal personalizada, comenzando con 30 minutos de audio. Estos son algunos ejemplos de organizaciones que están realizando la generación de voz de inteligencia artificial hoy:

Impulsar la innovación de aplicaciones con servicios de IA en la nube

Obtenga información sobre cinco formas clave en las que su organización puede empezar a usar la inteligencia artificial para obtener valor rápidamente.

Privacidad y seguridad completas

Documentación

El servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.

Puede ver y eliminar sus datos de voz personalizados y modelos de voz sintetizada en cualquier momento. Los datos se cifran mientras están en el almacenamiento.

Aprendizaje

Sus datos siguen siendo suyos. Los datos de texto no se almacenan mientras se procesan o se genera el audio.

Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.

Seguridad y cumplimiento integrales, integrados

  • Microsoft invierte más de 1,000,000,000 USD al año en la investigación y el desarrollo de la ciberseguridad.

Información general de un centro de seguridad en Azure, que muestra datos de directivas y cumplimiento, e higiene de seguridad de recursos
  • Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.

La pestaña de proceso y aplicaciones del centro de seguridad en Azure muestra una lista de recomendaciones
  • Azure tiene más certificaciones que cualquier otro proveedor de nube. Consulta la lista completa.

  • Los precios flexibles ofrecen la capacidad y el control que necesita

    Pague solo por lo que usa, sin costes por adelantado. Con Text to Speech, solo paga por lo que usa en función del número de caracteres que convierta en audio.

Empezar a usar una cuenta gratuita de Azure

1

Empieza gratis. Obtén un crédito de  200 USD  para usar durante 30 días. Mientras tengas el crédito, obtendrás cantidades gratuitas de muchos de nuestros servicios más populares y cantidades gratuitas de otros 55 servicios que son siempre gratis.

2

Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.

3

Transcurridos 12 meses, seguirá obteniendo más de 55 servicios que siempre son gratuitos y seguirá pagando solo por lo que use más allá de las cantidades gratuitas mensuales.

Directrices para la creación de voces sintéticas responsables

Más información sobre la implementación responsable

Las voces sintéticas deben diseñarse para lograr la confianza de otros. Conozca los principios de la creación de voces sintéticas que generen confianza en su empresa y los servicios que ofrece.

Obtención del consentimiento del actor de voz

Ayude a los actores de voz a entender cómo funciona la conversión de texto en voz (TTS) neuronal y obtenga información sobre los casos de uso recomendados.

Sea transparente

La transparencia es fundamental para hacer un uso responsable de las voces sintéticas. Ayude a asegurar que los usuarios comprenden cuándo escuchan una voz sintética y que el actor de voz está al tanto del uso que se va a hacer de su voz. Obtenga más información con nuestras directrices de diseño de transparencia.

Documentación y recursos

Explorar ejemplos de código

Eche un vistazo al código de ejemplo

Ver recursos de personalización

Personalice su solución de voz con Speech Studio. No requiere trabajo de programación.

Comenzar a crear con Cognitive Services

Pruebe texto a voz gartis

Chatear con el equipo de ventas