Omitir navegación

Text to Speech

Convierta texto en voz para crear interfaces más naturales y accesibles

Hable a humanos, no a robots

Compile aplicaciones y servicios que se dirijan a los usuarios de forma natural, por lo que mejorarán la accesibilidad y la usabilidad. Convierta texto en audio en tiempo casi real, reprodúzcalo y guárdelo como archivo para usarlo más adelante. Text to Speech está disponible en las versiones Neural y Standard.

Como integra lo último en innovación de voz digital, la funcionalidad Neural Text to Speech hace que las voces de sus aplicaciones sean casi indistinguibles de las grabaciones de personas. La inflexión natural y la articulación clara reducen significativamente la fatiga auditiva al interactuar con los sistemas de IA. Utilice Neural Text to Speech para que las interacciones con los bots de chat y los asistentes virtuales sean más naturales y atractivas, para convertir textos digitales como libros electrónicos en audiolibros y para mejorar los sistemas de navegación de los automóviles.

Neural Text to Speech en acción

Inglés (EE. UU.): Jessa

Frase Muestra de voz
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Inglés (EE. UU.): Guy

Frase Muestra de voz
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

¿Desea crear esto?

La funcionalidad Standard Text to Speech habla a los usuarios en varios idiomas. Elija entre más de 75 voces. Hay 45 idiomas o configuración regionales, incluidas opciones para voces masculinas y femeninas. Ajuste parámetros como la velocidad, el tono, el volumen, la pronunciación y las pausas adicionales.

Standard Text to Speech en acción

Para ver cómo funciona la síntesis de voz, haga clic en Reproducir.*

Lenguaje Texto de ejemplo Muestra de voz
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

¿Desea crear esto?

Texto a voz con modelos de voz personalizada

¿Tiene que darle una voz de marca única y reconocible a su agente de voz? Texto a voz, la característica de personalización de voz, simplifica la creación de aplicaciones únicas habilitadas para voz, sin necesidad de conocimientos técnicos.

Véala en acción

Lenguaje

Calidad

Texto de ejemplo Muestra de voz

¿Quiere empezar a compilar su propio modelo de voz?

Modelos de voz fáciles

Para personalizar su agente de voz, grabe y cargue datos de aprendizaje y el servicio creará una fuente de voz única sintonizada con su grabación. Inicie una prueba de concepto con una pequeña cantidad de datos. El sistema se escala sin problemas a medida que los datos aumentan, lo que mejora la calidad de voz natural.

Coherentes e integrados

Los modelos de voz personalizada se integran por completo con otros servicios de voz de Cognitive Services. No se requiere ninguna codificación y el modelo de voz personalizada puede implementarse fácilmente en la API.

Rápido y seguro

Mediante un único punto de conexión de API y la administración de autenticación segura, puede conectar sus fuentes de voz rápidamente en todas las plataformas. Los modelos están bajo su control.

Explore un escenario de voz

Quiosco multimedia inteligente

La combinación de los servicios de voz y Language Understanding permite que las aplicaciones y los usuarios interactúen con naturalidad. Utilice conversión de voz en texto para capturar una pregunta del usuario, Language Understanding para analizar la intención y formular una respuesta apropiada y conversión de texto en voz para sintetizar el texto en una respuesta hablada. Cree interfaces de conversación para diversos escenarios tales como banca, viajes y entretenimiento.

Bot de chat para operaciones comerciales

Commerce ChatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional email and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The speech recognition service can be added to support voice commands.1237456
  1. Información general
  2. Flujo

Información general

De forma conjunta, Azure Bot Service y el servicio Language Understanding permiten a los desarrolladores crear interfaces de conversación para distintos escenarios, como banca, viajes y entretenimiento. Por ejemplo, un recepcionista de hotel puede usar un bot para mejorar las interacciones tradicionales de correo electrónico y llamadas telefónicas mediante la validación de un cliente a través de Azure Active Directory y el uso de Cognitive Services para mejorar el procesamiento contextual de las solicitudes de los clientes mediante texto y voz. Se puede agregar el servicio de reconocimiento de voz para admitir los comandos de voz.

Flujo

  1. 1 El cliente usa su aplicación móvil.
  2. 2 El usuario se autentica con Azure AD B2C.
  3. 3 El usuario solicita información con un bot de aplicación personalizado.
  4. 4 Cognitive Services ayuda a procesar las solicitudes de lenguaje natural.
  5. 5 El cliente revisa la respuesta, quien además puede matizar la pregunta mediante una conversación natural.
  6. 6 Una vez que el usuario está satisfecho con el resultado, el bot de aplicación actualiza la reserva del cliente.
  7. 7 Application Insights recopila telemetría de tiempo de ejecución para facilitar el desarrollo con el uso y el rendimiento del bot.
"Microsoft Cognitive Services gives us a huge range of opportunities. It's a perfect match for us now and in the future, when we want to add more features to our app."

Jaan Apajalahti, CEO

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Video Indexer

Obtenga conocimiento de sus vídeos

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Custom Vision VERSIÓN PRELIMINAR

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

Bing Spell Check

Detecte y corrija errores ortográficos en las aplicaciones

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Servicios de voz

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.

Speaker Recognition VERSIÓN PRELIMINAR

Use la voz para la identificación y verificación de hablantes individuales

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

Use el SDK de dispositivos de voz para compilar un dispositivo de ambiente y crear una palabra de reactivación personalizada

Más información