Text to Speech

Convierta texto en voz para crear interfaces más naturales y accesibles

Hable a humanos, no a robots

Compile aplicaciones y servicios que se dirijan a los usuarios de forma natural, por lo que mejorarán la accesibilidad y la usabilidad. Convierta texto en audio en tiempo casi real, reprodúzcalo y guárdelo como archivo para usarlo más adelante. Text to Speech está disponible en las versiones Neural y Standard.

Como integra lo último en innovación de voz digital, la funcionalidad Neural Text to Speech hace que las voces de sus aplicaciones sean casi indistinguibles de las grabaciones de personas. La inflexión natural y la articulación clara reducen significativamente la fatiga auditiva al interactuar con los sistemas de IA. Utilice Neural Text to Speech para que las interacciones con los bots de chat y los asistentes virtuales sean más naturales y atractivas, para convertir textos digitales como libros electrónicos en audiolibros y para mejorar los sistemas de navegación de los automóviles.

Neural Text to Speech en acción

Inglés (EE. UU.): Jessa

Frase Muestra de voz
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Inglés (EE. UU.): Guy

Frase Muestra de voz
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chino (CN): Xiaoxiao

Frase Muestra de voz
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Alemán (DE): Katja

Frase Muestra de voz
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Italiano (IT): Elsa

Frase Muestra de voz
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

¿Desea crear esto?

La funcionalidad Standard Text to Speech habla a los usuarios en varios idiomas. Elija entre más de 75 voces. Hay 45 idiomas o configuraciones regionales, incluidas opciones para voces masculinas y femeninas. Ajuste parámetros como la velocidad, el tono, el volumen, la pronunciación y las pausas adicionales.

Standard Text to Speech en acción

Para ver cómo funciona la síntesis de voz, haga clic en Reproducir.*

Lenguaje Texto de ejemplo Muestra de voz
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

¿Desea crear esto?

Text to Speech con modelos de voz personalizada

¿Tiene que darle una voz de marca única y reconocible a su agente de voz? La característica de personalización de voz Text to Speech simplifica la creación de aplicaciones únicas habilitadas para voz, sin necesidad de conocimientos técnicos.

Véala en acción

Lenguaje

Calidad

Texto de ejemplo Muestra de voz

¿Quiere empezar a compilar su propio modelo de voz?

Modelos de voz fáciles

Para personalizar su agente de voz, grabe y cargue datos de aprendizaje y el servicio creará una fuente de voz única sintonizada con su grabación. Inicie una prueba de concepto con una pequeña cantidad de datos. El sistema se escala sin problemas a medida que los datos aumentan, lo que mejora la calidad de voz natural.

Coherentes e integrados

Los modelos de voz personalizada se integran por completo con otros servicios de voz de Cognitive Services. No se requiere ninguna codificación y el modelo de voz personalizada puede implementarse fácilmente en la API.

Rápido y seguro

Mediante un único punto de conexión de API y la administración de autenticación segura, puede conectar sus fuentes de voz rápidamente en todas las plataformas. Los modelos están bajo su control.

Explore un escenario de voz

Quiosco multimedia inteligente

La combinación de los servicios de voz y Language Understanding permite que las aplicaciones y los usuarios interactúen con naturalidad. Utilice Speech to Text para capturar una pregunta del usuario, Language Understanding para analizar la intención y formular una respuesta apropiada y Text to Speech para sintetizar el texto en una respuesta hablada. Cree interfaces de conversación para diversos escenarios tales como banca, viajes y entretenimiento.

Commerce ChatbotJuntos, o Azure Bot Service e o serviço de Compreensão de Idiomas permitem aos programadores criar interfaces conversacionais para vários cenários como banca, turismo e entretenimento. Por exemplo, o funcionário de um hotel pode utilizar um bot para melhorar as interações tradicionais por e-mail e telefone ao validar um cliente através do Azure Active Directory e com os Serviços Cognitivos para processar melhor contextualmente os pedidos dos clientes com texto e voz. O serviço de reconhecimento de Voz pode ser adicionado para suportar os comandos de voz.1234567
  1. Información general
  2. Flujo

Bot de chat para operaciones comerciales

Información general

De forma conjunta, Azure Bot Service y el servicio Language Understanding permiten a los desarrolladores crear interfaces de conversación para distintos escenarios, como banca, viajes y entretenimiento. Por ejemplo, un recepcionista de hotel puede usar un bot para mejorar las interacciones tradicionales de correo electrónico y llamadas telefónicas mediante la validación de un cliente a través de Azure Active Directory y el uso de Cognitive Services para mejorar el procesamiento contextual de las solicitudes de los clientes mediante texto y voz. Se puede agregar el servicio de reconocimiento de voz para admitir los comandos de voz.

Flujo

  1. 1 El cliente usa su aplicación móvil.
  2. 2 El usuario se autentica con Azure AD B2C.
  3. 3 El usuario solicita información con un bot de aplicación personalizado.
  4. 4 Cognitive Services ayuda a procesar las solicitudes de lenguaje natural.
  5. 5 El cliente revisa la respuesta, quien además puede matizar la pregunta mediante una conversación natural.
  6. 6 Una vez que el usuario está satisfecho con el resultado, el bot de aplicación actualiza la reserva del cliente.
  7. 7 Application Insights recopila telemetría de tiempo de ejecución para facilitar el desarrollo con el uso y el rendimiento del bot.

"ROOBO is an AI solution provider. Now with Microsoft's world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei, director de Tecnología, roobo

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Ink Recognizer VERSIÓN PRELIMINAR

Servicio de inteligencia artificial que reconoce contenido de lápiz digital, como escritura manual, formas y el diseño de documentos en tinta digital

Video Indexer

Obtenga conocimiento de sus vídeos

Custom Vision

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Form Recognizer VERSIÓN PRELIMINAR

Servicio de extracción de documentos basado en inteligencia artificial que reconoce sus formularios

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Immersive Reader VERSIÓN PRELIMINAR

Dé capacidad para leer y comprender textos a usuarios de todas las edades y capacidades

Servicios de voz

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.

Speaker Recognition VERSIÓN PRELIMINAR

Use la voz para la identificación y verificación de hablantes individuales

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Anomaly Detector VERSIÓN PRELIMINAR

Agregue funcionalidades de detección de anomalías a sus aplicaciones con facilidad.

Personalizer VERSIÓN PRELIMINAR

Servicio de inteligencia artificial que ofrece una experiencia del usuario personalizada

Use el SDK de dispositivos de voz para compilar un dispositivo de ambiente y crear una palabra de reactivación personalizada

Más información