Servicios de voz

Convierta audio en texto, traduzca voz y convierta texto en voz con los servicios de voz unificados

Speech to Text: convierte audio con voz en texto para ofrecer una interacción intuitiva

Agregue fácilmente a sus aplicaciones funcionalidad de conversión de voz en texto en tiempo real para casos como los comandos de voz, la transcripción de conversaciones y el análisis de registros de centros de llamadas.

Personalice sus modelos de reconocimiento de voz para adaptarlos al estilo de habla de los usuarios, sus expresiones o vocabulario único, así como a ruidos de fondo, acentos y patrones de voz.

Más información
Speech To Text

Text to Speech: ponga una voz natural en sus aplicaciones

Cree aplicaciones y servicios inteligentes que hablen a los usuarios de un modo natural con el servicio Text to Speech. Convierta texto en audio casi en tiempo real, adapte la velocidad de la voz, el tono, el volumen, etc.

Dé a sus aplicaciones una voz de marca única y reconocible usando modelos de voz personalizados. Solo tiene que grabar y cargar datos de entrenamiento y el servicio creará una fuente de voz única ajustada a la grabación.

Más información
Text to Speech

Traducción de voz

Incorpore a su aplicación funcionalidad de traducción de voz en tiempo real para cualquiera de los idiomas admitidos y reciba la traducción en forma de texto o de voz. Los modelos de Speech Translation se basan en tecnologías vanguardistas de reconocimiento de voz y traducción automática neuronal (NMT). Están optimizados para comprender la forma de hablar de las personas en la vida real y generar traducciones de una calidad excepcional.

Más información
Traducción de voz

Escenarios empresariales basados en servicios de voz

Transcriba fácilmente las llamadas y optimice los resultados con servicios de transcripción por lotes y de voz personalizada mejorados para centros de llamadas. Puede indexar las transcripciones de las llamadas para búsqueda de texto completo o aplicar análisis de texto para detectar opiniones, idiomas y frases clave con el fin de obtener conclusiones.

Más información
Servicios de voz para empresas
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Ink Recognizer

Servicio de inteligencia artificial que reconoce contenido de lápiz digital, como escritura manual, formas y el diseño de documentos en tinta digital

Video Indexer

Obtenga conocimiento de sus vídeos

Custom Vision

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Form Recognizer

Servicio de extracción de documentos basado en inteligencia artificial que reconoce sus formularios

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Immersive Reader

Dé capacidad para leer y comprender textos a usuarios de todas las edades y capacidades

Servicios de voz

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.

Speaker Recognition

Use la voz para la identificación y verificación de hablantes individuales

Traducción de voz

Integre fácilmente traducción de voz en tiempo real en sus aplicaciones

Conversión de voz en texto

Convierta audio hablado en texto para lograr interacciones más naturales.

Text to Speech

Convierta texto en voz para crear interfaces más naturales y accesibles

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Anomaly Detector

Agregue funcionalidades de detección de anomalías a sus aplicaciones con facilidad.

Personalizer

Servicio de inteligencia artificial que ofrece una experiencia del usuario personalizada

¿Preparado para aumentar el potencial de su aplicación?