• 5 min read

Azure AI: creación de aplicaciones de inteligencia artificial críticas con la nueva funcionalidad de Cognitive Services

A medida que el mundo se adapta a nuevas formas de trabajar y de no perder el contacto, mantenemos nuestro compromiso de proporcionar soluciones de Azure AI para ayudar a las organizaciones a inventar soluciones con fines concretos.

A medida que el mundo se adapta a nuevas formas de trabajar y de no perder el contacto, mantenemos nuestro compromiso de proporcionar soluciones de Azure AI para ayudar a las organizaciones a inventar soluciones con fines concretos.

Como continuación de nuestra visión de permitir que todos los desarrolladores usen la inteligencia artificial para lograr más cosas, hoy nos complace anunciar nuevas características de Azure Cognitive Services, entre las que se incluyen las siguientes:

  • Text Analytics para el sector sanitario (en versión preliminar).
  • Disponibilidad general de Form Recognizer.
  • Disponibilidad general de Comandos personalizados.
  • Nuevas voces de Text to Speech neuronal.

Las empresas de los sectores de la asistencia sanitaria, los seguros, la agricultura sostenible y otras áreas siguen eligiendo Azure AI para crear e implementar aplicaciones de inteligencia artificial que transformen sus negocios. Según IDC1, en 2022 el 75 % de las empresas implementarán soluciones basadas en inteligencia artificial para mejorar su eficiencia operativa y ofrecer experiencias de cliente mejoradas.

Con el fin de satisfacer esta creciente demanda, las actualizaciones de productos que anunciamos hoy amplían la funcionalidad actual de lenguaje, visión y voz de Azure Cognitive Services para ayudar a los desarrolladores a crear aplicaciones de inteligencia artificial críticas que permitan obtener información más completa, ahorrar tiempo y reducir costos, así como mejorar la interacción con los clientes.

Obtención de información enriquecida con un procesamiento de lenguaje natural muy eficaz

Una de las formas en las que las organizaciones se están adaptando consiste en ampliar su capacidad para procesar los datos rápidamente y generar información nueva a partir de esos datos. La COVID-19 ha acelerado esta urgencia, especialmente en el sector sanitario. Con la cantidad abrumadora de datos médicos que se generan cada año2, es cada vez más importante que los proveedores faciliten rápidamente el acceso a esa información para buscar nuevas soluciones que mejoren el desenlace clínico de los pacientes.

Obtención de información a partir de datos médicos con Text Analytics para el sector sanitario.

Hoy nos complace presentar Text Analytics para el sector sanitario, una nueva característica de Text Analytics que permite a los proveedores de asistencia sanitaria, investigadores y empresas del sector extraer información enriquecida y relaciones de los datos médicos no estructurados. Esta característica, que se ha entrenado con una amplia variedad de datos médicos (que abarcan varios formatos de historias clínicas, protocolos de ensayos clínicos, etc.), puede procesar numerosos tipos de datos y tareas, lo que evita la necesidad de invertir tanto tiempo en desarrollar manualmente modelos personalizados para extraer información de los datos.

En respuesta a la pandemia de COVID-19, Microsoft se ha asociado con el Instituto Allen para la Inteligencia Artificial y con importantes grupos de investigación para elaborar el conjunto de datos denominado COVID-19 Open Research Dataset. Basándonos en más de 47 000 artículos académicos, hemos desarrollado un motor de búsqueda para datos sobre la COVID-19 que utiliza Text Analytics para el sector sanitario y Cognitive Search. Este motor permite a los investigadores generar más información que ayude a combatir la enfermedad.

Además, seguimos avanzando en el procesamiento del lenguaje natural (NLP) para que los desarrolladores puedan crear con más rapidez aplicaciones que generen información sobre el sentimiento que se expresa en un texto. La característica de minería de la opinión de Text Analytics asigna un sentimiento a características o temas específicos para que los usuarios puedan comprender mejor los comentarios de los clientes obtenidos de medios sociales, sitios de reseñas, etc.

Ahorro de tiempo y reducción de costos con la conversión de formularios en datos útiles

Gran parte de los datos no estructurados se encuentran en formularios que tienen tablas, objetos y otros elementos. Normalmente, estos tipos de documentos se etiquetan manualmente por tipo de documento o se someten a un arduo trabajo de programación para extraer información.

Form Recognizer ya está disponible con carácter general para ayudar a los desarrolladores a extraer información de millones de documentos de manera eficaz y precisa, sin necesidad de tener conocimientos de ciencia de datos.

Extracción de texto y estructuras de documentos con Form Recognizer.

Clientes como Sogeti, que forma parte del grupo Capgemini, utilizan Form Recognizer para ayudar a sus clientes a procesar grandes volúmenes de documentos digitales con más rapidez.

“Sogeti busca constantemente nuevas formas de ayudar a los clientes en su proceso de transformación digital proporcionándoles soluciones vanguardistas de inteligencia artificial y aprendizaje automático. Nuestra oferta Cognitive Document Processing (CDP) permite a los clientes procesar y clasificar documentos no estructurados y extraer datos con una gran precisión, lo que reduce los costos operativos y el tiempo de procesamiento. CDP aprovecha la eficaz funcionalidad cognitiva y de etiquetado de Form Recognizer para extraer sin esfuerzo datos emparejados y otra información relevante de documentos no estructurados escaneados y digitales, lo que reduce aún más el tiempo de procesamiento total”. –Mark Oost, director de tecnología en Sogeti, inteligencia artificial y aprendizaje automático

Wilson Allen, un importante proveedor de soluciones de consultoría y análisis, utiliza Form Recognizer para ayudar a empresas de servicios jurídicos y otros servicios profesionales a procesar y evaluar documentos (archivos PDF e imágenes, como formularios financieros, solicitudes de préstamos, etc.) y a entrenar modelos personalizados para extraer valores de formularios complejos con precisión.

“La incorporación de Form Recognizer a nuestro kit de herramientas nos ayuda a convertir grandes cantidades de datos no estructurados en información valiosa, lo que nos permite ahorrar más de 400 horas de entrada de datos manual y obtener tiempo para que los empleados trabajen en tareas más estratégicas”. –Norm Mullock, vicepresidente de estrategia en Wilson Allen

Aplicaciones con reconocimiento de voz para mejorar la interacción con los clientes

Las personas y las organizaciones continúan buscando formas de enriquecer la experiencia de los clientes al tiempo que equilibran la transición hacia operaciones digitales sin intervención manual2. Los avances en la tecnología de voz permiten a los desarrolladores crear experiencias más fluidas, naturales y con reconocimiento de voz para que los clientes puedan interactuar con las marcas.

Uno de estos avances, Comandos personalizados, que es una característica del servicio de voz de Cognitive Services, ya está disponible con carácter general. Comandos personalizados permite a los desarrolladores crear con más facilidad aplicaciones de voz orientadas a tareas para escenarios de comando y control que tienen un conjunto bien definido de variables, como los termostatos domésticos inteligentes controlados por voz. Reúne Speech to Text para el reconocimiento de voz, Language Understanding para la captura de entidades mencionadas y Text to Speech para responder con voz, con el fin de acelerar la incorporación de funcionalidad de voz a sus aplicaciones con una experiencia de creación que requiera poco trabajo de programación.

Además, la característica Text to Speech neuronal amplía los idiomas admitidos con 15 voces nuevas con un sonido natural basadas en modelos de síntesis de voz neuronal de última generación: Salma en árabe (Egipto), Zariyah en árabe (Arabia Saudí), Alba en catalán (España), Christel en danés (Dinamarca), Neerja en inglés (India), Noora en finés (Finlandia), Swara en hindi (India), Colette en neerlandés (Países Bajos), Zofia en polaco (Polonia), Fernanda en portugués (Portugal), Dariya en ruso (Rusia), Hillevi en sueco (Suecia), Achara en tailandés (Tailandia), HiuGaai en chino (cantonés, tradicional) y HsiaoYu en chino (mandarín taiwanés).

Los clientes ya están agregando funcionalidad de voz a sus aplicaciones para mejorar la interacción con su clientes. Con Cognitive Services y Bot Service, la BBC creó un asistente de voz basado en inteligencia artificial, Beeb, que ofrece una experiencia más atractiva y personalizada a sus diversas audiencias.

Estamos encantados de presentar estas nuevas innovaciones de productos que permiten a todos los desarrolladores crear aplicaciones de inteligencia artificial críticas. Si desea obtener más información, eche un vistazo a los siguientes recursos.

Comience hoy mismo

Consulte los siguientes recursos para obtener más información y ponerse en marcha con Azure Cognitive Services y una cuenta gratuita de Azure.


1 Worldwide Artificial Intelligence Predictions (IDC FutureScape 2020).

2 Adapting customer experience in the time of coronavirus (McKinsey 2020).