Saltar al contenido principal

Esta publicación está escrita conjuntamente por Tina Coll, Directora general de marketing de producto, Azure Cognitive Services, y Anny Dow, Directora de marketing de producto, Azure Cognitive Services.

Azure Cognitive Services pone la inteligencia artificial al alcance de todos los desarrolladores sin requerir experiencia en el aprendizaje automático. Basta con una llamada API para incorporar la capacidad de ver, escuchar, hablar, comprender y acelerar la toma de decisiones en las aplicaciones. Las empresas han adoptado estas funcionalidades integradas y personalizadas de inteligencia artificial para ofrecer experiencias más atractivas y personalizadas. Para continuar el impulso de Microsoft Build 2019, estamos haciendo que Personalizer esté disponible de manera general e introduciendo funcionalidades avanzadas adicionales en las categorías Visión, Voz y Lenguaje. Hay muchos avances para compartir, así que vamos a empezar.

Personalizer: impulsar experiencias de usuario enriquecidas

El ganador del premio "Producto más innovador" de este año en la Conferencia sobre Strata de O’Reilly, Personalizer, es el único servicio de IA del mercado que hace que el aprendizaje reforzado esté disponible a escala mediante API fáciles de usar. Personalizer usa el aprendizaje reforzado y proporciona a los desarrolladores una manera de crear abundantes experiencias personalizadas para los usuarios, incluso si no tienen mucha experiencia en el aprendizaje automático.

Dar a los clientes lo que quieren en un determinado momento es uno de los mayores desafíos a los que se enfrentan las empresas minoristas, multimedia y de comercio electrónico. Independientemente de si aplican pruebas A/B aleatorias o el aprendizaje automático supervisado, las empresas se esfuerzan por seguir ofreciendo experiencias únicas y pertinentes a cada usuario. Es ahí donde entra Personalizer, que explora nuevas opciones para seguir en lo alto de las influencias no encontradas previamente sobre el comportamiento de los usuarios mediante la avanzada técnica del aprendizaje automático conocida como aprendizaje reforzado. Esta técnica permite que Personalizer aprenda de lo que ocurre en el mundo en tiempo real y actualice el algoritmo subyacente con una frecuencia de cada pocos minutos. El resultado es una mejora significativa de la usabilidad de la aplicación y la satisfacción del usuario. Cuando XBOX implementó Personalizer en su página principal, observaron una subida de un 40 por ciento de la involucración del usuario.  ilustración de un científico de datos y el ciclo de aprendizaje reforzado que realiza la personalización

Form Recognizer: aumentar la eficacia con la extracción automatizada de texto y el bucle de comentarios

Las empresas dependen con frecuencia de una variedad de documentos que pueden ser difíciles de leer. Estos documentos no siempre están bien impresos y muchas veces contienen texto escrito a mano. Las empresas, incluida Chevron, usan Form Recognizer para acelerar el procesamiento de documentos mediante la extracción automática de información de formularios impresos. Con ello, se libera a los empleados, que pueden centrarse en tareas más desafiantes y con mayor valor.

Form Recognizer extrae pares clave-valor, tablas y texto de los documentos, entre los que se incluyen las declaraciones de impuestos W2 estadounidenses, los informes de pozos petrolíferos, los informes de finalización, las facturas y los pedidos de compra. Hoy anunciamos la capacidad de proporcionar formularios de etiquetas de entrada humana y de entrenar un modelo personalizado para posibilitar una extracción de datos incluso más precisa. Los usuarios podrán etiquetar formularios para extraer los valores de interés. Esta característica permite a Form Recognizer admitir cualquier tipo de formulario que incluya valores sin claves, claves en valores, formularios inclinados, fotos de formularios y más. Empezando por tan solo cinco formularios, los usuarios pueden entrenar un modelo adaptado a su caso de uso con resultados de alta calidad. Una nueva experiencia de usuario le permite empezar rápidamente, seleccionar valores de interés, etiquetar y entrenar el modelo personalizado.

herramienta de experiencia de usuario que muestra la experiencia de etiquetado de formulario

Además, Form Recognizer puede entrenar ahora un único modelo sin etiquetas para todos los tipos de formularios y admite el entrenamiento en conjuntos de datos de gran tamaño y el análisis de documentos grandes con la nueva AsyncAPI. Esta ventaja permite a los clientes entrenar un único modelo para los diferentes tipos de facturas, órdenes de compra y más, sin necesidad de clasificar los documentos por adelantado.

También hemos mejorado nuestras capacidades de recibos integrados con mejoras en la precisión, nuevos campos para propinas, tipos de recibos (comprobante pormenorizado de tarjeta de crédito, gasolina, parking y otros) y la extracción de la partida presupuestaria detallando todos los elementos del recibo. Por último, también hemos mejorado la precisión de nuestro reconocimiento de texto que permite la extracción del texto de alta calidad de los formularios y nuestra extracción de tablas.

Sogeti, que forma parte de Capgemeni, está aprovechando estas nuevas capacidades de Form Recognizer. Arun Kumar Sahu, Director de ML de IA de Sogeti, indica:

"Estamos trabajando en una solución de clasificación de documentos y predicción para una de las compañías más grandes de subastas de automóviles de EE. UU. y necesitábamos una manera eficiente de extraer información de los distintos documentos relacionados con el automóvil (PDF o imagen). Form Recognizer fue rápido, fácil de entrenar y hospedar, además de rentable. Gestionó diferentes formatos de documentos y el resultado fue sorprendente. Las nuevas características de etiquetaje hicieron que la personalización de la extracción del par clave-valor fuera muy eficaz".

Voz: permitir interacciones más naturales y acelerar la productividad con capacidades de voz avanzadas

Las empresas quieren poder modernizarse y posibilitar interacciones más naturales y eficientes con sus clientes. Nuestros avances más recientes en voz permiten a los clientes hacer precisamente esto.

En Microsoft Ignite 2018, introdujimos nuestra capacidad de texto a voz neuronal, que usa redes neuronales profundas para permitir que la voz suene natural y reducir la fatiga de los usuarios cuando escuchan, al interactuar con sistemas de IA. El texto a voz neuronal se puede usar para que las interacciones con los bots de chat y los asistentes virtuales sean más naturales y atractivas, para convertir textos digitales, como los libros electrónicos, en audiolibros y para mejorar los sistemas de navegación de los automóviles. Estamos emocionados por desarrollar estas mejoras con la capacidad de voz neuronal personalizada, que permite a los clientes crear una voz de marca única, empezando con tan solo unos minutos de audio de entrenamiento. La capacidad de voz neuronal personalizada puede permitir escenarios, como el soporte técnico al cliente mediante un personaje de marca de una compañía, los planes de estudios interactivos, las visitas guiadas a museos y las tecnologías de asistencia por voz. La capacidad también admite la generación de contenido de formulario largo, incluidos los audiolibros.

Beijing Hongdandan Education and Culture Exchange Center se dedica a usar el audio para crear productos accesibles para aquellas personas con alguna discapacidad visual y mejorar su vida con ayudas, como los audiolibros. Hongdandan usa la capacidad de voz neuronal personalizada para producir audiolibros basados en la voz de Lina, que perdió su vista a la edad de 10 años. Lina es ahora entrenadora de Hongdandan Service Center y usa su voz para enseñar a otras personas con discapacidad visual a comunicarse.

Con el ritmo acelerado al que se mueven las empresas hoy día, recordar todos los detalles de la última reunión, hacer un seguimiento de los próximos pasos y los vencimientos clave puede ser un verdadero desafío. La transcripción rápida y precisa de las llamadas puede ayudar a la concordancia de las distintas partes interesadas, mediante la captura de detalles críticos y facilitando la búsqueda y revisión de los temas que se han tratado. En los escenarios de soporte técnico al cliente, poder escuchar y comprender a los clientes, así como conservar un registro preciso de la información, es fundamental para hacer el seguimiento de las necesidades del cliente y permitir un análisis más amplio.

Sin embargo, la transcripción precisa de los términos específicos de la organización, como los nombres de productos, los términos técnicos y los nombres de las personas, supone otra barrera. Con Custom Speech, puede adaptar los modelos de reconocimiento de voz basados en sus propios datos para que los términos únicos se capturen con precisión. Simplemente cargue su audio para entrenar un modelo personalizado. Ahora, también puede optimizar el reconocimiento de voz con los términos específicos de la organización mediante la generación de modelos personalizados que usan datos de Office 365 de una manera segura y compatible. Con esta característica de participación, las organizaciones que usan Office 365 pueden transcribir con más precisión la terminología de la compañía, ya sea en reuniones internas o en llamadas al cliente. El modelo de lenguaje de toda la organización se crea solo usando conversaciones y documentos de grupos públicos a los que todo el mundo de la organización puede acceder.

Las nuevas características adicionales, como los comandos personalizados, los contenedores de voz y de Custom Speech, Speech Translation con identificación automática del idioma y la integración del canal de voz de Direct Line con Bot Framework facilitan la integración de las capacidades de voz avanzadas en las aplicaciones. Para más información, consulte la página Servicios de voz de Azure.

Lenguaje: extraer conclusiones más profundas de los comentarios de clientes y documentos de texto

Actualmente, se capturan una infinidad de conclusiones valiosas de los clientes, ya sea de las redes sociales, las reseñas de los clientes o los foros de discusión. El desafío es poder extraer conclusiones de esos datos, de modo que las empresas puedan actuar rápidamente para mejorar el servicio al cliente y satisfacer las necesidades del mercado. Con la capacidad del análisis de sentimiento de Text Analytics, las empresas pueden detectar el sentimiento positivo, neutro, negativo y mixto del contenido, lo que les permite conservar un pulso continuo sobre la satisfacción del cliente, captar mejor a sus clientes y fidelizarlos. La última versión de la capacidad del análisis de sentimiento ofrece una mayor precisión en la puntuación del sentimiento, así como la posibilidad para detectar sentimiento en todo un documento y en frases individuales.

Otro desafío de la extracción de información de datos es poder tomar texto de lenguaje natural sin estructurar e identificar apariciones de entidades, como personas, ubicaciones, organizaciones y más. Text Analytics expande la compatibilidad de tipos de entidad a más de 100 tipos de entidad con nombre, facilitando más que nunca la extracción de información con significado y el análisis de las relaciones de texto sin formato y entre términos. Además, los clientes podrán detectar y extraer ahora más de 80 clases de información identificable personalmente en documentos de texto en inglés.

También agregamos varias capacidades nuevas a Language Understanding Intelligent Service (LUIS) que permiten a los desarrolladores crear modelos sofisticados conversacionales. Las nuevas capacidades proporcionan la posibilidad de tratar solicitudes más complejas de los usuarios (por ejemplo, si quiere permitir a los clientes usar un lenguaje verdaderamente natural, pueden pedir "dos hamburguesas sin cebolla y sustituir el pan por lechuga"). Esto proporciona a los clientes capacidad avanzada para entidades jerárquicas y descomposición de modelos, para crear modelos de lenguaje más sofisticados que reflejen la manera de hablar de las personas. Además, se están añadiendo más regiones y se están ampliando los lenguajes humanos existentes admitidos en LUIS, con la adición del hindi y el árabe.

Preparado para la empresa: Azure Virtual Network para la mejora de la seguridad de datos

Una de las consideraciones más importantes al elegir un servicio de IA es la seguridad y la conformidad con las normas. ¿Se puede confiar en que IA se procesa con los estándares y las protecciones superiores que se esperan de los sistemas de software reforzados y duraderos? Azure Cognitive Services ofrece más de 70 certificaciones. Hoy ofrecemos compatibilidad de Virtual Network como parte de Cognitive Services para garantizar la máxima seguridad de los datos confidenciales. Este servicio también está disponible en un contenedor que se puede ejecutar en una suscripción de Azure del cliente o en el entorno local.

Comience hoy mismo

Permitimos nuevos escenarios, potentes e inteligentes, para nuestros clientes que mejoran su productividad y las experiencias de usuario. La increíble amplitud de los servicios disponibles a través de Azure Cognitive Services le permiten extraer conclusiones de todos los datos. Con estos nuevos anuncios, puede extraer con precisión texto de los formularios mediante Form Recognizer, analizar y comprender este texto mediante Text Analytics y LUIS y, por último, proporcionar estas conclusiones a los usuarios a través de una interfaz conversacional hablada con nuestros servicios de voz.

Estos hitos ilustran nuestro compromiso para hacer de la plataforma de Azure AI un sitio ideal para todos los escenarios empresariales, con herramientas de clase empresarial que simplifiquen el desarrollo de aplicaciones y un cumplimiento y seguridad líderes en el sector que protejan los datos de los clientes.

Empiece hoy a crear su primera aplicación inteligente mediante una cuenta gratuita de Azure y obtenga más información sobre Cognitive Services.


Azure. Invente con un objetivo.

  • Explore

     

    Let us know what you think of Azure and what you would like to see in the future.

     

    Provide feedback

  • Build your cloud computing and Azure skills with free courses by Microsoft Learn.

     

    Explore Azure learning


Join the conversation