Omitir navegación

¿Qué es la visión artificial?

Descubra qué es la visión artificial, cómo funciona y para qué sirve.

Visión artificial

La visión artificial es un campo de la informática que se centra en habilitar los equipos para que identifiquen y reconozcan objetos y personas en imágenes y vídeos. Al igual que otros tipos de inteligencia artificial, el objetivo de la visión artificial es realizar y automatizar tareas que replican las capacidades humanas. En este caso, la visión artificial pretende replicar tanto la forma de ver de los humanos como la forma en la que le dan sentido a lo que ven.

El amplio abanico de aplicaciones prácticas de la tecnología de visión artificial la convierte en un componente central de numerosas innovaciones y soluciones modernas. La visión artificial se puede usar en la nube o en el entorno local.

Cómo funciona la visión artificial

Las aplicaciones de visión artificial utilizan entradas que proceden de sensores, inteligencia artificial, aprendizaje automático y aprendizaje profundo para replicar el funcionamiento de la visión humana. Las aplicaciones de visión artificial ejecutan algoritmos que se entrenan con enormes cantidades de datos visuales o imágenes en la nube. Reconocen patrones en los datos visuales y usan esos patrones para determinar el contenido de otras imágenes.

Análisis de imágenes con visión artificial

  • Un sensor captura una imagen. A menudo, este sensor es simplemente una cámara, pero puede ser una cámara de vídeo, un dispositivo médico de diagnóstico por imagen o cualquier otro tipo de dispositivo que capture una imagen para analizarla.
  • A continuación, se envía la imagen a un dispositivo de interpretación. El dispositivo de interpretación usa el reconocimiento de patrones para descomponer la imagen, comparar los patrones que contiene con su biblioteca de patrones conocidos y determinar si hay contenido en la imagen que coincida. El patrón puede ser algo general, como la apariencia de un determinado tipo de objeto, o podría basarse en identificadores únicos, como los rasgos faciales.
  • Un usuario solicita información específica sobre una imagen y el dispositivo de interpretación proporciona la información solicitada en función del análisis que ha realizado de la imagen.

Aprendizaje profundo y visión artificial

Las modernas aplicaciones de visión artificial están dejando de usar métodos estadísticos para analizar las imágenes y, cada vez más, se basan en lo que se conoce como aprendizaje profundo. Con el aprendizaje profundo, una aplicación de visión artificial ejecuta un tipo de algoritmo denominado red neuronal, que le permite proporcionar análisis más precisos de las imágenes. Además, el aprendizaje profundo permite a un programa de visión artificial conservar la información de cada imagen que analiza, de modo que, cuanto más se usa, mejor es su precisión.

Capacidades de la visión artificial

Hay tres funciones principales para el modo en el que los programas de visión artificial procesan imágenes y devuelven información:

El sistema clasifica los objetos de una imagen en función de una categoría definida. Por ejemplo, con la clasificación de objetos, un equipo podría distinguir a las personas de los objetos en una foto y determinar cuántas personas aparecen en la foto.

El sistema identifica un objeto determinado en una foto, un vídeo o una imagen. Por ejemplo, con la identificación de objetos, el sistema podría no solo distinguir a las personas de una foto, sino también analizar su apariencia para determinar la identidad o los rasgos de esas personas.

El sistema analiza un vídeo para procesar la ubicación de un objeto en movimiento a lo largo del tiempo. Por ejemplo, con el seguimiento de objetos, una cámara de vigilancia de un aparcamiento podría identificar los automóviles y proporcionar información sobre su ubicación y movimientos a lo largo del tiempo.

El sistema identifica las letras y los números de las imágenes y convierte el texto en texto codificado por máquina que otras aplicaciones informáticas pueden leer o los usuarios pueden editar.

¿Para qué se usa la visión artificial?

La visión artificial es una capacidad con un gran potencial y se puede combinar con muchos tipos de aplicaciones y sensores para habilitar un gran número de casos de uso prácticos. Estas son solo algunas aplicaciones de la visión artificial:

Organización de contenido

La visión artificial se puede usar para identificar a personas u objetos en fotografías y organizarlos en función de esa identificación. Las aplicaciones de reconocimiento de fotografías como esta se suelen usar para el almacenamiento de fotografías y en los medios sociales.

Extracción de texto

El reconocimiento óptico de caracteres puede usarse para mejorar la detectabilidad de la información contenida en grandes cantidades de texto y para habilitar el procesamiento de documentos en escenarios de automatización de procesos robóticos.

Realidad aumentada

La visión artificial puede detectar y seguir objetos físicos en tiempo real. Esta información se utiliza después para colocar objetos virtuales en un entorno físico de forma realista.

Agricultura

Se pueden analizar imágenes de cultivos tomadas por satélites, drones o aviones para supervisar las cosechas, detectar la aparición de malas hierbas o identificar una deficiencia de nutrientes en el cultivo.

Vehículos autónomos

Los automóviles sin conductor utilizan la identificación y el seguimiento de los objetos en tiempo real para recopilar información sobre lo que ocurre alrededor del automóvil y dirigirlo en consecuencia.

Atención sanitaria

Las fotos o imágenes capturadas por otros dispositivos médicos se pueden analizar para ayudar a los doctores a identificar problemas y realizar diagnósticos con más rapidez y precisión.

Deportes

La detección y el seguimiento de objetos se utilizan para el análisis de estrategias y partidos.

Fabricación

La visión artificial puede supervisar la maquinaria de fabricación con fines de mantenimiento. También se puede usar para supervisar la calidad y el empaquetado de los productos en una línea de producción.

Análisis espacial

El sistema identifica a personas u objetos, como automóviles, en un espacio y sigue su movimiento dentro de ese espacio.

Reconocimiento facial

La visión artificial se puede usar para identificar a personas.

Explore las soluciones de visión artificial de Azure

Descubra Azure Cognitive Services, una familia completa de servicios de inteligencia artificial y API cognitivas que facilitan la creación de aplicaciones inteligentes con características de visión artificial.

Conozca las características de visión artificial de Azure

Incorpore capacidades de visión en sus aplicaciones para lograr aumentar la visibilidad del contenido, acelerar la extracción de texto y crear productos dirigidos a un público más amplio.

Más información