¿Qué es la visión artificial?

Descubra qué es la visión artificial, cómo funciona y para qué sirve.

Computer Vision

Computer Vision es un campo de la informática que se centra en permitir que los equipos identifiquen y comprendan objetos y personas en imágenes y vídeos. Al igual que otros tipos de inteligencia artificial, el objetivo de la visión artificial es realizar y automatizar tareas que replican las capacidades humanas. En este caso, Computer Vision busca replicar la forma en que los humanos ven y la forma en que los humanos tienen sentido de lo que ven.

La gama de aplicaciones prácticas para la tecnología de Computer Vision lo convierte en un componente central de muchas innovaciones y soluciones modernas. Computer Vision se puede ejecutar en la nube o en el entorno local.

Cómo funciona Computer Vision

Las aplicaciones de Computer Vision utilizan entradas que proceden de sensores, inteligencia artificial, aprendizaje automático y aprendizaje profundo para replicar el funcionamiento de la visión humana. Las aplicaciones de visión artificial ejecutan algoritmos que se entrenan con enormes cantidades de datos visuales o imágenes en la nube. Reconocen patrones en los datos visuales y usan esos patrones para determinar el contenido de otras imágenes.

Cómo se analiza una imagen con Computer Vision

Un sensor captura una imagen. A menudo, este sensor es simplemente una cámara, pero puede ser una cámara de vídeo, un dispositivo médico de diagnóstico por imagen o cualquier otro tipo de dispositivo que capture una imagen para analizarla.
A continuación, se envía la imagen a un dispositivo de interpretación. El dispositivo de interpretación usa el reconocimiento de patrones para descomponer la imagen, comparar los patrones que contiene con su biblioteca de patrones conocidos y determinar si hay contenido en la imagen que coincida. El patrón puede ser algo general, como la apariencia de un determinado tipo de objeto, o podría basarse en identificadores únicos, como los rasgos faciales.
Un usuario solicita información específica sobre una imagen y el dispositivo de interpretación proporciona la información solicitada en función del análisis que ha realizado de la imagen.

Aprendizaje profundo y Computer Vision

Las modernas aplicaciones de Computer Vision están dejando de usar métodos estadísticos para analizar las imágenes y, cada vez más, se basan en lo que se conoce como aprendizaje profundo. Con el aprendizaje profundo, una aplicación de visión artificial ejecuta un tipo de algoritmo denominado red neuronal, que le permite proporcionar análisis más precisos de las imágenes. Además, el aprendizaje profundo permite a un programa de Computer Vision conservar la información de cada imagen que analiza, de modo que, cuanto más se usa, mejor es su precisión.

Capacidades de Computer Vision

Hay tres funciones principales para el modo en el que los programas de Computer Vision procesan imágenes y devuelven información:

Clasificación de objetos Identificación de objetos Seguimiento de objetos Reconocimiento óptico de caracteres

El sistema clasifica los objetos de una imagen en función de una categoría definida. Por ejemplo, con la clasificación de objetos, un equipo podría distinguir a las personas de los objetos en una foto y determinar cuántas personas aparecen en la foto.

El sistema identifica un objeto determinado en una foto, un vídeo o una imagen. Por ejemplo, con la identificación de objetos, el sistema podría no solo distinguir a las personas de una foto, sino también analizar su apariencia para determinar la identidad o los rasgos de esas personas.

El sistema analiza un vídeo para procesar la ubicación de un objeto en movimiento a lo largo del tiempo. Por ejemplo, con el seguimiento de objetos, una cámara de vigilancia de un aparcamiento podría identificar los automóviles y proporcionar información sobre su ubicación y movimientos a lo largo del tiempo.

El sistema identifica las letras y los números de las imágenes y convierte el texto en texto codificado por máquina que otras aplicaciones informáticas pueden leer o los usuarios pueden editar.

Para qué se usa Computer Vision

Computer Vision es una capacidad con un gran potencial y se puede combinar con muchos tipos de aplicaciones y sensores para habilitar un gran número de casos de uso prácticos. Estas son solo algunas aplicaciones de Computer Vision:

Organización de contenido

Computer Vision se puede usar para identificar a personas u objetos en fotografías y organizarlos en función de esa identificación. Las aplicaciones de reconocimiento de fotografías como esta se suelen usar para el almacenamiento de fotografías y en los medios sociales.

Extracción de texto

El reconocimiento óptico de caracteres puede usarse para mejorar la detectabilidad de la información contenida en grandes cantidades de texto y para habilitar el procesamiento de documentos en escenarios de automatización de procesos robóticos.

Realidad aumentada

Computer Vision puede detectar y seguir objetos físicos en tiempo real. Esta información se utiliza después para colocar objetos virtuales en un entorno físico de forma realista.

Agricultura

Se pueden analizar imágenes de cultivos tomadas por satélites, drones o aviones para supervisar las cosechas, detectar la aparición de malas hierbas o identificar una deficiencia de nutrientes en el cultivo.

Vehículos autónomos

Los automóviles sin conductor utilizan la identificación y el seguimiento de los objetos en tiempo real para recopilar información sobre lo que ocurre alrededor del automóvil y dirigirlo en consecuencia.

Sector sanitario

Las fotos o imágenes capturadas por otros dispositivos médicos se pueden analizar para ayudar a los doctores a identificar problemas y realizar diagnósticos con más rapidez y precisión.

Deportes

La detección y el seguimiento de objetos se utilizan para el análisis de estrategias y partidos.

Fabricación

Computer Vision puede supervisar la maquinaria de fabricación con fines de mantenimiento. También se puede usar para supervisar la calidad y el empaquetado de los productos en una línea de producción.

Análisis espacial

El sistema identifica a personas u objetos, como automóviles, en un espacio y sigue su movimiento dentro de ese espacio.

Reconocimiento facial

Computer Vision se puede usar para identificar a personas.

Explore las soluciones de Computer Vision de Azure

Descubra los Servicios de Azure AI, una familia completa de servicios de IA y API cognitivas que facilitan la creación de aplicaciones inteligentes con capacidades de Computer Vision.

Cuenta gratuita

Pruebe los servicios de informática en la nube de Azure de forma gratuita durante un máximo de 30 días.

Probar Azure gratis

Pago por uso

Empieza con precios de pago por uso. Sin compromiso por adelantado; puedes cancelar en cualquier momento.

Explorar la opción de pago por uso

Conozca las características de Computer Vision de Azure

Incorpore capacidades de visión en sus aplicaciones para lograr aumentar la visibilidad del contenido, acelerar la extracción de texto y crear productos dirigidos a un público más amplio.

Más información

Destacadas

IA y Machine Learning

Análisis

Compute

Contenedores

Bases de datos

DevOps

Herramientas para desarrolladores

Híbrido y multinube

Identidad

Integración

Internet de las cosas

Administración y Gobernanza

Multimedia

Migración

Realidad mixta

Movilidad

Redes

Seguridad

Almacenamiento

Web

Windows Virtual Desktop

Casos de uso

Desarrollo de aplicaciones

Inteligencia artificial

Migración y modernización en la nube

Datos y análisis

Nube e infraestructura híbridas