Présentation de la vision par ordinateur

Découvrez ce qu’est la vision de l’ordinateur, son fonctionnement et son utilisation.

Vision par ordinateur

La vision par ordinateur est un domaine de la science de l’informatique qui permet aux ordinateurs d’identifier et de comprendre les objets et les personnes dans les images et les vidéos. Comme les autres types d’IA, la vision par ordinateur cherche à exécuter et à automatiser les tâches qui répliquent les capacités humaines. Dans ce cas, la vision par ordinateur cherche à répliquer la manière dont les êtres humains voient et la façon dont les êtres humains donnent un sens à ce qu’ils voient.

La gamme d’applications pratiques pour la technologie de vision par ordinateur en fait un composant central de nombreuses innovations et solutions modernes. La vision par ordinateur peut être exécutée dans le cloud ou localement.

Fonctionnement de la vision par ordinateur

Les applications de vision par ordinateur utilisent les entrées des appareils de détection, l’intelligence artificielle, le Machine Learning et le Deep Learning pour répliquer la manière dont fonctionne le système de vision humaine. Les applications de vision par ordinateur s’exécutent sur des algorithmes qui sont entraînés sur de grandes quantités de données visuelles ou d’images dans le cloud. Elles reconnaissent les modèles dans ces données visuelles et utilisent ces modèles pour déterminer le contenu d’autres images.

Fonctionnement de l’analyse d’une image avec la vision par ordinateur

Un appareil de détection capture une image. L’appareil de détection est souvent tout simplement un appareil photo, mais il peut s’agir d’une caméra vidéo, d’un appareil d’imagerie médicale ou de tout autre type d’appareil qui capture une image à des fins d’analyse.
L’image est ensuite envoyée à un appareil d’interprétation. L’appareil d’interprétation utilise la reconnaissance de modèle pour fractionner l’image, comparer les modèles de l’image à sa bibliothèque de modèles connus et déterminer si un contenu de l’image est une correspondance. Le modèle peut être un critère général, tel que l’apparence d’un certain type d’objet, ou il peut être basé sur des identificateurs uniques, tels que les caractéristiques du visage.
Un utilisateur demande des informations spécifiques sur une image, et l’appareil d’interprétation fournit les informations demandées en fonction de son analyse de l’image.

Deep Learning et vision par ordinateur

Les applications modernes de vision par ordinateur s’éloignent des méthodes statistiques pour analyser les images et s’appuient de plus en plus sur ce qui est connu sous le nom de Deep Learning. Avec le Deep Learning, une application de vision par ordinateur s’exécute sur un type d’algorithme appelé réseau neuronal, ce qui lui permet de fournir des analyses encore plus précises des images. Par ailleurs, le Deep Learning permet à un programme de vision par ordinateur de conserver les informations de chaque image qu’il analyse, de sorte que plus il est utilisé plus sa précision augmente.

Fonctionnalités de la vision par ordinateur

Il existe trois fonctions principales pour le traitement des images par les programmes de vision par ordinateur et le retour d’informations :

Classification des objets Identification d’objets Suivi des objets Reconnaissance optique de caractères

Le système classe les objets dans une image en fonction d’une catégorie définie. Par exemple, avec la classification d’objets, un ordinateur peut distinguer les personnes des objets d’une photo et déterminer le nombre de personnes qui apparaissent dans la photo.

Le système identifie un objet particulier dans une photo, une vidéo ou une image. Par exemple, avec l’identification d’objet, le système peut distinguer les personnes dans une photo, et également analyser leur apparence pour déterminer l’identité ou les traits de ces personnes.

Le système analyse une vidéo pour traiter l’emplacement d’un objet en mouvement dans le temps. Par exemple, avec le suivi d’objet, une caméra de surveillance de parking peut identifier des voitures dans un parking et fournir des informations sur l’emplacement et les mouvements de ces voitures dans le temps.

Le système identifie les lettres et les chiffres dans les images et convertit ce texte en texte encodé par ordinateur qui peut être lu par d’autres applications informatiques ou modifié par les utilisateurs.

Types d’utilisation de la vision par ordinateur

La vision par ordinateur est une fonctionnalité puissante qui peut être combinée à de nombreux types d’applications et d’appareils de détection pour prendre en charge un certain nombre de cas d’usage pratiques. Voici quelques-uns des différents types d’applications de vision par ordinateur :

Organisation du contenu

La vision par ordinateur peut être utilisée pour identifier des personnes ou des objets dans des photos et les organiser en fonction de cette identification. Les applications de reconnaissance de photos comme celles-ci sont couramment utilisées dans le stockage de photos et les réseaux sociaux.

Extraction de texte

La reconnaissance optique de caractères peut être utilisée pour booster la détectabilité du contenu pour les informations contenues dans de grandes quantités de texte et pour activer le traitement des documents pour les scénarios d’automatisation des processus robotisés.

Réalité augmentée

Les objets physiques sont détectés et suivis en temps réel avec la vision par ordinateur. Ces informations sont ensuite utilisées pour placer des objets virtuels de manière réaliste dans un environnement physique.

Agriculture

Des images de cultures provenant de satellites, de drones ou d’avions peuvent être analysées pour surveiller les récoltes, détecter la levée des mauvaises herbes ou identifier la carence nutritive des cultures.

Véhicules autonomes

Les voitures autonomes utilisent l’identification et le suivi des objets en temps réel pour recueillir des informations sur ce qui se passe autour d’elles et se diriger en conséquence.

Santé

Les photos ou images capturées par d’autres appareils médicaux peuvent être analysées pour permettre aux médecins d’identifier les problèmes et d’effectuer des diagnostics plus rapidement et avec plus de précision.

Sports

La détection et le suivi des objets sont utilisés pour l’analyse des stratégies et du jeu.

Industrie

La vision par ordinateur peut surveiller les machines de fabrication à des fins de maintenance. Elle peut également être utilisée pour surveiller la qualité et l’empaquetage des produits sur une ligne de production.

Analyse spatiale

Le système identifie les personnes ou les objets, tels que les voitures, dans un espace et suit leur mouvement au sein de cet espace.

Reconnaissance faciale

La vision par ordinateur peut être appliquée pour identifier les individus.

Parcourir les solutions de vision par ordinateur Azure

DécouvrezAzure AI Services – une gamme complète de services d’IA et d’API cognitives qui facilitent la création d’applications intelligentes dotées de capacités de vision par ordinateur.

Compte gratuit

Essayez les services Azure cloud computinggratuitement gratuitement pendant 30 jours maximum.

Essayez Azure gratuitement

Paiement à l’utilisation

Commencez en optant pour une tarification à l’utilisation. Pas d’engagement initial. Annulation possible à tout moment.

Explorer le paiement à l’utilisation

Explorez la vision par ordinateur dans Azure

Optimisez la détectabilité de contenu, accélérez l’extraction de texte et créez des produits que davantage de personnes peuvent utiliser en incorporant des fonctionnalités de vision dans vos applications.

Sélection

IA + Machine Learning

Analyse

Calcul

Conteneurs

Bases de données

DevOps

Outils de développement

Hybride + multicloud

Identité

Intégration

Internet des Objets

Gestion et gouvernance

Données multimédias

Migration

Réalité mixte

Mobile

Mise en réseau

Sécurité

Stockage

Web

Bureau virtuel Windows

Cas d'utilisation

Développement d’applications

IA

Migration et modernisation cloud

Données et analyse

Cloud hybride et infrastructure