Passer la navigation

Vision par ordinateur

Service d’IA qui analyse le contenu des images et vidéos

Extrayez des informations riches à partir d’images et de vidéos

Optimisez la détectabilité de contenu, automatisez l’extraction de texte, analysez des vidéos en temps réel, et créez des produits que davantage de personnes peuvent utiliser en incorporant des fonctionnalités de vision cloud dans vos applications avec Vision par ordinateur, qui fait partie d’Azure Cognitive Services. Utilisez un traitement de données visuelles pour étiqueter le contenu avec des objets et des concepts, extraire du texte, générer des descriptions d’images, modérer du contenu et comprendre le déplacement de personnes dans des espaces physiques. Aucun savoir-faire en Machine Learning n’est nécessaire.

Extraction de texte (OCR)

Extrayez du texte imprimé et manuscrit d’images et de documents avec des langues et des styles d’écriture mélangés.

Compréhension d’image

Tirez parti d’une ontologie riche de plus de 10 000 concepts et objets pour générer de la valeur ajoutée à partir de vos ressources visuelles.

Analyse spatiale

Analysez la façon dont les gens se déplacent au sein d'un espace en temps réel pour gérer le nombre d'occupants, la distanciation sociale et la détection des masques.

Déploiement flexible

Exécutez Vision par ordinateur dans le cloud ou à la périphérie, dans des conteneurs.

Application aisée d’une vision par ordinateur révolutionnaire

Ajoutez la technologie de reconnaissance photo et vidéo de pointe à vos propres applications avec un simple appel d’API.

Voir en action

person
person
subway train
Nom de la caractéristique : Valeur
Objets [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Mots clés [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955776 }, { "name": "station", "confidence": 0.9796659 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.83886826 }, { "name": "clothing", "confidence": 0.5561272 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911558 } ]
Description { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Format de l’image "Jpeg"
Dimensions de l’image 462 x 600
Noir et blanc false
Contenu pour adultes false
Degré du contenu pour adultes 0.009112839
Sanglant false
Gore Score 0.0461505651
Osé false
Degré du contenu osé 0.0143244788
Catégories [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Visages []
Couleur d’arrière-plan dominante
"Black"
Couleur de premier plan dominante
"Black"
Couleur d’accentuation
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.83886826
    },
    {
      "name": "clothing",
      "confidence": 0.5561272
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911558
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "78e27c8f-1d81-45dd-8611-e5bbf25ade75",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.83886826
    },
    {
      "name": "clothing",
      "confidence": 0.5561272
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911558
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "78e27c8f-1d81-45dd-8611-e5bbf25ade75",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transformer vos processus

Identifiez automatiquement plus de 10 000 objets et concepts dans vos images. Extrayez du texte imprimé et manuscrit à partir de plusieurs types d’images et de documents, en tirant parti de la prise en charge de plusieurs langues et styles d’écriture. Appliquez ces fonctionnalités de l’API Vision par ordinateur pour simplifier des processus tels que l’automatisation robotisée des processus et la gestion des ressources numériques.

Optimiser la valeur de l’espace physique de votre organisation

Understand how people move in a physical space, whether it's an office or a store. Use the spatial analysis feature to create apps that can count people in a room, trace paths, understand dwell times in front of a retail display, and determine wait times in queues. Build solutions that enable occupancy management and social distancing, face mask compliance, optimize in-store and office layouts, and accelerate the checkout process. Run the service across multiple cameras and sites.

En savoir plus sur cette fonctionnalité

Déployer en tout lieu, du cloud à la périphérie

Exécutez Vision par ordinateur dans le cloud ou en local, avec des conteneurs. Appliquez l’API à divers scénarios, tels que l’examen d’images de dossier de santé, l’extraction de texte de documents sécurisés ou l’analyse de la façon dont les gens se déplacent dans un magasin, où la sécurité des données et la faible latence sont primordiales.

En savoir plus sur Vision par ordinateur dans des conteneurs

Reposez-vous sur les technologies de sécurité de pointe d’Azure

  • Microsoft investit plus de USD 1 billion par an dans la recherche et le développement en matière de cybersécurité.

  • Nous employons plus de 3 500 experts de sécurité qui se consacrent à la sécurité et à la protection des données.

  • Azure offre plus de certifications de conformité que tout autre fournisseur de cloud. Affichez la liste complète.

Vision par ordinateur de classe mondiale à des tarifs exceptionnels

Payez uniquement en fonction de votre utilisation, sans coût de démarrage. Avec Vision par ordinateur, vous payez à l’utilisation en fonction du nombre de transactions.

Prise en main de Vision par ordinateur en 3 étapes

Bénéficiez d'un accès instantané et d'un crédit de $200 en ouvrant un compte Azure gratuit.

Connectez-vous au portail Azure et ajoutez Vision par ordinateur.

Découvrez comment incorporer Vision par ordinateur avec les démarrages rapides et la documentation.

Documentation et ressources

Bien démarrer

Lire la documentation

Suivre les cours Microsoft Learn

Consultez des exemples de code

Explorer un exemple d’application

Questions fréquentes (FAQ) sur Vision par ordinateur

  • Vision par ordinateur et d’autres offres d’Azure Cognitive Services garantissent une disponibilité de 99,9 pour cent. Aucun contrat SLA n’est fourni pour le niveau tarifaire Gratuit. Voir les détails du contrat SLA.
  • Non. Microsoft supprime automatiquement vos photos et vidéos après traitement, et ne s’entraîne pas avec vos données pour améliorer les modèles sous-jacents. Les données vidéo ne quittent pas votre environnement local et ne sont pas stockées sur la périphérie où le conteneur s’exécute. En savoir plus sur la confidentialité et les conditions d’utilisation.
  • Après avoir utilisé Vision par ordinateur pour extraire le texte des images et des vidéos, vous pouvez exécuter Analyse de texte pour analyser les sentiments, Traduction de texte Translator Text pour traduire le texte dans la langue souhaitée, ou Lecteur immersif pour lire le texte à voix haute, ce qui le rend plus accessible. Les fonctionnalités supplémentaires liées à Vision par ordinateur comprennent Form Recognizer pour extraire les paires de valeurs clés et les tableaux des documents, Visage pour détecter et reconnaître les visages dans les photos, Custom Vision pour construire aisément votre propre modèle de vision par ordinateur à partir de zéro, et Content Moderator pour détecter les textes ou images indésirables.
  • L’analyse spatiale détecte et localise la présence humaine dans une séquence vidéo, et à ajouter un cadre englobant autour d’un corps humain. Les modèles d’IA ne détectent pas les visages ou ne déterminent pas les identités ou les données démographiques des individus.
  • Les modèles d’intelligence artificielle de l’analyse spatiale détectent et suivent les mouvements dans le flux vidéo en fonction d’algorithmes qui identifient la présence d’un ou de plusieurs êtres humains par un cadre englobant le corps. Pour chaque déplacement de cadre englobant détecté dans une zone du champ de vision de la caméra, les modèles d’intelligence artificielle génèrent des données d’événement, à savoir : coordonnées du cadre englobant du corps de la personne, type d’événement (par exemple, entrée dans une zone ou sortie de celle-ci, ou franchissement de ligne directionnelle), identificateur pseudonyme pour suivre le cadre englobant et indice de confiance de la détection. Ces données d’événement sont envoyées à votre propre instance d’Azure IoT Hub.

Créer votre compte gratuit Azure