Vision par ordinateur

Service d’IA qui analyse le contenu dans les images et vidéos.

Extrayez des informations riches à partir d’images et de vidéos

Optimisez la détectabilité de contenu, automatisez l’extraction de texte, analysez des vidéos en temps réel, et créez des produits que davantage de personnes peuvent utiliser en incorporant des fonctionnalités de vision dans vos applications. Utilisez un traitement de données visuelles pour étiqueter le contenu avec des objets et des concepts, extraire du texte, générer des descriptions d’images, modérer du contenu et comprendre le déplacement de personnes dans des espaces physiques. Aucun savoir-faire en Machine Learning n’est nécessaire.

Extraction de texte (OCR)

Extrayez du texte imprimé et manuscrit d’images et de documents avec des langues et des styles d’écriture mélangés.

Compréhension d’image

Tirez parti d’une ontologie riche de plus de 10 000 concepts et objets pour générer de la valeur ajoutée à partir de vos ressources visuelles.

Analyse spatiale

Analysez la façon dont les gens se déplacent dans un espace en temps réel.

Déploiement flexible

Exécutez Vision par ordinateur dans le cloud ou à la périphérie, dans des conteneurs.

Application aisée d’une vision par ordinateur révolutionnaire

Ajoutez la technologie de vision par ordinateur de pointe à vos propres applications avec un simple appel d’API.

Voir en action

person
person
subway train
Nom de la caractéristique : Valeur
Objets [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Mots clés [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955777 }, { "name": "station", "confidence": 0.979665935 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.838868737 }, { "name": "clothing", "confidence": 0.5561282 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911945 } ]
Description { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Format de l’image "Jpeg"
Dimensions de l’image 462 x 600
Noir et blanc false
Contenu pour adultes false
Degré du contenu pour adultes 0.009112834
Sanglant false
Gore Score 0.046150554
Osé false
Degré du contenu osé 0.0143244732
Catégories [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Visages []
Couleur d’arrière-plan dominante
"Black"
Couleur de premier plan dominante
"Black"
Couleur d’accentuation
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244732
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "30f97461-6b6a-4b8e-9534-dbaa638ee034",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244732
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "30f97461-6b6a-4b8e-9534-dbaa638ee034",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transformer vos processus

Identifiez automatiquement plus de 10 000 objets et concepts dans vos images. Extrayez du texte imprimé et manuscrit à partir de plusieurs types d’images et de documents, en tirant parti de la prise en charge de plusieurs langues et styles d’écriture. Appliquez ces fonctionnalités de l’API Vision par ordinateur pour simplifier des processus tels que l’automatisation robotisée des processus et la gestion des ressources numériques.

Optimiser la valeur de l’espace physique de votre organisation

Comprenez comment les utilisateurs se déplacent dans un espace physique, tel qu’un bureau ou un magasin. Créez des applications capables de dénombrer les personnes présentes dans une salle, de suivre leurs trajets, de comprendre les temps d’arrêt devant les présentoirs, et de déterminer les temps d’attente dans les files d’attente. Utilisez ces fonctionnalités pour créer des solutions qui permettent la gestion de l’occupation, la distanciation sociale, optimisent l’agencement de magasins et de bureaux, et accélèrent le processus d’encaissement. Exécutez le service sur plusieurs caméras et sites.

En savoir plus sur cette fonctionnalité

Déployer en tout lieu, du cloud à la périphérie

Exécutez Vision par ordinateur dans le cloud ou en local, avec des conteneurs. Appliquez l’API à divers scénarios, tels que l’examen d’images de dossier de santé, l’extraction de texte de documents sécurisés ou l’analyse de la façon dont les gens se déplacent dans un magasin, où la sécurité des données et la faible latence sont primordiales.

En savoir plus sur Vision par ordinateur dans des conteneurs

Reposez-vous sur les technologies de sécurité de pointe d’Azure

  • Microsoft investit plus de USD 1 billion par an dans la recherche et le développement en matière de cybersécurité.

  • Nous employons plus de 3 500 experts de sécurité qui se consacrent à la sécurité et à la protection des données personnelles.

  • Azure a plus de certifications que tout autre fournisseur de services cloud. Affichez la liste complète.

Vision par ordinateur de classe mondiale à des tarifs exceptionnels

Payez uniquement en fonction de votre utilisation, sans coût de démarrage. Avec Vision par ordinateur, vous payez à l’utilisation en fonction du nombre de transactions.

Prise en main de Vision par ordinateur en 3 étapes

Bénéficiez d'un accès instantané et d'un crédit de $200 en ouvrant un compte Azure gratuit.

Connectez-vous au portail Azure et ajoutez Vision par ordinateur.

Découvrez comment incorporer Vision par ordinateur avec les démarrages rapides et la documentation.

Documentation et ressources

Bien démarrer

Lire notre documentation

Suivre les cours Microsoft Learn

Explorer nos exemples de code

Consulter notre exemple de code

Mises à jour, billets de blog et annonces Vision par ordinateur

Questions fréquentes (FAQ) sur Vision par ordinateur

  • Vision par ordinateur et d’autres offres de Cognitive Services garantissent une disponibilité de 99,9 pour cent. Aucun contrat SLA n’est fourni pour le niveau tarifaire Gratuit. Voir les détails du contrat SLA.
  • Vos images et vidéos sont automatiquement supprimées après traitement. Microsoft n’utilise pas vos données dans les formations pour améliorer les modèles sous-jacents. Les données vidéo ne quittent pas votre environnement local et ne sont pas stockées sur la passerelle IoT Edge sur laquelle le conteneur s’exécute. En savoir plus sur la confidentialité et les conditions d’utilisation.
  • Oui, vous pouvez extraire des images uniques à partir de contenu vidéo. L’analyse spatiale vous permet d’analyser des flux vidéo à fréquence d’images élevée à l’aide de caméras connectées via Real Time Streaming Protocol.
  • L’analyse spatiale se limite à détecter et localiser la présence humaine dans une séquence vidéo, et à ajouter un cadre englobant autour d’un corps humain. Les modèles d’intelligence artificielle ne détectent pas les visages et ne découvrent pas les identités ou les données démographiques des individus.
  • Les modèles d’intelligence artificielle détectent et suivent les mouvements dans le flux vidéo en fonction d’algorithmes qui identifient la présence d’un ou de plusieurs êtres humains par un cadre englobant le corps. Pour chaque déplacement de cadre englobant détecté dans une zone du champ de vision de la caméra, les modèles d’intelligence artificielle génèrent des données d’événement, à savoir : coordonnées du cadre englobant du corps de la personne, type d’événement (par exemple, entrée dans une zone ou sortie de celle-ci, franchissement de ligne directionnelle), identificateur pseudonyme pour suivre le cadre englobant et indice de confiance de la détection. Ces données d’événement sont envoyées à votre propre instance d’Azure IoT Hub.

Créer votre compte gratuit Azure