Computer Vision

AI-szolgáltatás a képek és videók tartalmának elemzéséhez

Részletes információk kinyerése képekből és videóból

Az Azure Cognitive Services részeként elérhető Computer Vision használatával felhőbeli látástechnológiai képességeket ágyazhat be az alkalmazásokba, amivel elősegítheti a tartalmak felfedezhetőségét, automatizálhatja a szövegek kinyerését, valós időben elemezhet videókat, és több felhasználó számára használható termékeket állíthat elő. Vizuális adatok feldolgozásával objektum- és fogalom-címkékkel láthatja el a tartalmat, szöveget nyerhet ki, képleírásokat generálhat, moderálhatja a tartalmakat, és értelmezheti az emberek fizikai térben végzett mozgását. Gépi tanulási szakértelemre nincs szükség.

Szöveg kinyerése (OCR)

Többféle nyelven és stílusban írt nyomtatott és kézírásos szöveget nyerhet ki képekből és dokumentumokból.

Képértelmezés

Több, mint 10 000 fogalmat és objektumot tartalmazó gazdag ismerettár alapján állíthat elő értéket vizuális forrásokból.

Térbeli elemzés

Valós időben elemezheti emberek mozgását egy térben.

Rugalmas üzembe helyezés

A Computer Visiont a felhőben vagy a peremhálózaton, tárolókban is futtathatja.

A forradalmian új számítógépes látástechnológia egyszerű alkalmazása

Egy egyszerű API-hívás segítségével adhat hozzá fejlett videó- és fotófelismerési technológiát a saját alkalmazásaihoz.

Nézze meg működés közben

person
person
subway train
Jellemző neve: Value (Díj)
Objektumok [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Címkék [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955777 }, { "name": "station", "confidence": 0.979665935 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.838868737 }, { "name": "clothing", "confidence": 0.5561282 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911945 } ]
Leírás { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Képformátum "Jpeg"
Képméret 462 x 600
Fekete-fehér false
Felnőtt tartalom false
Felnőtt pontszám 0.009112834
Véres false
Véres pontszám 0.046150554
Pikáns false
Pikáns pontszám 0.0143244695
Kategóriák [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Arcok []
Domináns háttérszín
"Black"
Domináns előtérszín
"Black"
Kiemelés színe
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "33396c9d-86ef-422c-9e1a-1612aecca568",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "33396c9d-86ef-422c-9e1a-1612aecca568",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

A folyamatok átalakítása

Több mint 10 000 objektumot és fogalmat azonosíthat automatikusan a képeken. Nyomtatott és kézírásos szöveget nyerhet ki különböző kép- és dokumentumtípusokból, kihasználva a több nyelv és a vegyes írásmódok támogatását. A Computer Vision ezen funkcióinak használatával gördülékenyebbé teheti az olyan folyamatokat, mint a robotokkal végzett eljárások automatizálása és a digitális értékek kezelése.

A vállalat rendelkezésére álló fizikai tér értékének maximalizálása

Értelmezheti az emberek fizikai térben – irodában vagy áruházban – végzett mozgását. A térbeli elemzés használatával olyan alkalmazásokat készíthet, amelyek megszámolják az embereket egy helyiségben, nyomon követik az útvonalakat, értelmezik a kirakatok előtt eltöltött időt, és megállapítják a sorok várakozási idejét. Olyan megoldásokat készíthet, amelyek kezelhetik a térkihasználást, biztosíthatják a személyes teret, optimalizálhatják az áruházak és irodák kialakítását, és felgyorsíthatják a kilépési folyamatot. A szolgáltatás több kamerával és helyszínnel is futtatható.

További információk erről a képességről

A felhőtől a peremhálózatokig bárhol üzembe helyezhető

A Computer Visiont a felhőben vagy a helyszínen, tárolókban is futtathatja. Sokféle helyzetben alkalmazhatja, például egészségügyi képfelvételek vizsgálatára, bizalmas dokumentumok szövegének kinyerésére, vagy az emberek áruházbeli mozgatásának elemzésére, ha a fő szempont az adatok biztonsága és alacsony késése.

Tudnivalók a Computer Vision tárolókkal való használatáról

Az iparágvezető Azure-biztonságra épült

  • A Microsoft több mint USD 1 billion összeget költ évente a kiberbiztonsággal kapcsolatos kutatás-fejlesztési projektekre.

  • Több mint 3500 biztonsági szakértőnk dolgozik azon, hogy megfelelő szintű adatbiztonságot és adatvédelmet nyújthassunk Önnek.

  • Az Azure bármely más felhőszolgáltatónál több megfelelési tanúsítvánnyal rendelkezik. Tekintse meg átfogó listánkat.

Világszínvonalú számítógépes látástechnológia versenyképes árakon

Fizessen csak a tényleges használatért előzetes költség nélkül. A Computer Visionnel a tranzakciók száma alapján fizet.

Bevezetés a Computer Vision használatába 3 lépésben

Azonnali hozzáférés és $200 értékű kredit az ingyenes Azure-fiók regisztrálásával.

Jelentkezzen be az Azure Portalra, és adja hozzá a Computer Visiont.

A gyorsútmutatókból és a dokumentációkból megismerheti a Computer Vision beágyazását.

Dokumentáció és források

Az első lépések

Olvassa el a dokumentációt

Végezzen el Microsoft Learn-tanfolyamokat

Kódminták megtekintése

Ismerkedjen meg a mintaalkalmazással

Gyakori kérdések a Computer Visionről

  • A Computer Vision és az egyéb Azure Cognitive Services-ajánlatok 99,9%-os rendelkezésre állást biztosítanak. Az ingyenes tarifacsomaghoz nem tartozik SLA. Tekintse meg az SLA-val kapcsolatos részleteket.
  • Nem. A Microsoft a feldolgozás után automatikusan törli a képeket és a videókat, és az adatokat nem használja fel betanításhoz az alapul szolgáló modellek fejlesztéséhez. A videóadatok nem jutnak ki a helyszínről, és nincsenek videóadatok tárolva azon peremhálózaton, ahol a tároló fut. További információ az adatvédelemről és a használati feltételekről.
  • Miután a Computer Vision használatával kinyeri a szöveget a képekből és a videóból, a Text Analytics segítségével elemezheti a hangulatot, a Translatorrel lefordíthatja a szöveget a kívánt nyelvre, a Modern olvasóval pedig hangosan felolvashatja a szöveget, így az akadálymentesen is hozzáférhetővé válik. A Computer Visionhöz kapcsolódó további képességek között található a Form Recognizer, amellyel kulcs-érték párokat nyerhet ki táblázatokból és dokumentumokból, a Face, amellyel arcokat ismerhet fel képeken, a Custom Vision, amellyel egyszerűen felépítheti az alapoktól saját számítógépes látási modelljét, valamint a Content Moderator, amellyel nemkívánatos szövegeket és képeket észlelhet.
  • Nem. A térbeli elemzés az emberi jelenlétet és annak helyét észleli a videófelvételeken, ezt pedig az emberi test határolókeretét használva adja tovább. Az AI-modellek nem észlelnek arcokat, és nem állapítják meg az egyes személyek kilétét vagy demográfiai adatait.
  • A térbeli elemzési AI-modellek olyan algoritmusok alapján észlelik és követik nyomon a mozgásokat a videócsatornán, amelyek test-határolókeretek alapján azonosítják az embereket. Az AI-modellek a kamera látóterének egy zónájában észlelt összes határolókeret mozgásához eseményadatokat szolgáltatnak, köztük a következőket: egy személy testét határoló keret koordinátái, az esemény típusa (például belépés a zónába, annak elhagyása, vagy irányított vonal átlépése), a határolókeret követésére szolgáló azonosító és az észlelés megbízhatósági pontszáma. Ezeket az adatokat a saját Azure IoT Hub-példányhoz továbbítja.

Ha készen áll, állítsa be ingyenes Azure-fiókját