Számítógépes látástechnológiai API

Részletes információt nyerhet ki képekből a vizuális adatok kategorizálásához és feldolgozásához, a gépi támogatású képmoderálás pedig segítheti a szolgáltatások összeválogatásában.

Kép elemzése

Ezzel a funkcióval információt nyerhet ki a képek vizuális tartalmáról. Használjon címkéket, leírásokat és tartomány-specifikus modelleket a tartalom megbízható azonosításához és megjelöléséhez. A felnőtt/sikamlós beállítások alkalmazásával a felnőtt tartalmak automatikus korlátozhatók. Azonosítsa a képtípusokat és színösszeállításokat.

Nézze meg működés közben

Jellemző neve: Value (Díj)
Leírás { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331026 } ] }
Címkék [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
Képformátum "Jpeg"
Képméret 462 x 600
Grafikus kép típusa 0
Vonalrajz típusa 0
Fekete-fehér false
Felnőtt tartalom false
Felnőtt pontszám 0.0147124995
Pikáns false
Pikáns pontszám 0.0162802152
Kategóriák [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Arcok []
Domináns háttérszín
"Black"
Domináns előtérszín
"Black"
Kiemelés színe
#484C83

Szeretné ezt elkészíteni?

Olvassa el a szövegeket a képeken

Az optikai karakterfelismerés (OCR) azonosítja a képeken található szöveget, és géppel feldolgozható karaktersorozattá alakítja azt. A képelemzés felismeri és karakterfolyammá alakítja a beágyazott szövegeket, így lehetővé teszi a keresést. Másolás helyett elég, ha lefényképezi a szöveget, így időt és fáradságot takarít meg.

Nézze meg működés közben

  1. Előzetes verzió
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Azzal, hogy adatokat tölt fel a demóba, beleegyezik, hogy a Microsoft tárolja azokat, és felhasználja a Microsoft-szolgáltatások javításához, például ennek az API-nak a továbbfejlesztéséhez. Személyes adatainak védelmében igyekszünk megszüntetni az adatok azonosíthatóságát és biztonságba helyezni őket. Adatait nem tesszük közzé és nem bocsátjuk mások rendelkezésére.

Szeretné ezt elkészíteni?

Előzetes verzió: Kézzel írt szöveg felismerése képekből

Ez a technológia (kézírásos optikai karakterfelismerés) lehetővé teszi kézzel írt jegyzetek, levelek, esszék, táblaképek, űrlapok vagy más elemek szövegének felismerését és kinyerését. Különféle felületekkel és hátterekkel használható, például fehér papír, sárga jegyzetlapok vagy fehér tábla.

A kézírásos szövegek felismerése időt és energiát takarít meg, és növeli a hatékonyságot, hiszen lehetővé teszi, hogy szövegek átírása helyett egyszerűen lefényképezze az adott szöveget. Használatával digitalizálhatók a jegyzetek, így lehetővé válik a gyors és egyszerű szövegbeli keresés is. Ezen kívül a papírfelhasználást is csökkenti.

Megjegyzés: ez a technológia jelenleg előzetes verzióban, és kizárólag angol nyelvre érhető el.

Az optikai karakterfelismerés demójának kipróbálásához töltsön fel egy helyileg tárolt képet, vagy adjon meg egy képre mutató URL-címet. A bemutatóhoz használt képeket csak akkor tároljuk, ha ehhez Ön engedélyt ad.

Nézze meg működés közben

  1. Előzetes verzió
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Szeretné ezt elkészíteni?

Hírességek és tereptárgyak felismerése

A hírességek és tereptárgyak felismerése modellek tartományspecifikus modellek. A hírességfelismerési modell több mint 200.000 hírességet képes azonosítani az üzleti élet, a politika, a sport és a szórakoztatóipar területéről. A tereptárgy-felismerő modell 9000 természeti és mesterséges tereptárgyat képes felismerni világszerte. A tartományspecifikus modellek a Számítógépes látástechnológiai API egyik folyamatosan fejlődő funkciója.

Nézze meg működés közben

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "e9714e62-7341-4da3-a179-82d9a3126cd1",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Szeretné ezt elkészíteni?

Videók elemzése csaknem valós időben

Videók közel valós idejű elemzése Videofájlokhoz használhatja a számítógépes látástechnológiai API-kat is: az eszközön a videóból képkockákat másolhat ki, és elküldheti azokat bármely API-hívásnak. A videó adatait így gyorsabban tudja értelmezni.

A GitHubon elérhető mintát használva megkezdheti saját alkalmazásának létrehozását is.

Részletek

Nézze meg működés közben

Szeretné ezt elkészíteni?

Miniatűrkép generálása

Tetszőleges bemeneti kép alapján kiváló minőségű, hatékonyan tárolható miniatűrök hozhatók létre. A miniatűrkészítéssel úgy módosíthatja a képeket, hogy azok pontosan megfeleljenek a méretre, formára és stílusra vonatkozó igényeinek. Az intelligens képvágási funkció segítségével az eredetitől eltérő képarányú, azonban a lényeges területeket megőrző miniatűröket hozhat létre.

Nézze meg működés közben

Azzal, hogy adatokat tölt fel a demóba, beleegyezik, hogy a Microsoft tárolja azokat, és felhasználja a Microsoft-szolgáltatások javításához, például ennek az API-nak a továbbfejlesztéséhez. Személyes adatainak védelmében igyekszünk megszüntetni az adatok azonosíthatóságát és biztonságba helyezni őket. Adatait nem tesszük közzé és nem bocsátjuk mások rendelkezésére.

Szeretné ezt elkészíteni?

Ismerje meg a Cognitive Services API-kat

Számítógépes látástechnológiai API

Hasznos információkhoz juthat a képekből

Arcfelismerő API

Arcok felismerése, azonosítása, elemzése, rendszerezése és megjelölése a képeken

Content Moderator

Automatizált kép-, szöveg- és videomoderálás

Érzelemfelismerési API ELŐZETES VERZIÓ

Testreszabott, érzelemfelismerésre alkalmas felhasználói környezetek kialakítása

Custom Vision Service ELŐZETES VERZIÓ

Könnyedén testre szabhatja a saját legkorszerűbb számítógépes látástechnológiai modelljeit az egyedi használati esetekhez

Video Indexer ELŐZETES VERZIÓ

Tárja fel a videókban rejlő információkat

Language Understanding Intelligent Service (LUIS)

Megtaníthatja alkalmazásait a felhasználói parancsok értelmezésére.

Szövegelemzési API

Érzelmek és témakörök egyszerű kiértékelése a felhasználók szándékainak megértésére

Bing Helyesírás-ellenőrzési API

Helyesírási hibák észlelése és javítása az alkalmazásokban

Szövegfordító API

Gépi fordítás egy egyszerű REST API-hívással

Webes nyelvi modell API ELŐZETES VERZIÓ

Használja ki a webes méretű adatokon tanított prediktív nyelvi modellek hatékonyságát

Nyelvi elemzési API ELŐZETES VERZIÓ

A Nyelvi elemzési API használatával egyszerűsítheti a bonyolult nyelvi szerkezeteket, és szövegelemzést is végezhet

Translator Speech API

Valós idejű beszédfordítás egy egyszerű REST API-hívással

Hangfelismerő API ELŐZETES VERZIÓ

Beszéd használata az egyes beszélők azonosításához és hitelesítéséhez

Bing Beszédfelismerő API

A felhasználó szándékának megértése a beszéd írott szöveggé alakításával – és fordítva

Custom Speech Service ELŐZETES VERZIÓ

A beszédfelismerést akadályozó tényezők, például a különféle beszédstílusok, a háttérzaj vagy a szókincs kiküszöbölése

Ajánlatok API ELŐZETES VERZIÓ

Az ügyfelek által igényelt cikkek előrejelzése és ajánlása

Academic Knowledge API ELŐZETES VERZIÓ

Használja ki a Microsoft Academic Graph gazdag tudományos tartalmát

Knowledge Exploration Service ELŐZETES VERZIÓ

Strukturált adatokon természetes nyelvi bemenetekkel végezhet interaktív kereséseket

QnA Maker API ELŐZETES VERZIÓ

Az információkból közérthető, könnyen átlátható válaszokat nyerhet ki

Entitáskapcsolási intelligens szolgáltatás API ELŐZETES VERZIÓ

Tegye hatékonyabbá alkalmazása adatkapcsolatait elnevezett entitásfelismeréssel és -egyértelműsítéssel

Custom Decision Service ELŐZETES VERZIÓ

Felhőalapú, környezetfüggő döntéshozó API, amely a tapasztalatok felhasználásával egyre pontosabbá válik

Project Prague

Irányítás kézmozdulatokkal

Project Cuzco

Wikipedia-bejegyzésekhez tartozó esemény

Project Nanjing

Izokrón-számítások

Project Abu Dhabi

Távolsági mátrix

Project Johannesburg

Útvonal-logisztika

Project Wollongong

Helyinformációk

Szeretné magasabb szintre kapcsolni alkalmazását?