Visuellt innehåll

Extrahera information från bilder för att kategorisera och bearbeta visuella data, utföra datorstödd moderering av bilder som hjälper dig att moderera dina tjänster.

Analysera en bild

Den här funktionen returnerar information om visuellt innehåll som hittas i en bild. Använd taggning, domänspecifika modeller och beskrivningar på fyra språk till att identifiera innehåll och kategorisera det med tillförsikt. Använd objektidentifiering för att hämta platser för tusentals objekt på en bild. Använd inställningarna för vuxet och vågat innehåll till att identifiera innehåll som kan vara olämpligt för barn. Identifiera bildtyper och färgscheman in bilder.

Se hur det fungerar

person
person
subway train
Funktionsnamn: Värde
Objekt [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Taggar [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Beskrivning { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Bildformat "Jpeg"
Bilddimensioner 462 x 600
Clip art-typ 0
Linjeteckningstyp 0
Svart och vit false
Innehåll som är olämpligt för barn false
Poäng för vuxeninnehåll 0.009112834
Vågat false
Poäng för vågat 0.0143244695
Kategorier [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Ansikten []
Dominant färg för bakgrund
"Black"
Dominant färg för förgrund
"Black"
Accentfärg
#484C83

Vill du skapa det här?

Nu allmänt tillgängligt: Läs både tryckt och handskriven text på bilder

Använd avancerad optisk teckenläsning (OCR) i läsåtgärden för att identifiera inbäddad tryckt och handskriven text, extrahera identifierade ord till maskinläsbara teckenströmmar, och aktivera sökning. Spara tid och energi genom att fotografera text istället för att kopiera den.

Se hur det fungerar

  1. Förhandsversion
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Demo results are for illustrative purposes only - due to minor image manipulations applied, actual API results may differ.

Vill du skapa det här?

Identifiera kändisar och landmärken

Identifiera fler än 1 000 000 kändisar från affärsvärlden, politiken, sportvärlden och underhållningsbranschen samt 9 000 naturliga och konstgjorda landmärken från hela världen.

Se hur det fungerar

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "d9f7ff15-d297-40d5-8bd8-8384f8dc3212",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Vill du skapa det här?

Analysera video i nära realtid

Analysera video i nära realtid och använd något av API:erna för visuellt innehåll med dina videofiler genom att extrahera bildrutor i videon från enheten och sedan skicka bildrutorna till önskade API-anrop. Få resultat från dina videor snabbare.

Använd vårt exempel på GitHub för att komma igång och bygga din egen app.

Läs mer

Se hur det fungerar

Vill du skapa det här?

Skapa miniatyrbilder

Generera en lagringseffektiv miniatyr av hög kvalitet baserat på valfri bild, och ändra bilderna så att storlek, form och format passar dig. Använd smart beskärning och skapa miniatyrbilder där bildförhållandet skiljer sig från originalbilden men där ändå ROI (Region of Interest) bevaras.

Se hur det fungerar

Vill du skapa det här?

Utforska API:erna för Cognitive Services

Visuellt innehåll

Sammanfatta användbar information från bilder

Ansikte

Spåra, identifiera, analysera, organisera och tagga ansikten i foton

Handskriftsigenkänning FÖRHANDSVERSION

En AI-tjänst som identifierar digitala pennanteckningar, som handskrift, former och layouter

Video Indexer

Få tillgång till information i video

Custom Vision

Du kan enkelt anpassa egna avancerade modeller för visuellt innehåll som passar ditt unika användningsscenario

Formigenkänning FÖRHANDSVERSION

En AI-driven dokumentextraheringstjänst som känner igen dina former

Textanalys

Utvärdera enkelt sentiment och ämnen och förstå vad användare vill ha

Translator för textöversättning

Utför enkelt maskinöversättning i realtid med ett enkelt REST API-anrop

QnA Maker

Omformulera information till konversationsanpassade, navigerbara svar

Språkförståelse

Lär apparna att förstå kommandon från dina användare

Immersive Reader FÖRHANDSVERSION

Empower users of all ages and abilities to read and comprehend text

Taltjänster

Unified Speech Services för tal-till-text, text-till-tal och talöversättning

Talarigenkänning FÖRHANDSVERSION

Använd tal till att identifiera och verifiera individuella talare

Content Moderator

Automatiserad bild-, text- och videomoderering

Avvikelseidentifiering FÖRHANDSVERSION

Lägg enkelt till funktioner för avvikelseidentifiering i dina appar.

Personanpassning FÖRHANDSVERSION

En AI-tjänst som levererar en personanpassad användarupplevelse

Är du redo att ge din app ett lyft?