Visuellt innehåll

Extrahera information från bilder för att kategorisera och bearbeta visuella data, utföra datorstödd moderering av bilder som hjälper dig att moderera dina tjänster.

Analysera en bild

Den här funktionen returnerar information om visuellt innehåll som hittas i en bild. Använd taggning, domänspecifika modeller och beskrivningar på fyra språk till att identifiera innehåll och kategorisera det med tillförsikt. Använd objektidentifiering för att hämta platser för tusentals objekt på en bild. Använd inställningarna för vuxet och vågat innehåll till att identifiera innehåll som kan vara olämpligt för barn. Identifiera bildtyper och färgscheman in bilder.

Se hur det fungerar

person
person
subway train
Funktionsnamn: Värde
Objekt [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Taggar [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Beskrivning { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Bildformat "Jpeg"
Bilddimensioner 462 x 600
Clip art-typ 0
Linjeteckningstyp 0
Svart och vit false
Innehåll som är olämpligt för barn false
Poäng för vuxeninnehåll 0.009112834
Vågat false
Poäng för vågat 0.0143244695
Kategorier [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Ansikten []
Dominant färg för bakgrund
"Black"
Dominant färg för förgrund
"Black"
Accentfärg
#484C83

Vill du skapa det här?

Nu allmänt tillgängligt: Läs både tryckt och handskriven text på bilder

Använd avancerad optisk teckenläsning (OCR) i läsåtgärden för att identifiera inbäddad tryckt och handskriven text, extrahera identifierade ord till maskinläsbara teckenströmmar, och aktivera sökning. Spara tid och energi genom att fotografera text istället för att kopiera den.

Se hur det fungerar

  1. Förhandsversion
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Demoresultaten är endast avsedda för att illustrera funktionen. Det faktiska API-resultatet kan skilja sig åt på grund av mindre bildmanipulationer.

Vill du skapa det här?

Identifiera varumärken, kändisar och landmärken

Identifiera fler än 1 500 globala varumärken och logotyper, 1 miljon kändisar från affärsvärlden, politiken, sportvärlden och underhållningsbranschen samt 9 000 naturliga och konstgjorda landmärken från hela världen.

Se hur det fungerar

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "16256a2c-c09c-4589-b97d-8570056498a5",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "brands": []
}

Vill du skapa det här?

Analysera video i nära realtid

Analysera video i nära realtid och använd något av API:erna för visuellt innehåll med dina videofiler genom att extrahera bildrutor i videon från enheten och sedan skicka bildrutorna till önskade API-anrop. Få resultat från dina videor snabbare.

Använd vårt exempel på GitHub för att komma igång och bygga din egen app.

Läs mer

Se hur det fungerar

Vill du skapa det här?

Skapa miniatyrbilder

Generera en lagringseffektiv miniatyr av hög kvalitet baserat på valfri bild, och ändra bilderna så att storlek, form och format passar dig. Använd smart beskärning och skapa miniatyrbilder där bildförhållandet skiljer sig från originalbilden men där ändå ROI (Region of Interest) bevaras.

Se hur det fungerar

Vill du skapa det här?

"We can use the Computer Vision API to prove to our clients the reliability of the data, so they can be confident making important business decisions based on that information"

Leendert de Voogd: VD | Vigiglobe
vigiglobe

"It didn't take us long to realize Microsoft Cognitive Services had handed us a powerful set of computer-vision and artificial-intelligence tools that we could use to create great apps and new features for our customers in just a few hours"

John Fan: Medgrundare och VD | Cardinal Blue Software
Pic Collage

"Because the Cognitive Services APIs harness the power of machine learning, we were able to bring advanced intelligence into our product without the need to have a team of data scientists on hand"

Aaron Edell: Chief Product Owner | GrayMeta
GrayMeta

"We found Cognitive Services to be the missing piece in the equation, the one that we needed to bring this solution to market and really revolutionize the way people look at video"

Katie McCann: Vice President för Product and Engineering | Prism Skylabs
Prism Skylabs

"Microsoft Cognitive Services gives us a huge range of opportunities. It's a perfect match for us now, and in the future when we want to add more features to our app"

Jaan Apajalahti: VD | Blucup
Blucup

"Using the Cognitive Services APIs, it took us three months to develop a test pair of glasses that can translate text and images into speech, identify emotions, and describe scenery.If we had been working full time, we could have done it in two weeks"

Benoit Chirouter: R&D Director | Pivothead
Pivothead

Utforska API:erna för Cognitive Services

Visuellt innehåll

Sammanfatta användbar information från bilder

Ansikte

Spåra, identifiera, analysera, organisera och tagga ansikten i foton

Handskriftsigenkänning

En AI-tjänst som identifierar digitala pennanteckningar, som handskrift, former och layouter

Video Indexer

Få tillgång till information i video

Custom Vision

Du kan enkelt anpassa egna avancerade modeller för visuellt innehåll som passar ditt unika användningsscenario

Formigenkänning

En AI-driven dokumentextraheringstjänst som känner igen dina former

Textanalys

Utvärdera enkelt sentiment och ämnen och förstå vad användare vill ha

Translator för textöversättning

Utför enkelt maskinöversättning i realtid med ett enkelt REST API-anrop

QnA Maker

Omformulera information till konversationsanpassade, navigerbara svar

Språkförståelse

Lär apparna att förstå kommandon från dina användare

Avancerad läsare

Stärk läsningen och läsförståelsen för användare i alla åldrar och med alla förmågor

Taltjänster

Unified Speech Services för tal-till-text, text-till-tal och talöversättning

Talarigenkänning

Använd tal till att identifiera och verifiera individuella talare

Talöversättning

Integrera enkelt realtidsöversättning av tal i din app

Tal till text

Tal till text-API:t är en del av Azure Cognitive Services-taltjänster

Text till tal

Konvertera text till tal och skapa mer naturliga, användarvänliga gränssnitt

Content Moderator

Automatiserad bild-, text- och videomoderering

Avvikelseidentifiering

Lägg enkelt till funktioner för avvikelseidentifiering i dina appar.

Personanpassning

En AI-tjänst som levererar en personanpassad användarupplevelse

Är du redo att ge din app ett lyft?