API för visuellt innehåll

Extrahera information från bilder för att kategorisera och bearbeta visuella data – och datorstödd moderering av bilder hjälper dig att moderera dina tjänster.

Analysera en bild

Den här funktionen returnerar information om visuellt innehåll som hittas i en bild. Använd taggning, beskrivningar och domänspecifika modeller för att identifiera innehåll och kategorisera det med tillförsikt. Använd inställningarna för vuxet/vågat för att aktivera automatisk begränsning av innehåll som är olämpligt för barn. Identifiera bildtyper och färgscheman in bilder.

Se hur det fungerar

Funktionsnamn: Värde
Beskrivning { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331026 } ] }
Taggar [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
Bildformat "Jpeg"
Bilddimensioner 462 x 600
Clip art-typ 0
Linjeteckningstyp 0
Svart och vit false
Innehåll som är olämpligt för barn false
Poäng för vuxeninnehåll 0.0147124995
Vågat false
Poäng för vågat 0.0162802152
Kategorier [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Ansikten []
Dominant färg för bakgrund
"Black"
Dominant färg för förgrund
"Black"
Accentfärg
#484C83

Vill du skapa det här?

Läs text i bilder

Optisk teckeninläsning (OCR) identifierar text i en bild och extraherar identifierade ord till en maskinläsningsbar teckenström. Analysera bilder för att identifiera inbäddad text, generera teckenströmmar och aktivera sökning. Spara tid och energi genom att ta foton istället för att kopiera.

Se hur det fungerar

  1. Förhandsversion
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Genom att överföra data för den här demon samtycker du till att Microsoft kan lagra dessa data och använda dem för att förbättra Microsofts tjänster, inklusive detta API. För att skydda din integritet vidtar vi åtgärder för att avidentifiera dina data och skydda dem. Vi publicerar inte dina data och vi låter inte andra använda dem.

Vill du skapa det här?

Förhandsversion: Läs handskriven text från bilder

Med den här tekniken (handskriven OCR) kan du identifiera och extrahera handskriven text från anteckningar, brev, uppsatser, whiteboardtavlor, formulär och så vidare. Den fungerar med olika ytor och bakgrunder, som vitt papper, gula anteckningslappar och whiteboardtavlor.

Med handskriven textigenkänning sparar du tid och kraft och blir effektiv. Du kan öka produktiviteten eftersom du kan ta bilder av text istället för att behöva skriva ner allt. Det gör det möjligt att digitalisera anteckningar som du sedan kan använda för snabba och enkla sökningar. Du slipper också den oreda som uppstår när du har för mycket papper omkring dig.

Obs! Den här tekniken är för tillfället tillgänglig som förhandsversion och endast för engelsk text.

Ladda upp en lokalt lagrad bild eller en bild-URL för att testa den här demonstrationen av optisk teckenläsning. Vi lagrar inte bilderna som du tillhandahåller för den här demonstrationen om du inte ger oss tillåtelse att göra det.

Se hur det fungerar

  1. Förhandsversion
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Vill du skapa det här?

Identifiera kändisar och landmärken

Kändismodellen och modellen för landmärken är exempel på domänspecifika modeller. Vår igenkänningsfunktion för kändisar kan identifiera 200 000 kändisar från företagsvärlden, politiken, idrotten och underhållningsvärlden. Vår igenkänningsfunktion för landmärken kan identifiera 9000 landmärken i hela världen som skapats av såväl naturen som människan. Domänspecifika modeller är en funktion inom API för visuellt innehåll som ständigt utvecklas.

Se hur det fungerar

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "af30bb68-abf4-4a0b-8799-042acfce99cb",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Vill du skapa det här?

Analysera video i nära realtid

Analysera video i nära realtid och använd något av API:erna för visuellt innehåll med dina videofiler genom att extrahera bildrutor i videon från enheten och sedan skicka bildrutorna till önskade API-anrop. Få resultat från dina videor snabbare.

Använd vårt exempel på GitHub för att komma igång och bygga din egen app.

Läs mer

Se hur det fungerar

Vill du skapa det här?

Skapa miniatyrbilder

Generera en lagringseffektiv miniatyrbild med hög kvalitet för varje inmatad bild. Använd genereringen av miniatyrbilder till att ändra bilderna så att de passar dina behov när det gäller storlek, form och format. Använd smart beskärning och skapa miniatyrbilder där bildförhållandet skiljer sig från originalbilden men där ändå ROI (Region of Interest) bevaras.

Se hur det fungerar

Genom att överföra data för den här demon samtycker du till att Microsoft kan lagra dessa data och använda dem för att förbättra Microsofts tjänster, inklusive detta API. För att skydda din integritet vidtar vi åtgärder för att avidentifiera dina data och skydda dem. Vi publicerar inte dina data och vi låter inte andra använda dem.

Vill du skapa det här?

Utforska API:erna för Cognitive Services

API för visuellt innehåll

Sammanfatta användbar information från bilder

API för ansiktsigenkänning

Spåra, identifiera, analysera, organisera och tagga ansikten i foton

Content Moderator

Automatiserad bild-, text- och videomoderering

Känslo-API FÖRHANDSVERSION

Personanpassade användarupplevelser med igenkänning av känslor

Custom Vision Service FÖRHANDSVERSION

Du kan enkelt anpassa egna avancerade modeller för visuellt innehåll som passar ditt unika användningsscenario

Video Indexer FÖRHANDSVERSION

Få tillgång till information i video

Language Understanding Intelligent Service

Lär apparna att förstå kommandon från dina användare

API för textanalys

Utvärdera enkelt sentiment och ämnen och förstå vad användare vill ha

Stavningskontrolls-API i Bing

Hitta och korrigera stavfel direkt i din app

Translator-API för textöversättning

Utför enkelt maskinöversättning i realtid med ett enkelt REST API-anrop

API för webbspråksmodell FÖRHANDSVERSION

Använd styrkan i förutsägande språkmodeller som har tränats på webbskalade data

API för lingvistisk analys FÖRHANDSVERSION

Förenkla komplexa språkkoncept och parsa text med API:t för lingvistisk analys

Translator-API för talöversättning

Utför talöversättning enkelt i realtid med ett enda REST API-anrop

Talarigenkännings-API FÖRHANDSVERSION

Använd tal till att identifiera och autentisera individuella talare

Tal-API för Bing

Omvandla tal till text och tillbaka igen och förstå användaravsikten

Custom Speech Service FÖRHANDSVERSION

Komma över hinder för taligenkänning som samtalsstil, bakgrundsljus och vokabulär

API för rekommendationer FÖRHANDSVERSION

Förutse och rekommendera föremål som dina kunder vill ha

Academic Knowledge API FÖRHANDSVERSION

Ta del av omfattande akademiskt innehåll i Microsoft Academic Graph

Tjänst för kunskapsutveckling FÖRHANDSVERSION

Möjliggör interaktiva sökupplevelser över strukturerade data via naturliga språkinmatningar

API för QnA Maker FÖRHANDSVERSION

Omformulera information till konversationsanpassade, navigerbara svar

API för intelligent tjänst för entitetslänkning FÖRHANDSVERSION

Förse dina appars datalänkar med igenkänning av namngivna entiteter och tvetydigheter

Custom Decision Service FÖRHANDSVERSION

Ett molnbaserat API för kontextuellt beslutsfattande, som blir bättre genom användande

Prag-projektet

Gestbaserade kontroller

Cuzco-projektet

Evenemang med anknytning till Wikipedia-poster

Projekt Nanjing

Isokronberäkningar

Abu Dhabi-projektet

Avståndsmatris

Johannesburg-projektet

Routningslogistik

Wollongong-projektet

Platsinsikter

Är du redo att ge din app ett lyft?