Visuelt innhold

Utvinn rik informasjon fra bilder for å kategorisere og behandle visuelle data – og utfør maskinassistert moderering av bilder for å kuratere tjenestene dine.

Analyser et bilde

Denne funksjonen returnerer informasjon om visuelt innhold i et bilde. Bruk tagging, domenespesifikke modeller og beskrivelser i fire språk for å identifisere innhold og merke det med full trygghet. Bruk objektpåvisning til å finne posisjonen til tusenvis av objekter i et bilde. Bruk innstillinger for rasistisk innhold eller innhold uegnet for barn for å hjelpe deg med å oppdage slikt innhold. Identifiser bildetyper og fargeskjemaer i bilder.

Se i praksis

person
person
subway train
Funksjonsnavn: Verdi
Objekter [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Tagger [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Beskrivelse { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Bildeformat "Jpeg"
Bildedimensjoner 462 x 600
Ferdig tegningstype 0
Linjetegningstype 0
Svart-hvitt false
Vokseninnhold false
Voksenscore 0.009112834
Voksent false
Voksenscore 0.0143244695
Kategorier [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Ansikter []
Dominant bakgrunnsfarge
"Black"
Dominant forgrunnsfarge
"Black"
Aksentfarge
#484C83

Vil du bygge dette?

Nå generelt tilgjengelig: Les både trykt og håndskrevet tekst i bilder

Bruk den beste optiske tegngjenkjenningen (OCR) i Lesehandling til å finne innebygd trykt og håndskrevet tekst, trekke ut gjenkjente ord i maskinleste tegnstrømminger og aktivere søk. Spar tid og innsats ved å ta bilde av tekst i stedet for å kopiere den.

Se i praksis

  1. Testversjon
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Demo-resultatene er kun til illustrasjon. Fordi vi har manipulert avbildningene litt, kan faktiske API-resultater være annerledes.

Vil du bygge dette?

Gjenkjenn merkevarer, kjendiser og landemerker

Gjenkjenn mer enn 1 500 globale merkevarer og logoer, 1 million kjendiser fra forretningslivet, politikk, sport og underholdning, i tillegg til 9 000 naturlige og kunstige landemerker rundt om i verden.

Se i praksis

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "c7d425f0-a4b0-410f-b334-53c892fa08ae",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "brands": []
}

Vil du bygge dette?

Analyser video i nær sanntid

Analyser video i tilnærmet sanntid. Bruk en av API-ene for visuelt innhold sammen med videofilene ved å hente ut videobilder fra enheten og deretter sende disse bildene til de ønskede API-anropene. Får resultater fra videoene dine raskere.

Bruk eksempelet vårt på GitHub for å komme igang med å bygge din egen app.

Les mer

Se i praksis

Vil du bygge dette?

Opprett et miniatyrbilde

Lag et høyverdig lagringseffektivt miniatyrbilde basert på et hvilket som helst bilde, og rediger bilder slik at de passer dine behov i henhold til størrelse, format og stil. Bruk smart beskjæring for å lage miniatyrbilder som varierer fra størrelsesforholdet til det originale bildet, men likevel beholder det viktigste.

Se i praksis

Vil du bygge dette?

Utforsk API-ene for Cognitive Services

Visuelt innhold

Hent ut brukbar informasjon fra bilder

Ansikt

Registrer, identifiser, analyser, ordne og tagg ansikter i bilder

Ink Recognizer TESTVERSJON

En AI-tjeneste som gjenkjenner innhold i digital blekk, for eksempel håndskrift, figurer og oppsett i dokumenter

Video Indexer

Lås opp videoinnsikter

Custom Vision

Du kan enkelt tilpasse dine egne, moderne datamodeller for visuelt innhold til dine spesielle behov

Form Recognizer TESTVERSJON

Den AI-drevne dokumentuttrekkingstjenesten som forstår skjemaene dine

Tekstanalyser

Evaluer enkelt følelser og emner for å forstå hva brukerne vil ha

Translator Text

Utfør maskinoversettelse helt enkelt med en enkel REST-API-oppkalling

QnA Maker

Trekk ut informasjonen, og produser svar som er enkle å forstå og har en konversasjonslignende tone

Language Understanding

Lær appene dine å forstå kommandoer fra brukerne

Engasjerende leser TESTVERSJON

Gi brukere i alle aldre og på alle nivåer muligheten til å lese og forstå tekst

Speech-tjenester

Samlede taletjenester for tale til tekst, tekst til tale og taleoversettelse

Talergjenkjennings TESTVERSJON

Bruk tale til å identifisere og bekrefte enkelttalere

Content Moderator

Automatisert bilde, tekst og videomoderering

Avviksdetektor TESTVERSJON

Enkelt legg funksjoner for avviksdeteksjon inn i appene dine.

Personalizer TESTVERSJON

En kunstig intelligens-tjeneste som leverer en personlig tilpasset brukeropplevelse

Er du klar til å superlade appen din?