Hopp over navigasjon

API for visuelt innhold

Utvinn rik informasjon fra bilder for å kategorisere og behandle visuelle data – og maskinassistert moderering av bilder for å kuratere tjenestene dine.

Analyser et bilde

Denne funksjonen returnerer informasjon om visuelt innhold i et bilde. Bruk tagging, beskrivelser og domenespesifikke modeller for å identifisere innhold og merke det med full trygghet. Bruk innstillinger for rasistisk innhold eller innhold uegnet for barn for å aktivere automatiske begrensninger av slikt innhold. Identifiser bildetyper og fargeskjemaer i bilder.

Se i praksis

Funksjonsnavn: Verdi
Beskrivelse { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833099365 } ] }
Tagger [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
Bildeformat "Jpeg"
Bildedimensjoner 462 x 600
Ferdig tegningstype 0
Linjetegningstype 0
Svart-hvitt false
Vokseninnhold false
Voksenscore 0.0147124995
Voksent false
Voksenscore 0.0162802152
Kategorier [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Ansikter []
Dominant bakgrunnsfarge
"Black"
Dominant forgrunnsfarge
"Black"
Aksentfarge
#484C83

Vil du bygge dette?

Les tekst i bilder

Optisk tegngjenkjenning (OCR) gjenkjenner tekst i et bilde, og henter ut de gjenkjente ordene til en maskinlesbar tegnstrøm. Analyser bilder for å gjenkjenne innebygd tekst, opprette tegnstrømmer og aktivere søk. Spar tid ved å ta bilder av tekst i stedet for å kopiere.

Se i praksis

  1. Testversjon
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Når du laster opp data for denne demoen, samtykker du i at Microsfot kan lagre den og bruke den til å gjøre Microsoft-tjenester bedre, inkludert denne API-en. For å hjelpe med å beskytte personvernet utfører vi tiltak for å avidentifisere dataene dine og holde dem sikre. Vi kommer ikke til å publisere dataene dine eller la andre mennesker bruke dem.

Vil du bygge dette?

Testversjon: Les håndskrevet tekst fra bilder

Ved hjelp av denne teknologien (håndskrevet OCR) kan du oppdage og trekke ut håndskrevet tekst fra notater, brev, stiler, tavler, skjemaer osv. Den fungerer med forskjellige overflater og bakgrunner, for eksempel hvitbøker, gule lapper og tavler.

Gjenkjenning av håndskrevet tekst sparer tid og arbeid, og kan gjøre deg mer produktiv ved at du kan ta bilder av tekst i stedet for å måtte transkribere den. Det blir mulig å digitalisere notater slik at du senere kan kjøre raske og enkle søk. Det reduserer også papirrot.

Merk: denne teknologien er for øyeblikket i testversjon, og er bare tilgjengelig for engelsk tekst.

Hvis du skal prøve denne demonstrasjonsversjonen av optisk tegngjenkjenning, må du laste opp et lokalt lagret bilde eller oppgi URL-adressen til et bilde. Vi lagrer ikke bildene du bruker i denne demonstrasjonen med mindre du gir tillatelse til det.

Se i praksis

  1. Testversjon
  2. JSON

Our greatest glory is not

in never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "Our greatest glory is not",
        "words": [
          {
            "boundingBox": [
              47,
              206,
              161,
              205,
              157,
              274,
              43,
              275
            ],
            "text": "Our"
          },
          {
            "boundingBox": [
              179,
              205,
              350,
              204,
              346,
              273,
              175,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              381,
              204,
              509,
              203,
              505,
              272,
              377,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              526,
              203,
              588,
              203,
              584,
              272,
              522,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              588,
              203,
              680,
              202,
              676,
              271,
              584,
              272
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "in never failing ,",
        "words": [
          {
            "boundingBox": [
              507,
              300,
              553,
              300,
              564,
              376,
              518,
              376
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              579,
              300,
              693,
              300,
              704,
              376,
              590,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              712,
              300,
              872,
              300,
              883,
              376,
              723,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              864,
              300,
              902,
              300,
              913,
              376,
              875,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              125,
              417,
              213,
              418,
              200,
              491,
              112,
              490
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              217,
              418,
              273,
              418,
              260,
              491,
              204,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              297,
              418,
              433,
              419,
              420,
              492,
              284,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              461,
              419,
              589,
              420,
              576,
              492,
              448,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              612,
              407,
              718,
              409,
              709,
              470,
              603,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              753,
              409,
              825,
              410,
              815,
              471,
              743,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              863,
              410,
              973,
              412,
              964,
              472,
              853,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Vil du bygge dette?

Gjenkjenn kjendiser og landemerker

Modellene for kjendiser og landemerker er eksempler på domenespesifikke modeller. Vår gjenkjenningsmodell for kjendiser kan kjenne igjen 200 000 kjendiser fra forretningsverden, politikk, sport og underholdning. Vår gjenkjenningsmodell for landemerker gjenkjenner 9000 naturlige og menneskeskapte landemerker fra hele verden. Domenespesifikke modeller er funksjoner som stadig utvikles videre innen API-er for visuelt innhold.

Se i praksis

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99999558925628662
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.9903275009959599
      }
    ]
  },
  "requestId": "54cc83a0-361a-40df-a713-46a04f0d8193",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 48,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Vil du bygge dette?

Analyser video i nær sanntid

Analyser video i tilnærmet sanntid. Bruk en av API-ene for visuelt innhold sammen med videofilene ved å hente ut videobilder fra enheten og deretter sende disse bildene til de ønskede API-anropene. Får resultater fra videoene dine raskere.

Bruk eksempelet vårt på GitHub for å komme igang med å bygge din egen app.

Les mer

Se i praksis

Vil du bygge dette?

Opprett et miniatyrbilde

Opprett miniatyrbilder av høy kvalitet som er effektive for lagring basert på et hvilket som helst inndatabilde. Bruk miniatyrbilder for å redigere bilder slik at de passer dine behov i henhold til størrelse, format og stil. Bruk smart beskjæring for å lage miniatyrbilder som varierer fra størrelsesforholdet til det originale bildet, men likevel beholder det viktigste.

Se i praksis

Når du laster opp data for denne demoen, samtykker du i at Microsfot kan lagre den og bruke den til å gjøre Microsoft-tjenester bedre, inkludert denne API-en. For å hjelpe med å beskytte personvernet utfører vi tiltak for å avidentifisere dataene dine og holde dem sikre. Vi kommer ikke til å publisere dataene dine eller la andre mennesker bruke dem.

Vil du bygge dette?

Utforsk API-ene for Cognitive Services

API for visuelt innhold

Hent ut brukbar informasjon fra bilder

Content Moderator

Automatisert bilde, tekst og videomoderering

Følelses-API TESTVERSJON

Tilpass brukeropplevelsene med følelsesgjenkjenning

Ansikts-API

Registrer, identifiser, analyser, ordne og tagg ansikter i bilder

Video Indexer TESTVERSJON

Lås opp videoinnsikter

Custom Vision Service TESTVERSJON

Du kan enkelt tilpasse dine egne, moderne datamodeller for visuelt innhold til dine spesielle behov

Tekstanalyse-API

Evaluer enkelt følelser og emner for å forstå hva brukerne vil ha

Nettspråkmodell-API TESTVERSJON

Bruk mulighetene i prediktive språkmodeller som er lært opp med data i nettskala

Språkforståelse (LUIS)

Lær appene dine å forstå kommandoer fra brukerne

Stavekontroll-API for Bing

Finn og rett stavefeil i appen din

API for tekstoversetter

Utfør maskinoversettelse helt enkelt med en enkel REST-API-oppkalling

Linguistic Analysis API TESTVERSJON

Forenkle komplekse språkkonsepter og del opp tekst med Linguistic Analysis API

Bing tale-API

Konverter tale til tekst og tilbake igjen for å forstå brukernes hensikter

Talergjenkjennings-API TESTVERSJON

Bruk tale til å identifisere og godkjenne enkelttalere

Custom Speech Service TESTVERSJON

Løs talegjenkjenningsproblemer knyttet til talemåte, bakgrunnsstøy og ordforråd

API for taleoversetter

Utfør taleoversettelse i sanntid helt enkelt med en enkel REST-API-oppkalling

QnA Maker-API

Trekk ut informasjonen, og produser svar som er enkle å forstå og har en konversasjonslignende tone

Custom Decision Service

En skybasert, kontekstuell API for beslutninger som blir stadig bedre med erfaring

Prosjekt bevegelse

Bevegelsesbaserte kontroller

Prosjekt Knowledge Exploration Service

Tidligere kalt Knowledge Exploration Service API

Sporing av prosjekthendelse

Hendelse knyttet til Wikipedia-oppføringer

Prosjekt Academic Knowledge

Tidligere kalt Academic Knowledge

Prosjekt lokal innsikt

Plasseringsinnsikter

Prosjekt Entity Linking

Tidligere kalt Entity Linking Intelligence Service API

Er du klar til å superlade appen din?