Interfejs API wizualizacji komputerowej

Wyodrębniaj rozbudowane informacje z obrazów w celu kategoryzowania i przetwarzania danych wizualnych — oraz wspomaganego maszynowo moderowania obrazów, aby ułatwić nadzorowanie swoich usług.

Analizowanie obrazu

Ta funkcja zwraca informacje o zawartości wizualnej znajdującej się na obrazie. Korzystając z tagowania, opisów i modeli specyficznych dla domeny identyfikuj zawartość i przypisuj jej etykiety bez wahania. Stosuj ustawienia zawartości dla dorosłych/pikantnej, aby umożliwić automatyczne ograniczanie zawartości dla dorosłych. Identyfikuj typy obrazów i schematy kolorów na zdjęciach.

Zobacz, jak to działa

Płeć Male
Wiek 36
Nazwa funkcji: Wartość
Opis { "tags": [ "water", "swimming", "sport", "pool", "person", "man", "frisbee", "ocean", "blue", "bird", "riding", "top", "standing", "wave", "young", "body", "large", "game", "glass", "pond", "playing", "board", "catch", "clear", "boat", "white" ], "captions": [ { "text": "a man swimming in a pool of water", "confidence": 0.8909298 } ] }
Tagi [ { "name": "water", "confidence": 0.9997857 }, { "name": "swimming", "confidence": 0.955619633 }, { "name": "sport", "confidence": 0.953807831 }, { "name": "pool", "confidence": 0.9515978 }, { "name": "person", "confidence": 0.889862537 }, { "name": "water sport", "confidence": 0.664259 } ]
Format obrazu "Jpeg"
Wymiary obrazu 462 x 600
Typ obrazu clipart 0
Typ rysunku 0
Czarno-biały false
Treści dla dorosłych false
Treści dla dorosłych — ocena 0.07518345
Erotyka false
Erotyka — ocena 0.1814024
Kategorie [ { "name": "people_swimming", "score": 0.98046875 } ]
Twarze [ { "age": 36, "gender": "Male", "faceRectangle": { "top": 133, "left": 298, "width": 121, "height": 121 } } ]
Dominujący kolor tła
"White"
Dominujący kolor pierwszego planu
"Grey"
Kolor akcentu
#19A4B2

Chcesz to skompilować?

Odczytywanie tekstu z obrazów

Optyczne rozpoznawanie znaków (OCR) wykrywa tekst i wyodrębnia rozpoznane słowa do strumienia znaków, który może być odczytywany przez maszyny. Analizuj obrazy w celu wykrywania osadzonego tekstu, generowania strumieni znaków i umożliwiania wyszukiwania. Rób zdjęcia tekstu, zamiast go przepisywać, aby oszczędzić czas i ułatwić pracę.

Zobacz, jak to działa

  1. Wersja zapoznawcza
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Przekazując dane do tego pokazu, wyrażasz zgodę na przechowywanie ich przez firmę Microsoft i wykorzystanie w celu ulepszenia usług firmy Microsoft, w tym tego interfejsu API. Aby pomóc chronić Twoją prywatność, podejmujemy kroki w celu cofnięcia identyfikacji Twoich danych i przechowywania ich w bezpieczny sposób. Nie będziemy publikować Twoich danych ani udostępniać ich innym osobom do użytku.

Chcesz to skompilować?

Wersja zapoznawcza: Odczytywanie tekstu odręcznego z obrazów

Ta technologia (optyczne rozpoznawanie znaków pisma odręcznego) umożliwia wykrywanie i wyodrębnianie tekstu odręcznego z notatek, listów, esejów, tablic, formularzy itd. Działa ona na różnych powierzchniach i tłach, takich jak biały papier, żółte karteczki samoprzylepne i tablice.

Rozpoznawanie tekstu odręcznego oszczędza czas i pracę, a także może zwiększyć produktywność dzięki opcji przedstawiania tekstu w postaci obrazu zamiast jego transkrypcji. Funkcja ta pozwala na przekształcanie notatek do postaci cyfrowej, a przez to na implementowanie szybkiego i prostego wyszukiwania. Zmniejsza ona również nieład związany z dużą ilością papieru.

Uwaga: ta technologia jest obecnie dostępna w wersji zapoznawczej i tylko w przypadku tekstu w języku angielskim.

Aby wypróbować ten pokaz optycznego rozpoznawania znaków, przekaż obraz przechowywany lokalnie lub podaj adres URL obrazu. Nie przechowujemy obrazów udostępnionych na potrzeby tego pokazu, o ile nie udzielisz nam odpowiedniego pozwolenia.

Zobacz, jak to działa

  1. Wersja zapoznawcza
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Chcesz to skompilować?

Rozpoznawanie osobistości i charakterystycznych elementów krajobrazu

Modele osobistości i charakterystycznych elementów krajobrazu to przykłady modeli specyficznych dla domeny. Nasz model rozpoznawania osobistości rozpoznaje 200 tys. osobistości z różnych dziedzin: biznes, polityka, sport i rozrywka. Liczba charakterystycznych elementów krajobrazu z całego świata (zarówno naturalnych, jak i zbudowanych przez człowieka) rozpoznawanych przez nasz model rozpoznawania charakterystycznych elementów krajobrazu to 9000. Modele specyficzne dla domeny to ciągle rozwijana funkcja interfejsu API przetwarzania obrazów.

Zobacz, jak to działa

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "c8149c58-daaa-4829-9e2d-ff8ef3fde9a9",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Chcesz to skompilować?

Analiza filmów wideo prawie w czasie rzeczywistym

Analiza filmów wideo prawie w czasie rzeczywistym Używaj dowolnego interfejsu API przetwarzania obrazów z plikami filmów wideo, wyodrębniając klatki filmu wideo z urządzenia, a następnie wysyłając je do wybranych wywołań interfejsów API. Szybciej uzyskuj wyniki przetwarzania filmów wideo.

Skorzystaj z naszego przykładu w usłudze GitHub, aby rozpocząć pracę i skompilować własną aplikację.

Dowiedz się więcej

Zobacz, jak to działa

Chcesz to skompilować?

Generowanie miniatur

Generuj wysokiej jakości miniatury zajmujące niewiele miejsca na dysku na podstawie dowolnego obrazu wejściowego. Korzystając z funkcji generowania miniatur, modyfikuj obrazy tak, aby najlepiej spełniały potrzeby dotyczące rozmiaru, kształtu i stylu. Stosuj inteligentne przycinanie, aby generować miniatury o innym współczynniku proporcji niż oryginalny obraz, ale zachowujące interesujący obszar.

Zobacz, jak to działa

Przekazując dane do tego pokazu, wyrażasz zgodę na przechowywanie ich przez firmę Microsoft i wykorzystanie w celu ulepszenia usług firmy Microsoft, w tym tego interfejsu API. Aby pomóc chronić Twoją prywatność, podejmujemy kroki w celu cofnięcia identyfikacji Twoich danych i przechowywania ich w bezpieczny sposób. Nie będziemy publikować Twoich danych ani udostępniać ich innym osobom do użytku.

Chcesz to skompilować?

Poznaj interfejsy API usług Cognitive Services

Interfejs API wizualizacji komputerowej

Wyodrębnianie określonych informacji z obrazów

Interfejs API twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Interfejs API rozpoznawania emocji WERSJA ZAPOZNAWCZA

Personalizowanie środowisk użytkowników dzięki możliwości rozpoznawania emocji

Interfejs API wideo WERSJA ZAPOZNAWCZA

Inteligentne przetwarzanie obrazu wideo

Custom Vision Service WERSJA ZAPOZNAWCZA

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Indeksator wideo WERSJA ZAPOZNAWCZA

Udostępnienie analiz wideo

Language Understanding Intelligent Service WERSJA ZAPOZNAWCZA

Naucz aplikacje rozpoznawać polecenia użytkowników

Interfejs API analizy tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Interfejs API sprawdzania pisowni (Bing)

Wykrywaj i poprawiaj błędy pisowni w aplikacji

Interfejs API tekstu usługi Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

Interfejs API modelu języka sieci Web WERSJA ZAPOZNAWCZA

Korzystanie z możliwości predykcyjnych modeli języków wytrenowanych na danych w skali sieci Web

Interfejs API analizy językowej WERSJA ZAPOZNAWCZA

Uprość złożone koncepcje językowe i analizuj tekst za pomocą interfejsu API analizy językowej

Interfejs API tłumaczenia mowy w usłudze Translator

Łatwe tłumaczenie mowy w czasie rzeczywistym dzięki prostemu wywołaniu interfejsu API REST

Interfejs API rozpoznawania osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i uwierzytelniaj osoby mówiące na podstawie głosu

Interfejs API rozpoznawania mowy Bing

Konwertowanie mowy na tekst i tekstu na mowę w celu zrozumienia intencji użytkownika

Custom Speech Service WERSJA ZAPOZNAWCZA

Pokonaj bariery rozpoznawania mowy, takie jak styl wypowiedzi, hałas w tle czy słownictwo

Interfejs API zaleceń WERSJA ZAPOZNAWCZA

Przewidywanie i polecanie elementów zgodnych z preferencjami klientów

Academic Knowledge API WERSJA ZAPOZNAWCZA

Skorzystaj z ogromu zawartości akademickiej na wykresie Microsoft Academic Graph

Knowledge Exploration Service WERSJA ZAPOZNAWCZA

Uruchom środowiska obsługi interaktywnego wyszukiwania przez dane ze strukturą za pośrednictwem danych wejściowych języka naturalnego

Interfejs API usługi QnA Maker WERSJA ZAPOZNAWCZA

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Interfejs API usługi Entity Linking Intelligence Service WERSJA ZAPOZNAWCZA

Zwiększ możliwości połączeń między danymi swojej aplikacji za pomocą rozpoznawania i rozróżniania nazwanych jednostek

Custom Decision Service WERSJA ZAPOZNAWCZA

Chmurowy interfejs API służący do kontekstowego podejmowania decyzji, który mądrzeje wraz z doświadczeniem

Projekt Prague

Sterowanie oparte na gestach

Projekt Cuzco

Zdarzenie skojarzone z wpisami w witrynie Wikipedia

Projekt Nanjing

Obliczenia izochron

Projekt Abu Dhabi

Macierz odległości

Projekt Johannesburg

Logistyka tras

Projekt Wollongong

Analizy lokalizacji

Chcesz zrewolucjonizować swoją aplikację?