Przetwarzanie obrazów

Wyodrębniaj rozbudowane informacje z obrazów w celu kategoryzowania i przetwarzania danych wizualnych oraz wykonuj wspomagane maszynowo moderowanie obrazów, aby ułatwić nadzorowanie swoich usług.

Analizowanie obrazu

Ta funkcja zwraca informacje o zawartości wizualnej znajdującej się na obrazie. Korzystając z tagowania, modeli specyficznych dla domeny i opisów w czterech językach identyfikuj zawartość i przypisuj jej etykiety bez wahania. Wykrywanie obiektów umożliwia pobieranie lokalizacji tysięcy obiektów na obrazie. Stosuj ustawienia zawartości dla dorosłych/pikantnej, aby ułatwić wykrywanie potencjalnej zawartości dla dorosłych. Identyfikuj typy obrazów i schematy kolorów na zdjęciach.

Zobacz, jak to działa

person
person
subway train
Nazwa funkcji: Wartość
Obiekty [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Tagi [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Opis { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Format obrazu "Jpeg"
Wymiary obrazu 462 x 600
Typ obrazu clipart 0
Typ rysunku 0
Czarno-biały false
Treści dla dorosłych false
Treści dla dorosłych — ocena 0.009112834
Erotyka false
Erotyka — ocena 0.0143244695
Kategorie [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Twarze []
Dominujący kolor tła
"Black"
Dominujący kolor pierwszego planu
"Black"
Kolor akcentu
#484C83

Chcesz to skompilować?

Teraz ogólnie dostępne: Odczytywanie tekstu drukowanego i pisma odręcznego na obrazach

Korzystaj z najnowocześniejszej technologii optycznego rozpoznawania znaków (OCR) w operacji odczytu, aby wykrywać osadzony tekst drukowany i pismo odręczne, wyodrębniać rozpoznane wyrazy do strumieni znaków z możliwością odczytu przez maszyny oraz wyszukiwać tekst. Rób zdjęcia tekstu, zamiast go przepisywać, aby oszczędzić czas i ułatwić pracę.

Zobacz, jak to działa

  1. Wersja zapoznawcza
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Wyniki pokazu są tylko do celów ilustracyjnych. Ze względu na drobne zmiany obrazu rzeczywiste wyniki interfejsu API mogą być inne.

Chcesz to skompilować?

Rozpoznawanie marek, osobistości i charakterystycznych elementów krajobrazu

Rozpoznawaj ponad 1 500 globalnych marek i logo, milion osobistości ze świata biznesu, polityki, sportu i rozrywki oraz 9 000 naturalnych i zbudowanych przez człowieka charakterystycznych elementów krajobrazu z całego świata.

Zobacz, jak to działa

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "fe522d83-a0e3-42d5-9e87-d1071b8f9d00",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "brands": []
}

Chcesz to skompilować?

Analiza filmów wideo prawie w czasie rzeczywistym

Analiza filmów wideo prawie w czasie rzeczywistym Używaj dowolnego interfejsu API przetwarzania obrazów z plikami filmów wideo, wyodrębniając klatki filmu wideo z urządzenia, a następnie wysyłając je do wybranych wywołań interfejsów API. Szybciej uzyskuj wyniki przetwarzania filmów wideo.

Skorzystaj z naszego przykładu w usłudze GitHub, aby rozpocząć pracę i skompilować własną aplikację.

Dowiedz się więcej

Zobacz, jak to działa

Chcesz to skompilować?

Generowanie miniatur

Generuj wysokiej jakości miniatury zajmujące niewiele miejsca na dysku na podstawie dowolnego obrazu i modyfikuj obrazy tak, aby najlepiej spełniały potrzeby dotyczące rozmiaru, kształtu i stylu. Stosuj inteligentne przycinanie, aby generować miniatury o innym współczynniku proporcji niż oryginalny obraz, ale zachowujące interesujący obszar.

Zobacz, jak to działa

Chcesz to skompilować?

"We can use the Computer Vision API to prove to our clients the reliability of the data, so they can be confident making important business decisions based on that information"

Leendert de Voogd, dyrektor generalny | Vigiglobe
vigiglobe

"It didn't take us long to realize Microsoft Cognitive Services had handed us a powerful set of computer-vision and artificial-intelligence tools that we could use to create great apps and new features for our customers in just a few hours"

John Fan, współzałożyciel i dyrektor naczelny | Cardinal Blue Software
Pic Collage

"Because the Cognitive Services APIs harness the power of machine learning, we were able to bring advanced intelligence into our product without the need to have a team of data scientists on hand"

Aaron Edell, naczelny właściciel produktu | GrayMeta
GrayMeta

"We found Cognitive Services to be the missing piece in the equation, the one that we needed to bring this solution to market and really revolutionize the way people look at video"

Katie McCann, wiceprezes ds. inżynierii produktów | Prism Skylabs
Prism Skylabs

"Microsoft Cognitive Services gives us a huge range of opportunities. It's a perfect match for us now, and in the future when we want to add more features to our app"

Jaan Apajalahti, dyrektor generalny | Blucup
Blucup

"Using the Cognitive Services APIs, it took us three months to develop a test pair of glasses that can translate text and images into speech, identify emotions, and describe scenery.If we had been working full time, we could have done it in two weeks"

Benoit Chirouter, dyrektor ds. badań i rozwoju | Pivothead
Pivothead

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Rozpoznawanie pisma odręcznego WERSJA ZAPOZNAWCZA

Oparta na sztucznej inteligencji usługa umożliwiająca rozpoznawanie zawartości w postaci pisma cyfrowego, na przykład pisma ręcznego, kształtów i układu pisanych odręcznie dokumentów

Indeksator wideo

Udostępnienie analiz wideo

Niestandardowe przetwarzanie obrazów

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Rozpoznawanie formularzy WERSJA ZAPOZNAWCZA

Napędzana przez sztuczną inteligencję usługa wyodrębniania dokumentów, która rozpoznaje formularze

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Czytnik immersyjny WERSJA ZAPOZNAWCZA

Zwiększ możliwości użytkowników w każdym wieku i z różnymi zdolnościami w zakresie czytania i rozumienia tekstu

Usługi mowy

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

Rozpoznawanie osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i wideo

Narzędzie do wykrywania anomalii WERSJA ZAPOZNAWCZA

Łatwo dodawaj funkcje wykrywania anomalii do aplikacji.

Personalizacja WERSJA ZAPOZNAWCZA

Usługa sztucznej inteligencji udostępniająca spersonalizowane środowisko użytkownika

Chcesz zrewolucjonizować swoją aplikację?