Pomiń nawigację

Przetwarzanie obrazów

Usługa sztucznej inteligencji służąca do analizowania zawartości obrazów i filmów wideo

Wyodrębnianie szczegółowych informacji z obrazów i wideo

Zwiększaj możliwości odnajdywania zawartości, automatyzuj wyodrębnianie tekstu, analizuj wideo w czasie rzeczywistym i twórz produkty, których może używać więcej osób, dodając do swoich aplikacji możliwości przetwarzania obrazów w chmurze dzięki usłudze przetwarzania obrazów będącej częścią usług Azure Cognitive Services. Używaj przetwarzania danych wizualnych do oznaczania zawartości etykietami obiektów i pojęć, wyodrębniania tekstu, generowania opisów obrazów, moderowania zawartości i rozumienia ruchów osób w przestrzeniach fizycznych. Nie jest wymagana żadna wiedza na temat uczenia maszynowego.

Wyodrębnianie tekstu (OCR)

Wyodrębniaj tekst drukowany i napisany odręcznie z obrazów oraz dokumentów o mieszanych językach i stylach pisania.

Rozpoznawanie obrazów

Korzystaj z obszernej ontologii obejmującej ponad 10 000 pojęć i obiektów, aby generować wartość z zasobów wizualnych.

Analiza przestrzenna

Analizuj, w jaki sposób ludzie przemieszczają się w danej przestrzeni w czasie rzeczywistym, aby zliczać osoby w niej przebywające oraz sprawdzać zachowanie dystansu i wykrywać maseczki.

Elastyczne wdrożenia

Uruchamiaj usługę Computer Vision w chmurze lub na urządzeniach brzegowych w kontenerach.

W łatwy sposób stosuj przełomową technologię przetwarzania obrazów

Zastosuj najnowocześniejszą technologię rozpoznawania filmów wideo i zdjęć w swoich aplikacjach, korzystając z prostego wywołania interfejsu API.

Zobacz, jak to działa

person
person
subway train
Nazwa funkcji: Wartość
Obiekty [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Tagi [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955776 }, { "name": "station", "confidence": 0.9796659 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.83886826 }, { "name": "clothing", "confidence": 0.5561272 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911558 } ]
Opis { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Format obrazu "Jpeg"
Wymiary obrazu 462 x 600
Czarno-biały false
Treści dla dorosłych false
Treści dla dorosłych — ocena 0.009112839
Gory false
Gore Score 0.0461505651
Erotyka false
Erotyka — ocena 0.0143244788
Kategorie [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Twarze []
Dominujący kolor tła
"Black"
Dominujący kolor pierwszego planu
"Black"
Kolor akcentu
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.83886826
    },
    {
      "name": "clothing",
      "confidence": 0.5561272
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911558
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "c9f686de-e084-44db-a6dd-dbfe0923e983",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.83886826
    },
    {
      "name": "clothing",
      "confidence": 0.5561272
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911558
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "c9f686de-e084-44db-a6dd-dbfe0923e983",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Przekształcaj swoje procesy

Automatycznie identyfikuj ponad 10 000 obiektów i pojęć na obrazach. Wyodrębniaj tekst drukowany i napisany odręcznie z wielu typów obrazów i dokumentów, wykorzystując obsługę wielu języków i mieszanych stylów pisania. Zastosuj te funkcje przetwarzania obrazów, aby usprawnić procesy, takie jak automatyzacja procesów mechanicznych i zarządzanie zasobami cyfrowymi.

Maksymalizowanie wartości przestrzeni fizycznej w organizacji

Understand how people move in a physical space, whether it's an office or a store. Use the spatial analysis feature to create apps that can count people in a room, trace paths, understand dwell times in front of a retail display, and determine wait times in queues. Build solutions that enable occupancy management and social distancing, face mask compliance, optimize in-store and office layouts, and accelerate the checkout process. Run the service across multiple cameras and sites.

Dowiedz się więcej o tej funkcji

Wdrażanie z dowolnego miejsca z chmury do brzegu

Uruchamiaj usługę Computer Vision w chmurze lub lokalnie w kontenerach. Zastosuj ją do różnych scenariuszy, takich jak badanie obrazu w rekordzie opieki zdrowotnej, wyodrębnianie tekstu poufnych dokumentów lub analiza sposobu poruszania się osób po sklepie, w których bezpieczeństwo danych i niskie opóźnienia są najważniejsze.

Dowiedz się o usłudze Computer Vision w ramach kontenerów

Tworzenie z wykorzystaniem wiodących w branży zabezpieczeń platformy Azure

  • Firma Microsoft inwestuje ponad USD 1 billion rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.

  • Zatrudniamy ponad 3500 ekspertów w dziedzinie zabezpieczeń, którzy są skoncentrowani na ochronie danych i prywatności.

  • W porównaniu z innymi dostawcami usług w chmurze platforma Azure ma więcej certyfikatów w zakresie zgodności. Wyświetl pełną listę.

Światowej klasy przetwarzanie obrazów w konkurencyjnych cenach

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Za usługę Computer Vision płacisz zgodnie z rzeczywistym użyciem na podstawie liczby transakcji.

Wprowadzenie do usługi Computer Vision w 3 krokach

Uzyskaj błyskawiczny dostęp i środki w wysokości $200, zakładając bezpłatne konto platformy Azure.

Zaloguj się do witryny Azure Portal i dodaj usługę Computer Vision.

Dowiedz się, jak osadzić usługę Computer Vision, korzystając z przewodników Szybki start i dokumentacji.

Dokumentacja i zasoby

Rozpocznij

Przeczytaj dokumentację

Weź udział w kursach Microsoft Learn

Zobacz przykłady kodu

Zapoznaj się z przykładową aplikacją

Często zadawane pytania dotyczące usługi Computer Vision

  • Usługa przetwarzania obrazów oraz inne oferty usług Azure Cognitive Services gwarantują dostępność na poziomie 99,9%. W warstwie Bezpłatna nie jest dostępna umowa SLA. Zobacz szczegóły umowy SLA.
  • Nie. Firma Microsoft automatycznie usuwa obrazy i filmy wideo po przetworzeniu i nie używa Twoich danych do trenowania modeli bazowych w celu ich usprawnienia. Dane wideo nie opuszczają Twojego środowiska lokalnego ani nie są przechowywane na urządzeniach brzegowych, na których jest uruchomiony kontener. Dowiedz się więcej o zachowaniu poufności informacji i warunkach użytkowania.
  • Po wyodrębnieniu tekstu z obrazów i filmów wideo przy użyciu przetwarzania obrazów możesz skorzystać z analizy tekstu, aby przeanalizować tonację, translatora, aby przetłumaczyć tekst na żądany język, lub czytnika immersyjnego, aby odczytać tekst na głos, ułatwiając do niego dostęp. Dodatkowe funkcje związane z przetwarzaniem obrazów obejmują usługi Rozpoznawanie formularzy do wyodrębniania par klucz-wartość i tabel z dokumentów, Face do wykrywania i rozpoznawania twarzy na obrazach, Custom Vision do łatwego utworzenia własnego modelu przetwarzania obrazów od podstaw oraz Content Moderator do wykrywania niepożądanego tekstu lub obrazów.
  • Nie. Analiza przestrzenna wykrywa i lokalizuje obecność człowieka w filmach wideo i danych wyjściowych przy użyciu pola ograniczenia wokół ciała ludzkiego. Modele sztucznej inteligencji nie wykrywają twarzy ani nie określają tożsamości czy danych demograficznych poszczególnych osób.
  • Modele sztucznej inteligencji analizy przestrzennej wykrywają i śledzą ruchy w strumieniu wideo na podstawie algorytmów, które identyfikują obecność co najmniej jednej osoby przez pole ograniczenia ciała. Dla każdego ruchu wykrytego w polu ograniczenia w strefie pola widzenia kamery modele sztucznej inteligencji zwracają dane wyjściowe zdarzenia w tym: współrzędne pola ograniczenia ciała osoby, typ zdarzenia (na przykład wejście do strefy lub wyjście z niej albo kierunkowe przecięcie linii), identyfikatory pseudonimowe do śledzenia pola ograniczenia i wskaźnik pewności wykrywania. Te dane zdarzenia są wysyłane do Twojego własnego wystąpienia usługi Azure IoT Hub.

Wszystko gotowe — utwórz bezpłatne konto platformy Azure