Pomiń nawigację

Czym jest przetwarzanie obrazów?

Dowiedz się, czym jest przetwarzanie obrazów, jak działa i do czego służy.

Przetwarzanie obrazów

Przetwarzanie obrazów to obszar informatyki, który koncentruje się na umożliwianiu komputerom identyfikowania i rozumienia obiektów i osób na obrazach i wideo. Podobnie jak w przypadku innych typów sztucznej inteligencji, przetwarzanie obrazów dąży do wykonywania i automatyzacji zadań, które replikują możliwości człowieka. W takim przypadku przetwarzanie obrazów pozwala replikować zarówno ludzki sposób widzenia, jak i sposób, w jaki ludzie rozpoznają to, co widzą.

Zakres praktycznych zastosowań technologii przetwarzania obrazów sprawia, że jest to centralny składnik wielu nowoczesnych innowacji i rozwiązań. Przetwarzanie obrazów może być uruchamiane w chmurze lub lokalnie.

Sposób działania przetwarzania obrazów

Aplikacje do przetwarzania obrazów wykorzystują dane wejściowe z urządzeń wykrywających, sztucznej inteligencji, uczenia maszynowego i uczenia głębokiego, aby replikować sposób działania ludzkiego wzroku. Aplikacje do przetwarzania obrazów działają w oparciu o algorytmy, które są trenowane na ogromnych ilościach danych wizualnych lub obrazów w chmurze. Rozpoznają one wzorce w danych wizualnych i używają tych wzorców do określenia zawartości innych obrazów.

Jak obraz jest analizowany z użyciem przetwarzania obrazów

  • Urządzenie wykrywające przechwytuje obraz. Urządzenie wykrywające jest często tylko aparatem, ale może być kamerą, urządzeniem do obrazowania medycznego lub dowolnym innym typem urządzenia, które przechwytuje obraz do analizy.
  • Obraz jest następnie wysyłany do urządzenia interpretującego. Urządzenie interpretujące używa rozpoznawania wzorców do podziału obrazu, porównywania wzorców na obrazie z posiadaną biblioteką znanych wzorców i określania, czy dowolna zawartość obrazu jest zgodna. Wzorzec może to być coś ogólnego, takiego jak wygląd określonego typu obiektu, lub może on być oparty na unikatowych cechach, takich jak rysy twarzy.
  • Użytkownik żąda określonych informacji o obrazie, a urządzenie interpretujące dostarcza żądanych informacji na podstawie analizy obrazu.

Uczenie głębokie i przetwarzanie obrazów

Nowoczesne aplikacje do przetwarzania obrazów odchodzą od statystycznych metod analizowania obrazu i coraz częściej polegają na tym, co jest znane jako uczenie głębokie. Dzięki uczeniu głębokiemu aplikacja do przetwarzania obrazów jest uruchamiana w ramach typu algorytmu zwanego siecią neuronową, która umożliwia dostarczanie jeszcze dokładniejszych analiz obrazu. Ponadto uczenie głębokie pozwala programowi do przetwarzania obrazów na przechowywanie informacji z każdego analizowanego obrazu, dzięki czemu staje się on tym dokładniejszy, im częściej jest używany.

Możliwości przetwarzania obrazów

Istnieją trzy główne funkcje przetwarzania obrazów i zwracania informacji przez komputerowe programy do przetwarzania obrazów:

System klasyfikuje obiekty na obrazie zgodnie ze zdefiniowaną kategorią. Na przykład za pomocą klasyfikacji obiektów komputer może odróżnić osoby od obiektów na zdjęciu i określić liczbę osób znajdujących się na zdjęciu.

System identyfikuje konkretny obiekt na zdjęciu, wideo lub obrazie. Na przykład za pomocą identyfikacji obiektów system mógłby nie tylko odróżnić osoby na zdjęciu, ale również przeanalizować ich wygląd, aby określić tożsamość lub cechy tych osób.

System analizuje wideo, aby przetworzyć lokalizację ruchomego obiektu w czasie. Na przykład dzięki śledzeniu obiektów kamera nadzorująca parking może identyfikować samochody na parkingu oraz dostarczać informacji dotyczących lokalizacji i ruchów tych samochodów w czasie.

System identyfikuje litery i cyfry na obrazach i konwertuje ten tekst na tekst kodowany maszynowo, który może być odczytywany przez inne aplikacje komputerowe lub edytowany przez użytkowników.

Do czego służy przetwarzanie obrazów

Przetwarzanie obrazów jest zaawansowaną funkcją i można ją łączyć z wieloma typami aplikacji i urządzeń wykrywających w celu wsparcia wielu praktycznych przypadków użycia. Poniżej przedstawiono tylko kilka różnych typów aplikacji do przetwarzania obrazów:

Organizacja zawartości

Przetwarzanie obrazów może służyć do identyfikacji osób lub obiektów na zdjęciach oraz organizowania ich na podstawie tej identyfikacji. Aplikacje do rozpoznawania zdjęć, takie jak te, są często używane w aplikacjach do przechowywania zdjęć i mediach społecznościowych.

Wyodrębnianie tekstu

Optyczne rozpoznawanie znaków może służyć do zwiększania możliwości wykrywania zawartości w przypadku informacji zawartych w dużych ilościach tekstu oraz do umożliwiania przetwarzania dokumentów na potrzeby scenariuszy automatyzacji przetwarzania przez roboty.

Rzeczywistość rozszerzona

Obiekty fizyczne są wykrywane i śledzone w czasie rzeczywistym przy użyciu przetwarzania obrazów. Te informacje są następnie używane do realistycznego umieszczania obiektów wirtualnych w środowisku fizycznym.

Rolnictwo

Obrazy upraw pozyskane z satelitów, dronów lub samolotów można analizować w celu monitorowania zbiorów, wykrywania występowania chwastów lub identyfikowania niedoborów w nawożeniu upraw.

Pojazdy autonomiczne

Samochody autonomiczne wykorzystują identyfikację i śledzenie obiektów w czasie rzeczywistym w celu zebrania informacji o tym, co się dzieje wokół samochodu i odpowiedniego poprowadzenia samochodu.

Służba zdrowia

Zdjęcia lub obrazy przechwycone przez inne urządzenia medyczne mogą zostać przeanalizowane w celu ułatwienia lekarzom identyfikacji problemów oraz szybszego i bardziej precyzyjnego diagnozowania.

Sport

Wykrywanie i śledzenie obiektów służy do analizy odtwarzania i strategii.

Produkcja

Przetwarzanie obrazów może monitorować maszyny produkcyjne do celów konserwacyjnych. Można go również użyć do monitorowania jakości produktu i pakowania na linii produkcyjnej.

Analiza przestrzenna

System identyfikuje osoby lub obiekty, takie jak samochody, w przestrzeni i śledzi ich ruchy w tej przestrzeni.

Rozpoznawanie twarzy

Przetwarzanie obrazów może służyć do identyfikowania osób.

Przeglądaj rozwiązania do przetwarzania obrazów na platformie Azure

Odkryj usługi Azure Cognitive Services — kompleksową rodzinę usług sztucznej inteligencji i poznawczych interfejsów API, które ułatwiają tworzenie inteligentnych aplikacji mających możliwości przetwarzania obrazów.

Poznaj przetwarzanie obrazów na platformie Azure

Zwiększaj możliwość odnajdywania zawartości, przyspieszaj wyodrębnianie tekstu i twórz produkty, których może używać więcej osób, dodając do swoich aplikacji możliwości przetwarzania obrazów.

Dowiedz się więcej