Computer Vision이란?

Computer Vision이 무엇이고 Computer Vision이 어떻게 작동하며 Computer Vision을 어디에 사용하는지에 대해 알아봅니다.

Computer Vision

Computer Vision은 컴퓨터가 이미지와 비디오에서 개체와 사람을 식별하고 파악할 수 있도록 지원하는 컴퓨터 과학 분야입니다. 다른 종류의 AI와 마찬가지로 Computer Vision도 사람의 능력을 복제하는 작업을 수행하고 자동화합니다. 이 경우 Computer Vision은 사람이 보는 방식 및 사람이 자신이 보는 것을 이해하는 방식을 모두 복제하려고 합니다.

Computer Vision 기술에 대한 다양한 실용적인 애플리케이션은 최근의 많은 혁신 및 솔루션에서 핵심 구성 요소입니다. Computer Vision은 클라우드 또는 온-프레미스에서 실행할 수 있습니다.

Computer Vision 작동 방식

Computer Vision 애플리케이션은 감지 디바이스의 입력, 인공 지능, 기계 학습, 딥 러닝을 사용하여 인간의 시각 시스템이 작동하는 방식을 복제합니다. Computer Vision 애플리케이션은 클라우드에 있는 대량의 시각적 데이터 또는 이미지에 대해 학습된 알고리즘에서 실행됩니다. 또한 이 시각적 데이터의 패턴을 인식하고 이를 사용하여 다른 이미지의 콘텐츠를 판별합니다.

Computer Vision을 사용하여 이미지를 분석하는 방법

  • 감지 디바이스는 이미지를 캡처합니다. 감지 디바이스는 카메라일 수도 있지만 비디오 카메라, 의료 이미징 디바이스 또는 분석을 위해 이미지를 캡처하는 기타 유형의 디바이스일 수도 있습니다.
  • 그러면 이미지가 해석 디바이스로 전송됩니다. 해석 디바이스는 패턴 인식을 사용하여 이미지를 분류하고 이미지의 패턴을 알려진 패턴의 라이브러리와 비교하고 이미지의 내용 중에 일치하는 부분이 있는지를 확인합니다. 패턴은 특정 개체 유형의 모양과 같이 일반적일 수도 있고 얼굴 특징과 같은 고유한 식별자를 기반으로 할 수도 있습니다.
  • 사용자는 이미지에 대한 특정 정보를 요청하고 해석 디바이스는 이미지의 분석을 기반으로 요청된 정보를 제공합니다.

딥 러닝 및 Computer Vision

최신 Computer Vision 애플리케이션은 이미지 분석을 위한 통계적 방법에서 벗어나 점점 딥 러닝이라고 하는 것에 의존합니다. 딥 러닝에서는 Computer Vision 애플리케이션이 신경망이라고 하는 알고리즘 유형에서 실행되므로 이미지에 대한 더욱 정확한 분석을 제공할 수 있습니다. 또한 딥 러닝에서는 Computer Vision 프로그램이 각 분석 이미지의 정보를 유지할 수 있으므로 더 많이 사용될수록 더욱더 정확해집니다.

Computer Vision 기능

Computer Vision 프로그램에서 이미지를 처리하고 정보를 반환하는 방법에 대한 세 가지 주요 기능이 있습니다.

시스템은 정의된 범주에 따라 이미지의 개체를 분류합니다. 예를 들어 개체 분류를 통해 컴퓨터는 사진에서 사람들을 개체와 구분하고 사진에 사람이 몇 명인지를 파악할 수 있습니다.

시스템은 사진, 비디오 또는 이미지에서 특정 개체를 식별합니다. 예를 들어 개체 식별을 통해 시스템은 사진에서 사람들을 구분할 수 있을 뿐만 아니라, 사람의 외모를 분석하여 정체성 또는 특성을 파악할 수 있습니다.

시스템은 비디오를 분석하여 시간이 지남에 따라 이동하는 개체의 위치를 처리합니다. 예를 들어 개체 추적을 통해 주차장 감시 카메라는 주차장의 자동차를 식별하고 시간에 따른 자동차의 위치 및 움직임에 대한 정보를 제공할 수 있습니다.

시스템은 이미지의 문자와 숫자를 식별하고 텍스트를 머신 인코딩 텍스트로 변환합니다. 이 텍스트를 다른 컴퓨터 애플리케이션에서 읽거나 편집할 수 있습니다.

Computer Vision의 사용처

Computer Vision은 강력한 기능이며 여러 유형의 애플리케이션 및 감지 디바이스와 결합하여 다양한 실용적인 사용 사례를 지원할 수 있습니다. 몇 가지 종류의 Computer Vision 애플리케이션을 소개하면 다음과 같습니다.

콘텐츠 구성

Computer Vision을 사용하여 사진에서 사람이나 개체를 식별하고 식별된 내용에 따라 구성할 수 있습니다. 이와 같은 사진 인식 애플리케이션은 사진 스토리지 및 소셜 미디어 애플리케이션에서 일반적으로 사용됩니다.

텍스트 추출

광학 인식은 대량의 텍스트에 포함된 정보에 대한 콘텐츠 검색 기능을 향상하고 로봇 처리 자동화 시나리오를 위한 문서 처리를 지원하는 데 사용할 수 있습니다.

증강 현실

Computer Vision을 사용하여 물리적 개체를 실시간으로 검색 및 추적합니다. 그런 다음 물리적 환경에 가상 개체를 현실적으로 배치하는 데 이 정보가 사용됩니다.

농업

인공위성, 드론 또는 비행기에서 촬영한 작물 이미지를 분석하여 수확을 모니터링하거나 잡초를 감지하거나 작물 영양 결핍을 식별할 수 있습니다.

자율 차량

자율 주행차는 실시간 개체 식별 및 추적을 사용하여 자동차 주위에서 발생하는 상황에 대한 정보를 수집하고 그에 따라 자동차를 주행시킵니다.

의료

의사가 문제를 식별하고 더 빠르고 정확하게 진단하도록 돕기 위해 다른 의료 디바이스로 캡처한 사진이나 이미지를 분석할 수 있습니다.

스포츠

개체 감지 및 추적은 경기 및 전략 분석에 사용됩니다.

제조

Computer Vision은 유지 관리 목적으로 제조 기계를 모니터링할 수 있습니다. 제품 품질 및 제조 라인의 패키지를 모니터링하는 데 사용할 수도 있습니다.

공간 분석

시스템에서는 사람 또는 개체(예: 자동차)를 공간에서 식별하고 해당 공간 내에서의 이동을 추적합니다.

얼굴 인식

Computer Vision을 적용하여 개인을 식별할 수 있습니다.

Azure Computer Vision 솔루션 찾아보기

Computer Vision 기능을 사용하여 인텔리전트 앱을 더 쉽게 빌드할 수 있도록 하는 포괄적인 AI 서비스 및 인지 API 제품군인 Azure Cognitive Services에 대해 알아보세요.

Azure에서 Computer Vision 살펴보기

앱에 비전 기능을 포함하여 콘텐츠 검색 기능을 향상하고, 텍스트 추출을 가속하며, 더 많은 사람이 사용할 수 있는 제품을 만드세요.

자세한 내용