Пропустить навигацию

Что собой представляет компьютерное зрение?

Узнайте, что собой представляет компьютерное зрение, как оно работает и для чего используется.

Компьютерное зрение

Компьютерное зрение — это область компьютерных наук, которая стремится расширить возможности компьютеров по идентификации и определению объектов и людей на изображениях и видео. Как и другие типы ИИ, компьютерное зрение ориентируется на выполнение и автоматизацию задач, имитирующих человеческие возможности. В этом случае компьютерное зрение старается имитировать зрение и восприятие человека.

Спектр практического применения технологий компьютерного зрения обуславливает то, что оно стало центральным компонентом множества современных инноваций и решений. Рабочие нагрузки компьютерного зрения можно выполнять в облаке или локально.

Принципы работы компьютерного зрения

Приложения компьютерного зрения используют входные данные с сенсорных устройств, возможности ИИ, машинного обучения и глубокого обучения для имитации того, как работает человеческое зрение. Такие приложения работают на основе алгоритмов, обученных на огромных объемах визуальных данных или изображений в облаке. Они распознают образы в визуальных данных и с их помощью определяют содержимое, присутствующее на изображениях.

Анализ изображения с помощью технологий компьютерного зрения

  • Сенсорное устройство создает изображение. Сенсорное устройство часто представлено просто фотокамерой, но может быть видеокамерой, устройством медицинской визуализации или любым другим устройством, создающим изображение для анализа.
  • Изображение затем отправляется на устройство для анализа. Устройство для анализа использует возможности распознавания изображений для разбиения изображения на отдельные части, сравнения найденных образов с библиотекой известных образов и их сопоставления. Образом может быть что-то общее, например внешний вид объекта определенного типа, или же образ может быть основан на уникальных признаках, таких как черты лица.
  • Пользователь запрашивает определенную информацию об изображении, а анализирующее устройство предоставляет такие сведения по результатам анализа изображения.

Глубокое обучение и компьютерное зрение

Современные приложения компьютерного зрения все чаще используют для анализа изображений возможности глубокого обучения, а не статистические методы, как раньше. Глубокое обучение позволяет такому приложению выполнять определенный алгоритм, который называется нейронной сетью, позволяющий более точно выполнять анализ. Кроме того, при использовании глубокого обучения программа компьютерного зрения может сохранять информацию о каждом проанализированном изображении и с течением времени еще больше повышать точность.

Возможности компьютерного зрения

Существует три основные функции, с помощью которых программы компьютерного зрения обрабатывают изображения и возвращают информацию:

Система классифицирует объекты на изображении по определенной категории. Например, при классификации объектов компьютер может отличать людей от предметов, а также определять их количество.

Система идентифицирует определенный объект на фото, видео или изображении. Например, при идентификации объектов система может не только отличать людей на фото, но также анализировать их внешний вид для установления личности или признаков таких людей.

Система анализирует видео для обработки данных о расположении движущегося объекта со временем. Например, при отслеживании объектов камера на парковке может идентифицировать автомобили и предоставлять данные об их расположении и передвижении.

Система распознает буквы и цифры на изображениях и преобразует их в компьютерный текст, который может быть считан другими компьютерными приложениями или изменен пользователями.

Для чего используется компьютерное зрение

Компьютерное зрение — это мощная технология, которую можно сочетать с различными приложениями и сенсорными устройствами для реализации множества практических вариантов использования. Ниже приведены несколько типов приложений компьютерного зрения:

Упорядочение содержимого

Компьютерное зрение можно использовать для идентификации людей или объектов на фотографиях, а также для их классификации с учетом таких данных. Такие приложения для распознавания часто используются в системах хранения фотографий и в социальных сетях.

Извлечение текста

Оптическое распознавание символов можно использовать, чтобы упростить обнаружение содержимого в данных с большим объемом текста и реализовать обработку документов в сценариях автоматизированной обработки.

Дополненная реальность

Компьютерное зрение обнаруживает и отслеживает физические объекты в реальном времени. Эти сведения затем используются для реалистичного размещения виртуальных объектов в физической среде.

Сельское хозяйство

Изображения посевов, сделанные со спутников, дронов или самолетов, можно анализировать для сбора данных об урожае, обнаружения зарослей сорняков или определения дефицита питательных веществ.

Автономные транспортные средства

Беспилотные автомобили используют идентификацию и отслеживание объектов в реальном времени для сбора данных о ситуации вокруг автомобиля и построения маршрута.

Здравоохранение

Фотографии или изображения, созданные медицинскими устройствами, можно анализировать, чтобы упростить и ускорить врачам выявление проблем и постановку диагнозов и сделать их более точными.

Спорт

Обнаружение и отслеживание объектов используются для анализа игры и корректировки стратегии.

Производство

Компьютерное зрение может отслеживать производственное оборудование с целью обслуживания. Его также можно применять для контроля качества продукции и упаковки на производственных линиях.

Пространственный анализ

Система идентифицирует людей или объекты, такие как автомобили, в пространстве и отслеживает их передвижение.

Распознавание лиц

Компьютерное зрение может применяться для идентификации людей.

Знакомство с компьютерным зрением в Azure

Расширяйте возможности обнаружения содержимого, ускоряйте извлечение текста и создавайте продукты, доступные для большего числа пользователей, внедряя в свои приложения средства компьютерного зрения.

Подробнее