Что такое глубокое обучение?

Глубокое обучение — это тип машинного обучения, который с помощью искусственных нейронных сетей обеспечивает цифровым системам возможность обучаться и принимать решения на основе неструктурированных данных без меток.

Машинное обучение в целом позволяет ИИ-системам обучаться на основе полученного опыта работы с данными, определять закономерности, составлять рекомендации и адаптироваться. Глубокое обучение, в частности, отвечает не только за реагирование на наборы правил, но и за создание цифровыми системами знаний на основе примеров, а также последующее использование этих знаний для имитации человеческой реакции, поведения и работы.

Почему глубокое обучение так важно

Специалисты по обработке и анализу данных с помощью программного обеспечения для глубокого обучения обучают компьютеры анализу больших и сложных наборов данных, выполнению сложных и нелинейных задач, а также реагированию на текст, голос или изображения, которое нередко бывает более быстрым и точным, чем у людей. Эти возможности имеют широкое практическое применение и лежат в основе многих современных инноваций. Например, глубокое обучение позволяет беспилотным автомобилям обрабатывать изображения и отличать пешеходов от других объектов на дороге. Кроме того, именно благодаря этой технологии устройства умных домов могут понимать ваши голосовые команды.

Важность глубокого обучения заключается в том, что оно способствует внедрению инноваций, расширению возможностей и поддержке актуальности процессов. По мере увеличения объемов данных, а также повышения мощности и доступности вычислительных ресурсов компании в сфере розничной торговли, здравоохранения, перевозок, производства, технологий и других секторах инвестируют в глубокое обучение все больше средств.

Принцип работы глубокого обучения

Глубокое обучение основано на использовании архитектур нейронных сетей на нескольких уровнях, высокопроизводительных модулей графической обработки, развернутых в облаке или в кластерах, а также больших объемов данных с метками для достижения очень высокого уровня точности распознавания текста, речи и изображений. Все это позволяет разработчикам создавать цифровые системы, обладающие интеллектом, подобным человеческому, и быстрее достигать результатов, сократив время обучения моделей от нескольких недель до нескольких часов.

Например, для обучения модели беспилотного автомобиля могут понадобиться видео длительностью в тысячи часов и миллионы изображений. Без глубокого обучения обучение такого уровня не удалось бы выполнить в большом масштабе.

Что собой представляет платформа глубокого обучения?

Упростить реализацию сложных моделей машинного обучения разработчики могут с помощью таких платформ глубокого обучения, как TensorFlow или PyTorch. Эти платформы упрощают сбор данных, на основе которых затем можно обучать нейронные сети. Кроме того, с этими платформами можно использовать ускорители, такие как среда выполнения ONNX. Это позволит повысить скорость обучения моделей и формирования выводов.

Обучение моделей машинного обучения

Есть различные стратегии и методы обучения для моделей глубокого обучения. Рассмотрим некоторые из них.

Контролируемое обучение

При контролируемом обучении алгоритм обучается на основе помеченных наборов данных. Это означает, что, когда алгоритм создает сведения о фрагменте информации, он может проверить правильность определения с помощью меток, которыми снабжены данные. При контролируемом обучении данные, на основе которых обучаются модели, должны предоставляться людьми, помечающими эти данные, чтобы их можно было использовать для обучения алгоритма.

Неконтролируемое обучение

При неконтролируемом обучении алгоритмы обрабатывают данные, не содержащие меток или сведений, которые алгоритм может использовать для проверки определений. Система сортирует и классифицирует данные на основе определенных ею самой закономерностей.

Обучение с подкреплением

С помощью обучения с подкреплением система решает задачи методом проб и ошибок, чтобы принять ряд последовательных решений и достичь предполагаемого результата даже в непростой среде. При обучении с подкреплением алгоритм использует для формирования определений не наборы данных, а информацию, собираемую из среды.

Глубокое обучение с подкреплением

Когда методы глубокого обучения и обучения с подкреплением объединяются, они образуют тип машинного обучения под названием "глубокое обучение с подкреплением". При глубоком обучении с подкреплением используется тот же механизм принятия решений методом проб и ошибок, а также комплексный процесс достижения целей, что и при обучении с подкреплением, но дополнительно применяются возможности глубокого обучения для обработки больших объемов неструктурированных данных и получения на их основе осмысленных результатов.

Для чего используется глубокое обучение?

У глубокого обучения широкий спектр вариантов использования на предприятиях в самых различных отраслях. Вот некоторые примеры областей, в которых часто используется глубокое обучение:

Распознавание изображений, речи и эмоций

Программное обеспечение глубокого обучения позволяет повысить точность распознавания изображений, речи и эмоций, выполнять поиск по фотографиям, использовать персональных цифровых помощников, автомобили с автономным управлением, средства общественной и цифровой безопасности, а также другие интеллектуальные технологии.

Специализированные возможности

Службы потоковой передачи, интернет-магазины и другие предприятия с помощью моделей глубокого обучения создают автоматизированные рекомендации по продуктам, фильмам, музыке и т. д., а также совершенствуют взаимодействие с клиентами на основе истории приобретений, предыдущего поведения и других данных.

Чат-боты

На современных высокоэффективных предприятиях на основе глубокого обучения создают активируемых текстом или голосом чат-ботов, которые отвечают на часто задаваемые вопросы, помогают с выполнением распространенных транзакций и отвечают за поддержку клиентов. Такие боты устраняют необходимость в работе целых команд агентов по обслуживанию и позволяют избежать очередей из ожидающих клиентов, давая автоматизированные, контекстно согласованные и полезные ответы.

Персональные цифровые помощники

Персональные цифровые помощники с голосовым управлением используют глубокое обучение для распознавания речи, а также реагирования на запросы и команды на естественном языке. Они могут даже отпускать остроумные замечания.

Автомобили с автономным управлением

Отрасль, неофициально представляющая средства ИИ и глубокого обучения, — создание автомобилей с автономным управлением. В таких автомобилях с помощью алгоритмов глубокого обучения за долю секунды обрабатывается несколько каналов динамических данных. При этом направление не запрашивается, а на непредвиденные события система реагирует быстрее, чем человек.

Многие компании с помощью программного обеспечения машинного обучения с открытым кодом внедряют в свои системы решения глубокого обучения.

Подробнее о машинном обучении с открытым кодом

Что собой представляют нейронные сети?

Искусственная нейронная сеть (ANN) — это цифровая архитектура, имитирующая когнитивные процессы человеческого мозга для моделирования сложных шаблонов, разработки прогнозов и надлежащего реагирования на внешнее воздействие. Для многих типов машинного обучения требуются структурированные данные, в отличие от нейронных сетей, которые могут интерпретировать события окружающей среды как доступные для обработки данные.

Когда вы читаете отчет, смотрите фильм, ведете автомобиль или нюхаете цветок, миллиарды нейронов в вашем мозге обрабатывают информацию с помощью крошечных электрических сигналов. Каждый нейрон обрабатывает входные данные, и результаты выводятся в следующий нейрон для последующей обработки. А затем мгновенно следует реакция: вы придумываете идею для бизнеса, смеетесь, нажимаете тормоз или наслаждаетесь запахом. В машинном обучении нейронные сети позволяют цифровым системам интерпретировать ситуации и реагировать на них практически так же.

Сеть ANN похожа на мозг, заполненный цифровыми нейронами, и, хотя большинство сетей ANN — это элементарные имитации реального механизма, они могут обрабатывать большие объемы нелинейных данных для решения сложных проблем, которые в ином случае потребовали бы вмешательства человека. Например, банковские аналитики с помощью ANN могут обрабатывать заявки на кредиты и прогнозировать вероятность неуплаты долга лицом, подавшим заявку.

Какие возможности предоставляют нейронные сети

В машинном обучении нейронные сети используются для обучения и моделирования сложных изменяющихся входных и выходных данных, определения скрытых связей и прогнозирования без ограничений на распределение данных. Модели нейронных сетей — это основа для многих приложений глубокого обучения, таких как средства компьютерного зрения и обработки естественного языка, которые могут помочь в защите от мошенничества, распознавании лиц или создании автомобилей тс автономным управлением.

Большинство предприятий на основе прогнозов принимают обоснованные бизнес-решения, а также формируют стратегии продаж, финансовые политики и подходы к использованию ресурсов. Но ограничения, свойственные традиционному прогнозированию, часто затрудняют разработку прогнозов для сложных динамических процессов с множеством базовых факторов, которые зачастую скрыты (например, цены на фондовой бирже). Модели нейронных сетей глубокого обучения помогают определить сложные нелинейные связи и смоделировать скрытые факторы, чтобы предприятия могли создавать точные прогнозы для большинства видов деятельности.

Распространенные нейронные сети

Есть десятки типов нейронных сетей ИИ, каждая из которых подходит для различных приложений глубокого обучения. Используйте сеть ANN, соответствующую вашим деловым и технологическим требованиям. Вот несколько примеров распространенных нейронных сетей ИИ:

Сверточная нейронная сеть (CNN)

С помощью CNN разработчики упрощают для систем ИИ преобразование изображений в цифровые матрицы. Сети CNN используются в основном для классификации изображений и распознавания объектов. Такие сети хорошо подходят для распознавания лиц и тем, а также анализа тональности.

Нейронная сеть обратной свертки (DNN)

Если сетевые сигналы высокой сложности либо большого объема теряются или свертываются с другими сигналами, DNN поможет найти их. Сети DNN полезны для обработки изображений с высоким разрешением и оценки оптического потока.

Генеративно-состязательная сеть (GAN)

С помощью GAN инженеры обучают модели создавать новые сведения или материалы, которые имитируют конкретные свойства учебных данных. Сети GAN помогают моделям определять даже небольшие различия между оригиналами и копиями для создания более достоверных копий. Приложения на основе GAN обеспечивают создание высококачественных изображений и видео, расширенное распознавание лиц и сверхвысокое разрешение.

Рекуррентная нейронная сеть (RNN)

RNN вводит данные в скрытые слои с заданной задержкой. Сетевые вычисления охватывают исторические данные в текущих состояниях, а входные данные более высокого уровня не влияют на размер модели. Сети RNN подходят для распознавания речи, расширенного прогнозирования, робототехники и других сложных рабочих нагрузок глубокого обучения.

Преобразователи

Преобразователи предназначены для управления последовательными входными данными. Но они не ограничиваются обработкой таких данных в последовательном порядке. Вместо этого преобразователи задействуют технику постоянного отслеживания. Этот метод позволяет моделям назначать различные уровни влияния различным частям входных данных, а также определять контекст для отдельных фрагментов данных в порядке их поступления. Таким образом повышается уровень параллелизма, что может ускорить обучение модели.

Сравнение машинного обучения и нейронных сетей

Хотя нейронные сети считаются подмножеством машинного обучения, между ними и обычными моделями машинного обучения есть существенные различия.

Начнем с того, что нейронные сети сложнее и могут работать более независимо, чем обычные модели машинного обучения. Например, нейронная сеть может определить, являются ли ее прогнозы и результаты точными, тогда как модели машинного обучения для такого вывода требуется, чтобы инженер ввел данные вручную.

Кроме того, нейронные сети структурированы так, что они могут самостоятельно продолжать обучение и принимать обоснованные решения. Модели же машинного обучения могут принимать решения только на основе того, чему они были обучены.

Начало работы с глубоким обучением в Azure

Обеспечьте поддержку распознавания изображений с помощью нейронных сетей или оптимизируйте обработку естественного языка с помощью быстрых, простых и точных моделей NLP BERT. Узнайте, как создавать, обучать и развертывать любые типы моделей глубокого обучения с использованием Машинного обучения Azure.

Подробнее

Обзор возможностей машинного обучения для специалистов по обработке и анализу данных

Узнайте, как создавать решения машинного обучения в масштабе облака в Azure и ознакомьтесь с инструментами машинного обучения для специалистов по обработке и анализу данных, а также инженеров по машинному обучению.

Подробнее

Избранные

ИИ + машинное обучение

Аналитика

Вычислительная среда

Контейнеры

Базы данных

DevOps

Средства для разработчиков

Гибридная и многооблачная среда

Удостоверение

Интеграция

Интернет вещей

Управление

Мультимедиа

Миграция

Смешанная реальность

Мобильные приложения

Работа в сети

Безопасность

Хранилище

Интернет

Виртуальный рабочий стол Windows

Примеры использования

Разработка приложения

Искусственный интеллект

Миграция и модернизация в облако

Данные и аналитика

Гибридное облако и инфраструктура