This is the Trace Id: d881c3be235b95c9c1b454c60642c461
Перейти к основному контенту
Azure

Что такое глубокое обучение?

Узнайте о том, как глубокое обучение использует искусственные нейронные сети, почему глубокое обучение важно и о различных типах моделей глубокого обучения.

Определение глубокого обучения

Глубокое обучение — это тип   машинного обучения   , который использует искусственные нейронные сети, чтобы цифровые системы могли обучаться и принимать решения на основе неструктурированных, немаркированных данных.

Машинное обучение обучает системы ИИ извлекать уроки из полученного опыта работы с данными, распознавать закономерности, давать рекомендации и адаптироваться. Вместо того чтобы просто реагировать на наборы правил, системы глубокого обучения формируют знания на основе примеров, а затем используют эти знания, чтобы реагировать, вести себя и действовать подобно людям.

Основные выводы

  • Глубокое обучение — это тип машинного обучения, который облегчает обучение и принятие решений в цифровых системах.
  • Глубокое обучение основано на архитектурах нейронных сетей, имитирующих функциональность человеческого мозга.
  • Разработчики используют фреймворки глубокого обучения, такие как TensorFlow или PyTorch, чтобы упростить реализацию сложных моделей машинного обучения.
  • Глубокое обучение применяется в различных отраслях промышленности по-разному. Чат-боты, беспилотные автомобили и цифровые помощники — все это примеры технологий, использующих глубокое обучение.
  • Компании из разных отраслей инвестируют в глубокое обучение, чтобы стимулировать инновации, открывать новые возможности и извлекать ценную информацию из огромных наборов данных.

Почему глубокое обучение так важно

Специалисты по обработке и анализу данных с помощью программного обеспечения для глубокого обучения обучают компьютеры анализу больших и сложных наборов данных, выполнению сложных и нелинейных задач, а также реагированию на текст, голос или изображения, которое нередко бывает более быстрым и точным, чем у людей. Эти возможности имеют широкое практическое применение и лежат в основе многих современных инноваций. Например, глубокое обучение позволяет беспилотным автомобилям обрабатывать изображения и отличать пешеходов от других объектов на дороге. Кроме того, именно благодаря этой технологии устройства умных домов могут понимать ваши голосовые команды.

Глубокое обучение имеет важное значение, поскольку по мере увеличения объемов данных и повышения производительности вычислительных мощностей и доступности компании в сфере розничной торговли, здравоохранения, транспорта, производства, технологий и других секторах инвестируют в глубокое обучение, чтобы стимулировать инновации и оставаться актуальными.

Принцип работы глубокого обучения

Глубокое обучение работает, используя многоуровневые архитектуры нейронных сетей, высокопроизводительные графические процессоры, развернутые в облаке или на кластерах, и большие объемы размеченных данных для достижения очень высокого уровня точности распознавания текста, речи и изображений. Вся эта мощь может помочь вашим разработчикам создавать цифровые системы, имитирующие человеческий интеллект, и оптимизировать время получения результата за счет ускорения обучения моделей с недель до часов.

Например, для обучения модели беспилотного автомобиля могут понадобиться видео длительностью в тысячи часов и миллионы изображений. Без глубокого обучения обучение такого уровня не удалось бы выполнить в большом масштабе.

Что собой представляет платформа глубокого обучения?

Упростить реализацию сложных моделей машинного обучения разработчики могут с помощью таких платформ глубокого обучения, как TensorFlow или PyTorch. Эти платформы упрощают сбор данных, на основе которых затем можно обучать нейронные сети. Кроме того, с этими платформами можно использовать ускорители, такие как среда выполнения ONNX. Это позволит повысить скорость обучения моделей и формирования выводов.

Обучение моделей машинного обучения

Есть различные стратегии и методы обучения для моделей глубокого обучения. Рассмотрим некоторые из них.

Контролируемое обучение

При контролируемом обучении алгоритм обучается на основе помеченных наборов данных. Это означает, что, когда алгоритм создает сведения о фрагменте информации, он может проверить правильность определения с помощью меток, которыми снабжены данные. При контролируемом обучении данные, на основе которых обучаются модели, должны предоставляться людьми, помечающими эти данные, чтобы их можно было использовать для обучения алгоритма.

Неконтролируемое обучение

При неконтролируемом обучении алгоритмы обрабатывают данные, не содержащие меток или сведений, которые алгоритм может использовать для проверки определений. Система сортирует и классифицирует данные на основе определенных ею самой закономерностей.

Обучение с подкреплением

С помощью обучения с подкреплением система решает задачи методом проб и ошибок, чтобы принять ряд последовательных решений и достичь предполагаемого результата даже в непростой среде. При обучении с подкреплением алгоритм использует для формирования определений не наборы данных, а информацию, собираемую из среды.

Глубокое обучение с подкреплением

Когда методы глубокого обучения и обучения с подкреплением объединяются, они образуют тип машинного обучения под названием "глубокое обучение с подкреплением". При глубоком обучении с подкреплением используется тот же механизм принятия решений методом проб и ошибок, а также комплексный процесс достижения целей, что и при обучении с подкреплением, но дополнительно применяются возможности глубокого обучения для обработки больших объемов неструктурированных данных и получения на их основе осмысленных результатов.

Для чего используется глубокое обучение?

У глубокого обучения широкий спектр вариантов использования на предприятиях в самых различных отраслях. Вот некоторые примеры областей, в которых часто используется глубокое обучение:

Распознавание изображений, речи и эмоций

Программное обеспечение глубокого обучения позволяет повысить точность распознавания изображений, речи и эмоций, выполнять поиск по фотографиям, использовать персональных цифровых помощников, автомобили с автономным управлением, средства общественной и цифровой безопасности, а также другие интеллектуальные технологии.

Чат-боты

На современных высокоэффективных предприятиях на основе глубокого обучения создают активируемых текстом или голосом чат-ботов, которые отвечают на часто задаваемые вопросы, помогают с выполнением распространенных транзакций и отвечают за поддержку клиентов. Такие боты устраняют необходимость в работе целых команд агентов по обслуживанию и позволяют избежать очередей из ожидающих клиентов, давая автоматизированные, контекстно согласованные и полезные ответы.

Автомобили с автономным управлением

Беспилотные автомобили используют алгоритмы глубокого обучения для обработки множества динамических потоков данных за доли секунды и реагируют на непредвиденные ситуации быстрее, чем водитель-человек.

Специализированные возможности

Службы потоковой передачи, интернет-магазины и другие предприятия с помощью моделей глубокого обучения создают автоматизированные рекомендации по продуктам, фильмам, музыке и т. д., а также совершенствуют взаимодействие с клиентами на основе истории приобретений, предыдущего поведения и других данных.

Персональные цифровые помощники

Персональные цифровые помощники с голосовым управлением используют глубокое обучение для распознавания речи, а также реагирования на запросы и команды на естественном языке. Они могут даже отпускать остроумные замечания.

Понимание нейронных сетей

Нейронные сети — это цифровые архитектуры, предназначенные для имитации активности человеческого мозга. Они состоят из взаимосвязанных узлов, которые обрабатывают данные и обучаются на их основе, позволяя выполнять такие задачи, как распознавание образов и принятие решений в машинном обучении. Бизнес и другие учреждения полагаются на эти модели при финансовом прогнозировании, разработке стратегий продаж и принятии других бизнес-решений.

Что собой представляют нейронные сети?

Искусственная нейронная сеть — это цифровая архитектура, которая имитирует когнитивные процессы человека для моделирования сложных закономерностей, разработки прогнозов и адекватного реагирования на внешние стимулы. Для многих типов машинного обучения требуются структурированные данные, в отличие от нейронных сетей, которые могут интерпретировать события окружающей среды как доступные для обработки данные.

Когда вы читаете отчет, смотрите фильм, ведете автомобиль или нюхаете цветок, миллиарды нейронов в вашем мозге обрабатывают информацию с помощью крошечных электрических сигналов. Каждый нейрон обрабатывает входные данные, и результаты выводятся в следующий нейрон для последующей обработки. А затем мгновенно следует реакция: вы придумываете идею для бизнеса, смеетесь, нажимаете тормоз или наслаждаетесь запахом. В машинном обучении нейронные сети позволяют цифровым системам интерпретировать ситуации и реагировать на них схожим образом.

Искусственная нейронная сеть подобна мозгу, полному цифровых нейронов. Хотя большинство из них представляют собой примитивные имитации настоящих устройств, они все равно могут обрабатывать большие объемы нелинейных данных для решения сложных задач, которые в противном случае потребовали бы вмешательства человека. Например, банковские аналитики могут использовать искусственные нейронные сети для обработки заявок на кредит и прогнозирования вероятности дефолта заявителя.

Какие возможности предоставляют нейронные сети

В машинном обучении нейронные сети используются для обучения и моделирования сложных изменяющихся входных и выходных данных, определения скрытых связей и прогнозирования без ограничений на распределение данных. Модели нейронных сетей — это основа для многих приложений глубокого обучения, таких как средства компьютерного зрения и обработки естественного языка, которые могут помочь в защите от мошенничества, распознавании лиц или создании автомобилей тс автономным управлением.

Большинство предприятий на основе прогнозов принимают обоснованные бизнес-решения, а также формируют стратегии продаж, финансовые политики и подходы к использованию ресурсов. Но ограничения, свойственные традиционному прогнозированию, часто затрудняют разработку прогнозов для сложных динамических процессов с множеством базовых факторов, которые зачастую скрыты (например, цены на фондовой бирже). Модели нейронных сетей глубокого обучения помогают выявлять сложные нелинейные взаимосвязи и невидимые факторы, что позволяет компаниям разрабатывать более точные прогнозы.

Распространенные нейронные сети

Есть десятки типов нейронных сетей ИИ, каждая из которых подходит для различных приложений глубокого обучения. Используйте сеть ANN, соответствующую вашим деловым и технологическим требованиям. Вот несколько примеров распространенных нейронных сетей ИИ:

Сверточные нейронные сети
Разработчики используют сверточную нейронную сеть, чтобы помочь системам ИИ преобразовывать изображения в цифровые матрицы. Сети CNN используются в основном для классификации изображений и распознавания объектов. Такие сети хорошо подходят для распознавания лиц и тем, а также анализа тональности.

Деконволюционная нейронная сеть
Если сложные или объемные сетевые сигналы теряются или смешиваются с другими сигналами, их поможет найти деконволюционная нейронная сеть. Деконволюционные нейронные сети полезны для обработки изображений высокого разрешения и оценки оптического потока.

Генеративная состязательная сеть
Инженеры используют генеративно-состязательную сеть для обучения моделей генерировать новую информацию или материал, имитирующий определенные свойства обучающих данных. Генеративно-состязательные сети помогают моделям выявлять тонкие различия между оригиналами и копиями, чтобы создавать более аутентичные копии. Приложения генеративно-состязательной сети включают в себя генерацию изображений и видео высокой точности, расширенное распознавание лиц и сверхвысокое разрешение.

Рекуррентная нейронная сеть
Рекуррентная нейронная сеть вводит данные в скрытые слои с определенными временными задержками. Сетевые вычисления охватывают исторические данные в текущих состояниях, а входные данные более высокого уровня не влияют на размер модели. Рекуррентные нейронные сети являются хорошим выбором для распознавания речи, расширенного прогнозирования, робототехники и других сложных задач глубокого обучения.

Преобразователи
Преобразователи предназначены для управления последовательными входными данными. Но они не ограничиваются обработкой таких данных в последовательном порядке. Вместо этого преобразователи задействуют технику постоянного отслеживания. Этот метод позволяет моделям назначать различные уровни влияния различным частям входных данных, а также определять контекст для отдельных фрагментов данных в порядке их поступления. Таким образом повышается уровень параллелизма, что может ускорить обучение модели.

Сравнение машинного обучения и нейронных сетей

Хотя нейронные сети считаются подмножеством машинного обучения, между ними и обычными моделями машинного обучения есть существенные различия.

Начнем с того, что нейронные сети сложнее и могут работать более независимо, чем обычные модели машинного обучения. Например, нейронная сеть может определить, являются ли ее прогнозы и результаты точными, тогда как модели машинного обучения для такого вывода требуется, чтобы инженер ввел данные вручную.

Кроме того, нейронные сети структурированы так, что они могут самостоятельно продолжать обучение и принимать обоснованные решения. Модели же машинного обучения могут принимать решения только на основе того, чему они были обучены.
РЕСУРСЫ

 Погрузитесь глубже в преимущества глубокого обучения

Женщина в белой блузке сидит за компьютером.
Продукт

Начало работы с глубоким обучением в Azure

Обеспечьте поддержку распознавания изображений с помощью нейронных сетей или оптимизируйте обработку естественного языка с помощью быстрых, простых и точных моделей NLP BERT. Узнайте, как создавать, обучать и развертывать любые типы моделей глубокого обучения с использованием Машинного обучения Azure.
Мужчина прикрывает лицо рукой и смотрит в ноутбук.
Решение

Обзор возможностей машинного обучения для специалистов по обработке и анализу данных

Узнайте, как создавать решения машинного обучения в масштабе облака в Azure и ознакомьтесь с инструментами машинного обучения для специалистов по обработке и анализу данных, а также инженеров по машинному обучению.
Мужчина смотрит в свой телефон.
События

Мероприятия и вебинары Azure

Осваивайте новые навыки, изучайте новые технологии и общайтесь с коллегами — в цифровом формате или лично.

Вопросы и ответы

  • Глубокое обучение — это подвид ИИ. Он использует искусственные нейронные сети, которые помогают цифровым системам обучаться и принимать решения на основе неструктурированных, немаркированных данных.
  • Глубокое обучение — это подвид машинного обучения. Основное различие между ними заключается в том, как каждый алгоритм обучается и сколько данных требуется каждому типу алгоритма. Поскольку глубокое обучение использует больше данных, предприятия обычно используют его для решения более сложных задач.
  • Термины "искусственный интеллект", "машинное обучение" и "глубокое обучение" часто используются как взаимозаменяемые. Однако проще всего рассматривать эти три системы как ряд систем ИИ от самой большой к самой маленькой, каждая из которых охватывает следующую. ИИ — это всеобъемлющая система, машинное обучение — это подмножество ИИ, а глубокое обучение — это подмножество машинного обучения.
  • Глубокое обучение используется в самых разных отраслях промышленности различными способами. Например, цифровые помощники используют глубокое обучение, чтобы понимать речь и правильно реагировать на запросы и команды.
  • Глубокое обучение важно, поскольку оно позволяет извлекать ценную информацию из огромных наборов данных способами, которые ранее были невозможны. Компании в сфере розничной торговли, здравоохранения, транспорта, производства и других секторах инвестируют в глубокое обучение, чтобы стимулировать инновации, открывать новые возможности и оставаться актуальными.
  • Azure использует глубокое обучение с помощью сложной системы архитектур нейронных сетей, высокопроизводительных графических процессоров и больших объемов размеченных данных. Эти сервисы позволяют разработчикам, использующим Azure, создавать интеллектуальные, передовые, готовые к выходу на рынок и ответственные приложения.