Ignorar navegação

O que é aprendizado profundo?

O aprendizado profundo é um tipo de aprendizado de máquina que usa redes neurais artificiais para permitir que sistemas digitais aprendam e tomem decisões com base em dados não estruturados e não rotulados.

Em geral, o machine learning treina os sistemas de IA para aprender com as experiências adquiridas com os dados, reconhecer padrões, fazer recomendações e adaptar-se. Com o aprendizado profundo em particular, em vez de apenas responder a conjuntos de regras, os sistemas digitais criam conhecimento com base em exemplos e, em seguida, usam esse conhecimento para reagir, se comportar e desempenhar atividades como seres humanos.

Por que o aprendizado profundo é importante

Os cientistas e desenvolvedores de dados usam o software de aprendizado profundo para treinar computadores a fim de analisar conjuntos de dados grandes e complexos, concluir tarefas complicadas e não lineares e responder a texto, voz ou imagens, geralmente mais rápido e com mais precisão do que os humanos. Essas funcionalidades têm muitas aplicações práticas e possibilitaram várias inovações modernas. Por exemplo, o aprendizado profundo é o que os carros sem motorista usam para processar imagens e distinguir pedestres de outros objetos na estrada ou o que os dispositivos de casa inteligente usam para entender os seus comandos de voz.

O aprendizado profundo é importante porque, à medida que os volumes de dados aumentam e a capacidade de computação se torna mais poderosa e acessível, as empresas de varejo, saúde, transporte, manufatura, tecnologia e outros setores estão investindo no aprendizado profundo para impulsionar a inovação, abrir oportunidades e se manter relevantes.

Como o aprendizado profundo funciona

O aprendizado profundo funciona por meio de arquiteturas de rede neural em várias camadas, unidades de processamento gráfico de alto desempenho implantadas na nuvem ou em clusters e grandes volumes de dados rotulados para obter níveis muito altos de precisão de reconhecimento de texto, fala e imagem. Todo esse poder pode ajudar seus desenvolvedores a criar sistemas digitais com algo semelhante à inteligência humana e simplificar o tempo de implantação, acelerando o treinamento de modelos de semanas para horas.

Por exemplo, um modelo de carro sem motorista pode exigir milhares de horas de vídeo e milhões de imagens para ser treinado. Sem o aprendizado profundo, esse nível de treinamento não poderia ser realizado em escala.

O que é uma estrutura de aprendizado profundo?

Para facilitar a implementação de modelos de machine learning, os desenvolvedores recorrem a estruturas de aprendizado profundo como o TensorFlow e o PyTorch. Essas estruturas ajudam a simplificar o processo de coleta de dados, que podem então ser usados para treinar redes neurais. Além disso, aceleradores como o ONNX Runtime podem ser usados com essas estruturas para acelerar o treinamento e a inferência de modelos.

Treinamento de modelos de aprendizado profundo

Há métodos e estratégias diferentes para modelos de aprendizado profundo. Vamos dar uma olhada em alguns deles.

Aprendizado supervisionado

Com o aprendizado supervisionado, um algoritmo é treinado em conjuntos de dados rotulados. Isso significa que, quando o algoritmo faz uma determinação sobre uma determinada informação, ele pode usar os rótulos incluídos com os dados para verificar se essa determinação está correta. Com o aprendizado supervisionado, os dados nos quais os modelos são treinados precisam ser fornecidos por humanos, que rotulam os dados antes de usá-los para treinar os algoritmos.

Aprendizado não supervisionado

Com o aprendizado não supervisionado, os algoritmos são treinados usando dados que não contêm rótulos nem informações que o algoritmo possa usar para verificar as próprias determinações. Em vez disso, o sistema ordena e classifica os dados com base nos padrões que reconhece por conta própria.

Aprendizado de reforço

Com o aprendizado de reforço, um sistema soluciona tarefas usando tentativa e erro para tomar séries de decisões e alcançar um resultado desejado, mesmo em um ambiente complexo. Com o aprendizado de reforço, o algoritmo não usa conjuntos de dados para fazer determinações, mas usa informações que coleta de um determinado ambiente.

Aprendizado de reforço profundo

Quando técnicas de aprendizado por reforço e aprendizado profundo são combinadas, elas criam um tipo de machine learning chamado de aprendizado de reforço profundo. O aprendizado de reforço profundo usa o mesmo tipo de tomada de decisão por tentativa e erro e o alcance de metas complexas que o aprendizado de reforço, mas conta também com funcionalidades de aprendizado profundo para processar e compreender grandes quantidades de dados não estruturados.

Para que o aprendizado profundo é usado?

O aprendizado profundo é usado em empresas de vários setores em uma ampla gama de casos de uso. Aqui estão alguns exemplos de como o aprendizado profundo é normalmente usado:

Reconhecimento de imagem, fala e emoções

O software de aprendizado profundo é usado para aumentar a precisão do reconhecimento de imagem, fala e emoções e para habilitar pesquisas de fotos, assistentes digitais pessoais, veículos sem motorista, segurança pública, segurança digital e outras tecnologias inteligentes.

Experiências personalizadas

Os serviços de streaming, varejistas de comércio eletrônico e outras empresas usam modelos de aprendizado profundo para gerar recomendações automatizadas para produtos, filmes, músicas ou outros serviços e para uma experiência perfeita com o cliente com base em históricos de compra, comportamento passado e outros dados.

Chatbots

Empresas inteligentes usam o aprendizado profundo para potencializar chatbots online ativados por voz ou texto para perguntas frequentes, transações de rotina e, especialmente, atendimento ao cliente. Elas substituem equipes de agentes de atendimento e filas de clientes em espera por respostas automatizadas, contextualmente apropriadas e úteis.

Assistentes digitais pessoais

Os assistentes digitais pessoais ativados por voz usam o aprendizado profundo para compreender a fala, responder apropriadamente a comandos em linguagem natural e, às vezes, até fazer trocadilhos.

Veículos sem motorista

O representante não oficial da IA e do aprendizado profundo, carros sem motorista usam algoritmos de aprendizado profundo para processar vários feeds de dados dinâmicos em frações de segundo, nunca precisam pedir orientações e reagem ao inesperado com mais velocidade que um motorista humano.

Muitos negócios usam o machine learning de código aberto para trazer soluções de aprendizado profundo para as próprias organizações.

Saiba mais sobre o machine learning de código aberto

O que são redes neurais?

Uma ANN (rede neural artificial) é uma arquitetura digital que imita os processos cognitivos humanos para modelar padrões complexos, desenvolver previsões e reagir adequadamente a estímulos externos. Os dados estruturados são necessários para muitos tipos de machine learning, enquanto as redes neurais são capazes de interpretar eventos no mundo que as cerca como dados que podem ser processados.

Sempre que você ler um relatório, assistir a um filme, dirigir um carro ou cheirar uma flor, bilhões de neurônios em seu cérebro processam as informações por meio de pequenos sinais elétricos. Cada neurônio processa entradas e os resultados são gerados para o próximo neurônio para processamento posterior, produzindo finalmente, em um instante, uma visão comercial, uma risada, um pé no freio ou uma pequena alegria. No machine learning, as redes neurais permitem que sistemas digitais interpretem situações e reajam a elas de maneira muito parecida.

Uma ANN é como um cérebro cheio de neurônios digitais e, embora a maioria das ANNs sejam imitações rudimentares de um cérebro real, elas ainda podem processar grandes volumes de dados não lineares para resolver problemas complexos que, de outra forma, poderiam exigir intervenção humana. Por exemplo, os analistas bancários podem usar uma ANN para processar solicitações de empréstimo e prever a probabilidade de inadimplência de um candidato.

O que você pode fazer com redes neurais

No machine learning, as redes neurais são usadas para aprendizado e modelagem de entradas e saídas complexas e voláteis, a inferência de relações inéditas e a realização de previsões sem restrições de distribuição de dados. Os modelos de rede neural são a base para muitas aplicações do aprendizado profundo, como pesquisa visual computacional e processamento de linguagem natural, que podem ajudar no suporte à proteção contra fraudes, reconhecimento facial ou veículos autônomos.

A maioria das empresas dependem de previsões para informar decisões de negócios, estratégias de venda, políticas financeiras e utilização de recursos. No entanto, as limitações da previsão tradicional muitas vezes dificultam a previsão de processos complexos e dinâmicos, com vários fatores subjacentes (muitas vezes ocultos), como preços do mercado de ações. Os modelos de rede neural de aprendizado profundo ajudam a expor relações não lineares complexas e a modelar fatores inéditos, de modo que as empresas possam desenvolver previsões precisas para a maioria das atividades comerciais.

Redes neurais comuns

Há dúzias de tipos diferentes de redes neurais de IA e cada uma é adequada para diferentes aplicativos de aprendizado profundo. Use uma ANN que seja apropriada para seus requisitos de tecnologia e negócios. Aqui estão alguns exemplos de redes neurais de IA comuns:

CNN (rede neural convolucional)

Os desenvolvedores usam uma CNN para ajudar os sistemas de IA a converter imagens em matrizes digitais. Usadas principalmente para classificação de imagem e reconhecimento de objetos, CNNs são apropriadas para reconhecimento facial, detecção de tópico e análise de sentimento.

DNN (rede neural deconvolucional)

Se sinais de rede complexos ou de alto volume forem perdidos ou misturados com outros sinais, uma DNN ajudará a encontrá-los. DNNs são úteis para processar imagens de alta resolução e estimativas de fluxo óptico.

GAN (rede adversária gerativa)

Os engenheiros usam uma GAN para treinar modelos em como gerar informações ou materiais que imitam as propriedades específicas dos dados de treinamento. As GANs ajudam os modelos a distinguir diferenças sutis entre originais e cópias, a fim de produzir cópias mais autênticas. As aplicações da GAN incluem geração de imagens e vídeos de alta fidelidade, reconhecimento facial avançado e super resolução.

RNN (rede neural recorrente)

Uma RNN insere dados em camadas ocultas com atrasos de tempo específicos. As contas de computação de rede para informações históricas em estados atuais e entradas mais altas não alteram o tamanho do modelo. As RNNs são uma boa opção para reconhecimento de fala, previsão avançada, robótica e outras cargas de trabalho de aprendizado profundo complexas.

Transformadores

Os transformadores são projetados para lidar com os dados de entrada sequenciais. No entanto, eles não são restritos ao processamento desses dados em ordem sequencial. Em vez disso, os transformadores usam atenção, uma técnica que permite que os modelos atribuam diferentes níveis de influência a diferentes partes de dados de entrada e identifiquem o contexto para partes individuais de dados em uma sequência de entrada. Isso permite um nível maior de paralelização, o que pode reduzir os tempos de treinamento de modelo.

Machine learning versus redes neurais

Embora as redes neurais sejam consideradas um subconjunto de machine learning, há algumas diferenças significativas entre redes neurais e modelos comuns de machine learning.

Em primeiro lugar, as redes neurais são geralmente mais complexas e capazes de operar de modo mais independente do que modelos comuns de machine learning. Por exemplo, uma rede neural é capaz de determinar por conta própria se as próprias previsões e resultados são precisos, enquanto um modelo de machine learning exigiria a entrada de um engenheiro humano para fazer essa distinção.

Além disso, as redes neurais são estruturadas de modo que a rede neural pode continuar a aprender e tomar decisões inteligentes por conta própria. Os modelos de machine learning, por outro lado, limitam-se a tomada de decisões com base no que eles foram treinados especificamente para fazer.

Introdução ao aprendizado profundo no Azure

Dê suporte ao reconhecimento de imagem com redes neurais ou otimize o processamento de linguagem natural com modelos de PLN com BERT rápidos, fáceis e precisos. Explore como criar, treinar e implantar todos os tipos de modelos de aprendizado profundo com o Azure Machine Learning.

Explorar o machine learning para cientistas de dados

Aprenda a criar soluções de machine learning em escala de nuvem no Azure e explore as ferramentas de machine learning para cientistas de dados e engenheiros de machine learning.

Podemos ajudar você?