O que é a Aprendizagem Profunda?
A aprendizagem profunda é um tipo de machine learning que utiliza redes neurais artificiais para permitir que os sistemas digitais aprendam e tomem decisões com base em dados não estruturados e não etiquetados.
Em geral, o machine learning prepara os sistemas de IA para aprenderem a partir de experiências adquiridas com dados, reconhecerem padrões, fazerem recomendações e adaptarem-se. Com a aprendizagem profunda em particular, em vez de responderem apenas a conjuntos de regras, os sistemas digitais criam conhecimentos a partir de exemplos e, depois, utilizam esses conhecimentos para reagir, comportar-se e agir como humanos.
Porque é que a aprendizagem profunda é importante
Os cientistas de dados e os programadores utilizam software de aprendizagem profunda para preparar os computadores para análise de conjuntos de dados grandes e complexos, concluir tarefas complicadas e não lineares e responder a texto, voz ou imagens, em muitos casos, mais depressa e com mais precisão do que os humanos. Estas capacidades têm muitas aplicações práticas e possibilitaram muitas inovações modernas. Por exemplo, os veículos autónomos utilizam a aprendizagem profunda para processar imagens e distinguir os peões de outros objetos na estrada e os seus dispositivos domésticos inteligentes utilizam-na para compreender os seus comandos de voz.
A aprendizagem profunda é importante porque, à medida que os volumes de dados aumentam e a capacidade de computação se torna mais poderosa e acessível, empresas de setores como revenda, cuidados de saúde, transporte, fabrico, tecnologia, entre outros, estão a investir na mesma para gerar inovação, desbloquear oportunidades e manter a relevância.
Como funciona a aprendizagem profunda
A aprendizagem profunda funciona ao utilizar arquiteturas de redes neurais em várias camadas, unidades de processamento gráfico de elevado desempenho na cloud ou em clusters e grandes volumes de dados etiquetados para alcançar níveis muito elevados de precisão de reconhecimento de texto, voz e imagem. Todo este poder pode ajudar os seus programadores a criar sistemas digitais com algo semelhante a inteligência humana e uniformizar o tempo de comercialização ao acelerar a preparação de modelos de semanas para horas.
Por exemplo, um modelo de veículo autónomo pode exigir milhares de horas de vídeo e milhões de imagens para preparação. Sem a aprendizagem profunda, este nível de preparação não poderia ser feito em escala.
O que é um framework de aprendizagem profunda?
Para facilitar a implementação dos modelos de machine learning complexos, os programadores recorrem a frameworks de aprendizagem profunda como o TensorFlow ou o PyTorch. Estes frameworks ajudam a uniformizar o processo de recolha de dados, que podem, depois, ser utilizados para preparar as redes neurais. Além disso, podem ser utilizados aceleradores como o ONNX Runtime com estes frameworks, para acelerar a preparação e inferência dos modelos.
Preparar modelos de aprendizagem profunda
Existem estratégias e métodos diferentes para preparar modelos de aprendizagem profunda. Vamos analisar mais detalhadamente alguns deles.
Aprendizagem supervisionada
Com a aprendizagem supervisionada, os algoritmos são preparados com conjuntos de dados que estão etiquetados. Isto significa que, quando um algoritmo faz uma determinação sobre uma informação, pode utilizar as etiquetas incluídas nos dados para verificar se essa determinação está correta. Com a aprendizagem supervisionada, os dados com os quais os modelos são preparados têm de ser fornecidos por humanos, que etiquetam os dados antes de os utilizarem para preparar os algoritmos.
Aprendizagem não supervisionada
Com a aprendizagem não supervisionada, os algoritmos são preparados com dados que não contêm etiquetas nem informações que possam utilizar para verificar se as determinações estão corretas. Em vez disso, o sistema ordena e classifica os dados com base nos padrões que reconhece sozinho.
Aprendizagem por reforço
Com a aprendizagem por reforço, os sistemas resolvem tarefas por tentativa e erro para gerar séries de decisões em sequência e alcançar um resultado pretendido, mesmo em ambientes que não são diretos. Com a aprendizagem por reforço, o algoritmo não utiliza conjuntos de dados para fazer determinações, mas sim as informações que recolhe dos ambientes.
Aprendizagem por reforço profunda
Quando as técnicas de aprendizagem profunda e de aprendizagem por reforço são combinadas, criam um tipo de machine learning denominado "aprendizagem por reforço profunda". A aprendizagem por reforço profunda utiliza a mesma tomada de decisão baseada em tentativa e erro e a mesma obtenção de objetivos complexos da aprendizagem por reforço, mas também recorre às capacidades da aprendizagem profunda para processar e compreender grandes quantidades de dados não estruturados.
Para que é utilizada a aprendizagem profunda?
A aprendizagem profunda é utilizada em empresas das mais diversas indústrias e para um amplo conjunto de casos de utilização. Eis alguns exemplos de como a aprendizagem profunda é normalmente utilizada:
Reconhecimento de imagens, voz e emoções
O software de aprendizagem profunda é utilizado para aumentar a precisão do reconhecimento de imagens, voz e emoções e para permitir tecnologias de pesquisa de fotografias, assistentes pessoais digitais, veículos autónomos, segurança pública, segurança digital, entre outras tecnologias inteligentes.
Experiências à medida
Os serviços de transmissão em fluxo, os revendedores de comércio eletrónico e outros negócios utilizam os modelos de aprendizagem profunda para gerar recomendações automatizadas para produtos, filmes, músicas ou outros serviços e para aperfeiçoar as experiências do cliente com base nos históricos de compra, em comportamentos passados e noutros dados.
Chatbots
As empresas experientes utilizam a aprendizagem profunda para disponibilizar chatbots online ativados por voz para perguntas mais frequentes, transações rotineiras e, especialmente, para apoio ao cliente. Substituem as equipas de agentes de apoio e as filas de clientes à espera com respostas automatizadas, contextualmente adequadas e úteis.
Assistentes pessoais digitais
Os assistentes pessoais digitais ativados por voz utilizam a aprendizagem profunda para compreender a voz, responder adequadamente a consultas e comandos em linguagem natural e, às vezes, para se armarem em engraçados.
Veículos autónomos
Representantes oficiosos da IA e da aprendizagem profunda, os veículos autónomos utilizam algoritmos de aprendizagem profunda para processar múltiplos feeds de dados dinâmicos em frações de segundo, para nunca terem de pedir indicações e para reagir a imprevistos, mais rápido do que um condutor humano.
Muitas empresas utilizam software de machine learning open-source para incorporarem soluções de aprendizagem profunda nas respetivas organizações.
O que são redes neurais?
Uma rede neural artificial (ANN) é uma arquitetura digital que imita os processos cognitivos humanos para modelar padrões complexos, desenvolver predições e reagir adequadamente a estímulos externos. Muitos tipos de machine learning requerem dados estruturados, ao passo que as redes neurais conseguem interpretar eventos do mundo que as rodeia como dados passíveis de processamento.
Sempre que lê um relatório, vê um filme, conduz um carro ou cheira uma flor, milhares de milhões de neurónios no seu cérebro processam as informações através de sinais elétricos minúsculos. Cada neurónio processa entradas e os resultados são transmitidos ao próximo neurónio para processamento subsequente, produzindo no final e imediatamente uma informação comercial, um riso, um pé no travão ou uma pequena alegria. No machine learning, as redes neurais permitem que os sistemas digitais interpretem e reajam a situações praticamente da mesma forma.
As ANN são como um cérebro repleto de neurónios digitais e, embora a maior parte destas ANN sejam imitações rudimentares da versão original, conseguem, ainda assim, processar grandes volumes de dados não lineares para resolver problemas complexos que, caso contrário, podem exigir intervenção humana. Por exemplo, os analistas bancários podem utilizar uma ANN para processar pedidos de empréstimos e prever a probabilidade de um candidato de entrar em incumprimento.
O que pode fazer com as redes neurais
No machine learning, as redes neurais são utilizadas para aprendizagem e modelação de entradas e saídas complexas e voláteis, para inferência de relações ocultas e para fazer predições sem limitações na distribuição dos dados. Os modelos de redes neurais são o alicerce de muitas aplicações de aprendizagem profunda, como processamento de imagens digitalizadas e linguagem natural, o que pode ajudar a dar suporte a proteção contra fraudes, reconhecimento facial ou veículos autónomos.
A maior parte das empresas recorre à previsão para tomar decisões comerciais informadas e decidir estratégias de vendas, políticas financeiras e utilização de recursos. Contudo, as limitações da previsão tradicional fazem com que, muitas vezes, seja difícil prever processos complexos e dinâmicos com múltiplos fatores subjacentes, muitas vezes ocultos, como os preços no mercado bolsista. Os modelos de redes neurais de aprendizagem profunda ajudam a expor relações não lineares e complexas e modelam fatores ocultos, para que as empresas possam desenvolver previsões precisas para a maioria das atividades comerciais.
Redes neurais comuns
Existem dezenas de diferentes tipos de redes neurais de IA, sendo cada uma adequada para aplicações de aprendizagem profunda distintas. Utilize uma rede neural artificial que dê resposta aos seus requisitos empresariais e tecnológicos. Seguem-se alguns exemplos de redes neurais de IA comuns:
Rede neural convolucional (CNN)
Os programadores utilizam redes neurais convolucionais para ajudar os sistemas de IA a converter imagens em matrizes digitais. Utilizadas principalmente para classificação de imagens e reconhecimento de objetos, as CNNs são indicadas para reconhecimento facial, deteção de tópicos e análises de sentimentos.
Rede neural desconvolucional (deconvolutional neural network, DNN)
Se os sinais de rede complexos ou de elevado volume se perderem ou se misturarem (convolucionarem) com outros sinais, as redes neurais desconvolucionais ajudam a encontrá-los. As DNNs são úteis para o processamento de imagens de alta resolução e para estimativas de fluxos óticos.
Rede generativa antagónica (GAN)
Os engenheiros utilizam as redes generativas antagónicas para preparar modelos para gerarem informações novas ou materiais que reflitam as propriedades específicas dos dados de preparação. As GANs ajudam os modelos a distinguir diferenças subtis entre os originais e as cópias, de modo a criar cópias mais autênticas. As aplicações de GAN incluem geração de imagens e vídeos de alta fidelidade, reconhecimento facial avançado e super-resolução.
Rede neural recorrente (RNN)
As redes neurais recorrentes introduzem dados em camadas ocultas com atrasos de tempo específicos. As contas de computação de rede de informações históricas em estados atuais e entradas mais altas não alteram o tamanho do modelo. As RNNs são uma boa opção para reconhecimento de voz, previsões avançadas, robótica e outras cargas de trabalho de aprendizagem profunda complexas.
Transformadores
Os transformadores foram concebidos para processar dados de entrada sequenciais. Contudo, não se limitam ao processamento desses dados por ordem sequencial. Em vez disso, os transformadores utilizam a atenção, uma técnica através da qual os modelos atribuem diferentes níveis de influência a diferentes dados de entrada e identificam o contexto de dados individuais numa sequência de entrada. Esta técnica permite um maior nível de paralelização, o que pode reduzir os tempos de preparação dos modelos.
Machine learning vs. redes neurais
Embora as redes neurais sejam consideradas um subconjunto de machine learning, existem algumas diferenças significativas entre as redes neurais e os modelos de machine learning normais.
Em primeiro lugar, as redes neurais são geralmente mais complexas e capazes de funcionar de forma mais independente do que os modelos de machine learning normais. Por exemplo, uma rede neural consegue determinar sozinha se as respetivas predições e resultados são precisos, ao passo que um modelo de machine learning precisaria da ação de um engenheiro humano para fazer essa distinção.
Além disso, as redes neurais estão estruturadas de modo a que possam continuar a aprender e tomar decisões inteligentes sozinhas. Por sua vez, os modelos de machine learning estão limitados à tomada de decisões baseada apenas naquilo em que foram especificamente preparados.
Introdução à aprendizagem profunda no Azure
Dê suporte ao reconhecimento de imagens com redes neurais ou otimize o processamento de linguagem natural com modelos BERT NLP rápidos, fáceis e precisos. Explore como compilar, preparar e implementar todos os tipos de modelos de aprendizagem profunda com o Azure Machine Learning.
Explore a aprendizagem automática para cientistas de dados
Aprenda a criar soluções de machine learning à escala da nuvem no Azure e explore ferramentas de machine learning para cientistas de dados e engenheiros de machine learning.