Os algoritmos de aprendizado de máquina geralmente são agrupados por como aprendem com os dados. Cada tipo dá suporte a diferentes metas e cenários, e entender essas distinções ajuda a esclarecer quando algoritmos de ML específicos são mais úteis.
Algoritmos de aprendizado supervisionado: são treinados com dados rotulados, onde cada exemplo inclui uma entrada e um resultado conhecido. Durante o treinamento, o algoritmo compara os seus resultados com as respostas corretas e se ajusta para reduzir os erros.
Esses algoritmos de aprendizado de máquina funcionam bem quando os dados históricos incluem resultados claros, como categorias ou valores numéricos.
Alguns usos comuns de aprendizado supervisionado incluem:
- Classificar emails como spam ou legítimo
- Prever preços, demanda ou níveis de risco
- Identificar recursos ou objetos em imagens
Como os resultados são conhecidos, o desempenho é mais fácil de medir e refinar.
Algoritmos de aprendizado não supervisionados: trabalham com dados não rotulados, sem resultados pré-definidos. Em vez de aprender com as respostas, o algoritmo procura estrutura e relações dentro dos dados em si. Esses algoritmos são usados quando o objetivo é descobrir, não prever.
Alguns usos comuns do aprendizado não supervisionado incluem:
- Agrupar clientes com base no comportamento compartilhado
- Detectando padrões ou exceções incomuns
- Simplificando conjuntos de dados grandes ou complexos
O aprendizado não supervisionado ajuda as pessoas a entender melhor os dados, especialmente quando os padrões não são óbvios à primeira vista.
Algoritmos de aprendizado de reforço: algoritmos de aprendizado de reforço aprendem por meio de interação e comentários em vez de exemplos com respostas conhecidas. Um sistema executa ações, observa os resultados e recebe sinais que indicam se essas ações levaram a resultados melhores ou piores.
Alguns algoritmos de aprendizado de máquina também dão suporte ao aprendizado profundo, uma abordagem mais especializada que usa redes neurais em camadas para modelar padrões complexos nos dados.
Ao longo do tempo, o algoritmo identifica quais ações têm mais probabilidade de produzir resultados favoráveis. Essa abordagem é útil quando as decisões influenciam o que acontece em seguida.
Alguns usos comuns de aprendizado de reforço incluem:
- Navegar em ambientes físicos ou simulados
- Otimizar processos com decisões sequenciais
- Aprender estratégias por meio de tentativas e simulação
O aprendizado por reforço depende de metas, restrições e avaliação definidas por humanos para se manter alinhado com as necessidades do mundo real.