Algoritmos de machine learning

Introdução à matemática e lógica de machine learning.

O que são algoritmos de machine learning?

Os algoritmos de machine learning são partes de código que ajudam as pessoas a explorar, analisar e localizar o significado em conjuntos de dados complexos. Cada algoritmo é um conjunto finito de instruções passo a passo inequívocas que um computador pode seguir para atingir um determinado objetivo. Num modelo de machine learning, o objetivo é estabelecer ou descobrir padrões que as pessoas possam utilizar para fazer previsões ou categorizar informações. O que é a aprendizagem automática?

Os algoritmos de machine learning utilizam parâmetros baseados em dados de preparação, um subconjunto de dados que representa o conjunto maior. À medida que os dados de preparação se expandem para representar o mundo de forma mais realista, o algoritmo calcula resultados mais precisos.

Algoritmos diferentes analisam os dados de diversas formas. Geralmente, são agrupados consoante as técnicas de machine learning para as quais são utilizados: aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por reforço. Os algoritmos mais frequentes utilizam a regressão e a classificação para prever categorias de destino, localizar pontos de dados invulgares, prever valores e descobrir semelhanças.

Técnicas de aprendizagem automática

À medida que conhece melhor os algoritmos de machine learning, descobrirá que se enquadram normalmente numa de três técnicas de machine learning:

Aprendizagem supervisionada

Na aprendizagem supervisionada, os algoritmos fazem previsões com base num conjunto de exemplos etiquetados fornecidos por si. Esta técnica é útil quando sabe como deverá ser o resultado.

Por exemplo, fornece um conjunto de dados que inclui populações de cidades por ano nos últimos 100 anos e deseja saber qual será a população de uma cidade específica dentro de quatro anos. O resultado utiliza etiquetas que já existem no conjunto de dados: população, cidade e ano.

Aprendizagem não supervisionada

Na aprendizagem não supervisionada, os pontos de dados não são etiquetados. O algoritmo etiqueta-os ao organizar os dados ou ao descrever a sua estrutura. Esta técnica é útil quando não sabe como deverá ser o resultado.

Por exemplo, fornece dados de cliente e deseja criar segmentos de clientes que gostam de produtos semelhantes. Os dados que está a fornecer não são etiquetados e as etiquetas no resultado são geradas com base nas semelhanças descobertas entre os pontos de dados.

Aprendizagem por reforço

A aprendizagem por reforço utiliza algoritmos que aprendem com resultados e decide a ação a realizar em seguida. Após cada ação, o algoritmo recebe comentários que o ajudam a determinar se a escolha feita foi correta, neutra ou incorreta. É uma boa técnica utilizada para sistemas automatizados que precisam de tomar muitas decisões pequenas sem orientação humana.

Por exemplo, se estiver a criar um carro autónomo, quer que este cumpra a lei e mantenha as pessoas seguras. À medida que o carro ganha experiência e um histórico de reforço, aprende a permanecer dentro da faixa, a não ultrapassar o limite de velocidade e a travar quando encontrar peões.

O que pode fazer com algoritmos de machine learning

Os algoritmos de machine learning ajudam a responder a perguntas demasiado complexas para responder através de uma análise manual. Normalmente, os casos de utilização enquadram-se numa destas categorias.

Prever uma categoria de destino

Os algoritmos de classificação de duas classes (binários) dividem os dados em duas categorias. São úteis para perguntas com apenas duas respostas possíveis mutuamente exclusivas, incluindo perguntas de sim/não. Por exemplo:

  • Este pneu irá falhar nos próximos 1000 quilómetros: sim ou não?
  • O que traz mais referências: um crédito de 10 USD ou um desconto de 15%?

Os algoritmos de classificação multiclasse (multinomial) dividem os dados em três ou mais categorias. São úteis para perguntas com três ou mais respostas possíveis mutuamente exclusivas. Por exemplo:

  • Em que mês a maioria dos viajantes compra bilhetes de avião?
  • Que emoção apresenta a pessoa nesta foto?

Localizar pontos de dados invulgares

Os algoritmos de deteção de anomalias identificam os pontos de dados que estão fora dos parâmetros definidos para o que é considerado "normal". Por exemplo, pode utilizar algoritmos de deteção de anomalias para responder a perguntas como:

  • Onde estão as peças com defeito neste lote?
  • Que compras com cartão de crédito podem ser fraudulentas?

Prever valores

Os algoritmos de regressão preveem o valor de um novo ponto de dados com base em dados históricos. Ajudam a responder a perguntas como:

  • Qual o custo médio de uma casa com dois quartos na minha cidade no próximo ano?
  • Quantos pacientes virão à clínica na terça-feira?

Descobrir semelhanças

Os algoritmos de clustering dividem os dados por vários grupos ao determinar o nível de semelhança entre os pontos de dados. Os algoritmos de clustering funcionam bem para perguntas como:

  • Que visualizadores gostam dos mesmos tipos de filmes?
  • Que modelos de impressora falham da mesma forma?

Começar a experimentar com o Azure Machine Learning

Veja como algoritmos diferentes analisam os dados ao criar e implementar os seus próprios modelos de machine learning com o Azure Machine Learning.