Trace Id is missing
Passa al contenuto principale

Algoritmi di Machine Learning

Introduzione alla matematica e alla logica alla base di Machine Learning.

Che cosa sono gli algoritmi di Machine Learning?

Gli algoritmi di Machine Learning sono pezzi di codice che aiutano le persone a esplorare, analizzare e trovare un significato in set di dati complessi. Ogni algoritmo è un set finito di istruzioni dettagliate non ambigue che possono essere seguite da un computer per raggiungere un determinato obiettivo. L'obiettivo di un modello di Machine Learning consiste nello stabilire o nell'individuare criteri che le persone possono usare per creare previsioni o definire categorie per le informazioni. Che cos'è Machine Learning?

Gli algoritmi di Machine Learning usano parametri basati su dati di training, ovvero un sottoinsieme di dati che rappresenta il set più grande. L'espansione dei dati di training per rappresentare il mondo in modo più realistico consente all'algoritmo di calcolare risultati più accurati.

I diversi algoritmi analizzano i dati in modi diversi. Vengono spesso raggruppati in base alle tecniche di Machine Learning per cui vengono usati, ovvero apprendimento supervisionato, apprendimento non supervisionato e apprendimento per rinforzo. Gli algoritmi più diffusi usano la regressione e la classificazione per prevedere le categorie di destinazione, trovare punti dati insoliti, prevedere valori e individuare somiglianze.

Tecniche di Machine Learning

Scoprendo di più sugli algoritmi di Machine Learning, noterai che rientrano in genere entro una delle tre tecniche di Machine Learning seguenti:


Apprendimento supervisionato

Nell'apprendimento supervisionato gli algoritmi creano previsioni in base a un set di esempi con etichetta forniti da te. Questa tecnica risulta utile quando hai un'idea di come dovrebbe essere il risultato.
 

Puoi usarla ad esempio se fornisci un set di dati che include la popolazione di una città per ogni anno negli ultimi 100 anni e vuoi conoscere la popolazione di una città specifica tra quattro anni. Il risultato usa etichette già esistenti nel set di dati, ovvero popolazione, città e anno.
 

Apprendimento non supervisionato

Nell'apprendimento non supervisionato i punti dati non sono etichettati e l'algoritmo applica automaticamente le etichette organizzando i dati o descrivendone la struttura. Questa tecnica risulta utile quando non hai idea di come dovrebbe essere il risultato.

 

Puoi usarla ad esempio se fornisci dati dei clienti e vuoi creare segmenti di clienti che apprezzano prodotti simili. I dati forniti non sono etichettati e le etichette nei risultati vengono generate in base alle somiglianze individuate tra i punti dati.

 

Apprendimento per rinforzo

L'apprendimento per rinforzo usa algoritmi che apprendono dai risultati e decidono quale azione eseguire successivamente. Dopo ogni azione l'algoritmo riceve feedback che contribuisce a determinare se la scelta è stata corretta, neutra o non corretta. Si tratta di una tecnica ideale per i sistemi automatizzati che devono prendere molte piccole decisioni senza indicazioni da parte di esseri umani.

 

Puoi usarla ad esempio se progetti un'automobile autonoma e vuoi assicurarti che rispetti le normative e garantisca la protezione delle persone. Quando l'automobile acquisisce esperienza e crea una cronologia di rinforzo, impara a rimanere nella propria corsia, rispettare i limiti di velocità e frenare se sono presenti pedoni.

Che cosa puoi fare con gli algoritmi di Machine Learning

Gli algoritmi di Machine Learning ti aiutano a ottenere risposta a domande troppo complesse per l'analisi manuale. Sono disponibili molti tipi diversi di algoritmi di Machine Learning, ma i casi d'uso per gli algoritmi di Machine Learning rientrano in genere in una di queste categorie.

Prevedi una categoria di destinazione

Gli algoritmi di classificazione a due classi (binari)  dividono i dati in due categorie. Sono utili per domande che hanno solo due possibili risposte che si escludono a vicenda, incluse le domande di tipo sì/no. Ad esempio:

  • Sarà possibile percorrere le prossime 1.000 miglia con questi pneumatici: Sì o No?
  • Quale opzione consente di ottenere più segnalazioni: un credito di 10 USD$ o uno sconto del 15%?

 

Gli algoritmi di classificazione con più classi (multinomiali) dividono i dati in tre o più categorie. Sono utili per domande che hanno tre o più risposte possibili che si escludono a vicenda. Ad esempio:

  • In quale mese la maggior parte dei viaggiatori acquista biglietti aerei?
  • Quale emozione mostra la persona in questa foto?

Trova punti dati insoliti

Gli algoritmi di rilevamento anomalie identificano i punti dati che non rientrano nei parametri definiti per gli elementi "normali". Puoi ad esempio usare gli algoritmi di rilevamento anomalie per rispondere a domande come queste:

  • Quali sono le parti difettose di questo batch?
  • Quali acquisti con carta di credito potrebbero essere illeciti?

Stima dei valori

Gli algoritmi di regressione prevedono il valore di un nuovo punto dati in base ai dati cronologici. Aiutano a fornire risposta a domande come queste:

  • Quale sarà il costo medio di un appartamento con due camere nella mia città il prossimo anno?
  • Quanti pazienti verranno visitati nella clinica al martedì?

Verifica il cambiamento dei valori nel tempo

Gli algoritmi Time Series mostrano il cambiamento di un valore specifico nel tempo. Grazie all'analisi delle serie temporali e alla previsione serie temporale, i dati vengono raccolti a intervalli regolari nel tempo e vengono usati per creare previsioni e identificare tendenze, stagionalità, ciclicità e irregolarità. Gli algoritmi Time Series vengono usati per rispondere a domande quali:

  • È probabile che il prezzo di azioni specifiche aumenti o diminuisca nel prossimo anno?
  • Quali saranno le mie spese l'anno prossimo?

Individua le somiglianze

Gli algoritmi di clustering dividono i dati in più gruppi determinando il livello di somiglianza tra punti dati. Gli algoritmi di clustering sono ottimali per domande come queste:

  • A quali spettatori piacciono gli stessi tipi di film?
  • Quali modelli di stampanti condividono lo stesso malfunzionamento?

Classificazione

Gli algoritmi di classificazione usano calcoli predittivi per assegnare i dati a categorie predefinite. Gli algoritmi di classificazione vengono sottoposti a training in base ai dati di input e vengono usati per rispondere a domande quali:

  • Questo messaggio di posta elettronica è indesiderato?
  • Qual è la valutazione (positiva, negativa o neutra) di un testo specifico?
Gli algoritmi di regressione lineare mostrano o prevedono la relazione tra due variabili o fattori applicando una linea retta ai dati. La linea viene spesso calcolata tramite la funzione di costo dell'errore quadratico. La regressione lineare è uno dei tipi più diffusi di analisi di regressione.
Gli algoritmi di regressione logistica applicano una curva continua a forma di S ai dati. La regressione logistica è un altro tipo molto diffuso di analisi di regressione.
Gli algoritmi Naïve Bayes calcolano la probabilità che si verifichi un evento, in base all'occorrenza di un evento correlato.
Le macchine a vettori di supporto tracciano un iperpiano tra i due punti dati più vicini. Questo approccio marginalizza le classi e massimizza le distanze tra i punti dati per differenziarli in modo più chiaro.
Gli algoritmi dell'albero delle decisioni suddividono i dati in due o più set omogenei. Usano regole di tipo if–then per separare i dati in base al differenziatore più significativo tra punti dati.
Gli algoritmi di tipo k-NN (k-nearest neighbor) archiviano tutti i punti dati disponibili e classificano ogni nuovo punto dati in base ai punti dati che più si avvicinano al nuovo punto dati, in base alle misurazioni di una funzione di distanza.
Gli algoritmi di foresta casuale sono basati sugli alberi delle decisioni, ma invece di creare un albero creano una foresta di alberi e quindi randomizzano gli alberi nella foresta. Aggregano quindi i voti da diverse formazioni casuali degli alberi delle decisioni per determinare la classe finale dell'oggetto di test.
Gli algoritmi di tipo gradient boosting producono un modello di previsione che riunisce modelli di previsioni meno avanzati, in genere alberi delle decisioni, tramite un processo di combinazione che consente di migliorare le prestazioni complessive del modello.
Gli algoritmi di tipo K-medie classificano i dati in cluster, in cui K equivale al numero di cluster. I punti dati all'interno di ogni cluster sono omogenei e sono eterogenei rispetto ai punti dati in altri cluster.

Che cosa sono le librerie di Machine Learning?

Una libreria di Machine Learning è un set di funzioni, framework, moduli e routine scritto in un linguaggio specifico. Gli sviluppatori usano il codice nelle librerie di Machine Learning come blocchi predefiniti per la creazione di soluzioni di Machine Learning che possono eseguire attività complesse. Invece di dovere scrivere manualmente il codice di ogni algoritmo e ogni formula in una soluzione di Machine Learning, gli sviluppatori possono trovare le funzioni e i moduli necessari in una delle molte librerie di Machine Learning disponibili e possono usarli per creare una soluzione che soddisfa le esigenze specifiche.

Inizia a sperimentare con Azure Machine Learning

Scopri in che modo i diversi algoritmi analizzano i dati creando e distribuendo modelli personalizzati di apprendimento automatico tramite Azure Machine Learning.