Algoritmer til maskinel indlæring

En introduktion til matematikken og logikken bag maskinel indlæring.

Hvad er algoritmer til maskinel indlæring?

Algoritmer til maskinel indlæring er kodestykker, der hjælper brugerne med at udforske, analysere og finde mening i komplekse datasæt. Hver enkelt algoritme er et afgrænset sæt af utvetydige trinvise instruktioner, som en maskine kan følge for at opnå et bestemt mål. I en model til maskinel indlæring er målet at oprette eller registrere mønstre, som kan bruges til at skabe forudsigelser eller kategorisere oplysninger. Hvad er Machine Learning?

Algoritmer til maskinel indlæring anvender parametre, der er baseret på træningsdata – et undersæt af data, der repræsenterer det overordnede sæt. Efterhånden som træningsdataene udvides for at repræsentere verden på en mere realistisk måde, beregner algoritmen mere nøjagtige resultater.

Forskellige algoritmer analyserer data på forskellige måder. De er ofte grupperet af de teknikker til maskinel indlæring, som de bruges til: overvåget læring, uovervåget læring og styrket indlæring. De mes almindelige algoritmer anvender regression og klassificering til at forudsige målkategorier, finde usædvanlige datapunkter, forudsige værdier og opdage ligheder.

Teknikker inden for maskinel indlæring

Efterhånden som du lærer mere om algoritmer til maskinel indlæring, vil du opleve, at de typisk ligger inden for en af tre teknikker inden for maskinel indlæring:

Overvåget læring

I forbindelse med overvåget læring foretager algoritmer forudsigelser baseret på et sæt af mærkede eksempler, som du angiver. Denne teknik er praktisk, når du ved, hvordan resultatet bør se ud.

Du angiver f.eks. et datasæt, der indeholder befolkningstal i byer efter år for de seneste 100 år, og du vil gerne vide, hvad befolkningstallet for en bestemt by vil være om fire år. Resultatet anvender mærkater, der allerede findes i datasættet: befolkningsstal, by og år.

Uovervåget læring

I forbindelse med en uovervåget læring er datapunkterne ikke mærket – algoritmen mærker dem for dig ved at organisere dataene eller beskrive deres struktur. Denne teknik er nyttig, når du ikke ved, hvordan resultatet bør se ud.

Du angiver f.eks. kundedata og vil oprette segmenter af kunder, der kan lide de samme produkter. De data, du angiver, er ikke mærket, og mærkaterne i resultatet genereres på baggrund af de ligheder, der blev fundet mellem datapunkterne.

Styrket læring

Styrket læring anvender algoritmer, der lærer fra resultater og bestemmer, hvilken handling der derefter skal udføres. Efter hver enkelt handling modtager algoritmen feedback, der hjælper med at afgøre, om det trufne valg var korrekt, neutralt eller forkert. Det er en god teknik at anvende i automatiserede systemer, hvor der skal træffes mange små beslutninger uden menneskelig vejledning.

Du designer f.eks. en selvkørende bil, og du vil sikre dig, at den overholde loven, og er sikker for mennesker. I takt med at bilen får erfaring og en historik for styrke, lærer den, hvordan den kan holde sin vognbane, køre efter hastighedsbegrænsningerne og bremse for fodgængere.

Det kan du bruge algoritmer til maskinel indlæring til

Algoritmer til maskinel indlæring hjælper dig med at besvare spørgsmål, der er for komplekse til at blive besvaret ved hjælp af manuelle analyser. Use cases er typisk omfattet af en af disse kategorier.

Forudsig en målkategori

Toklasses-klassifikationsalgoritmer (binære) deler dataene i to kategorier. De er nyttige i forbindelse med spørgsmål, der kun har to mulige svar, som gensidigt udelukker hinanden, herunder ja/nej-spørgsmål. Eksempel:

  • Vil dette hjul falde af inden for de næste 1.000 kilometer: ja eller nej?
  • Hvad giver flest kunder: en kredit på 10 USD eller en rabat på 15 %?

Multiklasse-klassifikationsalgoritmer (multinominal) deler dataene i tre eller flere kategorier. De er nyttige i forbindelse med spørgsmål, der har tre eller flere mulige svar, som gensidigt udelukker hinanden. Eksempel:

  • I hvilken måned køber de fleste rejsende flybilletter?
  • Hvilken følelse udviser personen på dette foto?

Find usædvanlige datapunkter

Algoritmer til registrering af uregelmæssigheder identificerer datapunkter, der falder uden for de definerede parametre for det, der er "normalt". Du kan f.eks. bruge algoritmer til registrering af uregelmæssigheder til at besvare spørgsmål som f.eks.:

  • Hvor er de defekte dele i dette batch?
  • Hvilke køb via kreditkort er måske falske?

Forudsig værdier

Regressionsalgoritmer forudsiger værdien af et nyt datapunkt baseret på historiske data. De kan hjælpe dig med at besvare spørgsmål som f.eks.:

  • Hvor meget vil en gennemsnitlig toværelsesbolig koste i min by næste år?
  • Hvor mange patienter behandles i klinikken på tirsdag?

Opdag ligheder

Klyngedannelsesalgoritmer opdeler dataene i flere grupper ved at fastlægge lighedsniveauet mellem datapunkter. Klyngedannelsesalgoritmer fungerer godt i forbindelse med spørgsmål som f.eks.:

  • Hvilke seere kan lide de samme typer film?
  • Hvilke printermodeller fejler på samme måde?

Begynd at eksperimentere med Azure Machine Learning

Se, hvordan forskellige algoritmer analyserer data ved at oprette og udrulle dine egne modeller til maskinel indlæring ved hjælp af Azure Machine Learning.