Spring over navigation

Algoritmer til maskinel indlæring

En introduktion til matematikken og logikken bag maskinel indlæring.

Hvad er algoritmer til maskinel indlæring?

Algoritmer til maskinel indlæring er kodestykker, der hjælper brugerne med at udforske, analysere og finde mening i komplekse datasæt. Hver enkelt algoritme er et afgrænset sæt af utvetydige trinvise instruktioner, som en maskine kan følge for at opnå et bestemt mål. I en model til maskinel indlæring er målet at oprette eller registrere mønstre, som kan bruges til at skabe forudsigelser eller kategorisere oplysninger. Hvad er maskinel indlæring?

Algoritmer til maskinel indlæring anvender parametre, der er baseret på træningsdata – et undersæt af data, der repræsenterer det overordnede sæt. Efterhånden som træningsdataene udvides for at repræsentere verden på en mere realistisk måde, beregner algoritmen mere nøjagtige resultater.

Forskellige algoritmer analyserer data på forskellige måder. De er ofte grupperet af de teknikker til maskinel indlæring, som de bruges til: overvåget læring, uovervåget læring og styrket indlæring. De mes almindelige algoritmer anvender regression og klassificering til at forudsige målkategorier, finde usædvanlige datapunkter, forudsige værdier og opdage ligheder.

Teknikker inden for maskinel indlæring

Efterhånden som du lærer mere om algoritmer til maskinel indlæring, vil du opleve, at de typisk ligger inden for en af tre teknikker inden for maskinel indlæring:

Overvåget læring

I forbindelse med overvåget læring foretager algoritmer forudsigelser baseret på et sæt af mærkede eksempler, som du angiver. Denne teknik er praktisk, når du ved, hvordan resultatet bør se ud.

Du angiver f.eks. et datasæt, der indeholder befolkningstal i byer efter år for de seneste 100 år, og du vil gerne vide, hvad befolkningstallet for en bestemt by vil være om fire år. Resultatet anvender mærkater, der allerede findes i datasættet: befolkningsstal, by og år.

Ikke-overvåget læring

I forbindelse med en uovervåget læring er datapunkterne ikke mærket – algoritmen mærker dem for dig ved at organisere dataene eller beskrive deres struktur. Denne teknik er nyttig, når du ikke ved, hvordan resultatet bør se ud.

Du angiver f.eks. kundedata og vil oprette segmenter af kunder, der kan lide de samme produkter. De data, du angiver, er ikke mærket, og mærkaterne i resultatet genereres på baggrund af de ligheder, der blev fundet mellem datapunkterne.

Styrket læring

Styrket læring anvender algoritmer, der lærer fra resultater og bestemmer, hvilken handling der derefter skal udføres. Efter hver enkelt handling modtager algoritmen feedback, der hjælper med at afgøre, om det trufne valg var korrekt, neutralt eller forkert. Det er en god teknik at anvende i automatiserede systemer, hvor der skal træffes mange små beslutninger uden menneskelig vejledning.

Du designer f.eks. en selvkørende bil, og du vil sikre dig, at den overholde loven, og er sikker for mennesker. I takt med at bilen får erfaring og en historik for styrke, lærer den, hvordan den kan holde sin vognbane, køre efter hastighedsbegrænsningerne og bremse for fodgængere.

Det kan du bruge algoritmer til maskinel indlæring til

Algoritmer til maskinel indlæring hjælper dig med at besvare spørgsmål, der er for komplekse til at blive besvaret ved hjælp af manuelle analyser. Der er mange forskellige algoritmetyper til maskinel indlæring, men use cases for algoritmer til maskinel indlæring er typisk placeret i en af disse kategorier.

Forudsig en målkategori

Toklasses-klassifikationsalgoritmer (binære) deler dataene i to kategorier. De er nyttige i forbindelse med spørgsmål, der kun har to mulige svar, som gensidigt udelukker hinanden, herunder ja/nej-spørgsmål. Eksempel:

  • Vil dette hjul falde af inden for de næste 1.000 kilometer: ja eller nej?
  • Hvad giver flest kunder: en kredit på 10 USD eller en rabat på 15 %?

Multiklasse-klassifikationsalgoritmer (multinominal) deler dataene i tre eller flere kategorier. De er nyttige i forbindelse med spørgsmål, der har tre eller flere mulige svar, som gensidigt udelukker hinanden. Eksempel:

  • I hvilken måned køber de fleste rejsende flybilletter?
  • Hvilken følelse udviser personen på dette foto?

Find usædvanlige datapunkter

Algoritmer til registrering af uregelmæssigheder identificerer datapunkter, der falder uden for de definerede parametre for det, der er "normalt". Du kan f.eks. bruge algoritmer til registrering af uregelmæssigheder til at besvare spørgsmål som f.eks.:

  • Hvor er de defekte dele i dette batch?
  • Hvilke køb via kreditkort er måske falske?

Forudsig værdier

Regressionsalgoritmer forudsiger værdien af et nyt datapunkt baseret på historiske data. De kan hjælpe dig med at besvare spørgsmål som f.eks.:

  • Hvor meget vil en gennemsnitlig toværelsesbolig koste i min by næste år?
  • Hvor mange patienter behandles i klinikken på tirsdag?

Se, hvordan værdier ændrer sig med tiden

Tidsseriealgoritmer viser, hvordan en given værdi ændres med tiden. Ved hjælp af tidsserieanalyse og tidsserieprognoser indsamles data regelmæssigt med tiden og bruges til at skabe forudsigelser og identificere tendenser, sæsonudsving, cyklusser og uregelmæssigheder. Tidsseriealgoritmer bruges til at besvare spørgsmål som f.eks.:

  • Er det sandsynligt, at prisen på en bestemt aktie stiger eller falder i det kommende år?
  • Hvad vil mine udgifter være næste år?

Opdag ligheder

Klyngedannelsesalgoritmer opdeler dataene i flere grupper ved at fastlægge lighedsniveauet mellem datapunkter. Klyngedannelsesalgoritmer fungerer godt i forbindelse med spørgsmål som f.eks.:

  • Hvilke seere kan lide de samme typer film?
  • Hvilke printermodeller fejler på samme måde?

Klassifikation

Klassifikationsalgoritmer bruger forudsigende beregninger til at tildele data til foruddefinerede kategorier. Klassifikationsalgoritmer oplæres ved hjælp af inputdata og bruges til at besvare spørgsmål som f.eks.:

  • Er denne mail spam?
  • Hvad er synspunktet (positivt, negativt eller neutralt) for en given tekst?

Hvad er biblioteker til maskinel indlæring?

Et bibliotek til maskinel indlæring er et sæt funktioner, strukturer, moduler og rutiner, der er skrevet på et bestemt computersprog. Udviklere bruger koden i biblioteker til maskinel indlæring som mursten til at skabe løsninger til maskinel indlæring, der kan udføre komplekse opgaver. I stedet for at skulle kode alle algoritmer og formler i en løsning til maskinel indlæring manuelt, kan udviklere finde de funktioner og moduler, de har brug for, i et af de mange tilgængelige biblioteker til maskinel indlæring og bruge dem til at skabe en løsning, der opfylder deres behov.

Begynd at eksperimentere med Azure Machine Learning

Se, hvordan forskellige algoritmer analyserer data ved at oprette og udrulle dine egne modeller til maskinel indlæring ved hjælp af Azure Machine Learning.