Gépi tanulási algoritmusok

Bevezetés a gépi tanulás által használt matematikába és logikába.

Mik azok a gépi tanulási algoritmusok?

A gépi tanulási algoritmusok olyan kódrészletek, amelyek segítenek abban, hogy bonyolult adatkészleteket tárjunk fel és elemezzünk, és hogy értelmes információkat találjunk bennük. Minden algoritmus olyan egyértelmű, lépésenkénti utasítások véges halmaza, amelyeket a gép követni tud egy meghatározott cél érdekében. A gépi tanulási modell célja, hogy olyan mintákat hozzon létre vagy tárjon fel, amelyeket az emberek felhasználhatnak előrejelzésekhez vagy az információk kategorizálásához. Mi a gépi tanulás?

A gépi tanulási algoritmusok a betanítási adatokon alapuló paramétereket használnak, azaz a nagyobb halmaz adatainak egy részhalmazát. A betanítási adatmennyiség bővülésével, és amint azok már valósághűbben le tudják írni a világot, az algoritmus egyre pontosabb eredményeket képes majd kiszámítani.

A különböző algoritmusok más-másféleképpen elemzik az adatokat. Ezek gyakran a gépi tanulási technikák szerint vannak csoportosítva: felügyelt tanulás, nem felügyelt tanulás és megerősítő tanulás. A leggyakrabban használt algoritmusok regressziót és besorolást használnak a célkategóriák előrejelzéséhez, a szokatlan adatpontok megkereséséhez, az értékek előrejelzéséhez és a hasonlóságok feltárásához.

Gépi tanulási technikák

Amint egyre többet tud majd a gépi tanulási algoritmusokról, azt tapasztalhatja majd, hogy ezek általában három gépi tanulási technika valamelyikéhez tartoznak:

Felügyelt tanulás

A felügyelt tanulásban az algoritmusok az Ön által megadott címkézett példák alapján készítenek előrejelzéseket. Ez a módszer akkor hasznos, ha tudja, hogy az eredménynek hogyan kell kinéznie.

Például megadhat egy adatkészletet, amely az elmúlt 100 évre vonatkozóan városok népességi adatait tartalmazza, és azt szeretné tudni, hogy egy adott város népessége hogyan alakul majd négy év múlva. Az eredmény olyan címkéket használ, amelyek már szerepelnek az adatkészletben: népesség, város és év.

Felügyelet nélküli tanulás

A nem felügyelt tanulásban az adatpontok nincsenek megcímkézve – az algoritmus címkézi meg őket Ön helyett az adatok rendszerezésével vagy a szerkezetük leírásával. Ez a módszer akkor hasznos, ha nem tudja, hogy az eredménynek hogyan kell kinéznie.

Például megadja az ügyféladatokat, és olyan ügyfélcsoportokat szeretne eredményül kapni, akik hasonló termékeket kedvelnek. Az Ön által megadott adatok nincsenek megcímkézve, és az eredményben szereplő címkék az adatpontok között felderített hasonlóságok alapján jönnek létre.

Megerősítő tanulás

A megerősítő tanulás olyan algoritmusokat használ, amelyek az eredményekből tanulnak, és eldönti, hogy melyik műveletet kell elvégeznie a következő lépésben. Az egyes műveletek után az algoritmus visszajelzést kap, amely segít megállapítani, hogy a választott döntés helyes, semleges vagy helytelen volt-e. Az olyan automatizált rendszerek esetében érdemes használni, amelyeknek sok kis, emberi útmutatás nélküli döntést kell hozniuk.

Tegyük fel például, hogy önvezető autót tervez, és biztosítani szeretné, hogy az autó betartja a szabályokat, és az emberek biztonságáról is gondoskodik. Amint az autó tapasztalatokat szerez és már vannak megerősítő előzményei, megtanulja, hogyan maradhat a saját sávjában, hogyan tarthatja tiszteletben a sebességkorlátozást, és hogyan fékezzen a gyalogosok számára.

Mire használhatóak a gépi tanulási algoritmusok

A gépi tanulási algoritmusok segítenek olyan kérdések megválaszolásában, amelyek túl összetettek ahhoz, hogy manuális elemzéssel válaszoljunk rájuk. A használati esetek általában az alábbi kategóriák valamelyikébe tartoznak.

Célkategória előrejelzése

A kétosztályos (bináris) osztályozó algoritmusok az adatokat két kategóriára osztják. Ezek olyan kérdések esetében hasznosak, amelyekre csak két, egymást kölcsönösen kizáró lehetséges válasz adható, többek között az igen és a nem. Példa:

  • Ez a gumiabroncs meghibásodik a következő 1000 mérföld során? Igen vagy nem?
  • Melyik hoz majd több érdeklődőt: 10 USD kredit, vagy 15% kedvezmény?

A Többosztályos (multinomális) osztályozó algoritmusok az adatokat két vagy több kategóriába sorolják. Ezek olyan kérdések esetében hasznosak, amelyekre három vagy több, egymást kölcsönösen kizáró lehetséges válasz adható. Példa:

  • Melyik hónapban vásárolja meg a legtöbb utazó a repülőjegyét?
  • Milyen érzelmet mutat az ezen a fényképen látható személy?

Szokatlan adatpontok keresése

Az Anomáliadetektálási algoritmusok azonosítják azokat az adatpontokat, amelyek kívül esnek a „normálisként” definiált paramétereken. Anomáliadetektálási algoritmusokat használhat többek között az alábbi kérdések megválaszolásához:

  • Hol találhatók ebben a kötegben hibás részek?
  • Mely hitelkártyás vásárlások lehetnek hamisak?

Értékek előrejelzése

A regressziós algoritmusok egy új adatpont értékét jósolják meg a korábbi értékek alapján. Az alábbiakhoz hasonló kérdések megválaszolásához hasznosak:

  • Mennyibe fog kerülni jövőre egy átlagos, kétszobás lakás ebben a városban?
  • Hány beteg érkezik majd a klinikára kedden?

Hasonlóságok felderítése

A fürtalgoritmusok az adatokat több csoportra osztják az alapján, hogy meghatározzák az adatpontok közötti hasonlóság szintjét. A fürtalgoritmusok az alábbiakhoz hasonló kérdések esetén hasznosak leginkább:

  • Mely nézők kedvelik az ugyanolyan típusú filmeket?
  • Mely nyomtatók hibásodnak meg ugyanolyan módon?

Próbálja ki az Azure Machine Learning használatát

Megtudhatja, hogy a különböző algoritmusok hogyan elemzik az adatokat. Ehhez saját gépi tanulási modelleket hozhat létre és helyezhet üzembe az Azure Machine Learning használatával.