Makine öğrenmesi algoritmaları

Makine öğrenmesinde kullanılan matematik ve mantığa giriş.

Makine öğrenmesi algoritmaları nelerdir?

Makine öğrenmesi algoritmaları, insanların karmaşık veri kümelerini keşfetmesine, analiz etmesine ve bunlarda anlam bulmasına yardımcı olan kod parçacıklardır. Her algoritma, bir makinenin belirli bir hedefi gerçekleştirmek için izleyebileceği sınırlı ve belirli adım adım ilerleyen yönerge kümesidir. Makine öğrenmesi modelinin hedefi, insanların tahmin yapmak veya bilgileri kategorilere ayırmak için kullanabileceği desenler oluşturmak veya keşfetmektir. Makine öğrenimi nedir?

Makine öğrenmesi algoritmaları, büyük kümeyi temsil eden eğitim verilerini temel alan parametreleri kullanır. Eğitim verileri dünyayı daha gerçekçi bir şekilde temsil etmek için genişledikçe, algoritma daha doğru sonuçlar hesaplar.

Farklı algoritmalar, verileri farklı şekilde analiz eder. Bunlar, kullanıldıkları makine öğrenmesi teknikleri ile gruplandırılır: denetimli öğrenme, denetimsiz öğrenme ve pekiştirmeye dayalı öğrenme. En yaygın olarak kullanılan algoritmalar, hedef kategorileri tahmin etmek, olağandışı veri noktalarını bulmak, değerleri tahmin etmek ve benzerlikleri bulmak için regresyon ve sınıflandırmayı kullanır.

Makine öğrenmesi teknikleri

Makine öğrenmesi algoritmaları hakkında daha fazla bilgi edindikçe, bunların genelde aşağıdaki üç makine öğrenmesi tekniğinin birisi olduğunu görürsünüz:

Denetimli öğrenme

Denetimli öğrenmede, algoritmalar sağladığınız etiketli örnekleri temel alarak tahmin yapar. Bu teknik, sonucun nasıl görüneceğini bildiğiniz durumlarda faydalıdır.

Örneğin, son 100 yıla göre şehirlerin nüfuslarını içeren bir küme sağlayıp dört yıl sonra belirli bir şehrin nüfusunun ne olacağını öğrenmek istediğinizi varsayalım. Sonuç, veri kümelerinde mevcut olan etiketleri kullanır: nüfus, şehir ve yıl.

Denetimsiz öğrenme

Denetimsiz öğrenmede veri noktaları etiketlenmez. Algoritma, verileri düzenleyerek veya bunların yapısını açıklayarak veri noktalarını sizin için etiketler. Bu teknik, sonucun nasıl görüneceğini bilmediğiniz durumlarda faydalıdır.

Örneğin, müşteri verilerini sağlayıp benzer ürünlerden hoşlanan müşterilerin segmentlerini oluşturmak istediğinizi varsayalım. Sağladığınız veriler etiketlenmez ve sonuçtaki etiketler, veri noktalarında keşfedilen benzerlikler temel alınarak oluşturulur.

Pekiştirmeye dayalı öğrenme

Pekiştirmeye dayalı öğrenme, sonuçlardan öğrenen ve gerçekleştirilecek eylemi kararlaştıran algoritmaları kullanır. Algoritma, her eylemden sonra seçeneğin doğru mu, nötr mü yoksa yanlış mı olduğunu belirlemeye yardımcı olan geri bildirim alır. İnsan kılavuzluğu olmadan birçok küçük kararlar alması gereken otomatikleştirilmiş sistemler için kullanılabilecek iyi bir tekniktir.

Örneğin, sürücüsüz bir araç tasarlıyorsunuz ve bu aracın yasalara uyduğundan ve insan güvenliğini sağladığından emin olmak istiyorsunuz. Araç deneyim ve pekiştirme geçmişi kazandıkça şeritte kalmayı, hız limitini aşmamayı ve yayaları görünce fren yapmayı öğrenir.

Machine Learning ile yapabilecekleriniz

Makine öğrenmesi algoritmaları, el ile yapılan analiz ile yanıtlanması çok karmaşık olan soruları yanıtlamanıza yardımcı olur. Kullanım örnekleri genelde bu kategorilerden birisinde sınıflandırılır.

Hedef kategorisini tahmin etme

İki sınıf (ikili) sınıflandırma algoritmaları verileri iki kategoriye böler. Bunlar, evet/hayır soruları da dahil olmak üzere karşılıklı olarak birbirini dışlayan ve yalnızca olası iki yanıtı bulunan sorular için kullanışlıdır. Örneğin:

  • Bu lastik sonraki 1600 kilometrede patlar mı: evet mi hayır mı?
  • Şunların hangisi daha fazla yönlendirilen müşteri getirir: 10 ABD doları değerinde kredi mi yoksa %15 oranında indirim mi?

Çoklu sınıflı (çok terimli) sınıflandırma algoritmaları verileri üç veya daha fazla kategoriye böler. Bunlar, karşılıklı olarak birbirini dışlayan üç veya daha fazla olası yanıtı bulunan sorular için kullanışlıdır. Örneğin:

  • Seyahat eden kişilerin büyük çoğunluğu uçak biletlerini hangi ay satın alır?
  • Fotoğraftaki kişinin duygularını tanıma

Olağan dışı veri noktalarını bulma

Anomali algılama algoritmaları, nelerin “normal” olduğunu tanımlayan parametrelerin dışında kalan veri noktalarını tanımlar. Örneğin, aşağıda verilenler gibi soruları yanıtlamak için anomali algılama algoritmaları kullanılır:

  • Bu toplu işteki kusurlu parçalar nelerdir?
  • Kredi kartıyla yapılan hangi alışverişler dolandırıcılık amaçlı olabilir?

Değerleri tahmin etme

Regresyon algoritmaları, geçmiş verileri temel alarak yeni bir veri noktasının değerini tahmin eder. Şu gibi soruları yanıtlamanıza yardımcı olurlar:

  • Oturduğum şehirde iki yatak odalı bir evin ortalama fiyatı ne olacak?
  • Salı günü kaç hasta kliniği ziyaret edecek?

Benzerlikleri bulma

Kümeleme algoritmaları, veri noktaları arasındaki benzerlik düzeyini belirleyerek verileri birden fazla gruba böler. Kümeleme algoritmaları şunun gibi sorular için uygundur:

  • Hangi izleyiciler aynı tür filmleri izlemekten hoşlanıyor?
  • Hangi yazıcı modelleri aynı şekilde hatayla karşılaşıyor?

Azure Machine Learning ile deneme yapmaya başlayın

Azure Machine Learning’i kullanarak kendi makine öğrenmesi modelinizi oluşturup dağıtarak farklı algoritmaların verileri nasıl analiz ettiğini öğrenin.