Lewati Navigasi

Algoritma pembelajaran mesin

Pengantar matematika dan logika di balik pembelajaran mesin.

Apa itu algoritme pembelajaran mesin?

Algoritme pembelajaran mesin adalah bagian dari kode yang membantu orang menjelajahi, menganalisis, dan menemukan makna dalam kumpulan data kompleks. Setiap algoritme adalah sekumpulan instruksi langkah demi langkah yang tidak ambigu yang dapat diikuti mesin untuk mencapai tujuan tertentu. Dalam model pembelajaran mesin, tujuannya adalah untuk menetapkan atau menemukan pola yang dapat digunakan orang lain untuk membuat prediksi atau mengategorikan informasi. Apa itu pembelajaran mesin?

Algoritme pembelajaran mesin menggunakan parameter yang didasarkan pada data pelatihan—subset data yang mewakili kumpulan yang lebih besar. Saat data pelatihan diperluas untuk mewakili dunia secara lebih realistis, algoritme menghitung hasil yang lebih akurat.

Algoritme yang berbeda menganalisis data dengan cara yang berbeda. Algoritme sering dikelompokkan berdasarkan teknik pembelajaran mesin yang mereka gunakan untuk: pembelajaran yang diawasi, pembelajaran tanpa pengawasan, dan pembelajaran penguatan. Algoritme yang paling umum digunakan menggunakan regresi dan klasifikasi untuk memprediksi kategori target, menemukan titik data yang tidak biasa, memprediksi nilai, dan menemukan kemiripan.

Teknik pembelajaran mesin

Saat mempelajari selengkapnya tentang algoritme pembelajaran mesin, Anda akan menemukan bahwa algoritme tersebut biasanya berada dalam salah satu dari tiga teknik pembelajaran mesin:

Pembelajaran yang diawasi

Dalam pembelajaran yang diawasi, algoritme membuat prediksi berdasarkan sekumpulan contoh berlabel yang Anda berikan. Teknik ini berguna saat Anda mengetahui seperti apa hasilnya.

Misalnya, Anda menyediakan himpunan data yang mencakup populasi kota menurut tahun selama 100 tahun terakhir, dan ingin mengetahui populasi kota tertentu yang akan menjadi empat tahun dari sekarang. Hasil menggunakan label yang sudah ada dalam himpunan data: populasi, kota, dan tahun.

Pembelajaran tanpa pengawasan

Dalam pembelajaran yang tidak diawasi, poin data tidak diberi label—algoritme memberi label untuk Anda dengan menata data atau menjelaskan strukturnya. Teknik ini berguna ketika Anda tidak tahu seperti apa hasilnya.

Misalnya, Anda memberikan data pelanggan, dan ingin membuat segmen pelanggan yang menyukai produk serupa. Data yang Anda berikan tidak diberi label, dan label dalam hasil dihasilkan berdasarkan kemiripan yang ditemukan di antara titik data.

Pembelajaran penguatan

Pembelajaran penguatan menggunakan algoritme yang mempelajari dari hasil dan memutuskan tindakan mana yang akan diambil berikutnya. Setelah setiap tindakan, algoritme menerima umpan balik yang membantunya menentukan apakah pilihan yang dibuat benar, netral, atau salah. Teknik yang baik digunakan untuk sistem otomatis yang harus membuat banyak keputusan kecil tanpa panduan manusia.

Misalnya, Anda sedang merancang mobil otonom, dan ingin memastikan bahwa mobil tersebut mematuhi hukum dan menjaga orang-orang tetap aman. Saat mobil mendapatkan pengalaman dan riwayat penguatan, mobil mempelajari cara tetap berada di jalurnya, melaju di batas kecepatan, dan mengerem pejalan kaki.

Apa yang dapat Anda lakukan dengan algoritme pembelajaran mesin

Algoritme pembelajaran mesin membantu Anda menjawab pertanyaan yang terlalu kompleks untuk dijawab melalui analisis manual. Ada banyak jenis algoritme pembelajaran mesin yang berbeda, tetapi kasus penggunaan untuk algoritme pembelajaran mesin biasanya termasuk dalam salah satu kategori ini.

Memprediksi kategori target

Algoritme klasifikasi dua kelas (biner) membagi data menjadi dua kategori. Pertanyaan tersebut berguna untuk pertanyaan yang hanya memiliki dua kemungkinan jawaban yang sama eksklusifnya, termasuk pertanyaan ya/tidak. Misalnya:

  • Apakah ban ini akan gagal dalam 1.000 mil ke depan: ya atau tidak?
  • Mana yang membawa lebih banyak rujukan: kredit USD 10 atau diskon 15%?

Algoritme klasifikasi multikelas (multinomial) membagi data menjadi tiga kategori atau lebih. Pertanyaan tersebut berguna untuk pertanyaan yang memiliki tiga atau beberapa kemungkinan jawaban yang sama-sama eksklusif. Misalnya:

  • Pada bulan mana mayoritas pelancong membeli tiket pesawat?
  • Emosi apa yang ditampilkan oleh orang dalam foto ini?

Menemukan titik data yang tidak biasa

Algoritme deteksi anomali mengidentifikasi titik data yang berada di luar parameter yang ditentukan untuk apa yang \"normal.\" Misalnya, Anda akan menggunakan algoritme deteksi anomali untuk menjawab pertanyaan seperti:

  • Di mana bagian-bagian yang rusak dalam batch ini?
  • Pembelian kartu kredit mana yang mungkin penipuan?

Prediksi nilai

Algoritme regresi memprediksi nilai titik data baru berdasarkan data riwayat. Ini membantu Anda menjawab pertanyaan seperti:

  • Berapa biaya rumah dua kamar tidur rata-rata di kota saya tahun depan?
  • Berapa banyak pasien yang akan masuk ke klinik pada hari Selasa?

Lihat perubahan nilai seiring waktu

Algoritme rangkaian waktu memperlihatkan bagaimana nilai tertentu berubah seiring waktu. Dengan analisis rangkaian waktu dan perkiraan rangkaian waktu, data dikumpulkan pada interval reguler dari waktu ke waktu dan digunakan untuk membuat prediksi dan mengidentifikasi tren, musiman, siklikasi, dan tidak teratur. Algoritme rangkaian waktu digunakan untuk menjawab pertanyaan seperti:

  • Apakah harga saham tertentu mungkin naik atau turun pada tahun mendatang?
  • Berapa biaya saya tahun depan?

Menemukan kemiripan

Algoritme pengklusteran membagi data menjadi beberapa grup dengan menentukan tingkat kemiripan antara titik data. Algoritme pengklusteran berfungsi dengan baik untuk pertanyaan seperti:

  • Pemirsa mana yang menyukai tipe film yang sama?
  • Model printer mana yang gagal dengan cara yang sama?

Klasifikasi

Algoritme klasifikasi menggunakan penghitungan prediktif untuk menetapkan data ke kategori prasetel. Algoritme klasifikasi dilatih tentang data input, dan digunakan untuk menjawab pertanyaan seperti:

  • Apakah ini spam email?
  • Sentimen apa itu (positif, negatif, atau netral) dari teks tertentu?

Apa itu pustaka pembelajaran mesin?

Pustaka pembelajaran mesin adalah sekumpulan fungsi, kerangka kerja, modul, dan rutinitas yang ditulis dalam bahasa tertentu. Pengembang menggunakan kode dalam pustaka pembelajaran mesin sebagai blok pembangun untuk membuat solusi pembelajaran mesin yang dapat melakukan tugas kompleks. Daripada harus mengodekan setiap algoritme dan rumus secara manual dalam solusi pembelajaran mesin, pengembang dapat menemukan fungsi dan modul yang mereka perlukan di salah satu dari banyak pustaka ML yang tersedia, dan menggunakannya untuk membuat solusi yang memenuhi kebutuhan mereka.

Mulai bereksperimen dengan Azure Machine Learning

Lihat seberapa berbeda algoritme menganalisis data dengan membuat dan menyebarkan model pembelajaran mesin Anda sendiri menggunakan Azure Machine Learning.