Trace Id is missing
Lompati ke konten utama
Azure

Algoritma pembelajaran mesin

Pengantar matematika dan logika di balik pembelajaran mesin.

Apa itu algoritma pembelajaran mesin?

Algoritma pembelajaran mesin adalah bagian dari kode yang membantu orang menjelajahi, menganalisis, dan menemukan makna dalam himpunan data kompleks. Setiap algoritma adalah sekumpulan instruksi langkah demi langkah yang jelas yang dapat diikuti mesin untuk mencapai tujuan tertentu. Tujuan model pembelajaran mesin adalah untuk menetapkan atau menemukan pola yang dapat digunakan untuk membuat prediksi atau mengategorikan informasi. Apa itu pembelajaran mesin?

Algoritme pembelajaran mesin menggunakan parameter yang didasarkan pada data pelatihan; subset data yang mewakili kumpulan yang lebih besar. Saat data pelatihan semakin luas untuk mewakili dunia secara lebih realistis, algoritma menghitung hasil yang lebih akurat.

Algoritma yang berbeda menganalisis data dengan cara yang berbeda. Algoritma tersebut sering dikelompokkan berdasarkan teknik pembelajaran mesin yang mereka gunakan untuk: pembelajaran dengan pengawasan, pembelajaran tanpa pengawasan, dan pembelajaran penguatan. Algoritma yang paling umum digunakan menggunakan regresi dan klasifikasi untuk memprediksi kategori target, menemukan titik data yang tidak biasa, memprediksi nilai, dan menemukan kemiripan.

Teknik pembelajaran mesin

Saat mempelajari selengkapnya tentang algoritma pembelajaran mesin, Anda akan bisa mengamati bahwa algoritma tersebut biasanya berada dalam salah satu dari tiga teknik pembelajaran mesin:


Pembelajaran dengan pengawasan

Dalam pembelajaran dengan pengawasan, algoritma membuat prediksi berdasarkan sekumpulan contoh berlabel yang Anda berikan. Teknik ini berguna jika Anda mengetahui seperti apa hasilnya.
 

Misalnya, Anda menyediakan himpunan data yang mencakup populasi kota menurut tahun selama 100 tahun terakhir, dan ingin mengetahui prediksi populasi kota tertentu empat tahun dari sekarang. Hasil menggunakan label yang sudah ada dalam himpunan data: populasi, kota, dan tahun.
 

Pembelajaran tanpa pengawasan

Dalam pembelajaran tanpa pengawasan, titik data tidak diberi label; algoritma membuat label untuk Anda dengan mengatur data atau menjelaskan strukturnya. Teknik ini berguna jika Anda tidak mengetahui seperti apa hasilnya.

 

Misalnya, Anda menyediakan data pelanggan, dan ingin membuat segmen pelanggan yang menyukai produk serupa. Data yang Anda berikan tidak diberi label, dan label dalam hasil dihasilkan berdasarkan kemiripan yang ditemukan di antara titik data.

 

Pembelajaran penguatan

Pembelajaran penguatan menggunakan algoritma yang didapatkan dari hasil dan memutuskan tindakan mana yang akan diambil berikutnya. Setelah setiap tindakan, algoritma menerima umpan balik yang membantunya menentukan apakah pilihan yang dibuat sudah benar, netral, atau salah. Teknik ini cocok digunakan untuk sistem otomatis yang harus membuat banyak keputusan kecil tanpa panduan manusia.

 

Misalnya, Anda mendesain mobil otomatis dan ingin memastikan bahwa mobil tersebut mematuhi peraturan lalu lintas dan menjaga orang-orang tetap aman. Saat mendapatkan pengalaman dan riwayat penguatan, mobil mempelajari cara tetap berada di jalurnya, melaju dalam batas kecepatan, dan mengerem jika pejalan kaki ada di depannya.

Hal yang dapat Anda lakukan dengan algoritma pembelajaran mesin

Algoritma pembelajaran mesin membantu Anda menjawab pertanyaan yang terlalu kompleks untuk dijawab melalui analisis manual. Ada berbagai jenis algoritma pembelajaran mesin, tetapi kasus penggunaan untuk algoritma pembelajaran mesin biasanya termasuk dalam salah satu kategori ini.

Kategori prediksi target

Algoritma klasifikasi dua kelas (biner) membagi data menjadi dua kategori. Algoritma ini cocok untuk pertanyaan yang hanya memiliki dua kemungkinan jawaban yang sama eksklusifnya, termasuk pertanyaan ya/tidak. Sebagai contoh:

  • Apakah ban ini akan rusak dalam 1.000 mil ke depan: ya atau tidak?
  • Rujukan mana yang lebih efektif: kredit USD$10 atau diskon 15%?

 

Algoritma klasifikasi multikelas (multinomial) membagi data menjadi tiga kategori atau lebih. Algoritma ini cocok untuk pertanyaan yang hanya memiliki tiga kemungkinan jawaban yang sama eksklusifnya atau lebih. Sebagai contoh:

  • Pada bulan apa mayoritas pelancong membeli tiket pesawat?
  • Emosi apa yang ditunjukkan oleh orang dalam foto ini?

Menemukan titik data yang tidak biasa

Algoritma deteksi anomali mengidentifikasi titik data yang berada di luar parameter yang ditentukan untuk hal yang “normal.” Misalnya, Anda menggunakan algoritma deteksi anomali untuk menjawab pertanyaan seperti:

  • Mana saja bagian yang rusak dalam batch ini?
  • Pembelian kartu kredit mana yang mungkin merupakan penipuan?

Nilai prediksi

Algoritma regresi memprediksi nilai titik data baru berdasarkan data historis. Algoritma ini membantu Anda menjawab pertanyaan seperti:

  • Berapa harga rata-rata rumah dua kamar tidur di kota saya tahun depan?
  • Berapa banyak pasien yang akan datang ke klinik pada hari Selasa?

Melihat bagaimana nilai berubah seiring waktu

Algoritma rangkaian waktu memperlihatkan bagaimana nilai tertentu berubah seiring waktu. Dengan analisis rangkaian waktu dan prakiraan rangkaian waktu, data dikumpulkan pada interval reguler dari waktu ke waktu dan digunakan untuk membuat prediksi serta mengidentifikasi tren, musiman, siklus, dan ketidakteraturan. Algoritma rangkaian waktu digunakan untuk menjawab pertanyaan seperti:

  • Apakah harga saham tertentu akan naik atau turun pada tahun mendatang?
  • Berapa pengeluaran saya tahun depan?

Menemukan kemiripan

Algoritma pengklusteran membagi data menjadi beberapa grup dengan menentukan tingkat kemiripan antara titik data. Algoritma pengklusteran cocok untuk pertanyaan seperti:

  • Penonton mana yang menyukai jenis film yang sama?
  • Model printer mana yang gagal dengan cara yang sama?

Klasifikasi

Algoritma klasifikasi menggunakan kalkulasi prediktif untuk menetapkan data ke kategori prasetel. Algoritma klasifikasi dilatih pada data input, dan digunakan untuk menjawab pertanyaan seperti:

  • Apakah ini email sampah?
  • Apa sentimen (positif, negatif, atau netral) dari teks tertentu?

Algoritma regresi linear memperlihatkan atau memprediksi hubungan antara dua variabel atau faktor dengan menyesuaikan garis lurus berkelanjutan ke data. Garis ini sering dihitung menggunakan fungsi Kesalahan Kuadrat Biaya. Regresi linear adalah salah satu tipe analisis regresi yang paling populer.

Algoritma regresi logistik mencocokkan kurva berbentuk S berkelanjutan ke data. Regresi logistik adalah jenis analisis regresi populer lainnya.

Algoritma Naïve Bayes menghitung probabilitas kejadian akan terjadi, berdasarkan kemunculan kejadian terkait.

Mendukung Mesin Vektor menggambar hyperplane di antara dua titik data terdekat. Tindakan ini menyisihkan kelas dan memaksimalkan jarak di antaranya untuk membedakannya dengan lebih jelas.

Algoritma pohon keputusan membagi data menjadi dua kumpulan homogen atau lebih. Algoritma ini menggunakan aturan jika–maka untuk memisahkan data berdasarkan pembeda paling signifikan antara titik data.

Algoritma K-Nearest neighbor menyimpan semua titik data yang tersedia dan mengklasifikasikan setiap titik data baru berdasarkan titik data yang paling dekat dengannya, seperti yang diukur oleh fungsi jarak.

Algoritma random forest  didasarkan pada pohon keputusan, tetapi alih-alih membuat satu pohon, mereka membuat hutan pohon lalu mengacak pohon di hutan tersebut. Kemudian, algoritma tersebut menggabungkan voting dari formasi acak pohon keputusan yang berbeda untuk menentukan kelas akhir objek uji.

Algoritma gradient boosting menghasilkan model prediksi yang menggabungkan model prediksi lemah, biasanya membuat pohon keputusan melalui proses ensambel yang meningkatkan kinerja model secara keseluruhan.

Algoritma K-Means mengklasifikasikan data ke dalam kluster di mana K sama dengan jumlah kluster. Titik data di dalam setiap kluster bersifat homogen, dan bersifat heterogen terhadap titik data di kluster lain.

Apa itu pustaka pembelajaran mesin?

Pustaka pembelajaran mesin adalah sekumpulan fungsi, kerangka kerja, modul, dan rutinitas yang ditulis dalam bahasa tertentu. Pengembang menggunakan kode dalam pustaka pembelajaran mesin sebagai blok pembangun untuk membuat solusi pembelajaran mesin yang dapat melakukan tugas kompleks. Alih-alih mengodekan setiap algoritma dan rumus secara manual dalam solusi pembelajaran mesin, pengembang dapat menemukan fungsi dan modul yang mereka butuhkan di salah satu dari banyak pustaka ML yang tersedia, dan menggunakannya untuk membuat solusi yang memenuhi kebutuhan mereka.

Mulai bereksperimen dengan Azure Machine Learning

Lihat perbedaan algoritma dalam menganalisis data dengan membuat dan menyebarkan model pembelajaran mesin Anda sendiri menggunakan Azure Machine Learning.