Jenis Klasifikasi berdasarkan Tipe Output-nya

Salah satu task pada Data Mining ataupun Machine Learning adalah Classification (Klasifikasi). Classification masuk pada kategori pembelajaran Supervised Learning, yaitu suatu model pembelajaran yang “membutuhkan” pembimbingan dari pakar. Data training untuk klasifikasi telah memiliki label kelas yang dibuat oleh pakar. Berdasarkan pembelajaran pada data training yang telah berlabel tersebut, model klasifikasi dapat memprediksi label untuk data baru.

Berdasarkan tipe output-nya, klasifikasi dapat terbagi dalam 4 kategori sebagai berikut:

Binary Classification

Setiap data pada Binary Classification memiliki satu atribut kelas yang terdiri dari dua nilai. Nilai dari suatu kelas dapat direpresentasikan dengan positive atau negatif; 0 atau 1; true atau false; dsb. Contoh dari binary classification: Spam Filtering (suatu model klasifikasi yang akan mendeteksi suatu pesan masuk kelas spam atau not-spam). Beberapa contoh lain binary classifcation adalah loan analysis (menentukan suatu customer dapat diandalkan secara ekonomi atau tidak), evaluasi medis, menentukan apakah pasien memiliki penyakit tertentu atau tidak, dan sebagainya.

Model binary classifier bertujuan untuk mencari boundary (batas) yang dapat memisahkan data secara optimal berdasarkan kelasnya (positive atau negative).

Contoh Spam Filtering, garis biru adalah class boundary

Mutliclass Classification

Dataset dari tipe Multiclass Classification memili satu atribut kelas yang terdiri dari banyak nilai. Himpunan nilai dari kelas bersifat terbatas dan diskrit. Contoh multiclass classification adalah identifikasi jenis bunga iris, dimana pada contoh ini bunga iris memiliki 3 jenis kelas yaitu: Setosa, Versicolour, dan Virginica.

Strategi pembelajaran multiclass classification dapat dilakukan dengan dua pendekatan, yaitu One-VS-One Classification (OVO) dan One-VS-All Classification (OVA)

Contoh dataset pada Multiclass Classification

Multilabel Classification

Dataset dari Multilabel Classification, output class berbentuk vector yang terdiri dari kombinasi label (label set). Panjang vector sesuai dengan banyaknya tipe kelas dan setiap elemen pada vector dapat direpresentasikan dengan nilai biner (0 atau 1). Misalkan klasifikasi pada suatu citra dengan kelas [beach, field, montain, sea], jika dalam citra tersebut tersusun atas gambar pantai, gunung, dan laut maka bentuk vector class untuk data citra tersebut adalah (1, 0, 1, 1)

Multidimensional Classification

Bentuk output class dari Multidimensional Classification adalah berbentuk vector, yang mana setiap elemen pada vector berbentuk suatu set / himpunan dari nilai.

Multiple Instance Learning

 

SUMBER:

Francisco Herrera, dkk. Multilabel Classification: Problem Analysis, Metrics and Techniques. Springer International Publishing Switzerland. 2016