Pengujian Metode SMOTE Untuk Penanganan Data Tidak Seimbang Pada Dataset Binary
Keywords:
pengujian, SMOTE, data tidak seimbang, dataset binaryAbstract
Dataset tidak seimbang jika berukuran besar maka tidak berpengaruh besar terhadap nilai akurasi, tetapi masalah akan muncul ketika dihadapkan pada data yang tidak normal seperti distribusi kelas tidak seragam di antara kelas-kelas dengan memiliki jumlah kelas mayoritas lebih banyak daripada kelas minoritas. Penelitian ini bertujuan untuk mengatasi jumlah kelas yang tidak seimbang agar tetap ideal dengan menggunakan metode SMOTE pada data tidak seimbang. Berdasarkan hasil eksperimen yang telah dilakukan, maka penulis menyimpulkan penelitian ini yaitu bahwa pengujian metode SMOTE dengan metode klasifikasi mampu menangani jumlah kelas mayoritas (negatif) dan kelas minoritas (positif) pada data tidak seimbang dengan menghasilkan nilai MCC dan Gmean mencapai kinerja prediksi yang lebih besar. Kinerja dari metode diukur dari nilai MCC dan Gmean dari masing-masing data tidak seimbang, namun untuk dataset Binary nilai MCC dan Gmean yang paling tinggi menggunakan metode SMOTE + KKN dengan nilai MCC = 0,90 dan nilai Gmean = 0,95 juga dapat mencapai kinerja prediksi yang lebih besar.