PERBANDINGAN METODE KLASIFIKASI RANDOM FOREST DAN SUPPORT VECTOR MACHINE DALAM MEMPREDIKSI CAPAIAN STUDI MAHASISWA

Enggar Novianto - [ https://orcid.org/0009-0007-3775-3478 ]
Suhirman Suhirman
Damar Prasetyo


DOI: https://doi.org/10.29100/jipi.v9i4.5423

Abstract


Keberhasilan Universitas, swasta dan negeri bergantung pada mahasiswa dan untuk mengurangi tingkat kegagalan akademik, diperlukan sistem yang dapat memprediksi mahasiswa berdasarkan data akademik serta membuat penilaian untuk memprediksi seberapa baik capaian studi mahasiswa. Data program studi dapat diolah dengan cepat dan akurat, dan data mining adalah proses penambangan data untuk membuat prediksi capaian studi berdasarkan data tentang mahasiswa. Kebaharuan dari penelitian ini adalah menggunakan proses untuk mengoptimalkan model RF dan SVM serta menghasilkan atribut yang berpengaruh terhadap akurasi dalam memprediksi capaian studi mahasiswa program studi S1 Ilmu Hukum Fakultas Hukum Universitas Sebelas Maret dengan seleksi fitur menggunakan Forward Selection. Pemodelan menggunakan RF sebelum dilakukan seleksi fitur mendapatkan hasil akurasi sebesar 97,67%, sedangkan pemodelan menggunakan SVM mendapatkan hasil akurasi sebesar 91,47% dengan menggunakan data mahasiswa angkatan tahun 2021 sejumlah 433 data dengan pembagian 70% data latih dan 30% data uji. Penggunaan seleksi fitur menggunakan metode Forward Selection tidak dapat meningkatkan hasil akurasi pada algoritma RF serta menghasilkan empat atribut yang berpengaruh pada klasifikasi prediksi capaian studi mahasiswa. Pada pemodelan SVM, seleksi fitur dapat meningkatkan nilai akurasi sebesar 6,2%, sehingga hasil akurasi SVM setelah dilakukan seleksi fitur adalah sebesar 97,67% dengan menghasilkan satu atribut yang berpengaruh pada klasifikasi prediksi capain studi mahasiswa. Perbandingan metode klasifikasi RF dan SVM setelah dilakukan seleksi fitur mendapatkan akurasi yang sama yaitu 97,67%, oleh karena itu, hasil penelitian ini termasuk dalam kategori model yang cukup. Hasil penelitian dapat menjadi acuan bagi pengelola program studi dalam memberikan perlakuan khusus kepada mahasiswa yang diprediksi tidak tercapai pembelajarannya.

 

The success of universities, private and public depends on students and to reduce the rate of academic failure, a system is needed that can predict students based on academic data and make assessments to predict how well students will achieve in their studies. Study program data can be processed quickly and accurately, and data mining is a data mining process to make predictions about study outcomes based on data about students. The novelty of this research is that it uses a process to optimize the RF and SVM models and produces attributes that influence accuracy in predicting study outcomes for undergraduate students in the Legal Sciences study program, Faculty of Law, Sebelas Maret University by selecting features using Forward Selection. Modeling using RF before feature selection got an accuracy result of 97.67%, while modeling using SVM got an accuracy result of 91.47% using 433 student data from the class of 2021 with a division of 70% training data and 30% test data. The use of feature selection using the Forward Selection method cannot improve the accuracy results of the RF algorithm and produces four attributes that influence the classification of student study achievement predictions. In SVM modeling, feature selection can increase the accuracy value by 6.2%, so that the SVM accuracy result after feature selection is 97.67% by producing one attribute that influences the prediction classification of student study achievement. Comparison of the RF and SVM classification methods after feature selection obtained the same accuracy, namely 97.67%, therefore, the results of this study are included in the adequate model category. The results of the research can be a reference for study program managers in providing special treatment to students whose learning is predicted to fail.


Keywords


Klasifikasi; Mahasiswa; Random Forest; Sup-port Vector Machine

Full Text:

PDF

Article Metrics :

References


A. Budiyantara, I. Irwansyah, E. Prengki, P. Pratama Ahmad, and N. Wiliani, “Komparasi Algoritma Decision Tree, Naive Bayes Dan K-Nearest Neighbor Untuk Memprediksi Mahasiswa Lulus Tepat Waktu,” 2020, [Online]. Available: www.bri-institute.ac.id

S. Linawati, S. Nurdiani, H. Kartika, and L. Latifah, “Prediksi Prestasi Akademik Mahasiswa Menggunakan Algoritma Random Forest Dan C4.5,” vol. VIII, no. 1, 2020, [Online]. Available: www.bsi.ac.id

I. M. N. O. Mahardika, “PINTU : Pusat Penjamin Mutu,” vol. 2, no. 2, 2021.

A. M. F. Achmad, “Prediksi Performansi Mahasiswa dengan Mempertimbangkan Motivasi Intrinsik Menggunakan Machine Learning,” J. Serambi Eng., vol. 8, no. 4, pp. 6976–6982, 2023, doi: 10.32672/jse.v8i4.6722.

T. Asril and S. M. Isa, “Prediction of Students Study Period using K-Nearest Neighbor Algorithm,” Int. J. Emerg. Trends Eng. Res., vol. 8, no. 6, pp. 2585–2593, 2020, doi: 10.30534/ijeter/2020/60862020.

A. Putri et al., “Komparasi Algoritma K-NN, Naive Bayes dan SVM untuk Prediksi Kelulusan Mahasiswa Tingkat Akhir,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, pp. 20–26, 2023, doi: 10.57152/malcom.v3i1.610.

J. Zeniarja, A. Salam, and F. A. Ma’ruf, “Seleksi Fitur dan Perbandingan Algoritma Klasifikasi untuk Prediksi Kelulusan Mahasiswa,” J. Rekayasa Elektr., vol. 18, no. 2, pp. 102–108, 2022, doi: 10.17529/jre.v18i2.24047.

N. Hidayati and A. Hermawan, “K-Nearest Neighbor (K-NN) algorithm with Euclidean and Manhattan in classification of student graduation,” J. Eng. Appl. Technol., vol. 2, no. 2, pp. 86–91, 2021, doi: 10.21831/jeatech.v2i2.42777.

R. P. S. Putri and I. Waspada, “Penerapan Algoritma C4.5 pada Aplikasi Prediksi Kelulusan Mahasiswa Prodi Informatika,” Khazanah Inform. J. Ilmu Komput. dan Inform., vol. 4, no. 1, pp. 1–7, 2018, doi: 10.23917/khif.v4i1.5975.

S. F. Selegi, “Evaluasi Pelaksanaan Standar Proses Pembelajaran KKNI Program Studi Pendidikan Geografi Universitas PGRI Palembang,” vol. 4, no. 2, 2019.

S. S. Alfere and A. Y. Maghari, “Prediction of Student’s Performance Using Modified KNN Classifiers,” First Int. Conf. Eng. Futur. Technol. (ICEFT 2018), no. Iceft, pp. 143–150, 2018.

A. Mailana, A. A. Putra, S. Hidayat, and A. Wibowo, “Comparison of C4.5 Algorithm and Support Vector Machine in Predicting the Student Graduation Timeliness,” J. Online Inform., vol. 6, no. 1, p. 11, 2021, doi: 10.15575/join.v6i1.608.

O. W. Yuda, D. Tuti, I. S. Yee, and Susanti, “Penerapan Penerapan Data Mining Untuk Klasifikasi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Random Forest,” SATIN - Sains dan Teknol. Inf., vol. 8, no. 2, pp. 122–131, 2022, doi: 10.33372/stn.v8i2.885.

A. Andika, S. Syarli, and C. R. Sari, “Data Mining Klasifikasi Kelulusan Mahasiswa Menggunakan Metode Naïve Bayes,” J. Peqguruang Conf. Ser., vol. 4, no. 1, p. 423, 2022, doi: 10.35329/jp.v4i1.2358.

N. Khasanah, A. Salim, N. Afni, R. Komarudin, and Y. I. Maulana, “Prediksi Kelulusan Mahasiswa Dengan Metode Naive Bayes,” Technol. J. Ilm., vol. 13, no. 3, p. 207, 2022, doi: 10.31602/tji.v13i3.7312.

M. Raharjo, R. Ridwa, J. L. Putra, and T. lfian A. Sandi, “Implementasi Metode Decision Tree Klasifikasi Data Mining Untuk Prediksi Peminatan Jurusan Robotika oleh Mahasiswa,” J. Tek. Komput. AMIK BSI, 2019, doi: 10.31294/jtk.v4i2.

E. E. Barito, J. T. Beng, and D. Arisandi, “Penerapan Algoritma C4.5 Untuk Klasifikasi Mahasiswa Penerima Bantuan Sosial Covid-19,” J. Ilmu Komput. dan Sist. Inf., vol. 10, no. 1, 2022, doi: 10.24912/jiksi.v10i1.17819.

M. L. Mu’tashim, A. Zaidiah, and B. S. Yulistiawan, “Klasifikasi Ketepatan Lama Studi Mahasiswa Dengan Algoritma Random Forest Dan Gradient Boosting (Studi Kasus Fakultas Ilmu Komputer Universitas Pembangunan Nasional Veteran Jakarta),” Semin. Nas. Mhs. Bid. Ilmu Komput. dan Apl., vol. 4, no. 1, pp. 155–166, 2023.

I. K. Hasan, R. Resmawan, and J. Ibrahim, “Perbandingan K-Nearest Neighbor dan Random Forest dengan Seleksi Fitur Information Gain untuk Klasifikasi Lama Studi Mahasiswa,” Indones. J. Appl. Stat., vol. 5, no. 1, p. 58, 2022, doi: 10.13057/ijas.v5i1.58056.

N. A. P. Indaryono, R. R. Saedudin, and F. Hamami, “Analisa Perbandingan Algoritma Random Forest Dan Naive Bayes Untuk Klasifikasi Curah Hujan Berdasarkan Iklim Di Indonesia,” vol. 9, no. 1, pp. 158–167, 2024, doi: 10.29100/jipi.v9i1.4421.

N. W. E. Rosiana Dewi, I. G. Aris Gunadi, and G. Indrawan, “Detection of Class Regularity with Support Vector Machine methods,” Lontar Komput. J. Ilm. Teknol. Inf., vol. 11, no. 1, p. 20, 2020, doi: 10.24843/lkjiti.2020.v11.i01.p03.

M. F. Abdullah, K. Kusrini, and M. R. Arief, “Prediksi Nilai Dan Waktu Kelulusan Mahasiswa Menggunakan Metode Support Vector Machine,” J. Sains dan Teknol., vol. 14, no. 1, p. 35, 2022.

M. F. Nugroho and S. Wibowo, “Fitur Seleksi Forward Selection Untuk Menetukan Atribut Yang Berpengaruh Pada Klasifikasi Kelulusan Mahasiswa Fakultas Ilmu Komputer UNAKI Semarang Menggunakan Algoritma Naive Bayes,” J. Inform. Upgris, vol. 3, no. 1, pp. 63–70, 2017, doi: 10.26877/jiu.v3i1.1669.

F. N. Fajriyan, M. Ahsan, and W. Harianto, “Komparasi Tingkat Akurasi Information Gain Dan Gain Ratio Pada Metode K-Nearest Neighbor,” JATI (Jurnal Mhs. Tek. Inform., vol. 6, no. 1, pp. 386–391, 2022, doi: 10.36040/jati.v6i1.4694.

M. N. Akbar, H. Hariani, and A. I. Syahyadi, “Analisis Prediksi Ketepatan Masa Studi Mahasiswa Menggunakan Algoritma Naive Bayes Classifier Dan Feature Selection,” J. INSTEK (Informatika Sains dan Teknol., vol. 7, no. 2, pp. 306–315, 2022, doi: 10.24252/instek.v7i2.32576.

E. Nurlia and U. Enri, “Penerapan Fitur Seleksi Forward Selection Untuk Menentukan Kematian Akibat Gagal Jantung Menggunakan Algoritma C4.5,” J. Tek. Inform. Musirawas) Elin Nurlia, vol. 6, no. 1, p. 42, 2021.

D. B. Srisulistiowati, M. Khaerudin, and S. Rejeki, “Sistem Informasi Prediksi Penjualan Alat Tulis Kantor Dengan Metode Fp-Growth (Studi Kasus Toko Koperasi Sekolah Bina Mulia),” J. Sist. Inf. Univ. Suryadarma, vol. 8, no. 2, 2021, doi: 10.35968/jsi.v8i2.739.