ANALISIS PERBANDINGAN METODE LOGISTIC REGRESSION, RANDOM FOREST, GRADIENT BOOSTING UNTUK PREDIKSI DIABETES
Abstract
Salah satu penyakit yang paling umum pada manusia adalah diabetes. Hampir 350 juta orang menderita diabetes dan jumlah kematian akibat penyakit ini meningkat setiap tahun. Karena kurangnya pengetahuan dasar tentang diabetes, banyak orang awalnya tidak tahu mereka mengidap diabetes. Saat ini, metode untuk mendeteksi diabetes menggunakan tes laboratorium, yang memakan waktu yang lama. Salah satu metode yang dapat digunakan untuk mengembangkan sistem untuk memprediksi diabetes sejak dini adalah data mining dengan prinsip analitik. Dalam penelitian ini menggunakan tiga metode Logistic Regression, Random Forest, Gradient Boosting untuk membedakan karakteristik pemodelan dan mengetahui metode mana yang tepat untuk prediksi penyakit diabetes dengan cara membuat perbandingan antara ketiga metode tersebut. Tujuan penelitian ini adalah untuk membandingkan nilai akurasi terbaik dari tiga metode Logistic Regression, Random Forest, Gradient Boosting dalam memprediksi diabetes. Model ini kemudian dievakuasi menggunakan metrik kinerja seperti presisi, perolehan, dan skor F1 untuk membandingkan efektivitas masing-masing metode dalam memprediksi diabetes. Berdasarkan pengujian ketiga metode tersebut kita bisa tau bahwa metode Random Forest dengan precision 85%, recall 69%, dan F1 score 76%.