ANALISA PERBANDINGAN ALGORITMA RANDOM FOREST DAN NAÏVE BAYES UNTUK KLASIFIKASI CURAH HUJAN BERDASARKAN IKLIM DI INDONESIA

Nicolaus Advendea Prakoso Indaryono


DOI: https://doi.org/10.29100/jipi.v9i1.4421

Abstract


Indonesia merupakan wilayah yang hampir seluruhnya memiliki iklim tropis. Sebagai daerah yang kebanyakan memiliki iklim tropis, Indonesia mengalami variasi suhu yang sempit namun variasi curah hujan yang beragam. Curah hujan di Indonesia memiliki tingkat keberagaman yang signifikan. Untuk mencegah bahaya yang ditimbulkan oleh curah hujan tinggi, seperti banjir dan tanah longsor. Selain persiapan terhadap bencana, informasi mengenai curah hujan juga bermanfaat dalam bidang pertanian, transportasi, dan industri. Dengan implementasi klasifikasi data mining, akan membantu proses prediksi curah hujan di Indonesia. Penelitian ini menggunakan data iklim harian di Indonesia dan mengadopsi algoritma Random forest sebagai metode klasifikasi. Algoritma tersebut dipilih karena dapat menghasilkan model klasifikasi yang akurat dan stabil tanpa memerlukan penyesuaian parameter yang kompleks. Selain itu, metode Naïve bayes juga digunakan karena kemudahan implementasinya dan pemodelan probabilitas sederhana yang dapat diterapkan pada berbagai jenis data klasifikasi. Berdasarkan hasil penelitian, mendapatkan kesimpulan bahwa algoritma Random forest mendapatkan performa dan akurasi yang lebih baik daripada algoritma Naïve bayes dalam proses klasifikasi dataset iklim di Indonesia. Algoritma Random forest mencapai akurasi sebesar 86.55%, sementara algoritma Naïve bayes hanya mencapai akurasi sebesar 36.61%. Diharapkan hasil dari penelitian ini dapat digunakan sebagai referensi untuk studi literatur penelitian selanjutnya dan digunakan untuk memantau curah hujan harian di Indonesia guna mencegah bencana alam.

Keywords


Curah hujan; Data mining; Klasifikasi; Naïve bayes; Random forest

Full Text:

PDF

Article Metrics :

References


M. M. Rojas-Downing, A. P. Nejadhashemi, T. Harrigan, and S. A. Woznicki, “Climate change and livestock: Impacts, adaptation, and mitigation,” Clim Risk Manag, vol. 16, pp. 145–163, 2017, doi: 10.1016/j.crm.2017.02.001.

B. A. Molle and A. F. Larasati, “ANALISIS ANOMALI POLA CURAH HUJAN BULANAN TAHUN 2019 TERHADAP NORMAL CURAH HUJAN (30 TAHUN) DI KOTA MANADO DAN SEKITARNYA,” 2020. [Online]. Available: https://web.meteo.bmkg.go.id/id

R. Ruqoyah, Y. Ruhiat, and A. Saefullah, “Analisis Klasifikasi Tipe Iklim Dari Data Curah Hujan Menggunakan Metode Schmidt-Ferguson (Studi Kasus: Kabupaten Tangerang),” 2023.

D. Setiawan, “Analisis Curah Hujan di Indonesia untuk Memetakan Daerah Potensi Banjir dan Tanah Longsor dengan Metode Cluster Fuzzy C-Means dan Singular Value Decompotition (SVD),” Engineering, MAthematics and Computer Science (EMACS) Journal, vol. 3, no. 3, pp. 115–120, Oct. 2021, doi: 10.21512/emacsjournal.v3i3.7428.

J. Jackson, “Data Mining; A Conceptual Overview,” Communications of the Association for Information Systems, vol. 8, 2002, doi: 10.17705/1CAIS.00819.

D. T. Larose and C. D. Larose, “DISCOVERING KNOWLEDGE IN DATA An Introduction to Data Mining Second Edition Wiley Series on Methods and Applications in Data Mining.”

Deny Jollyta, William Ramdhan, and Muhammad Zarlis, Konsep data mining dan penerapan. Deepublish, 2020.

A. I. Kusumarini, P. A. Hogantara, and N. Chamidah, Perbandingan Algoritma Random Forest, Naïve Bayes, Dan Decision Tree Dengan Oversampling Untuk Klasifikasi Bakteri E. Coli. 2021.

M. F. Rifai, H. Jatnika, and B. Valentino, “Penerapan Algoritma Naïve Bayes Pada Sistem Prediksi Tingkat Kelulusan Peserta Sertifi-kasi Microsoft Office Specialist (MOS),” PETIR, vol. 12, no. 2, pp. 131–144, Sep. 2019, doi: 10.33322/petir.v12i2.471.

R. Leonardo and J. Pratama, “Address: Universitas Prima Indonesia, Teknik Informatika,” Jl. Sekip Sei Kambing Medan, no. 123, 2011, [Online]. Available: https://archive.ics.uci.edu/ml/datasets/Bank+Ma

Bonggo Bawono and Rochdi Wasono, “PERBANDINGAN METODE RANDOM FOREST DAN NAÏVE BAYES UNTUK KLASIFIKASI DEBITUR BERDASARKAN KUALITAS KREDIT,” Seminar Nasional Edusaintek, 2022.

Erma Delima Sikumbang, “Penerapan Data Mining Penjualan Sepatu Menggunakan Metode Algoritma Apriori,” Jurnal Teknik Kom-puter, vol. 4, no. 1, 2018, doi: https://doi.org/10.31294/jtk.v4i1.2560.

J. Han, M. Kamber, and J. Pei, Data Mining. Elsevier, 2012. doi: 10.1016/C2009-0-61819-5.

J. Ali, R. Khan, N. Ahmad, and I. Maqsood, “Random Forests and Decision Trees,” 2012. [Online]. Available: www.IJCSI.org

A. Triawan and D. Lintang Melinda, “Penerapan Metode Naïve Bayes Untuk Rekomendasi Topik Tugas Akhir Berdasarkan Daftar Hasil Studi Mahasiswa di Perguruan Tinggi,” Teknois : Jurnal Ilmiah Teknologi Informasi dan Sains, vol. 10, no. 2, pp. 58–70, Nov. 2020, doi: 10.36350/jbs.v10i2.91.

M. Syukron, R. Santoso, and T. Widiharih, “PERBANDINGAN METODE SMOTE RANDOM FOREST DAN SMOTE XGBOOST UNTUK KLASIFIKASI TINGKAT PENYAKIT HEPATITIS C PADA IMBALANCE CLASS DATA”, [Online]. Available: https://ejournal3.undip.ac.id/index.php/gaussian/

G. A. Sandag, “Prediksi Rating Aplikasi App Store Menggunakan Algoritma Random Forest,” CogITo Smart Journal, vol. 6, no. 2, pp. 167–178, Dec. 2020, doi: 10.31154/cogito.v6i2.270.167-178.