Ihsan Fawzan
Ahmad Luthfi



Permasalahan yang dihadapi dalam penelitian ini berkaitan dengan adanya isu yang timbul akibat kerusakan file digital dalam konteks hukum, serta kontribusi penelitian ini dalam mengatasi permasalahan tersebut. Virus, malfungsi sistem, dan malware menjadi beberapa penyebab terjadinya file rusak sehingga menghambat akses menuju data penting dalam proses hukum. Teknik  yang sesuai dalam menganalisis konten file dan mengidentifikasi pola menggunakan algoritma untuk mengatasi masalah yaitu menggunakan teknik content-based. Penelitian ini memanfaatkan algoritma K-Nearest Neighbor dalam machine learning untuk mendeteksi jenis file pada file yang rusak. Penelitian yang mengkaji tentang identifikasi  jenis file sudah pernah dilakukan sebelumnya, namun masih menggunakan dataset lama yaitu GovDocs yang dirilis pada tahun 2009 sehingga perlu adanya penelitian yang menggunakan dataset baru. Penelitian ini memperbarui dataset GovDocs ke dalam NapierOne, yang berkontribusi pada peningkatan aksesibilitas data yang relevan untuk analisis. Machine learning digunakan dalam penelitian ini untuk mengklasifikasikan data dan berhasil meningkatkan keterbacaan dokumen meskipun tanpa informasi header atau footer. Selain itu, penelitian yang penulis lakukan dalam mengidentifikasi jenis file ambigu dalam artefak digital menggunakan K-Nearest Neighbor memperoleh hasil yang tinggi dengan tingkat akurasi mencapai 86%. Secara keseluruhan, studi ini berkontribusi pada peningkatan aksesibilitas dan keandalan bukti digital dalam konteks hukum, khususnya terkait file yang mengalami kerusakan.


Artefak Digital; file Corrupt; Forensik Digital; Identifikasi Jenis file; K-Nearest Neighbor

