PENGIMPLMENTASIAN ALGORITMA LONG SHORT-TERM MEMORY UNTUK MENDETEKSI UJARAN KEBENCIAN PADA APLIKASI TWITTER

Renaldo Yosia Rafael
Fransiskus Adikara - [ https://orcid.org/0000-0003-3012-3020 ]


DOI: https://doi.org/10.29100/jipi.v8i2.3490

Abstract


Memasuki tahun 2022, jumlah pengguna internet di Indonesia sudah mencapai angka 204.7 juta pengguna, dimana se-bagian besar penggunaan internet adalah untuk media social. Seiring dengan tingginya pengguna media sosial, Direktorat Tindak Pidana Siber Bareskrim Polri mendapati 89 konten media sosial terverifikasi mengandung ujaran kebencian selama periode Februari-Maret 2021, dimana konten terbanyak berasal dari aplikasi Twitter. Oleh karena itu dilakukanlah penelitian dengan mengimplementasikan Machine learning untuk mendeteksi ujaran kebencian pada ap-likasi Twitter menggunakan metode Long short-term memory. Penyerapan data Twitter dilakukan dengan mengimplemen-tasikan Tweepy Library oleh Muhammad Okky Ibrohim yang diakses melalui Kaggle selama sekitar 7 bulan, mulai 20 Maret 2018 hingga 10 September 2018. Tujuan penyerapan data dengan waktu yang lama adalah untuk mendapatkan lebih banyak pola tulisan twit. Data yang telah melalui text processing kemudian dibuat menjadi token-token yang meru-pakan rangkaian nilai integer. Kemudian model LSTM dibangun dengan mengkompilasikan input layer, LSTM layer, dan output layer, untuk nantinya dilatih dengan data training yang telah dipisahkan dari dataset. Peneliti menemukan hasil dari pelatihan model menunjukan accuracy sebesar 95.74% dan nilai loss 0.3463. Saat model yang telah dilatih digunakan untuk membuat prediksi terhadap data test, peneliti mendapatkan nilai accuracy sebesar 90% yang mengindi-kasikan model telah melakukan prediksi secaara akurat. Berdasarkan performa model dalam mendeteksi ujaran keben-cian, peneliti dapat menyimpulkan bahwa deteksi ujaran kebencian pada Twitter dapat dilakukan dengan penggunaan Machine learning dan algoritma Long short-term memory(LSTM) dengan tingkat akurasi yang cukup tinggi.

Keywords


Long short-term memory; LSTM; Machine learning; Text pre-processing

Full Text:

PDF

Article Metrics :

References


“Digital-2022-Indonesia-February-2022-v01_compressed.pdf.” .

A. Perwira, J. Dwitama, and K. Kunci, “Deteksi Ujaran Kebencian Pada Twitter Bahasa Indonesia Menggunakan Machine Learning : Reviu Literatur,” vol. 1, pp. 31–39, 2021.

“Virtual Police temukan konten ujaran kebencian terbanyak di Twitter - ANTARA News.” https://www.antaranews.com/berita/2039738/virtual-police-temukan-konten-ujaran-kebencian-terbanyak-di-twitter (accessed Apr. 02, 2022).

D. J. Ningrum, S. Suryadi, and D. E. Chandra Wardhana, “Kajian Ujaran Kebencian Di Media Sosial,” J. Ilm. KORPUS, vol. 2, no. 3, pp. 241–252, 2019, doi: 10.33369/jik.v2i3.6779.

A. Rafly, Z. Abidin, and F. O. Lubis, “Analisis Semiotika Mengenai Representasi Rasisme Terhadap Orang Kulit Hitam Dalam Film Blackkklansman,” Semiotika, vol. 14, no. 2, pp. 135–147, 2020, [Online]. Available: http://journal.ubm.ac.id/.

F. N. Rosyidah and N. Nurwati, “Gender dan Stereotipe: Konstruksi Realitas dalam Media Sosial Instagram,” Share Soc. Work J., vol. 9, no. 1, p. 10, 2019, doi: 10.24198/share.v9i1.19691.

F. Alzami, R. A. Megantara, and ..., “Sentiment Analysis Untuk Deteksi Ujaran Kebencian Pada Domain Politik,” Sci. …, vol. 5, no. Sens 5, pp. 213–218, 2020, [Online]. Available: http://conference.upgris.ac.id/index.php/sens/article/view/1606%0Ahttp://conference.upgris.ac.id/index.php/sens/article/download/1606/711.

Y. Sudriani, I. Ridwansyah, and H. A Rustini, “Long short term memory (LSTM) recurrent neural network (RNN) for discharge level prediction and forecast in Cimandiri river, Indonesia,” IOP Conf. Ser. Earth Environ. Sci., vol. 299, no. 1, 2019, doi: 10.1088/1755-1315/299/1/012037.

E. Retnoningsih and R. Pramudita, “Mengenal Machine Learning Dengan Teknik Supervised Dan Unsupervised Learning Menggunakan Python,” Bina Insa. Ict J., vol. 7, no. 2, p. 156, 2020, doi: 10.51211/biict.v7i2.1422.

V.A.R.Barao, R.C.Coata, J.A.Shibli, M.Bertolini, and J.G.S.Souza, “No 主観的健康感を中心とした在宅高齢者における 健康関連指標に関する共分散構造分析Title,” Braz Dent J., vol. 33, no. 1, pp. 1–12, 2022.

“Word Embeddings Explained. What is Word Embedding ? | by Ashwin Prasad | Analytics Vidhya | Medium.” https://medium.com/analytics-vidhya/word-embeddings-explained-62c046f7c79e (accessed Aug. 30, 2022).