EVALUASI FITUR WORD2VEC PADA SISTEM UJIAN ESAI ONLINE

Faisal Rahutomo
Deasy Sandhya Elya Ikawati
Obby Auliyaur Rohman


DOI: https://doi.org/10.29100/jipi.v4i1.1098

Abstract


Sampai sekarang pengembangan sistem informasi untuk mengevaluasi pemahaman siswa terhadap proses belajar memang sudah banyak dilakukan, baik berbentuk pilihan ganda maupun esai secara online. Dari referensi yang telah didapat kebanyakan menggunakan vektor kata dengan pendekatan skema pembobotan Term Frequency (TF). Dimana pada TF menghasilkan matriks kata yang senggang (Sparse), serta hasil error kemiripan yang besar. Didalam penelitian ini dievaluasi kinerja representasi fitur teks dan pembobotan yang lain, yaitu Word2vec. Selanjutnya perhitungan vektor kemiripan antar kedua teks menggunakan metode Cosine Simiarity dan Euclidean Distance. Hasil evaluasi pengujian berupa nilai koefisien antara penilaian sistem dengan penilaian manual yang dibandingkan dengan penelitian terdahulu dengan skala sama. Data yang digunakan sebanyak 2162 data. Data ini diperoleh dari 50 siswa yang menjawab 40 soal (politik, olahraga, lifestyle dan teknologi). Hasil pengujian menunjukkan rata-rata nilai precentage error dengan menggunakan fitir Word2vec sebesar 59.5%. Angka tersebut menunjukkan nilai error yang tinggi. Sehingga penelitian ini sampai pada kesimpulan bahwa menggunakan fitur Word2vec tidaklah lebih akurat pada kasus ujian esai online dibanding menggunakan fitur Term Frequency (TF).

Full Text:

PDF

Article Metrics :

References


Roshinta, Trisna Ari. “Analisa Aspek-Aspek Ujian Esai Daring Berbahasa Indonesia”. Seminar Nasional Terapan Riset Inovatif Sema-rang, Volume 1. 2016.Denpasar Based on NASA Data,” J. Phys. Conf. Ser., vol. 953, no. 1, 2018.

Manning, C. D., Raghavan, P., Schutze, H., (2009). An Introduction to Information Retrieval. Cambridge: Cambridge University Presss, 22-32.

Kencana, I Kadek Bayu Arys Wisnu. “Klasifikasi Opini Pada Fitur Produk Berbasis Graph”. e-Proceeding of Engineering, Vol.4, No.2, 2017.

T. Mikolov, I. Sutskever, K. Chen, G. Corrado and J. Dean, “Efficient Estimation of Word Representations in Vector Space,” ICLR Work-shop, 2013.

T. Mikolov, I. Sutskever, K. Chen, G. Corrado and J. Dean, “Distributed Representations of Words and Phrases and their Composition-ality,” Proceedings of the 27th Annual Conference on Neural Information Processing Systems (NIPS), 2013.

TensorFlow. “Vector Representations of Words”. [Online]. Tersedia: https://www.tensorflow.org.

M. Naili, A. H. Chaibi, dan H. H. Ben Ghezala, “Comparative Study of Word Embedding Methods in Topic Segmentation,” Procedia Computer Science, Vol. 112, hal. 340–349, 2017.

Carl J. Wenning, Ed.D. (2014). All Student Lab Handbook Physics Teacher. Education Program Coordinator 1994-2008, 12-32.

http://flask.pocoo.org (Diakses pada 25/05/2019 06:48)

http://flask.pocoo.org:80/docs/1.0/foreword (Diakses pada 25/05/2019 07:16)

Rahutomo, Faisal, et al. “Econo-ESA reduction scheme and the impact of its index matrix density”. Procedia Computer Science 35, 2014.

Putra, Carfin Febriawan Pratama. “Implementasi Explicit Semantic Analysis Berbahasa Indonesia Menggunakan Corpus Wikipedia Indo-nesia”. Jurnal Informatika Polinema, Vol4, Edisi4, 2018.

Rahutomo, Faisal, et al. “Open Problems in Indonesian Automatic Essay Scoring System”. International Journal of Engineering & Tech-nology 44, 2018.

Sari, Dhiana Novita. “Evaluasi Library Deep Learning - Keras Pada Ujian Esai Online”. Politeknik Negeri Malang. 2019.

Rahutomo, Faisal, et al. “Semantic Cosine Similarity”. Graduate School of Science and Technology, Kumamoto University. 2012.

Ali, Muhammad Haidar. “Evaluasi Hasil Implementasi Manhattan Distance Dan Dice Similiarity Pada Sistem Ujian Esai Daring Berbahasa Indonesia”. Politeknik Negeri Malang. 2019.