ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA
DOI:
https://doi.org/10.46984/sebatik.v27i1.2072Keywords:
Information Retrieval, Stemming, Perbandingan, Akurasi, Waktu Proses, Nazief Adriani, Arifin SetionoAbstract
Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.
References
Anugrah, I. G., Rosyid, H. (2018), Penerapan Information Retrieval Menggunakan Pemodelan Topik Pada Deskripsi Portal Multimedia. Jurnal Nasional Komputasi dan Teknologi Informasi, 2(1), 48-54.
Frakes, W. B. (1992), Information Retrieval Data Structure and Algorithms. New Jersey: Prentice-Hall.
Hasanah, N. (2017), Sistem Pencarian Skripsi Berbasis Information Retrieval di FASTIKOM UNSIQ. Jurnal PPKM, 1(1), 105-113.
Herlingga, A. C., Prismana, P. E. IGL., Prehanto, D. R., Dermawan, D. A. (2020), Algoritma Stemming Nazief & Adriani Dengan Metode Cosine Similarity Untuk Chatbot Telegram Terintegrasi Dengan E-layanan. Journal of Informatics and Computer Science, 02(01), 19-26.
Jumadi, J., Maylawati, D. S., Pratiwi1, L. D, M., Ramdhani, A. (2021), Comparison of Nazief-Adriani and Paice-Husk algorithm for Indonesian text stemming process. The 5th Annual Applied Science and Engineering Conference (AASEC 2020), 1098, IOP Publishing. https://doi:10.1088/1757-899X/1098/3/032044
Kowalski, G. J. (2000), Information Storage and Retrieval systems: Theory and Implementation. United States.
Novitasari, D. (2016), Perbandingan Algoritma Stemming Porter Dengan Arifin Setiono Untuk Menentukan Tingkat Ketepatan Kata Dasar. Jurnal String, 1(2), 120-129.
Nugroho, H. T. (2017), Pengaruh Algoritma Stemming Nazief-Adriani Terhadap Kinerja Algoritma Winnowing Untuk Mendeteksi Plagiarisme Bahasa Indonesia. ULTIMA COMPUTING: JURNAL SISTEM KOMPUTER, IX(1), 36-40.
Rozi, M. L. (2013), Implementasi dan Analisis Perbandingan Algoritma Stemming Nazief & Adriani dengan Algoritma Stemming Vega dalam Information Retrieval System. Universitas Telkom, Bandung.
Simarangkir, M. S. H. (2017), "Studi Perbandingan Algoritma-Algoritma Stemming untuk Dokumen Teks Bahasa Indonesia. Jurnal Inkofar, 1(1), 41–47.
Tala F. Z. (2004), A Study of Stemming Effect on Information Retrieval in Bahasa Indonesia. Netherland, Universiteit van Amsterdam
Wahyudi, D., Susyanto, T., Nugroho, D. (2017), Implementasi Dan Analisis Algoritma Stemming Nazief & Adriani Dan Porter Pada Dokumen Berbahasa Indonesia. Jurnal Ilmiah SINUS, 15(2), 49-56.
Wibawa, A. P., Dwiyanto, F. A., Zaeni, I. A. E, Nurrohman, R. K., Afandi, AN. (2020), Stemming javanese affix words using Nazief and Adriani modifications. JURNAL INFORMATIKA, 14(1), 36-42.
Downloads
Published
How to Cite
Issue
Section
License
Authors retain all their rights to the published works, such as (but not limited to) the following rights; Copyright and other proprietary rights relating to the article, such as patent rights, The right to use the substance of the article in own future works, including lectures and books, The right to reproduce the article for own purposes, The right to self-archive the article