PENDETEKSI KESAMAAN KATA UNTUK JUDUL PENULISAN BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA STEMMING NAZIEF-ADRIANI
DOI:
https://doi.org/10.46984/sebatik.v22i2.320Keywords:
Text Mining, Stemming, Algoritma Nazief-Adrian, PlagiarismeAbstract
Penelitian ini mengimplementasikan algoritma stemming Nazief-Adrian untuk mencari kesamaan judul penulisan berbahasa Indonesia. Dengan mencari kesamaan judul penulisan tersebut dapat membantu mahasiswa maupun dosen dalam menentukan judul penulisan yang ingin dibuat atau dapat menjadi referensi dalam pembuatan penulisan, sehingga dapat menghindari tindakan plagiarisme judul penulisan. Penelitian ini juga membangun aplikasi yang dapat menambahkan data judul penulisan ke dalam database dan mencari kesamaan judul penulisan dari judul penulisan yang terdapat dalam database. Tahapan yang dilakukan untuk proses mencari kesamaan adalah memecah kata pada judul penulisan untuk didapatkan kata dasar dengan menggunakan algoritma stemming Nazief-Adriani, kemudian dihitung term frequency (tf) untuk mendapatkan persentase kesamaan kata. Hasil dari pencarian kesamaan judul penulisan ini berupa kata dasar yang diambil dari setiap kata dari judul penulisan yang ingin dicari kesamaan dan persentase kesamaan dengan judul penulisan yang ada di database. Pengujian dilakukan pada 5 judul penulisan yang diinputkan oleh pengguna kemudian dicari kesamaannya dengan 1561 judul penulisan pada database.
References
Agusta dan Ledy. 2009. Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia. Prosiding Konferensi Nasional Sistem dan Informatika, November 14th, Bali, Indonesia.
Azhar, F., Ernawati & Vatresia, A. 2014. Aplikasi Pendeteksi Kemiripan Pada Dokumen Teks Menggunakan Algortima Nazief & Adriani dan Metode Cosine Similarity. Jurnal Teknologi Informasi, Volume 10 Nomor 1, ISSN : 1414-9999.
Breitinger, C., Gipp, B., Langer, S. 2015. "Research-paper recommender systems: a literature survey" (Submitted manuscript). International Journal on Digital Libraries. 17 (4): 305–338. doi:10.1007/s00799-015-0156-0. ISSN 1432-5012.
Kao dan Poteet, S. 2005. Text mining and natural language processing: introduction for the special issue. SIGKDD Explor. Newsl, vol. 7, no. 1, pp. 1-2.
Khan, M.A., Aleem, A., Wahab, A dan Khan, MN. 2011. Copy detection in Urdu language documents using n-grams model. Proceedings of the International Conference on Computer Networks and Information Technology, July 11-13, Abbottabad, Pakistan, pp: 263-266
Manning, Christopher D., Raghavan, P dan Schütze, H. 2009. An Introduction to Information Retrieval. Cambridge: Cambridge University
Ohana, B., Tierney, B. 2011. Supervised Learning Methods for Sentiment Classification with RapidMiner. RapidMiner Community Meeting And Conference, RCOMM, pp. 1-8.
Poernomo, B., Gunawan, Ir. 2015. Sistem Information Retrieval Pencarian Kesamaan Ayat Terjemahan Al Quran Berbahasa Indonesia Dengan Query Expansion Dari Tafsirnya, Seminar Nasional “Inovasi dalam Desain dan Teknologi, IdeaTech, ISSN : 2089-1121
Rajaraman, A.; Ullman, J.D. 2011. "Data Mining". Mining of Massive Datasets. pp. 1–17. doi:10.1017/CBO9781139058452.002. ISBN 978-1-139-05845-2
Simarangkir, MSH. 2017. Studi Banding Algoritma-Algoritma Stemming Untuk Dokumen Teks Bahasa Indonesia. Jurnal Infokar, Volume 1, ISSN : 2615-3645.
Susyanto, T., Wahyudi, D., Nugroho, D. 2017. Implementasi Dan Analisis Algoritma Stemming Nazief & Adriani Dan Porter Pada Dokumen Berbahasa Indonesi. Jurnal Ilmiah SINUS, ISSN : 1693-1173
Downloads
Published
How to Cite
Issue
Section
License
Authors retain all their rights to the published works, such as (but not limited to) the following rights; Copyright and other proprietary rights relating to the article, such as patent rights, The right to use the substance of the article in own future works, including lectures and books, The right to reproduce the article for own purposes, The right to self-archive the article