PENDETEKSI KESAMAAN KATA UNTUK JUDUL PENULISAN BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA STEMMING NAZIEF-ADRIANI

Authors

  • Mochamad Wisuda Sardjono Jurusan Sistem Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Gunadarma
  • Margi Cahyanti Jurusan Sistem Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Gunadarma
  • Maulana Mujahidin Jurusan Sistem Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Gunadarma
  • Rini Arianty Jurusan Sistem Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Gunadarma

Keywords:

Text Mining, Stemming, Algoritma Nazief-Adrian, Plagiarisme

Abstract

Penelitian ini mengimplementasikan algoritma stemming Nazief-Adrian untuk mencari kesamaan judul penulisan berbahasa Indonesia. Dengan mencari kesamaan judul penulisan tersebut dapat membantu mahasiswa maupun dosen dalam menentukan judul penulisan yang ingin dibuat atau dapat menjadi referensi dalam pembuatan penulisan, sehingga dapat menghindari tindakan plagiarisme judul penulisan. Penelitian ini juga membangun aplikasi yang dapat menambahkan data judul penulisan ke dalam database dan mencari kesamaan judul penulisan dari judul penulisan yang terdapat dalam database.  Tahapan yang dilakukan untuk proses mencari kesamaan adalah memecah kata pada judul penulisan untuk didapatkan kata dasar dengan menggunakan algoritma stemming Nazief-Adriani, kemudian dihitung term frequency (tf) untuk mendapatkan persentase kesamaan kata. Hasil dari pencarian kesamaan judul penulisan ini berupa kata dasar yang diambil dari setiap kata dari judul penulisan yang ingin dicari kesamaan dan persentase kesamaan dengan judul penulisan yang ada di database. Pengujian dilakukan pada 5 judul penulisan yang diinputkan oleh pengguna kemudian dicari kesamaannya dengan 1561 judul penulisan pada database.

References

Adriani, M., Jelita, A., Williams, HE., Tahaghoghi, SMM., Nazief, B. 2007. Stemming Indonesian : A Confix-stripping approach . Journal ACM Transaction on Asian Language Information Processing (TALIP), Volume 6 Issue 4, USA.
Agusta dan Ledy. 2009. Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia. Prosiding Konferensi Nasional Sistem dan Informatika, November 14th, Bali, Indonesia.
Azhar, F., Ernawati & Vatresia, A. 2014. Aplikasi Pendeteksi Kemiripan Pada Dokumen Teks Menggunakan Algortima Nazief & Adriani dan Metode Cosine Similarity. Jurnal Teknologi Informasi, Volume 10 Nomor 1, ISSN : 1414-9999.
Breitinger, C., Gipp, B., Langer, S. 2015. "Research-paper recommender systems: a literature survey" (Submitted manuscript). International Journal on Digital Libraries. 17 (4): 305–338. doi:10.1007/s00799-015-0156-0. ISSN 1432-5012.
Kao dan Poteet, S. 2005. Text mining and natural language processing: introduction for the special issue. SIGKDD Explor. Newsl, vol. 7, no. 1, pp. 1-2.
Khan, M.A., Aleem, A., Wahab, A dan Khan, MN. 2011. Copy detection in Urdu language documents using n-grams model. Proceedings of the International Conference on Computer Networks and Information Technology, July 11-13, Abbottabad, Pakistan, pp: 263-266
Manning, Christopher D., Raghavan, P dan Schütze, H. 2009. An Introduction to Information Retrieval. Cambridge: Cambridge University
Ohana, B., Tierney, B. 2011. Supervised Learning Methods for Sentiment Classification with RapidMiner. RapidMiner Community Meeting And Conference, RCOMM, pp. 1-8.
Poernomo, B., Gunawan, Ir. 2015. Sistem Information Retrieval Pencarian Kesamaan Ayat Terjemahan Al Quran Berbahasa Indonesia Dengan Query Expansion Dari Tafsirnya, Seminar Nasional “Inovasi dalam Desain dan Teknologi, IdeaTech, ISSN : 2089-1121
Rajaraman, A.; Ullman, J.D. 2011. "Data Mining". Mining of Massive Datasets. pp. 1–17. doi:10.1017/CBO9781139058452.002. ISBN 978-1-139-05845-2
Simarangkir, MSH. 2017. Studi Banding Algoritma-Algoritma Stemming Untuk Dokumen Teks Bahasa Indonesia. Jurnal Infokar, Volume 1, ISSN : 2615-3645.
Susyanto, T., Wahyudi, D., Nugroho, D. 2017. Implementasi Dan Analisis Algoritma Stemming Nazief & Adriani Dan Porter Pada Dokumen Berbahasa Indonesi. Jurnal Ilmiah SINUS, ISSN : 1693-1173

Downloads

Published

2018-12-04

How to Cite

Sardjono, M. W., Cahyanti, M., Mujahidin, M. and Arianty, R. (2018) “PENDETEKSI KESAMAAN KATA UNTUK JUDUL PENULISAN BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA STEMMING NAZIEF-ADRIANI”, Sebatik, 22(2), pp. 138–146. Available at: https://jurnal.wicida.ac.id/index.php/sebatik/article/view/320 (Accessed: 5 November 2024).