APLIKASI PENDETEKSI KESAMAAN DOKUMEN DENGAN MENGGUNAKAN ALGORITMA JARAK JARO WINKLER DAN LEVENSHTEIN

Authors

DOI:

https://doi.org/10.46984/sebatik.v25i1.1309

Keywords:

Jarak, Dokumen, Kesamaan, Jaro Winkler, Levenshtein,

Abstract

 

Peranan teknologi di era revolusi 4.0 membuat penggunaan teknologi informasi dan komunikasi semakin luas. Peranan ini juga mencakup segala bidang, salah satunya untuk mempermudah pengguna dalam mendapatkan informasi yang tersedia secara bebas dan  tanpa biaya. Akan tetapi hal ini memungkinkan terjadinya pengambilan informasi tertulis (karya tulis,  penulisan ilmiah, dokumen dan lain sebagainya) tanpa mencantumkan referensi (menjiplak) yang biasa dikenal sebagai tindakan plagiarism. Teknologi informasi pengukur tingkat plagiat suatu dokumen teks berhubungan dengan pencarian informasi dari data yang ada. Dokumen teks merupakan sesuatu yang tertulis atau tercetak yang dapat digunakan sebagai keterangan. Untuk membuat suatu informasi tertentu dibutuhkan waktu yang lama untuk memproses hasil kemiripan dari seluruh isi dokumen teks. Pemrosesan text mining menggunakan beberapa algoritma. Salah satunya  adalah algoritma Jarak Jaro Winkler dan  Jarak Levenshtein . Jarak Jaro Winkler adalah sebuah algoritma menghitung panjang kata dalam dokumen, kata yang sama, dan jumlah transposisi. Sedangkan algoritma Jarak Levenshtein digunakan untuk menghitung jarak yang dibutuhkan untuk mengubah satu kata menjadi kata lain. Untuk itu dibuat aplikasi pendeteksi untuk melihat kemiripan dokumen teks dengan menerapkan Algoritma jarak Jaro Winkler dan jarak Levenshtein. Kedua algoritma ini diimplementasikan dan menampilkan hasil dari perhitungan antara Jaro Winkler dan jarak Levenshtein dalam sebuah aplikasi. Dengan melihat perbandingan kedua algoritma ini pengguna dapat mengetahui algoritma mana yang akan menghasilkan keluaran yang lebih baik jika dibandingkan dengan pencarian kemiripan secara manual.

References

Ade, R. (2019). Penerapan Metode Word2vec Untuk Mendeteksi Kemiripan Dokumen (Doctoral dissertation, Institut Telkom Purwokerto).
Awasthi, S. 2019. Plagiarism and Academic Misconduct: A Systematic Review. DESIDOC Journal of Library & Information Technology, 39(2).
Farhat, L. 2019. Upaya Pencegahan Tindakan Plagiarisme untuk Meningkatkan Kualitas Penulisan Karya Tulis Ilmiah di Dalam Pembimbingan Tugas Akhir (Skripsi) Bagi Mahasiswa STIE Jambi. J-MAS (Jurnal Manajemen dan Sains), 4(2), 326-333.
Febiawan, M. H., Setiawan, A., & Primadewi, A. 2019. Sistem Pendeteksi Dini Plagiarisme Menggunakan Algoritma Jarak Levenshtein. Jurnal Komtika (Komputasi dan Informatika), 3(1), 18-27.
Febrianti, Y. M., & Indriati, A. W. W. 2018. Analisis Sentimen Pada Ulasan “Lazada” Berbahasa Indonesia Menggunakan K-Nearest Neighbor (K-NN) Dengan Perbaikan Kata Menggunakan Jaro Winkler Distance. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN, 2548, 964X.
Frando, J., Ruslianto, I., & Hidayati, R. 2019. Penerapan Jarak Jaro Winklerdalam Aplikasi Pengoreksi Kesalahan Penulisan Bahasa Indonesia Berbasis Web. Coding Jurnal Komputer dan Aplikasi, 7(03).
Hermawan, A. 2019. Kebijakan Dosen Mengurangi Plagiarisme pada Karya Ilmiah Mahasiswa. IJIP: Indonesian Journal of Islamic Psychology, 1(2), 264-284.
Kambey, G. E. I., Sengkey, R., & Jacobus, A. 2020. Penerapan Clustering pada Aplikasi Pendeteksi Kemiripan Dokumen Teks Bahasa Indonesia. Jurnal Teknik Informatika, 15(2), 75-82.
Noaman, H. M., Sarhan, S. S., & Rashwan, M. A. 2018. Enhancing recurrent neural network-based language models by word tokenization. Human-centric Computing and Information Sciences, 8(1), 1-13.
Novantara, P. 2018. Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi. Buffer Informatika, 3(2).
Omar, N., & Al-Tashi, Q. 2018. Arabic nested noun compound extraction based on linguistic features and statistical measures. GEMA Online® Journal of Language Studies, 18(2).
Prayogo, A. H., & Mubarok, M. S. 2018. On the structure of Bayesian network for Indonesian text document paraphrase identification. In Journal of Physics: Conference Series (Vol. 971, No. 1, p. 012051). IOP Publishing.
Purba, A. H., & Situmorang, Z. 2017. Analisis Perbandingan Algoritma Rabin-Karp Dan Jarak Levenshtein Dalam Menghitung Kemiripan Teks. Jurnal Teknik Informatika UNIKA Santo Thomas, 2(2), 24-32.
Purnomo, W. G., & Purnomo, P. P. 2017. Akurasi Text Mining Menggunakan Algoritma K-Nearest Neighbour pada Data Content Berita SMS. Format, 6(1), 1-13.
Rahadian, B. A., Kurnianingtyas, D., Mahardika, D. P., Maghfira, T. N., & Cholissodin, I. 2017. Analisis Judul Majalah Kawanku Menggunakan Clustering K-Means Dengan Konsep Simulasi Big Data Pada Hadoop Multi Node Cluster. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) p-ISSN, 2355, 7699.
Rustiana, D., & Rahayu, N. 2017. Analisis Sentimen Pasar Otomotif Mobil: Tweet Twitter Menggunakan Naïve Bayes. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 8(1), 113-120.
Saputra, P. Y., Subhi, D. H., & Winatama, F. Z. A. 2019. Implementasi Sentimen Analisis Komentar Channel Video Pelayanan Pemerintah Di Youtube Menggunakan Algoritma Naïve Bayes. Jurnal Informatika Polinema, 5(4), 209-213.
Silvana, H., Rullyana, G., & Hadiapurwa, A. 2018. Persepsi Mahasiswa Terhadap Tindakan Plagiarisme Dalam Penyusunan Tugas Akhir. EDUTECH, 16(3), 338-347.
Spelling, A. F. D. 2018. Algoritma Jaro-Winkler Distance: Fitur Autocorrect dan Spelling Suggestion pada Penulisan Naskah Bahasa Indonesia di BMS TV. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 5(4).

Published

2021-06-01

How to Cite

Salim, R. A., Septian, M. R. D., Suhartini, S., Anggraini, D. and Qomariyah, Q. (2021) “APLIKASI PENDETEKSI KESAMAAN DOKUMEN DENGAN MENGGUNAKAN ALGORITMA JARAK JARO WINKLER DAN LEVENSHTEIN”, Sebatik, 25(1), pp. 35–41. doi: 10.46984/sebatik.v25i1.1309.

Issue

Section

Articles