APLIKASI PENDETEKSI KESAMAAN DOKUMEN DENGAN MENGGUNAKAN ALGORITMA JARAK JARO WINKLER DAN LEVENSHTEIN
DOI:
https://doi.org/10.46984/sebatik.v25i1.1309Keywords:
Jarak, Dokumen, Kesamaan, Jaro Winkler, Levenshtein,Abstract
Peranan teknologi di era revolusi 4.0 membuat penggunaan teknologi informasi dan komunikasi semakin luas. Peranan ini juga mencakup segala bidang, salah satunya untuk mempermudah pengguna dalam mendapatkan informasi yang tersedia secara bebas dan tanpa biaya. Akan tetapi hal ini memungkinkan terjadinya pengambilan informasi tertulis (karya tulis, penulisan ilmiah, dokumen dan lain sebagainya) tanpa mencantumkan referensi (menjiplak) yang biasa dikenal sebagai tindakan plagiarism. Teknologi informasi pengukur tingkat plagiat suatu dokumen teks berhubungan dengan pencarian informasi dari data yang ada. Dokumen teks merupakan sesuatu yang tertulis atau tercetak yang dapat digunakan sebagai keterangan. Untuk membuat suatu informasi tertentu dibutuhkan waktu yang lama untuk memproses hasil kemiripan dari seluruh isi dokumen teks. Pemrosesan text mining menggunakan beberapa algoritma. Salah satunya adalah algoritma Jarak Jaro Winkler dan Jarak Levenshtein . Jarak Jaro Winkler adalah sebuah algoritma menghitung panjang kata dalam dokumen, kata yang sama, dan jumlah transposisi. Sedangkan algoritma Jarak Levenshtein digunakan untuk menghitung jarak yang dibutuhkan untuk mengubah satu kata menjadi kata lain. Untuk itu dibuat aplikasi pendeteksi untuk melihat kemiripan dokumen teks dengan menerapkan Algoritma jarak Jaro Winkler dan jarak Levenshtein. Kedua algoritma ini diimplementasikan dan menampilkan hasil dari perhitungan antara Jaro Winkler dan jarak Levenshtein dalam sebuah aplikasi. Dengan melihat perbandingan kedua algoritma ini pengguna dapat mengetahui algoritma mana yang akan menghasilkan keluaran yang lebih baik jika dibandingkan dengan pencarian kemiripan secara manual.
References
Awasthi, S. 2019. Plagiarism and Academic Misconduct: A Systematic Review. DESIDOC Journal of Library & Information Technology, 39(2).
Farhat, L. 2019. Upaya Pencegahan Tindakan Plagiarisme untuk Meningkatkan Kualitas Penulisan Karya Tulis Ilmiah di Dalam Pembimbingan Tugas Akhir (Skripsi) Bagi Mahasiswa STIE Jambi. J-MAS (Jurnal Manajemen dan Sains), 4(2), 326-333.
Febiawan, M. H., Setiawan, A., & Primadewi, A. 2019. Sistem Pendeteksi Dini Plagiarisme Menggunakan Algoritma Jarak Levenshtein. Jurnal Komtika (Komputasi dan Informatika), 3(1), 18-27.
Febrianti, Y. M., & Indriati, A. W. W. 2018. Analisis Sentimen Pada Ulasan “Lazada” Berbahasa Indonesia Menggunakan K-Nearest Neighbor (K-NN) Dengan Perbaikan Kata Menggunakan Jaro Winkler Distance. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN, 2548, 964X.
Frando, J., Ruslianto, I., & Hidayati, R. 2019. Penerapan Jarak Jaro Winklerdalam Aplikasi Pengoreksi Kesalahan Penulisan Bahasa Indonesia Berbasis Web. Coding Jurnal Komputer dan Aplikasi, 7(03).
Hermawan, A. 2019. Kebijakan Dosen Mengurangi Plagiarisme pada Karya Ilmiah Mahasiswa. IJIP: Indonesian Journal of Islamic Psychology, 1(2), 264-284.
Kambey, G. E. I., Sengkey, R., & Jacobus, A. 2020. Penerapan Clustering pada Aplikasi Pendeteksi Kemiripan Dokumen Teks Bahasa Indonesia. Jurnal Teknik Informatika, 15(2), 75-82.
Noaman, H. M., Sarhan, S. S., & Rashwan, M. A. 2018. Enhancing recurrent neural network-based language models by word tokenization. Human-centric Computing and Information Sciences, 8(1), 1-13.
Novantara, P. 2018. Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi. Buffer Informatika, 3(2).
Omar, N., & Al-Tashi, Q. 2018. Arabic nested noun compound extraction based on linguistic features and statistical measures. GEMA Online® Journal of Language Studies, 18(2).
Prayogo, A. H., & Mubarok, M. S. 2018. On the structure of Bayesian network for Indonesian text document paraphrase identification. In Journal of Physics: Conference Series (Vol. 971, No. 1, p. 012051). IOP Publishing.
Purba, A. H., & Situmorang, Z. 2017. Analisis Perbandingan Algoritma Rabin-Karp Dan Jarak Levenshtein Dalam Menghitung Kemiripan Teks. Jurnal Teknik Informatika UNIKA Santo Thomas, 2(2), 24-32.
Purnomo, W. G., & Purnomo, P. P. 2017. Akurasi Text Mining Menggunakan Algoritma K-Nearest Neighbour pada Data Content Berita SMS. Format, 6(1), 1-13.
Rahadian, B. A., Kurnianingtyas, D., Mahardika, D. P., Maghfira, T. N., & Cholissodin, I. 2017. Analisis Judul Majalah Kawanku Menggunakan Clustering K-Means Dengan Konsep Simulasi Big Data Pada Hadoop Multi Node Cluster. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) p-ISSN, 2355, 7699.
Rustiana, D., & Rahayu, N. 2017. Analisis Sentimen Pasar Otomotif Mobil: Tweet Twitter Menggunakan Naïve Bayes. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 8(1), 113-120.
Saputra, P. Y., Subhi, D. H., & Winatama, F. Z. A. 2019. Implementasi Sentimen Analisis Komentar Channel Video Pelayanan Pemerintah Di Youtube Menggunakan Algoritma Naïve Bayes. Jurnal Informatika Polinema, 5(4), 209-213.
Silvana, H., Rullyana, G., & Hadiapurwa, A. 2018. Persepsi Mahasiswa Terhadap Tindakan Plagiarisme Dalam Penyusunan Tugas Akhir. EDUTECH, 16(3), 338-347.
Spelling, A. F. D. 2018. Algoritma Jaro-Winkler Distance: Fitur Autocorrect dan Spelling Suggestion pada Penulisan Naskah Bahasa Indonesia di BMS TV. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 5(4).
Downloads
Published
How to Cite
Issue
Section
License
Authors retain all their rights to the published works, such as (but not limited to) the following rights; Copyright and other proprietary rights relating to the article, such as patent rights, The right to use the substance of the article in own future works, including lectures and books, The right to reproduce the article for own purposes, The right to self-archive the article