KOMPETISI KEYWORD PADA ALGORITMA GENETIKA DENGAN FITNES JACCARD DAN DICE
Keywords:
database, optimasi, kemiripan, POSI, GA, Jaccard, DiceAbstract
Dalam paper ini, penulis mengusulkan kompetisi keyword pada Algoritma Genetika (Genetic Algorithm,
GA) dengan formulasi fitnessnya memanfaatkan formulasi Jaccard dan Dice. Kemudian untuk mengurutkan
persentasi kemiripan sebagai hasil retrieval, penulis mengembangkan suatu formula POSI (Persentage Of
Similarity) untuk memilih dokumen yang diprediksi relevan dari dari suatu database. Sebagai data testing
penulis menggunakan database yang terdiri dari dari koleksi jurnal, paper dan proceeding BATAN (Badan
Tenaga Atom Nasional) dan beberapa tesis (skripsi) mahasiswa Prodi S1 Ilmu Komputer, Fasilkom-TI USU
sebagai benchmark data-set. Penulis mengenerate keyword dari koleksi dokumen tersebut menjadi bentuk
kromosom, kemudian kromosom-kromosom tersebut berkompetisi berdasarkan nilai fitness kromosom.
Penulis mengimplementasikan kompetisi ini pada sebuah prototype mesin pencari dokumen yang disebut
sebagai Pendeteksi Kemiripan Dokumen (PKD). Hasil PKD ini dapat dipertimbangkan oleh user untuk
menemukan dokokumen yang diprediksi relevan berdasarkan persentase nilai kemiripan setiap dokumen dari
database