ANALISA PERBANDINGAN METODE NAÏVE BAYES CLASSIFIER DAN K-NEAREST NEIGHBOR TERHADAP KLASIFIKASI DATA
Keywords:
Klasifikasi, Forum, K-Nn, Nbc Classifier, Confusion MatrixAbstract
Penggunaan forum sebagai sarana pembelajaran telah banyak digunakan pada kalangan Mahasiswa. Forum digunakan sebagai sarana berdiskusi antar sesama anggota forum untuk membahas materi sesuai dengan judul topik. Judul topik biasanya ditentukan sesuai dengan isi materi yang akan dibahas. Judul topik yang sudah terlalu banyak di dalam sebuah forum dapat berakibat salah dalam pemilihan judul. Salah satu cara untuk mengatasinya yaitu dengan melakukan klasifikasi judul topik secara otomatis sesuai dengan isi materi. Klasifikasi teks dapat diselesaikan dengan menggunakan teknik text mining. Pada proses klasifikasi yang dilakukan yaitu dengan membagi dataset menjadi 2 (dua) bagian menjadi data latih (training) dan data uji (testing). Pada tahapan awal klasifikasi dilakukan proses pre-processing yang diawali dengan tahapan tokenisasi, kemudian dilanjutkan dengan filtering dan diakhiri dengan stemming. Ada beberapa metode yang dapat digunakan dalam klasifikasi teks antara lain naïve bayes classifier (nbc), k-nearest neighbor (k-nn), rocchio, weight adjusted k-nearest neighbor (wa k-nn) dan lain-lain. Pada penelitian ini, penulis membandingkan 2 (dua) metode yaitu nbc dan k-nn. Dari hasil perbandingan kedua metode dapat disimpulkan bahwa metode k-nn lebih baik tingkat akurasinya daripada metode nbc. Hal ini dibuktikan dengan tingkat akurasi sebesar 80% untuk metode k-nn dan sebesar 73% untuk nbc yang dihitung dengan menggunakan metode confusion matrix.
References
Hapsari, I.T., Andoko, B.S., & Rahmad, C. 2015. Aplikasi Information Retrieval untuk Pencarian Dokumen Laporan Penelitian. Jurnal Informatika Polinema. ISSN: 2407-070x Vol. 1 No. 3, pp. 23-28.
Herwijayanti, B., Ratnawati, D.E., & Muflikhah, L. 2018. Klasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. e-ISSN: 2548-964X Vol. 2, No.1 hlm:306-312.
Indriani, A. Klasifikasi Data Forum dengan menggunakan Metode Naïve Bayes Classifier. 2014. Seminar Nasional Aplikasi Teknologi Informasi (SNATI). ISSN: 1907-5022, pp. G5-G10.
Indriani, A., Muhammad, Suprianto, & Hadriansa. 2018. Implementasi Jaccard Index dan N-gram pada Rekayasa Aplikasi Koreksi Kata Berbahasa Indonesia. Jurnal Sebatik. Vol. 22 No. 2, pp. 95-101.
Ma’arif, M.R. 2016. Perbandingan Naïve Bayes Classifier dan Support Vector Machine untuk Klasifikasi Judul Artikel. Jurnal Informatika Sunan Kalijaga. ISSN: 2527-5836 Vol. 1 No. 2 pp. 90-93.
Rivki, M., & Bachtiar, A.M. 2017. Implementasi Algoritma k-Nearest Neighbor dalam Pengklasifikasian Follower Twitter yang menggunakan Bahasa Indonesia. Jurnal Sistem Informasi. Vol. 13 Issue 1, pp. 31-37.
Rosandy, T. 2016. Perbandingan Metode Naïve Bayes Classifier dengan Metode Decision Tree (c4.5) untuk menganalisa Kelancaran Pembiayaan (study kasus: kspps/bmt al-fadhila). Jurnal TIM Darmajaya. ISSN: 2442-5567 Vol. 2 No. 1, pp. 52-62
Downloads
Published
How to Cite
Issue
Section
License
Authors retain all their rights to the published works, such as (but not limited to) the following rights; Copyright and other proprietary rights relating to the article, such as patent rights, The right to use the substance of the article in own future works, including lectures and books, The right to reproduce the article for own purposes, The right to self-archive the article