Perbandingan Metode Clustering pada Kelompok Dokumen Teks Untuk Menentukan Nilai Ambang Batas Similaritas
Keywords:
K-Means K-Medoids Dokumen Jaccard SimilarityAbstract
Dokumen teks adalah bentuk informasi tertulis yang dapat dibaca oleh komputer dan dapat dibaca oleh manusia. Jumlah dokumen teks yang dihasilkan terus meningkat seiring dengan pertumbuhan data digital. Untuk menemukan pola atau hubungan antara dokumen teks dalam hal ini, sangat penting untuk dapat mengelompokkannya.Salah satu tantangan dalam pemrosesan dokumen teks adalah menentukan nilai similaritas minimal yang diperlukan agar dokumen termasuk dalam satu kelompok. Pengelompokan dokumen dapat digunakan untuk mencari nilai ambang batas. Nilai ambang batas menunjukkan batas data yang dapat hadir dalam anggota cluster. Metode pengelompokan yang akan digunakan adalah K-Means dan K-Medoids.Penelitian ini bertujuan untuk membandingkan metode cluster kemudian mencari nilai ambang batas pada kelompok dokumen menggunakan jaccard similarity. Hasil dari penelitian ini adalah berdasarkan nilai silhouette coefficient algoritma K-Means lebih unggul dari pada algoritma K-Medoids untuk pengelompokan dokumen teks dengan nilai silhouette K-Means sebesar 0.0304 sedangkan untuk K-Medoids menghasilkan nilai silhouette sebesar 0.226. Diperoleh ambang nilai similaritas yang dihitung menggunakan jaccard similarity sebesar 0.07 berdasarkan pengelompokan K-Means
References
A. Pujianti, “Implementasi Data Mining Menggunakan Metode K-Means Clustering Untuk Menentukan Status Kematian Bayi Di Jawa Barat,” 2023.
N. Khilmiyatul Ilmiyah, D. E. Ratnawati, and S. Anam, “Implementasi Gabungan Metode K-Means Learning Vector Quantization (LVQ) Untuk Klasifikasi Fungsi Senyawa Aktif Menggunakan Data SMILES,” 2019. [Online]. Available: http://j-ptiik.ub.ac.id
S. Fatimah and A. Usman, “Pengelompokkan Tingkat Pemahaman Guru PAUD Terhadap Pembelajaran Berbasis STEAM Menggunakan Metode X-Means Clustering,” 2022.
S. Bahri, D. Marisa Midyanti, and P. Korespondensi, “Penerapan Metode K-Medoids Untuk Pengelompokan Mahasiswa Berpotensi Drop Out Application Of K-Medoids Method For Dropout Potential Student Grouping,” vol. 10, no. 1, pp. 165–172, 2023, doi: 10.25126/jtiik.2023106643.
D. L. Karputri1 and W. Yustanti2, “Analisis Klastering Buku sebagai Evaluasi untuk Peningkatan Minat Baca Perpusatakaan SMAN 1 Grogol,” 2022.
E. Luthfi, A. Wahyu Wijayanto, and P. Statistika, “Analisis perbandingan metode hirearchical, k-means, dan k-medoids clustering dalam pengelompokkan indeks pembangunan manusia Indonesia,” no. 4, pp. 761–773, 2021, [Online]. Available: http://journal.feb.unmul.ac.id/index.php/INOVASI
P. Widiandana and I. Riadi, “Implementasi Metode Jaccard pada Analisis Investigasi Cyberbullying,” masa berlaku mulai, vol. 1, no. 3, pp. 1046–1051, 2017.
S. Dewi, S. Defit, and Y. Yuhandri, “Akurasi Pemetaan Kelompok Belajar Siswa Menuju Prestasi Menggunakan Metode K-Means,” Jurnal Sistim Informasi dan Teknologi, pp. 28–33, Mar. 2021, doi: 10.37034/jsisfotek.v3i1.40.
T. Hidayat, “Klasifikasi Data Jamaah Umroh Menggunakan Metode K-Means Clustering,” Jurnal Sistim Informasi dan Teknologi, pp. 19–24, Feb. 2022, doi: 10.37034/jsisfotek.v4i1.115.
J. Penerapan, T. Informasi, D. Komunikasi, G. B. Kaligis, and S. Yulianto, “It-Explore Analisa Perbandingan Algoritma K-Means, K-Medoids, Dan X-Means Untuk Pengelompokkan Kinerja Pegawai (Studi Kasus: Sekretariat DPRD Provinsi Sulawesi Utara),” 2022.
F. Firzada and Y. Yuhandri, “Klasterisasi Tingkat Masa Studi Tepat Waktu Mahasiswa Menggunakan Algoritma K-Medoids,” Jurnal Sistim Informasi dan Teknologi, pp. 162–168, Aug. 2021, doi: 10.37034/jsisfotek.v3i3.60.
K. H. Manguri, R. N. Ramadhan, and P. R. Mohammed Amin, “Twitter Sentiment Analysis on Worldwide COVID-19 Outbreaks,” Kurdistan Journal of Applied Research, pp. 54–65, May 2020, doi: 10.24017/covid.8.
J. Khatib Sulaiman, M. Ikhsan, and R. R. Kurniawan, “Penerapan Text Mining pada Sistem Rekomendasi Pembimbing Skripsi Mahasiswa Menggunakan Algoritma Naïve Bayes Classifier,” Indonesian Journal of Computer Science Attribution, vol. 12, no. 6, pp. 2023–4196.
N. , & S. J. Feldman, The Text Mining Hand Book Advanced Approaches in Analyzing Unstructured Data. . United States of Amerika: Cambridge University Press., 2007.
P. J. Rousseeue, “Silhouettes: A graphical aid to the interpretation and validation of cluster analysis,” 1987.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2024 Scoriny Noor Hasanah

This work is licensed under a Creative Commons Attribution 4.0 International License.













