PENERAPAN ALGORITMA TF-IDF DAN COSINE SIMILARITY UNTUK QUERY PENCARIAN SOAL MATA PELAJARAN SOSIOLOGI SMA
DOI:
https://doi.org/10.47111/jti.v20i1.23986Keywords:
Information Retrieval, TF-IDF, Cosine Similarity, Question SearchAbstract
Pencarian pertanyaan dalam bank soal sosiologi sekolah menengah seringkali tidak efisien karena banyaknya dokumen, sehingga menyulitkan siswa dan guru dalam menemukan pertanyaan yang relevan dengan cepat. Untuk mengatasi masalah ini, penelitian ini mengembangkan sistem pencarian pertanyaan berbasis Information Retrieval (RI) menggunakan TF-IDF dan Cosine Similarity untuk meningkatkan akurasi pencarian. Dataset terdiri dari 350 pertanyaan sosiologi, yang diproses melalui tahapan pra-pemrosesan teks termasuk case folding, tokenisasi, penghapusan stopword, dan stemming. Dokumen yang dinormalisasi kemudian diberi bobot menggunakan TF-IDF dan dicocokkan dengan kueri pengguna menggunakan Cosine Similarity untuk menghasilkan hasil peringkat. Kinerja sistem dievaluasi menggunakan dua pengaturan ambang batas, yaitu ambang batas 10 dan ambang batas 15, dengan mengukur presisi, recall, dan F1-measure. Hasil menunjukkan bahwa ambang batas 10 menghasilkan presisi yang lebih tinggi tetapi recall yang sangat rendah, menyebabkan banyak dokumen yang relevan terlewatkan. Sementara itu, ambang batas 15 mencapai keseimbangan yang lebih baik dengan presisi rata-rata 0,733, recall 0,037, dan F1-measure 0,070, menjadikannya konfigurasi paling optimal dalam penelitian ini. Temuan ini menunjukkan bahwa peningkatan ambang batas meningkatkan kemampuan sistem untuk mengambil dokumen yang relevan sambil mempertahankan akurasi yang dapat diterima, dan oleh karena itu ambang batas 15 direkomendasikan untuk sistem pencarian pertanyaan sosiologi yang dikembangkan dalam penelitian ini.
Downloads
References
[1] M. Danuri, M. Informatika, J. Teknologi, and C. Semarang, “PERKEMBANGAN DAN TRANSFORMASI TEKNOLOGI DIGITAL,” 2019.
[2] B. Anjani, Y. Sugiarti, D. Lestari, R. Program, S. Pendidikan, and T. Agroindustri, “PENGEMBANGAN BANK SOAL DIGITAL INTERAKTIF PADA KOMPETENSI DASAR MENGANALISIS SIFAT BAHAN HASIL PERTANIAN,” 2019, [Online]. Available: http://ejournal.upi.edu/index.php/edufortech/indexEDUFORTECH4
[3] Ferry Sanjaya, “Pemanfaatan Sistem Temu Kembali Informasi dalam Pencarian Dokumen Menggunakan Metode Vector Space Model,” 2017.
[4] K. D. Putung, A. Lumenta, and A. Jacobus, “PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI,” 18 E-journal Teknik Informatika, vol. 8, no. 1, 2016.
[5] D. Nugraha, “Penerapan Algoritma Cosine Similarity Pada Aplikasi Bank Soal 2021,” 2021.
[6] Nanang Setiawan and Fatkhul Amin, “Sistem Temu Kembali Informasi Jurnal Ilmiah Unisbank Dengan Metode Cosine Similarity,” 2024.
[7] A. H. Nasrullah, “Integrasi Tf-Idf Dan Algoritma Cosine Similarity Untuk Deteksi Tingkat Kemiripan Judul Penelitian (Studi Kasus Mahasiswa Fakultas Ilmu Komputer UNISAN Gorontalo),” INTEC Journal: Information Technology Education Journal, vol. 3, no. 3, 2024, [Online]. Available: https://scholar.google.com/,
[8] R. Al Rasyid, D. Handayani, and U. Ningsih, “Penerapan Algoritma TF-IDF dan Cosine Similarity untuk Query Pencarian Pada Dataset Destinasi Wisata,” Jurnal Teknologi Informasi dan Komunikasi), vol. 8, no. 1, p. 2024, 2024, doi: 10.35870/jti.
[9] D. Septiani and I. Isabela, “SINTESIA: Jurnal Sistem dan Teknologi Informasi Indonesia ANALISIS TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DALAM TEMU KEMBALI INFORMASI PADA DOKUMEN TEKS”.
[10] Ernawati, “PERPUSTAKAAN DIGITAL DALAM TEMU KEMBALI INFORMASI DENGAN OPAC Ernawati,” 2018. [Online]. Available: http://puslit2.petra.ac.id/ejournal/index.php/pus/article/download/17222
[11] D. W. T. PUTRA and J. J. PUTRA, “PERANCANGAN SISTEM INFORMASI PENCARIAN LOWONGAN PEKERJAAN,” JURNAL TEKNOIF, vol. 6, no. 1, pp. 48–54, Apr. 2018, doi: 10.21063/jtif.2018.v6.1.48-54.
[12] S. Yusuf, M. A. Fauzi, and K. C. Brata, “Sistem Temu Kembali Informasi Pasal-Pasal KUHP (Kitab Undang-Undang Hukum Pidana) Berbasis Android Menggunakan Metode Synonym Recognition dan Cosine Similarity,” 2018. [Online]. Available: http://j-ptiik.ub.ac.id





