Klasifikasi Dokumen Skripsi Dengan Menggunakan Text Mining (Studi Kasus: Fakultas Teknologi Informasi)

Penulis

  • Feri Irfanto Teknik Informatika, Fakultas Teknologi Informasi, Universitas Hasyim Asy’ari
  • Aries Dwi Indriyanti Teknik Informatika, Fakultas Teknologi Informasi, Universitas Hasyim Asy’ari
  • Dharma Bagus Pratama Putra Teknik Informatika, Fakultas Teknologi Informasi, Universitas Hasyim Asy’ari

Abstrak

Klasifikasi dokumen skripsi ialah metode data mining dengan tujuan untuk mengategorikan abstrak skripsi yang kategorinya belum diketahui. Klasifikasi dokumen skripsi ini bertujuan untuk membantu mahasiswa dalam mencari dokumen skripsi yang sesuai dengan penelitiannya dengan membaca abstrak bisa diketahui masuk dalam kategori apa. Penelitian yang dibahas mengenai penerapan text mining dalam pengklasifikasian dokumen skripsi dengan studi kasus di Fakultas Teknologi Informasi. Text mining ini difungsikan melakukan ekstraksi suatu data berupa text untuk mendapatkan informasi dari kumpulan dokumen. Pada penelitian ini menggunakan metode Naive Bayes Classifier, metode klasifikasi dengan menghitung probabilitas dengan cara menjumlahkan frekuensi dengan kombinasi nilai yang ada di data set. Metode ini memiliki tujuan untuk mengklasifikasi datatesting yang sesuai dengan atribut datatraining. File abstrak yang diolah dalam klasifikasi ini yaitu dari file abstrak dari mahasiswa Fakultas Teknologi Informasi yang sudah lulus. Kategori yang digunakan ada 5 kategori ialah SPK, RPL, Data Mining, Pengolahan Citra, dan Keamanan Sistem dan Jaringan. Proses perhitungan klasifikasi dokumen skripsi dengan metode Naïve Bayes Classifier ini diawali dengan input data training, preprocessing, menghitung term frequency (kemunculan kata), menghitung nilai probabilitas kata dari data training, dan proses terakhir yaitu menghitung nilai probabilitas maksimal setiap kategori. Data yang digunakan dalam penelitian ini yaitu 49 data yang masing-masing 34 digunakan untuk data training dan 15 sisanya untuk data testing. Dari jumlah 1.5 data testing tersebut diperoleh 14 data terklasifikasi benar dan 1 sisanya tidak terklasifikasi benar. Akurasi yang diperoleh dari sistem klasifikasi dokumen skripsi sebesar 93%.

Kata kunci: Klasifikasi Dokumen Skripsi, Text Mining, Naïve Bayes Classifier

Unduhan

Data unduhan belum tersedia.

Unduhan

Diterbitkan

2021-03-17