Perbandingan Pembobotan Term Frequency-Inverse Document Frequency dan Term Frequency-Relevance Frequency terhadap Fitur N-Gram pada Analisis Sentimen
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
View Archive InfoField | Value | |
ISSN |
2548-964X |
|
Authentication Code |
dc |
|
Title Statement |
Perbandingan Pembobotan Term Frequency-Inverse Document Frequency dan Term Frequency-Relevance Frequency terhadap Fitur N-Gram pada Analisis Sentimen |
|
Added Entry - Uncontrolled Name |
Ramadhan, Randy Sari, Yuita Arum Adikara, Putra Pandu Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Ilmu Komputer, Universitas Brawijaya |
|
Summary, etc. |
Analisis sentimen merupakan salah satu metode yang digunakan untuk mengekstrak sentimen dalam kalimat berdasarkan isinya. Analisis sentimen merupakan salah satu metode dalam text mining yang menggunakan proses text preprocessing yang setelahnya terdapat suatu proses yaitu pembobotan kata. Term Frequency-Inverse Document Frequency (TF-IDF) merupakan metode pembobotan kata yang paling populer dari kategori unsupervised term weighting yang dilansir tidak cocok untuk melakukan pengelompokan teks. Term Frequency-Relevance Frequency (TF-RF) merupakan metode penggabungan antara TF dan RF dengan tujuan untuk mendapatkan performansi yang lebih baik, metode ini berfokus pada seluruh dokumen yang mengandung term atau tidak mengandung term. Twitter merupakan tempat untuk masyarakat mencurahkan isi pikiran tentang pandemi yang dialami. Ulasan tentang hal karyawan dirumahkan pada Twitter perlu diklasifikasikan menjadi ulasan positif, negatif, dan netral, yang berguna untuk menjadi pertimbangan perusahaan dan pemerintah untuk melakukan keputusan dalam kebijakan PSBB. Terdapat beberapa tahap penelitian ini yaitu preprocessing untuk pemrosesan dokumen, dan menggunakan fitur unigram dan bigram serta pembobotan kata menggunakan metode TF-IDF dan TF-RF lalu dalam pengklasifikasian menggunakan metode klasifikasi K-Nearest Neighbor. Data yang digunakan sebanyak 246 data latih dan 90 data uji. Hasil terbaik dari perbandingan evaluasi yang didapatkan adalah dengan menggunakan pembobotan kata TF.RF dengan fitur unigram pada klasifikasi KNN dengan nilai K = 3 yaitu accuracy dengan 0,677, precision sebesar 0,526, recall dengan 0,654, serta f-measure dengan nilai 0,583. Nilai bigram tidak berpengaruh besar dalam penelitian ini dikarenakan nilai f-measure terbaik didapatkan bigram dengan nilai 0,591, serta nilai unigram terbaik dengan nilai 0,583.
|
|
Publication, Distribution, Etc. |
Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya |
|
Electronic Location and Access |
application/pdf http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/10173 |
|
Data Source Entry |
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer; Vol 5 No 11 (2021): November 2021 |
|
Language Note |
ind |
|
Terms Governing Use and Reproduction Note |
Hak Cipta (c) 2021 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer |
|