Record Details

Perbandingan Pembobotan Term Frequency-Inverse Document Frequency dan Term Frequency-Relevance Frequency terhadap Fitur N-Gram pada Analisis Sentimen

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer

View Archive Info
 
 
Field Value
 
ISSN 2548-964X
 
Authentication Code dc
 
Title Statement Perbandingan Pembobotan Term Frequency-Inverse Document Frequency dan Term Frequency-Relevance Frequency terhadap Fitur N-Gram pada Analisis Sentimen
 
Added Entry - Uncontrolled Name Ramadhan, Randy
Sari, Yuita Arum
Adikara, Putra Pandu
Fakultas Ilmu Komputer, Universitas Brawijaya
Fakultas Ilmu Komputer, Universitas Brawijaya
Fakultas Ilmu Komputer, Universitas Brawijaya
 
Summary, etc. Analisis sentimen merupakan salah satu metode yang digunakan untuk mengekstrak sentimen dalam kalimat berdasarkan isinya. Analisis sentimen merupakan salah satu metode dalam text mining yang menggunakan proses text preprocessing yang setelahnya terdapat suatu proses yaitu pembobotan kata. Term Frequency-Inverse Document Frequency (TF-IDF) merupakan metode pembobotan kata yang paling populer dari kategori unsupervised term weighting yang dilansir tidak cocok untuk melakukan pengelompokan teks. Term Frequency-Relevance Frequency (TF-RF) merupakan metode penggabungan antara TF dan RF dengan tujuan untuk mendapatkan performansi yang lebih baik, metode ini berfokus pada seluruh dokumen yang mengandung term atau tidak mengandung term. Twitter merupakan tempat untuk masyarakat mencurahkan isi pikiran tentang pandemi yang dialami. Ulasan tentang hal karyawan dirumahkan pada Twitter perlu diklasifikasikan menjadi ulasan positif, negatif, dan netral, yang berguna untuk menjadi pertimbangan perusahaan dan pemerintah untuk melakukan keputusan dalam kebijakan PSBB. Terdapat beberapa tahap penelitian ini yaitu preprocessing untuk pemrosesan dokumen, dan menggunakan fitur unigram dan bigram serta pembobotan kata menggunakan metode TF-IDF dan TF-RF lalu   dalam pengklasifikasian menggunakan metode klasifikasi K-Nearest Neighbor. Data yang digunakan sebanyak 246 data latih dan 90 data uji. Hasil terbaik dari perbandingan evaluasi yang didapatkan adalah dengan menggunakan pembobotan kata TF.RF dengan fitur unigram pada klasifikasi KNN dengan nilai K = 3 yaitu accuracy dengan 0,677, precision sebesar 0,526, recall dengan 0,654, serta f-measure dengan nilai 0,583. Nilai bigram tidak berpengaruh besar dalam penelitian ini dikarenakan nilai f-measure terbaik didapatkan bigram dengan nilai 0,591, serta nilai unigram terbaik dengan nilai 0,583.
 
Publication, Distribution, Etc. Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya
 
Electronic Location and Access application/pdf
http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/10173
 
Data Source Entry Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer; Vol 5 No 11 (2021): November 2021
 
Language Note ind
 
Terms Governing Use and Reproduction Note Hak Cipta (c) 2021 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
 


www.freevisitorcounters.com