Klasifikasi Tweets Pada Twitter Menggunakan Metode K-Nearest Neighbour (K-NN) Dengan Pembobotan TF-IDF
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
View Archive InfoField | Value | |
ISSN |
2548-964X |
|
Authentication Code |
dc |
|
Title Statement |
Klasifikasi Tweets Pada Twitter Menggunakan Metode K-Nearest Neighbour (K-NN) Dengan Pembobotan TF-IDF |
|
Added Entry - Uncontrolled Name |
Satrio, Rakhman Halim Fauzi, Mochammad Ali Indriati, Indriati Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Ilmu Komputer, Universitas Brawijaya |
|
Summary, etc. |
Twitter termasuk mikroblog yang sedang diminati oleh banyak orang dan menjelma menjadi penyiar informasi yang amat cepat saat ini. Informasi yang dikeluarkan serta bersirkulasi via media ini amat bebas serta banyak ragam, layaknya berita, pendapat, pertanyaan, kritikan, komentar baik bersifat positif ataupun negatif. Klasifikasi ialah kaidah di teks mining yang menghimpunkan muatan mengacu pada kesamaan skripnya. Lewat kaidah ini membolehkan tweets yang tersedia di Twitter digolongkan jadi satu bersandarkan jenisnya. Misalkan, substansi sepakbola, voli, serta tenis diguguskan pada kategori olahraga. Prosedur pada klasifikasi dimulai memakai preprocessing, selanjutnya dilakukan pembobotan kata, lalu kategorisasi yang terdiri dari kalkulasi cosine similarity. Preprocessing sendiri terdiri dari beberapa tahapan, yakni pembersihan dokumen, tokenizing, stopword removal, serta stemming. Metode pembobotan kata yang dipergunakan dalam skripsi ini ialah Term Frequency-Inverse Document Frequency (TF-IDF) & memakai K-Nearest Neighbor (K-NN) untuk metode klasifikasinya. Metode KNN merupakan klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Pengujian akurasi dari klasifikasi tweets pada Twitter dengan memakai metode K-Nearest Neighbor (K-NN) menghasilkan akurasi dimana total data berjumlah 140, dengan uraian 100 data latih & 40 data uji serta angka k yang dimasukkan ialah 1, 3, 5, serta 7, masing-masing hasilnya k = 1, akurasi sebesar 75,0%; k = 3, ketepatan 72,5%; k = 5, ketepatan 62,5%; k = 7, ketepatan 55,0%.
|
|
Publication, Distribution, Etc. |
Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya |
|
Electronic Location and Access |
application/pdf http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/6133 |
|
Data Source Entry |
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer; Vol 3 No 8 (2019): Agustus 2019 |
|
Language Note |
ind |
|
Terms Governing Use and Reproduction Note |
Hak Cipta (c) 2019 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer |
|