Klasifikasi Fungsi Senyawa Aktif berdasarkan Notasi Simplified Molecular Input Line Entry System (SMILES) menggunakan Metode Random Forest
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
View Archive InfoField | Value | |
ISSN |
2548-964X |
|
Authentication Code |
dc |
|
Title Statement |
Klasifikasi Fungsi Senyawa Aktif berdasarkan Notasi Simplified Molecular Input Line Entry System (SMILES) menggunakan Metode Random Forest |
|
Added Entry - Uncontrolled Name |
Winantoro, Faiz Anggiananta Ratnawati, Dian Eka Anam, Syaiful Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Brawijaya |
|
Summary, etc. |
Senyawa merupakan zat tunggal yang tersusun dari dua atau lebih unsur yang membentuk ikatan kimia. Terdapat dua jenis senyawa, yaitu senyawa aktif dan senyawa tidak aktif. Senyawa aktif merupakan senyawa yang memiliki efek fisiologis terhadap organisme lain. Di Indonesia, masih banyak senyawa aktif yang belum diketahui fungsinya. Oleh sebab itu, diperlukan metode klasifikasi untuk membantu menentukan fungsi dari senyawa aktif. Klasifikasi dilakukan dengan data yang ditulis dalam notasi SMILES. Dari notasi SMILES tersebut, kemudian diambil fitur seperti jumlah atom B, C, N, O, P, S, F, Cl, Br, I, OH, =, #, @, -, +, COC, C=C, [O-], N+, C=O, dan () melalui proses preprocessing. Sebelum digunakan untuk proses klasifikasi, semua fitur tersebut dibagi dengan panjang notasi SMILES untuk mendapat nilainya. Penelitian ini dilakukan untuk mengklasifikasi fungsi senyawa aktif dengan menerapkan metode Random Forest (RF) dengan objek data SMILES dengan 4 kelas fungsi senyawa. RF dipilih karena metode ini hampir tidak mengalami kondisi overfitting, mampu menangani data dengan banyak fitur, dan metode ini tidak terpengaruh oleh dataset yang memiliki missing value. Akurasi terbaik yang dihasilkan pada pengujian dengan data 4 kelas adalah sebesar 69% dan rata-rata terbaik pada pengujian dengan metode K-Fold Cross Validation sebesar 63%. Kemudian, pada data dengan 3 kelas fungsi senyawa, akurasi terbaik yang dihasilkan sebesar 76% dan rata-rata terbaik pada pengujian dengan metode K-Fold Cross Validation sebesar 70%. Terakhir, pengujian pada data dengan 2 kelas fungsi senyawa menghasilkan akurasi tertinggi sebesar 86% dan rata-rata terbaik sebesar 80%
|
|
Publication, Distribution, Etc. |
Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya |
|
Electronic Location and Access |
application/pdf http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/8804 |
|
Data Source Entry |
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer; Vol 5 No 4 (2021): April 2021 |
|
Language Note |
ind |
|
Terms Governing Use and Reproduction Note |
Hak Cipta (c) 2021 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer |
|