Automatic Speech Recognition Bahasa Indonesia menggunakan Unidirectional Gated Recurrent Unit
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
View Archive InfoField | Value | |
ISSN |
2548-964X |
|
Authentication Code |
dc |
|
Title Statement |
Automatic Speech Recognition Bahasa Indonesia menggunakan Unidirectional Gated Recurrent Unit |
|
Added Entry - Uncontrolled Name |
Firmansyah, Bayu Aji Bachtiar, Fitra Abdurrachman Fakultas Ilmu Komputer, Universitas Brawijaya Fakultas Ilmu Komputer, Universitas Brawijaya |
|
Summary, etc. |
Penelitian speech recognition dengan pendekatan Âend-to-end model berbasis bidirectional RNN masih memiliki kendala pada latency yang tinggi. Model speech recognition yang dibangun menggunakan end-to-end model juga masih memiliki permasalahan pada kesalahan pengejaan. Selain itu, model speech recognition sangat sensitif terhadap dialek dan jenis alat perekam penutur. Penelitian ini akan meneliti perilaku jaringan dalam mempelajari fitur akustik berdasarkan gradient dan loss dengan penggunaan basis unidirectional GRU CTC yang mana memiliki cost computation yang lebih rendah dibandingkan basis bidirectional RNN CTC. Penelitian ini tidak menggunakan languge model dalam membantu model akustik dalam memetakan sinyal akusti. Dengan menggunakan data audio terjemahan Al-Quran dalam dialek dan berbahasa Indonesia, data diekstraksi menggunakan MFCC untuk mendapatkan fitur akustik. Batch Normalization juga digunakan pada jaringan GRU untuk menghindari covariate shift antar lapisan jaringan. Jaringan terdiri dari tiga layer jaringan MLP dengan fungsi aktivasi ReLU dan diteruskan dengan layer unidirectional GRU. Setelah melewati GRU, data akan diproses pada SLP dengan fungsi aktivasi softmax yang mana hasilnya akan menjadi masukan pada CTC. Jaringan dioptimasi menggunakan Adam optimizer dan menghasilkan 90.611 % WER dari model terbaik yang diuji. Jaringan mengalami vanishing gradient dan mengakibatkan lambatnya proses belajar jaringan dalam merekognisi sinyal akustik. Penggunaan basis unidirectional GRU juga tidak memiliki signifikansi yang besar pada delay layer dalam mengekspose informasi temporal.
|
|
Publication, Distribution, Etc. |
Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya |
|
Electronic Location and Access |
application/pdf http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/10200 |
|
Data Source Entry |
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer; Vol 5 No 12 (2021): Desember 2021 |
|
Language Note |
ind |
|
Terms Governing Use and Reproduction Note |
Hak Cipta (c) 2021 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer |
|