Record Details

Automatic Speech Recognition Bahasa Indonesia menggunakan Unidirectional Gated Recurrent Unit

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer

View Archive Info
 
 
Field Value
 
ISSN 2548-964X
 
Authentication Code dc
 
Title Statement Automatic Speech Recognition Bahasa Indonesia menggunakan Unidirectional Gated Recurrent Unit
 
Added Entry - Uncontrolled Name Firmansyah, Bayu Aji
Bachtiar, Fitra Abdurrachman
Fakultas Ilmu Komputer, Universitas Brawijaya
Fakultas Ilmu Komputer, Universitas Brawijaya
 
Summary, etc. Penelitian speech recognition dengan pendekatan ­end-to-end model berbasis bidirectional RNN masih memiliki kendala pada latency yang tinggi. Model speech recognition yang dibangun menggunakan end-to-end­ model juga masih memiliki permasalahan pada kesalahan pengejaan. Selain itu, model speech recognition sangat sensitif terhadap dialek dan jenis alat perekam penutur. Penelitian ini akan meneliti perilaku jaringan dalam mempelajari fitur akustik berdasarkan gradient dan loss dengan penggunaan basis unidirectional GRU CTC yang mana memiliki cost computation yang lebih rendah dibandingkan basis bidirectional RNN CTC. Penelitian ini tidak menggunakan languge model dalam membantu model akustik dalam memetakan sinyal akusti. Dengan menggunakan data audio terjemahan Al-Quran dalam dialek dan berbahasa Indonesia, data diekstraksi menggunakan MFCC untuk mendapatkan fitur akustik. Batch Normalization juga digunakan pada jaringan GRU untuk menghindari covariate shift antar lapisan jaringan. Jaringan terdiri dari tiga layer jaringan MLP dengan fungsi aktivasi ReLU dan diteruskan dengan layer unidirectional GRU. Setelah melewati GRU, data akan diproses pada SLP dengan fungsi aktivasi softmax yang mana hasilnya akan menjadi masukan pada CTC. Jaringan dioptimasi menggunakan Adam optimizer dan menghasilkan 90.611 % WER dari model terbaik yang diuji. Jaringan mengalami vanishing gradient dan mengakibatkan lambatnya proses belajar jaringan dalam merekognisi sinyal akustik. Penggunaan basis unidirectional GRU juga tidak memiliki signifikansi yang besar pada delay layer dalam mengekspose informasi temporal.
 
Publication, Distribution, Etc. Fakultas Ilmu Komputer (FILKOM), Universitas Brawijaya
 
Electronic Location and Access application/pdf
http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/10200
 
Data Source Entry Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer; Vol 5 No 12 (2021): Desember 2021
 
Language Note ind
 
Terms Governing Use and Reproduction Note Hak Cipta (c) 2021 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
 


www.freevisitorcounters.com