ANALISIS PERFORMA MODEL MACHINE LEARNING KLASIFIKASI SUARA UNTUK LINGKKUNGAN PERKOTAAN
Abstract
Polusi suara merupakan salah satu permasalahan lingkungan yang memiliki dampak signifikan
terhadap kualitas hidup masyarakat, baik di daerah pedesaan maupun perkotaan. Untuk meng-
hadapi hal tersebut, pendekatan solusi berbasis teknologi dilakukan, salah satunya adalah klasi-
fikasi suara berbasis machine learning. Beberapa model machine learning untuk mengklasi-
fikasi suara telah diterapkan , baik model hibrida ataupun model machine learning tradisional
seperti Support Vector Machine (SVM), K-Nearest Neighbor (KNN), Decision Tree, dan model
berbasis Neural Network. Saat ini model hibrida berbasis neural network juga telah diterap-
kan untuk mengklasifikasi suara. Namun, beberapa model tersebut memiliki trade off ataupun
kelebihan dan kekurangan terhadap model tersebut. Penelitian ini bertujuan untuk menganalisis
model SVM, KNN, Decision Tree, Logistic Regression, serta Convolutional Neural Network-
Long Short Term Memory CNN-LSTM untuk model yang paling cocok untuk digunakan dalam
klasifikasi suara lingkungan perkotaan dari segi performa akurasi dan waktu komputasi. Dataset
yang digunakan dalam penelitian ini merupakan kumpulan suara yang bersumber dari Urban-
Sound8k, dimana merupakan dataset yang menjadi State of the art untuk penelitian klasifikasi
suara. Kemudian dataset tersebut dilakukan ekstraksi fitur menggunakan Mel-Frequency Cep-
stral Coefficients (MFCCs) untuk mendapatkan karakteristik spektral dari seluruh data suara
yang digunakan untuk mendapatkan representasi fitur yang dapat digunakan dalam proses pelati-
han model. Evaluasi model dilakukan dengan menggunakan accuracy, precision, recall, F1-
Score, serta divalidasi lebih lanjut dengan menggunakan K-Fold Cross Validation. Hyperpa-
rameter tuning yang diterapkan dalam penelitian ini menggunakan Optuna untuk semua model.
Hasil penelitian menunjukkan bahwa KNN mencapai performa tertinggi dengan akurasi 95.25%
dan waktu komputasi paling efektif (44.71 detik) dengan menggunakan fine tuning. Model lain-
nya yang menghasilkan akurasi di atas 90% yaitu SVM dan CNN-LSTM, tetapi kedua model
tersebut membutuhkan waktu komputasi 250 kali lebih tinggi dari KNN. Selain itu, Decision
Tree dan Logistic Regression menghasilkan performa yang lebih rendah. Hasil tersebut menun-
jukkan bahwa KNN adalah model yang memiliki performa yang paling unggul dibandingkan
dengan model lainnya baik dalam segi akurasi maupun waktu komputasi. Untuk penelitian
selanjutnya, mengeksplorasi model lainnya seperti Transformer-based sangat disarankan untuk
studi kasus klasifikasi suara dan model tersebut dapat dikaji serta diintegrasikan ke dalam sistem
berbasis Internet of Things (IoT) untuk sistem monitoring kebisingan.