PENGGALIAN OPINI MASYARAKAT TERKAIT OBAT HERBAL SEBAGAI ALTERNATIF PENGOBATAN DIABETES DENGAN MODEL INDOBERTWEET
Abstract
Meningkatnya jumlah penderita diabetes di Indonesia bersamaan dengan maraknya informasi
mengenai pengobatan herbal di media sosial berpotensi menyebabkan penyebaran informasi yang
tidak terverifikasi. Oleh karena itu, penelitian ini bertujuan untuk menganalisis sentimen masyarakat
terhadap penggunaan obat herbal untuk diabetes dengan menggunakan model IndoBERTweet. Data
dikumpulkan melalui media sosial platform X, menghasilkan 6.661 tweet, yang kemudian disaring
sehingga diperoleh 1.820 tweet berbahasa Indonesia. Selanjutnya, dilakukan tahap pre-processing
yang mencakup case folding, penghapusan URL, mention, hashtag, teks retweet, tanda baca, angka,
spasi berlebih, serta spasi di awal dan akhir teks, sehingga tersisa 1.610 tweet. Data ini kemudian
dilabeli menggunakan pendekatan lexicon, yang hasilnya dianalisis kembali secara manual. Proses
pelabelan menghasilkan 383 tweet dengan sentimen netral sebanyak 215 tweet, positif 152 tweet, dan
negatif 16 tweet. Dataset yang telah dilabeli kemudian dibagi menggunakan pustaka Scikit-Learn
ke dalam tiga bagian, yaitu data latih (80%), validasi (10%), dan uji (10%). Selanjutnya, dilakukan
tokenisasi menggunakan IndoBERTweet tokenizer. Model IndoBERTweet kemudian dilatih dengan
kombinasi hyperparameter terbaik yang diperoleh melalui Bayesian Optimization menggunakan Op tuna. Proses pelatihan menggunakan objek Trainer, yang mengelola dataset pelatihan dan validasi.
Untuk mencegah overfitting, diterapkan EarlyStoppingCallback agar pelatihan dihentikan jika per forma model tidak mengalami peningkatan. Setelah proses pelatihan selesai, model diuji menggu nakan dataset uji, dan evaluasi dilakukan dengan mengukur akurasi, presisi, recall, dan F1-score.
Hasil evaluasi menunjukkan bahwa model memiliki akurasi total sebesar 92,3%, yang berarti model
mampu mengklasifikasikan sentimen dengan benar pada lebih dari 90% data uji. Pada sentimen posi tif, model mencapai precision sebesar 95,2% dan recall 90,9%. Untuk sentimen negatif, precision
yang diperoleh adalah 88,2% dengan recall 93,75%. Sementara itu, kelas netral menunjukkan hasil
sempurna dengan precision, recall, dan F1-score sebesar 100%. Hasil ini menunjukkan bahwa model
IndoBERTweet mampu mengklasifikasikan sentimen secara efektif dengan tingkat kesalahan yang
minimal.