MODEL NAMED ENTITY RECOGNITION (NER) DALAM BAHASA INDONESIA DENGAN MENGGUNAKAN BiLSTM-CNNs
Abstract
Named-Entity Recognition (NER) merupakan bagian dari riset Natural Language Processing (NLP) yang digunakan untuk mengekstrak informasi seperti nama orang, organisasi, lokasi, dan waktu. NER telah digunakan di banyak bidang pekerjaan salah satunya pada pengembangan chatbot. Penggunaan NLP dan machine learning (ML) pada chatbot dapat membuat chatbot lebih cerdas dengan analisis personal yang lebih baik ke pengguna. Tujuan dari penelitian ini adalah untuk membuat model NER dalam bahasa Indonesia dengan menggunakan arsitektur model Bidirectional Long-Short-Term-Memory (BiLSTM) dan Convolutional Neural Networks (CNNs). Berbeda dengan penelitian sebelumnya, model ini hanya menggunakan word-level embedding pada lapisan CNNs untuk menjaga agar model tetap sederhana. Named-entities (NEs) yang digunakan pada penelitian ini hanya terbatas pada nama orang, organisasi, lokasi, kuantitas, dan waktu dengan menggunakan format pelabelan BILOU. Performa model yang dibangun diukur dengan menggunakan metrik evaluasi f1 score dengan rataan mikro. Model BiLSTM-CNNs + pretrained word2vec embedding menghasilkan performa yang sangat baik dibanding model lainnya dengan nilai f1 score rataan mikro 73.37%.