• Login
    View Item 
    •   DSpace Home
    • FACULTY OF SCIENCE AND COMPUTER
    • COMPUTER SCIENCE (ILMU KOMPUTER)
    • DISSERTATIONS AND THESES (CS)
    • View Item
    •   DSpace Home
    • FACULTY OF SCIENCE AND COMPUTER
    • COMPUTER SCIENCE (ILMU KOMPUTER)
    • DISSERTATIONS AND THESES (CS)
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Studi Pengaruh Tingkat Interferensi Terhadap Performa Transkripsi Model Wav2Vec2-Large-XLSR-Indonesian

    Thumbnail
    View/Open
    Abstract and Table of Content (221.6Kb)
    Chapter 1: Introduction (134.6Kb)
    Chapter 2: Literature Review (191.0Kb)
    Chapter 3: Method (323.8Kb)
    Chapter 4: Result and Discussions (1.445Mb)
    Chapter 5: Conclusion (100.9Kb)
    References (113.2Kb)
    Cover and Legal (406.0Kb)
    Date
    2025-08-10
    Metadata
    Show full item record
    Abstract
    Kegiatan rapat secara umum memerlukan Minutes of Meeting (MoM) untuk mencatat pokok bahasan rapat. Pembuatan secara manual akan memakan waktu dan tenaga, tetapi dapat dibantu dengan teknologi transkripsi Automatic Speech Recognition (ASR) untuk mengubah percakapan yang terekam menjadi teks atau speech-to-text (STT). Namun, penggunaan teknologi ini umumnya memiliki confidentiality issue karena penggunaan teknologi pihak ketiga. Masalah lain juga timbul dari adanya interferensi suara percakapan lain yang tidak bisa dihindarkan tercampur dengan percakapan utama. Oleh karena itu, penelitian ini mempelajari seberapa jauh pengaruh interferensi terhadap performa ASR dan pembuatan MoM yang dilakukan secara lokal tanpa menggunakan layanan pihak ketiga. Model yang dipakai untuk ASR di penelitian ini adalah Wav2Vec2 XLSR Indonesian, yang kemudian dilakukan fine-tuning menggunakan dataset Few-shot Learning Evaluation of Universal Representations of Speech (FLEURS). Suara interferensi dibangkitkan dalam beberapa skenario, yaitu ideal, whisper, equal rms, dan overpower, untuk ditambahkan ke sistem. Performa model kemudian diukur menggunakan metrik Word Error Rate (WER). Hasil simulasi menunjukkan bahwa semakin tinggi level audio dari interferensi maka performa model transkripsi semakin rendah. Namun hasil summarization untuk pembuatan MoM oleh LLM menunjukkan bahwa interferensi skenario whisper hingga level audio -40 dBFS memberikan performa yang sama baiknya seperti pada kondisi ideal (tidak ada interferensi), yang ditandai dengan nilai BERTScore yang didapatkan. Hal ini menunjukkan bahwa LLM mampu memperbaiki hasil transkripsi STT yang kurang memuaskan.
    URI
    https://library.universitaspertamina.ac.id//xmlui/handle/123456789/14574
    Collections
    • DISSERTATIONS AND THESES (CS)

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV