APAKAH REGRESI POLINOMIAL BERGANDA KUADRATIK TEPAT UNTUK ANALISIS PERFORMA TIM SEPAK BOLA? STUDI KASUS LIGA INGGRIS 2022-2023
Abstract
Sepak bola kini tidak hanya menjadi sebuah hobi namun sudah berkembang menjadi sebuah industri yang besar. Liga Inggris atau English Premier League (EPL) merupakan salah satu liga sepak bola yang memiliki pasar terbesar di antara liga-liga sepak bola lainnya. Dikarenakan sepak bola telah berkembang menjadi industri, setiap tim berusaha untuk meningkatkan performa mereka. Salah satu caranya adalah dengan memanfaatkan data statistik yang mereka punya menggunakan Machine Learning. Tujuan dari penelitian ini adalah untuk mendapatkan fitur yang sesuai serta mendapatkan hasil performa model yang dibangun menggunakan regresi polinomial berganda kuadratik. Penelitian ini menggunakan data statistik yang diambil dari situs fbref.com dengan cara web scrapping. Untuk memenuhi keperluan pembuatan model regresi polinomial berganda kuadratik, data diproses dan dilakukan perkalian fitur. Selain itu, penelitian ini menggunakan korelasi Pearson untuk melihat nilai korelasi dari setiap fitur. Performa model yang dibangun diuji dengan menggunakan metode R-square dan mean absolute eror (MAE). Penelitian ini menghasilkan fitur-fitur yang cocok untuk melakukan prediksi terjadinya goal, yaitu fitur banyaknya operan berhasil yang dilakukan oleh pemain ke-5 (passComplete5) dikalikan fitur upaya melakukan serangan yang menghasilkan tendangan mengarah ke gawang yang dilakukan oleh pemain ke-6 (shotCreation6), upaya percobaan melakukan operan yang dilakukan oleh pemain ke-5 (passAttempt5) dikalikan fitur shotCreation6, fitur banyaknya bola yang didapatkan pemain ke-5 (touches5) dikalikan fitur shotCreation6, fitur operan berhasil yang dilakukan oleh pemain ke-5 (passComplete5) dikalikan fitur menit bermain dari pemain ke-9 (menit9) dan fitur pemain ke-5 melakukan dribble bola (carries5) dikalikan fitur shotCreation6. Lalu fitur upaya tackle yang dilakukan oleh pemain ke-1 (tackle1) dikalikan fitur dimana pertandingan dilaksanakan (HomeAway1), fitur upaya pemain ke-2 menahan tendangan dari musuh (blocks2) dikalikan fitur kartu kuning yang didapatkan pemain ke-8 (yellowCard8), fitur upaya pemain ke-2 melakukan pressing (press2) dikalikan fitur upaya pemain ke-9 menahan tendangan dari musuh (blocks9), fitur tackle1 dikalikan fitur HomeAway9, dan fitur tackle1 dikalikan fitur HomeAway8 digunakan untuk memprediksi goal kemasukan yang dialami oleh tim tersebut. Model ini juga dibandingkan dengan model regresi linear sebagai baseline. Hasil evaluasi performa model menunjukan bahwa performa model regresi polinomial berganda kuadratik memiliki akurasi sebesar 0.13 lebih tinggi dibandingkan dengan model regresi linear untuk dataset yang tidak menggunakan fitur goalCreation. Namun, performa model regresi linear 0,09 lebih besar dibandingkan model regresi polinomial berganda kuadratik untuk pemakaian dataset yang menggunakan fitur goalCreation.