Mówca
Opis
W prezentacji przedstawiono system, który stanowi kompletny pipeline predykcji meczów piłki nożnej na podstawie danych pochodzących z czterech najwyższych lig piłkarskich w Anglii - od surowych danych po symulację szczegółowych statystyk spotkania. Punkt wyjścia stanowi integracja wielu źródeł: historii meczów, składów, wartości rynkowych oraz tabel ligowych, przekształcanych w spójny panel meczowy z rozbudowanym zestawem cech przedmeczowych. Na tej bazie zbudowany jest rozszerzony system rankingowy Elo, w którym ratingi drużyn aktualizowane są po każdym meczu z uwzględnieniem przebiegu spotkania i przewagi własnego boiska, tak aby dynamicznie odzwierciedlać realną siłę zespołów. Równolegle estymowana jest forma ofensywna i defensywna, liczona względem ligowego tła z wykorzystaniem xG oraz ważonej historii, z większym naciskiem na ostatnie spotkania. Kolejna warstwa to gwiazdkowy system oceny ataku, obrony i ogólnej jakości drużyn. Całość domyka blok TDPR (Time-Dependent Poisson Regression), czyli modele Poissona i regresje, które generują szczegółowe statystyki meczu. Symulacja ma charakter probabilistyczny: losujemy przebieg całego meczu, więc ten sam zestaw wejść może prowadzić do różnych rezultatów. Projekt prezentuje ogólną ramę, którą można rozwijać o dodatkowe źródła i warianty modeli.