Analiza xG i statystyk piłkarskich – infografika

Analiza xG i statystyk

Anatomia przypadku – o nowym rozumieniu logiki futbolu

Futbol, w swojej najbardziej pierwotnej formie, przez ponad stulecie uchodził za dyscyplinę odporną na chłodną, matematyczną wiwisekcję. W przeciwieństwie do baseballu czy koszykówki, gdzie powtarzalność zdarzeń i statyczność pewnych faz gry naturalnie zapraszały statystyków do stołu, piłka nożna pozostawała sportem płynnym, chaotycznym i rządzonym przez kaprysy losu. Przez dekady jedynym niepodważalnym sędzią był wynik, a jedyną miarą jakości – skuteczność, często mylona z czystym przypadkiem. Jednak każdy wnikliwy obserwator tej gry wielokrotnie doświadczył poczucia głębokiej niesprawiedliwości, widząc drużynę dominującą, kreującą koronkowe akcje, która ostatecznie schodziła z murawy pokonana po jednym, desperackim rzucie rożnym rywala. W tradycyjnym ujęciu mówiono wtedy o „pięknie futbolu” lub jego „nieprzewidywalności”. Współczesna analityka rzuca jednak temu podejściu rękawicę, twierdząc, że to, co nazywamy przypadkiem, jest w istocie mierzalnym ryzykiem, a model Expected Goals (xG) to próba skatalogowania tegoż ryzyka.

Zrozumienie rewolucji, jaką przyniosło wprowadzenie wskaźnika goli oczekiwanych, wymaga od nas porzucenia binarnego postrzegania rzeczywistości boiskowej. W klasycznej relacji meczowej strzał oddany z trzydziestu metrów i uderzenie z linii piątego metra do pustej bramki w statystykach figurowały jako to samo zdarzenie: „strzał celny” lub „niecelny”. Jest to jednak rażące uproszczenie, które zaciemnia obraz gry. Fundamentem xG jest przekonanie, że każdy kontakt z piłką zmierzający ku bramce posiada swoją wewnętrzną, probabilistyczną wartość. Jeśli przypiszemy uderzeniu wartość 0.15 xG, nie mówimy jedynie o prawdopodobieństwie zdobycia bramki w danej sekundzie. Mówimy o sumie historycznych doświadczeń tysięcy piłkarzy, którzy znaleźli się w niemal identycznych okolicznościach: przy takim samym kącie względem słupków, z analogiczną liczbą obrońców na linii strzału i przy podobnej prędkości nadlatującej piłki.

W tym miejscu dochodzimy do kluczowego pojęcia, jakim jest „jakość egzekucji” kontra „jakość procesu”. Model xG pozwala nam oddzielić te dwie sfery. Drużyna, która kończy sezon z wynikiem punktowym znacznie przewyższającym jej wskaźnik goli oczekiwanych, często jest gloryfikowana jako „zespół z charakterem”. Analityk jednak widzi w tym sygnał alarmowy – to statystyczne balansowanie na krawędzi, które zazwyczaj kończy się bolesnym powrotem do średniej. Liczby uczą nas pokory wobec szczęścia. Pokazują, że fenomenalne bramki z woleja poza polem karnym są raczej błędem w systemie niż strategią, na której można budować trwały sukces. Prawdziwa wielkość nowoczesnych zespołów, takich jak te prowadzone przez Pepa Guardiolę czy Jürgena Kloppa, nie polega na liczeniu na błysk geniuszu jednostki, lecz na powtarzalnym i metodycznym dostarczaniu piłki w strefy, gdzie xG jest najwyższe.

Wprowadzenie tych danych do krwiobiegu futbolu zmieniło coś jeszcze – samą naturę debaty publicznej. Przestaliśmy rozmawiać o tym, kto „chciał bardziej”, a zaczęliśmy analizować, kto potrafił efektywniej zarządzać przestrzenią. Analityka nie odarła futbolu z romantyzmu, jak sugerują niektórzy krytycy. Wręcz przeciwnie, pozwoliła nam jeszcze bardziej docenić tych, którzy potrafią systematycznie oszukiwać matematykę. Kiedy widzimy napastnika, który sezon po sezonie strzela więcej goli, niż wynikałoby to z jakości otrzymywanych podań, nie patrzymy już tylko na szczęściarza. Patrzymy na kogoś, kogo technika wykończenia jest tak doskonała, że standardowe modele statystyczne nie są w stanie w pełni oddać jego kunsztu. To właśnie w tej szczelinie między matematycznym modelem a ludzkim geniuszem kryje się dzisiaj największa tajemnica współczesnej piłki nożnej.

Geometria szansy – parametryzacja boiskowego chaosu

Jeśli Rozdział I nauczył nas, że futbol można zamknąć w ramach prawdopodobieństwa, to Rozdział II musi odpowiedzieć na pytanie: jak to się dzieje w praktyce? Algorytmy liczące xG nie są bowiem jedynie suchymi bazami danych; to skomplikowane systemy wagowe, które muszą ocenić dynamikę zdarzenia w ułamku sekundy. Kluczowym parametrem, od którego wszystko się zaczyna, jest oczywiście dystans od bramki, jednak współczesna analityka dawno już przestała traktować go jako jedyną zmienną. Odległość to tylko punkt wyjścia, który bez kontekstu geometrii kątów bywa mylący. Strzał z dwunastu metrów oddany z ostrego kąta może mieć znacznie niższą wartość niż uderzenie z osiemnastu metrów, ale wykonane idealnie na wprost bramki, gdzie światło celu jest największe.

W tym miejscu do gry wchodzi czynnik, który analitycy nazywają „proksymiką obronną”. Algorytm musi wiedzieć, co znajduje się między piłką a siatką. Wczesne modele xG były pod tym względem ułomne – nie potrafiły odróżnić strzału na pustą bramkę od uderzenia, gdy na linii stało trzech defensorów. Dzisiaj, dzięki technologii śledzenia zawodników (tracking data), wiemy dokładnie, w jakiej odległości od strzelającego znajduje się najbliższy obrońca oraz czy bramkarz jest odpowiednio ustawiony. To właśnie dlatego „setki”, których piłkarze nie wykorzystują, mają tak wysoką wartość xG – model rozpoznaje, że przy danej konfiguracji ciał na boisku, statystyczny napastnik nie miał prawa spudłować.

Jednak prawdziwy przełom w rozumieniu budowania akcji nastąpił wraz z wprowadzeniem pojęcia asyst oczekiwanych (xA – Expected Assists). O ile xG ocenia egzekutora, o tyle xA jest hołdem dla kreatora. Jest to wskaźnik, który mierzy prawdopodobieństwo, że dane podanie stanie się asystą, niezależnie od tego, co z piłką zrobi kolega z drużyny. To radykalne podejście, które wyzwoliło rozgrywających z „niewoli” skuteczności swoich napastników. Przez lata ocenialiśmy pomocników przez pryzmat liczb w kolumnie asyst. Dzisiaj wiemy, że to niesprawiedliwe. Pomocnik, który posyła genialne, prostopadłe podanie, wykładając piłkę „jak na patelni”, wykonuje swoją pracę perfekcyjnie, nawet jeśli napastnik fatalnie pudłuje. xA zapisuje tę zasługę na konto podającego, uznając, że stworzył on sytuację o wysokim prawdopodobieństwie sukcesu.

Dzięki xA i pokrewnym modelom, takim jak Expected Threat (xT), zaczęliśmy rozumieć wartość zawodników, którzy dotychczas byli „niewidzialni” dla statystyk. Chodzi o graczy wykonujących tzw. przedostatnie podanie lub tych, którzy swoimi rajdami w głąb pola karnego sieją największy popłoch, nawet jeśli rzadko sami wpisują się na listę strzelców. Analityka pozwoliła nam dostrzec, że futbol to nie tylko gole i asysty, ale ciągły proces zwiększania prawdopodobieństwa. Każde podanie, które przesuwa piłkę z bezpiecznej strefy obrony w „gorącą” strefę przedpolem karnym, ma swoją mierzalną wartość. To tak zwana progresja piłki – cicha bohaterka każdego sukcesu, która w oczach algorytmu jest równie istotna, co finalne uderzenie.

Zrozumienie tej geometrycznej zależności między pozycją, presją rywala a jakością podania pozwala nam spojrzeć na tabele ligowe z zupełnie innej perspektywy. Przestajemy pytać: „Kto strzelił najwięcej goli?”, a zaczynamy pytać: „Kto najskuteczniej zarządza ryzykiem i przestrzenią?”. To właśnie w tej przestrzeni, między centymetrami a sekundami, wykuwa się nowoczesna przewaga, która sprawia, że futbol – choć wciąż piękny i pełen pasji – staje się dyscypliną coraz bardziej przewidywalną dla tych, którzy potrafią czytać między wierszami liczb.

Paradoks wybitności – gdy talent staje się anomalią

W idealnym świecie statystyka dąży do równowagi. Prawo wielkich liczb sugeruje, że po odpowiednio długim czasie każdy zawodnik powinien „wrócić do średniej” – czyli liczba jego bramek powinna zrównać się z wartością oczekiwaną wyliczoną przez model xG. Jednak futbol na najwyższym poziomie karmi się jednostkami, które tę regułę brutalnie podważają. To właśnie tutaj rodzi się „Paradoks Wybitności”. Kiedy analizujemy kariery takich graczy jak Lionel Messi, Erling Haaland czy Robert Lewandowski, zauważamy fascynujące zjawisko: oni nie tylko osiągają wysokie wskaźniki xG, oni je regularnie „przebijają”. Rok po roku strzelają więcej, niż wynikałoby to z chłodnej kalkulacji prawdopodobieństwa. Czy to oznacza, że model jest błędny? Wręcz przeciwnie – to właśnie ta różnica jest najdokładniejszą miarą piłkarskiej wielkości.

Musimy zrozumieć, że standardowy model xG bazuje na „przeciętnym” wykonawcy. Kiedy algorytm wylicza, że dany strzał ma wartość 0.30 xG, mówi nam, że średniej klasy ligowy napastnik zamieni taką okazję na gola w 30% przypadków. Ale wybitny snajper nie jest przeciętny. Jego technika uderzenia, umiejętność nadania piłce rotacji czy precyzja w kierowaniu jej tuż przy słupku sprawiają, że dla niego ta sama sytuacja może być warta realnie 0.50 xG. Różnica między tym, co „oczekiwane” (xG), a tym, co faktycznie „zdobyte” (Gole), to w analityce tzw. finishing skill – czysta umiejętność wykańczania akcji. To matematyczny dowód na to, że w futbolu wciąż istnieje miejsce na magię, której nie da się w pełni zamknąć w algorytmie, choć można ją za jego pomocą precyzyjnie wyodrębnić.

Zjawisko to prowadzi nas do kolejnego, głębszego poziomu analizy: wskaźnika PSxG (Post-Shot Expected Goals). O ile klasyczne xG ocenia sytuację w momencie oddawania strzału (bazując na ustawieniu gracza i piłki), o tyle PSxG ocenia już sam lot piłki i jej celność. Jest to wskaźnik niezwykle brutalny dla bramkarzy. Jeśli napastnik uderza z trudnej pozycji (niskie xG), ale trafia idealnie w „okienko”, wartość PSxG gwałtownie rośnie. W tym momencie statystyka przestaje oceniać to, jak napastnik doszedł do sytuacji, a zaczyna oceniać, jak trudny do obrony był dany strzał. Bramkarz, który regularnie broni strzały o wysokim wskaźniku PSxG, jest dla swojej drużyny wart tyle samo, co napastnik seryjnie zdobywający bramki. To dzięki tym liczbom dowiedzieliśmy się, że niektórzy golkiperzy, choć widowiskowi, w rzeczywistości puszczają strzały, które „powinni” obronić, podczas gdy inni – często mniej medialni – są statystycznymi gigantami w powstrzymywaniu uderzeń niemal niemożliwych do zatrzymania.

Istnieje jednak również druga strona tego medalu. „Oszukiwanie” modelu może działać w obie strony. Drużyny lub zawodnicy, którzy drastycznie podkręcają swoje statystyki przez kilka meczów, często padają ofiarą tzw. regresji do średniej. To moment, w którym szczęście się wyczerpuje, a każda piłka, która wcześniej po rykoszecie wpadała do siatki, teraz obija słupek. Dla analityka i świadomego obserwatora, regresja do średniej jest najbardziej bolesnym, a zarazem najbardziej przewidywalnym elementem sezonu. Pozwala ona odróżnić chwilową formę od systemowej jakości. Zespół, który wygrywa mecze, oddając mało strzałów o niskiej jakości, jest jak hazardzista na zwycięskiej fali – prędzej czy później matematyka upomni się o swoje.

W ostatecznym rozrachunku analiza xG i jej pochodnych nie służy do tego, by zastąpić naszą radość z gry suchymi wykresami. Służy do tego, byśmy potrafili docenić to, co w futbolu najtrudniejsze: powtarzalność. Wybitność w sporcie to nie jest jednorazowy akt odwagi czy szczęścia. To zdolność do ciągłego stawiania się w sytuacjach, które matematyka uznaje za korzystne, i regularne udowadnianie, że talent jest jedyną siłą zdolną nagiąć prawa statystyki. To właśnie na tym styku – między tym, co przewidywalne, a tym, co nadzwyczajne – bije serce współczesnej analizy piłkarskiej.

Rozdział IV: Śmierć kanonierów – jak analityka zawęziła pole bitwy

Jednym z najbardziej namacalnych dowodów na dominację analityki w nowoczesnym futbolu jest niemal całkowity zanik strzałów z dystansu. Jeszcze dwie dekady temu stadionowe owacje wzbudzali „bombardierzy”, którzy bez wahania uderzali z trzydziestu metrów. Dziś, gdy zawodnik decyduje się na taki krok, często słyszy pełne dezaprobaty westchnienie analityków siedzących na trybunie prasowej. Powód jest prozaiczny i brutalny zarazem: matematyka dowiodła, że jest to działanie skrajnie nieefektywne. Średni współczynnik xG dla uderzenia zza pola karnego oscyluje w granicach 0.03. Oznacza to, że statystycznie potrzeba ponad trzydziestu takich prób, by zdobyć jedną bramkę. W świecie, w którym każda posiadana piłka jest zasobem deficytowym, marnowanie jej na tak niskie prawdopodobieństwo sukcesu uznawane jest za taktyczne marnotrawstwo.

Ewolucja strzału doprowadziła do powstania koncepcji „strefy zagrożenia” (Danger Zone) – obszaru wewnątrz pola karnego, o szerokości zbliżonej do światła bramki, z którego pada blisko 80% wszystkich goli w topowych ligach. Współczesne drużyny są projektowane tak, aby za wszelką cenę „wtłoczyć” piłkę właśnie tam. Zamiast widowiskowego, ale ryzykownego strzału z dystansu, trenerzy wolą serię krótkich podań, których celem jest wykreowanie sytuacji o wartości 0.40 xG. To zmiana myślenia z „uderz i miej nadzieję” na „rozegraj i miej pewność”. Pola karne przestały być miejscem chaosu, a stały się szachownicami, na których napastnicy szukają wolnych centymetrów nie po to, by tylko uderzyć, ale by uderzyć z pozycji, która daje matematyczną przewagę.

Ta optymalizacja wpłynęła również na profil bocznych obrońców i skrzydłowych. Tradycyjne dośrodkowania z głębi pola, niegdyś fundament brytyjskiego stylu gry, dziś są w odwrocie. Analityka wykazała, że ich skuteczność jest niska, ponieważ dają obrońcom czas na ustawienie się i interwencję. Zostały one zastąpione przez tzw. cut-backs – niskie, wsteczne podania spod linii końcowej w okolice jedenastego metra. Dlaczego? Ponieważ podanie wsteczne zmusza linię obrony do gwałtownego zwrotu, a napastnikowi pozwala uderzać piłkę „pod prąd” ruchu bramkarza, co drastycznie zwiększa wartość xG całej akcji.

Zjawisko to doprowadziło do pewnego paradoksu estetycznego. Futbol stał się bardziej „wycyzelowany”, a drużyny rzadziej podejmują ryzyko, które statystyka uznaje za nieopłacalne. Niektórzy twierdzą, że przez to gra straciła na swojej dzikości i nieprzewidywalności. Jednak z perspektywy profesjonalizmu, jesteśmy świadkami najwyższej w historii formy dyscypliny taktycznej. Każdy ruch na boisku jest dziś podszyty kalkulacją: czy to działanie przybliża nas do bramki, czy jedynie oddala nas od porażki?

Zrozumienie ewolucji stref strzału pozwala kibicowi dostrzec nową warstwę emocji. Kiedy widzimy drużynę, która przez trzy minuty wymienia podania wokół pola karnego, nie patrząc na bramkę, nie patrzymy na nudę. Patrzymy na drapieżnika, który cierpliwie czeka, aż ofiara popełni błąd i odsłoni ten jeden, konkretny metr kwadratowy murawy, z którego statystycznie nie da się chybić. To nowa, zimna inteligencja futbolu, która na naszych oczach zmienia tę grę na zawsze.

Horyzont zdarzeń – tam, gdzie milkną algorytmy

Docierając do kresu naszej analitycznej podróży, musimy postawić pytanie o granice poznania. Skoro dysponujemy modelami xG, xA, trackingiem zawodników i sztuczną inteligencją przewidującą trajektorie lotu piłki z dokładnością do milimetra, to czy futbol stał się grą rozwiązaną? Czy jesteśmy w stanie, niczym w szachach, przewidzieć wynik końcowy na podstawie samej konfiguracji startowej jedenastek? Odpowiedź, ku uludze romantyków i udręce matematyków, brzmi: nie. Istnieje bowiem sfera, którą analitycy nazywają „szumem”, a którą kibice od zawsze określają mianem duszy sportu. Są to czynniki, których obecne modele statystyczne nie potrafią, a być może nigdy nie będą potrafiły w pełni skwantyfikować.

Pierwszą z tych barier jest psychika i jej wpływ na fizjologię w warunkach ekstremalnego stresu. Model xG powie nam, że rzut karny to sytuacja o wartości 0.76. Nie powie nam jednak nic o ciężarze gatunkowym tego uderzenia w dziewięćdziesiątej minucie finału Ligi Mistrzów, gdy nogi piłkarza stają się ciężkie od kwasu mlekowego, a tętno przekracza granice wydolności. Statystyka operuje na próbach masowych, ale konkretny mecz to zawsze jednostkowy dramat. Nie istnieje jeszcze algorytm, który zmierzyłby „charyzmę” kapitana podnoszącego zespół z kolan po stracie dwóch bramek, ani taki, który przewidziałby „pęknięcie” mentalne faworyta pod presją rozwrzeszczanego tłumu na stadionie rywala.

Kolejną granicą jest chaos wynikający z interakcji międzyludzkich. Futbol to system złożony, w którym dwudziestu dwóch aktorów podejmuje tysiące decyzji w ułamkach sekund. O ile potrafimy zmierzyć jakość podania, o tyle trudniej jest zmierzyć intencję i dezinformację. Zwód ciałem, który nie kończy się kontaktem z piłką, ale „wyłącza” obrońcę z akcji, jest w czystym zapisie danych zdarzeniem nieistniejącym. Podobnie jak wpływ zmęczenia na kognitywną ocenę sytuacji – moment, w którym genialny taktyk przestaje widzieć wolne przestrzenie, bo jego mózg domaga się jedynie tlenu. To są białe plamy na mapie nowoczesnej analityki.

Mimo tych ograniczeń, analiza statystyczna nie jest wrogiem pasji, lecz jej nowym językiem. Pozwala nam ona zrozumieć, że futbol to nieustanna walka porządku z chaosem. Liczby dają nam strukturę, pozwalają klubom mądrzej wydawać miliony euro i chronią trenerów przed pochopnymi ocenami opartymi na emocjach. Jednak to właśnie ten margines błędu, ta statystyczna anomalia, która sprawia, że piłka odbija się od wewnętrznej strony słupka i zamiast wpaść do siatki, wraca w pole, stanowi o wielkości tego sportu. Gdyby wszystko było policzalne, przestalibyśmy oglądać mecze, a zaczęli analizować same arkusze kalkulacyjne.

Podsumowując erę danych w „Dzienniku Piłkarskim”, musimy pamiętać, że xG i inne wskaźniki to jedynie narzędzia, a nie wyrocznie. Uczą nas one patrzeć na mecz głębiej, doceniać proces nad wynikiem i rozumieć geometrię boiska. Ale ostatecznie, gdy wybrzmiewa pierwszy gwizdek, wszystkie modele zostają za linią boczną. Na murawie zostaje tylko człowiek, piłka i nieskończona liczba możliwości, których żadna maszyna nigdy nie zdoła do końca ujarzmić. I to jest być może najpiękniejsza statystyka, jaką futbol ma nam do zaoferowania.

Autor

  • Portret założyciela i współwłaściciela DziennikPiłkarski.pl. Tomasz Sawczak w czarnej czapce i białej koszulce siedzi z telefonem w dłoniach, za jego głową duże logo Dziennika Piłkarskiego.

    Założyciel i współwłaściciel DziennikPiłkarski.pl. Łączy analityczne podejście z pasją do sportu. IT Project Manager, ekspert branży HVAC, mówi w pięciu językach. Mieszka w Stavanger (Norwegia). Fan Leo Messiego, kibic Liverpoolu, Viking FK i Legii Warszawa. Inwestor na rynku akcji i kryptowalut, związany z obszarem nowych technologii. Szczęśliwy ojciec i mąż.

Czytaj więcej