Gödöllői Röplabda Club

A futball statisztikák forradalma: Big Data és fejlett mutatók Európában

2026.06.22

Az elemzés professzionalizálódásának köszönhetően már-már tudományos igényűek a futball leírását célzó vizsgálatok. Ha nem is tudományos szinten, de szeretnénk rávilágítani a labdarúgás hátországában folyó óriási változásokra. Egyrészt nem mehetünk el szó nélkül a különböző mutatókból, statisztikákból nyert Big Data mellett, amelynek már a kevésbé tehetős klubok működésében is láthatjuk hatását.

A Big Data térhódítása a labdarúgásban

Biztos sokan ismerik a Moneyball-sztorit. Billy Beane, az Oakland Athletics baseballcsapatának igazgatója a kétezres évek elején úgy döntött, hogy ügynökök helyett egy matematikus segítségével, analitikai és mérési módszerekkel alakítja ki új keretét a következő szezonra - főleg addig alulértékelt és nem utolsó sorban olcsó játékosokból. Holott ekkor még szó sem volt igazán nagy mennyiségű adatról; inkább azok újszerű felhasználása állt a középpontban. Azóta viszont olyan mértékben fejlődött a számítástechnika, hogy a profi futballban dolgozó szakemberek mára elképesztő mennyiségű adatot képesek az őket alkalmazó klubok rendelkezésére bocsátani. Ez a Big Data világa.

A kifejezés leegyszerűsítve nagyon nagy mennyiségű, gyorsan változó és nagyon változatos adathalmazt, pontosabban annak feldolgozását jelenti. Kinek jó ez? A sportklubok, a játékosok, a média, de még a szurkolók egy része is világszerte áhítja az elképesztő iramban fejlődő új statisztikai módszerek által kinyerhető információkat. A véleményvezérek imádják, ha a álláspontjukat ilyen módon is képesek alátámasztani. A lehetőségeknek csak a képzelet szab határt.

Mindezek ugyan inkább jópofa dolgok, de a játék fejlődésének szempontjából is kiemelten fontos, hogy a csapatok a rendelkezésre álló információt milyen területen tudják hasznosítani.

A Big Data fogalma és alkalmazása a futballban

Adatvezérelt folyamatok a klubok mindennapjaiban

Manapság mindent, ami a pályán (és olykor azon kívül) történik, különböző szenzorokkal és érzékelőkkel rögzítenek, majd elmentik egy nagy közös adatmedencébe. Csak néhány példa: játékosok teljesítőképességének javítása, sérülések lehetőségének csökkentése, taktikai felkészülés, egészségügyi monitorozás (ide tartozik a táplálkozási és életviteli szokások ellenőrzése is) vagy éppen a játékosmegfigyelői előszűrés.

Játékosmegfigyelés és adatelemzés

A világ minden bajnokságában vannak alulértékelt játékosok, felkutatásukért pedig minden korábbinál kiélezettebb a verseny. Az adatelemzésen alapuló játékosmegfigyelés úttörőinek a dán FC Midtjylland és az angol másodosztályban szereplő Brentford FC tulajdonosai számítanak. Matthew Benham és Rasmus Ankersen forradalmasították a játékosmegfigyelői részlegüket. Mellettük az Egyesült Államokban szereplő legtöbb klub, így a New England Revolution, a Sporting Kansas City vagy a Toronto FC is rendkívül progresszív ezen a területen. Ez szinte természetes is, hiszen a tengerentúli profi ligákban a statisztikai alapú elemzésnek nagyon komoly hagyománya van.

A GSN-index: Összetett játékosértékelés

Dustin Böttger, a Global Soccer Network nevű cég ügyvezető igazgatója elmondása szerint a világ legösszetettebb játékosértékelő-rendszerét szeretné létrehozni. Az ún. GSN-indexet egy rendkívül összetett indikátor, amelyet bonyolult adatfeldolgozási és rendszerezési módszerek alapján számolnak ki. Az index alapján könnyen összehasonlíthatóak a különböző országok és bajnokságok játékosai. Az index nagy előnye, hogy segítéségével a klubvezetők és ügynökök olyan ismeretlen, vagy épp alulértékelt labdarúgókra is rálelhetnek, akik adott pillanatban még nem a piac sztárjai, de a jövőben nagy karrier futhatnak be.

A GSN-index négy fő pillérre épül:

Pillér Leírás
1. Futball-karakterisztika (Soccer Related Characteristics) Ez a játékosok különböző tulajdonságainak és adottságainak (több mint 70 különféle mutató tartozik ide) értékelését és pontozását jelenti. Technikai, taktikai, mentális és fizikális jellegzetességeket különböztetnek meg, amelyek mindegyikét 0-tól 100-ig terjedő skálán értékelik.
2. Fejlődési potenciál Játékosvásárlásnál az egyik legfontosabb kérdés: vajon mennyit tud fejlődni a kiszemelt a jövőben?
3. A +/- statisztika Ebben a pillérben számítják a játékosok meccsen nyújtott teljesítményét. Plusz pont jár a pozitív akcióért (gól, gólpassz, tizenegyes kivédése, pontos beadások, jó passzok) és levonás a negatív (öngól, piros lap, pontatlan passzok) megmozdulásokért, így alakul ki az az összteljesítmény, amelynél szintén figyelembe veszik a játékos posztját. A négy pillér közül ez a legfontosabb.
4. A játék szintje Nem mindegy, hogy valaki a Bajnokok Ligája döntőjében teljesít jól vagy a svéd másodosztály első fordulójában. Ezért minden meccset 1-20-ig terjedő skálán helyeznek el.

Ebből a négy pillérből áll össze a GSN-index.

GSN-index struktúrája és működése

Esettanulmány: A Benfica adatgyűjtési és -feldolgozási módszerei

A három legnagyobb portugál klubnak, az FC Portónak, a Sportingnak és a Benficának nagyjából hasonló méretű stadionja, jegyeladási mutatói és közvetítési jogokból származó forrásai vannak. Utóbbi mégis majdnem kétszer annyi bevétellel (150 millió euró, szemben a Porto 76 és a Sporting 69 milliójával) rendelkezik, mint riválisai. A különbséget a piros-fehérek csúcsra járatott, progresszív edzésmódszerei, illetve jól időzített játékoseladásai jelentik. Nuno Gomes neve sokaknak lehet ismerős. A 79-szeres portugál válogatott csatár jelenleg a Caixa Futebol Campuson (a Benfica akadémiája) dolgozik. „A mi filozófiánk a folyamatos fejlesztés. Portugáliában mindig mi szeretnénk lenni az elsők, akik a legújabb technológiákat használják. Mielőtt azonban bármilyen elemzés kezdődne, a Benficának rengeteg adatot kell gyűjtenie - főleg a legkülönfélébb szenzorok segítségével, de az is előfordul (például pszichológiai területen vagy étkezési szokások elemzésénél), hogy manuális adatbevitellel dolgoznak.

Szemléltetésül íme néhány cég, amellyel a portugál klub együttműködik az adatok gyűjtésében és feldolgozásában: Datatrax, Prozone, Philips Actiware, StatSports, OptoGait, Biodex, Microsoft Azure - és a lista hosszan folytatható. Természetesen a fentieken kívül is van még sok cég, amelyek valamilyen módon kapcsolódnak a labdarúgásban képződő Big Data feldolgozásához. A Ferencváros például az ausztrál Catapult Sportsszal dolgozik együtt, akik szatellites navigációs rendszerekkel (GNSS) mérik és követik a játékosok mozgását és fizikai állapotát.

Visszatérve a Benfica módszereihez: az adatokhoz való hozzáférés korlátozott. Részletes információkhoz csak egy nagyon szűk csoport férhet hozzá a profi elemzői csapatból. Sokatmondó, hogy a klub jelenleg már nem az adatmennyiség növelésén, hanem a pontosság, a felbontás és a megbízhatóság javításán dolgozik. Az orvosi labor részéről a végső cél például egy olyan eszköz kifejlesztése, amelynek segítségével pontosan megállapítható, hogy a játékosok meddig feszíthetik a húrt anélkül, hogy megsérülnének. Ezen felül hasznos lenne előre jelezni, hogy milyen típusú sérülés várható egy adott játékosnál, vagy éppen mennyi időre van szükség a felépüléséhez. A statisztika képes kiszűrni azokat a játékosokat, akiket érdemes megnézniük a játékosmegfigyelőknek. Kizárólag adatok alapján azonban felelőtlenség leszerződtetni valakit.

Adatgyűjtés a Benfica akadémiáján

Adatvezérelt játékoskeresés: Egy gyakorlati példa

Hogy valamilyen elképzelésünk legyen arról, hogyan működik ez a gyakorlatban, lássunk egy példát arra, milyen adatok alapján kereshetnek konkrét posztra játékosokat. Conor Murhpy a WhoScored statisztikai adatait használva egy N’Golo Kantéhoz hasonló védekező középpályást keresett képzelt csapata számára. Első feltétele az volt, hogy a kiszemelt középpályás legalább 1000 percet játszott a megelőző szezonban, ezzel biztosítva önmagának a rendelkezésre álló minta reprezentativitását. A következő szűrés a 90 perc alatt legalább három sikeres szerelést végrehajtott játékosokat célozta. Ezek alapján egy 70 főből álló listát kapott. A következő lépésben jöhetett a szabálytalanságok (1.8/mérkőzés) és a befejezett passzok aránya (minimum 78%). Végül „kiselejtezte” a 24 évnél öregebb labdarúgókat. Az így kapott listáról kizárta azokat, akik egész biztosan nem mozdíthatóak jelenlegi klubjuktól. A szűrések után feltűnt egy kevésbé ismert név: Valentin Rongier, a Nantes 22 éves rombolója, aki a Transfermarkt szerint jelenleg 2,55 millió eurót ér. S ha már a keret megerősítésénél járunk! Chris Anderson, a Számháború (The Numbers Game) című futballstatisztikával foglalkozó könyv szerzője szerint a Moneyball-sztoriból nagyon fontos konklúzió, hogy egy csapat megerősítését nem felülről lefelé kell végezni, hanem pont fordítva: alulról felfelé. A leggyengébb láncszemek kicserélésével vagy folyamatos javításával. „Hogyan lehet a csapatod átlagos teljesítményén javítani?

A Big Data tehát elérte a futballt. A feldolgozásával foglalkozó cégek szinte osztódással szaporodnak. A legnagyobb kihívás Európában mégis a klubvezetők mentalitásának megváltoztatása, hiszen sokan közülük rendkívül konzervatívak a témával kapcsolatban. Attól tartanak, a digitalizáció munkahelyek megszűnését eredményezi majd - ez azonban teljesen rossz megközelítés. A digitális eszközök nem helyettesíthetik a klubvezetőt, az edzőt, a csapatorvost vagy a játékosmegfigyelőt. Ellenkezőleg, segítik, hogy munkájukat sokkal hatékonyabban tudják végezni.

Játékosmegfigyelés és adatmodellezés

Fejlett statisztikai mutatók: xG, xGChain és Passmap

Expected Goals (xG)

Jó ideje foglalkoztatja a kérdés a futballszakmát: hogyan lehet eldönteni, hogy egy passz vagy egy beadás valóban elhibázott, azaz rossz-e. Vajon a csapat, amely sokszor lőtt kapura, valóban dominált a mérkőzésen? A megszokott, labdarúgáshoz kapcsolódó statisztikák mennyire írják le a mérkőzés képét, esetleg vannak olyan mutatók, amelyek közelebbi képet tudnak adni egy-egy összecsapásról? No, de mi lett az eredmény? Az Expected Goal Ratio (röviden: xG) egy olyan mutató, amely a helyzetek száma helyett azok minőségére helyezi a hangsúlyt, és megpróbálja rangsorolni egymáshoz képest a próbálkozásokat. A módszer azonban csalóka lehet, azaz a helyes értelmezéshez érdemes az adott szituációkat is látni. Fontos kiemelni, hogy ezek a statisztikák leginkább mankót jelentenek, nem helyettesítik a mérkőzés megtekintését.

Sokszor hallani, hogy az edzők jobban örülnek a kapu torkából bebelsőzött góloknak, mint az elsülő kapanyeleknek. Mi lehet ennek az oka? Röviden arról van szó, hogy a modellben nem minden lövés egyenértékű; a nagyobb lehetőségek magasabb értéket kapnak, míg azok, amelyek kevésbé kecsegtetnek a gólszerzés valós lehetőségével, kisebbet. Az xG-mutató valójában arra ad választ, hogy egy topbajnokság átlagos csapatának átlagos játékosa az adott helyzetekből mennyi gólt ért volna el a meccsen. Az elsőre talán kissé ijesztően bonyolult definíciót a legegyszerűbb tizenegyesekkel szemléltetni. Az xG-modellek elsősorban a lövés helyét veszik figyelembe, ez a büntetőknél pontosan adott. Miután elhelyeztek minden lövést, egyszerűen azokat, amelyekből gól született, elosztják az összes adatbázisban már szereplő lövéssel, amelyet az adott pontról adtak le a kapura korábban. Példánkban a berúgott tizenegyesek/összes tizenegyes. Tulajdonképpen ilyen egyszerű az egész.

Mindenképp érdemes tisztázni, hogy nem beszélhetünk „a modellről”: többféle xG-számítás létezik a szakmán belül. A mutató gyakorlati megjelenítése egyszerű: a mérkőzésen leadott minden egyes lövéshez rendelnek egy számot 0 és 1 között, majd ezeket a számokat csapatonként összeadják. Van tehát egy modellünk, ami rendkívül sokrétűen használható, letisztult képet ad a meccsről, továbbá azt állítja magáról, hogy tudományos igénnyel készült, és az egyszerű szurkoló számára is könnyen megérthető, sőt, hozzáférhető.

Expected Goals (xG) grafikus ábrázolása

A mutatóval szemben már többen felemelték a szavukat, többek között Michael Bertin, ismert futballstatisztikus is. Tény, hogy a mutatót idővel muszáj lesz fejleszteni. A modellben általánosságban nem szerepel a védők pozíciója, ez azonban mindenképpen fontos információ, ha számszerűsíteni akarjuk, hogy milyen minőségű a helyzet. Nem veszi számításba az xG azt sem, ki áll éppen a labda mögött, mivel azzal számol, átlagosan hány gól lesz a lövésből, és ebben benne vannak a legrosszabb és a legjobb lövők is, így az éppen gólszerzésre törő csatár képességét nem reprezentálja. A harmadik dolog, amit fel szokás róni az xG-mutatóval szemben az, hogy gyakran téved a kivételesen jó csapatok esetében. Amióta az xG megvetette a lábát a futballal kapcsolatos diskurzusban, szerepe napról napra nő. A játékosok értékelésében is egyre nagyobb szerepe van az xG-modelleknek, így már nem csupán egy mutatóról beszélünk, hanem a játékosok formáját, erősségeit/gyengeségeit értékelő számról is.

Expected Goals Chain (xGChain)

A következő elgondolás szervesen kapcsolódik az Expected Goal-modellhez, azonban akad benne egy kis csavar. Az eddig általunk ismertetett mutatók vajmi keveset foglalkoztak a build-up-play jelentőségével (eddig nem volt szó arról, hogyan jut el lövésig a csapat; a build-up-play az ezt megelőző passzok, mozgások összessége), pedig legalább olyan fontos lenne ezt mérni, mint magát a végterméket. Természetesen így a támadók lesznek előnyben, hiszen ők szokták befejezni az akciókat, ezért mindig kapnak pontot. Ezt az értéket a későbbiekben rendkívül sokféle módon lehet hasznosítani, többek között a játékosok build-up-playben nyújtott teljesítményének értékelésére, de akár egy-egy csapat kiegyensúlyozottsága is mérhetővé válik. Ezt meg is tette a szerző, a Gini-index segítségével (ezzel mérik a statisztikai eloszlások egyenlőtlenségeit). Az index nulla és egy között bármilyen értéket felvehet. Jelen helyzetben annál kevésbé kiegyensúlyozott egy csapat, minél közelebb van ez a szám az egyhez.

Passmaps (Passztérképek)

A 11tegen11 nevű oldal az xG-elemzésekkel egy időben szokta megosztani olvasóival passztérképeit is. Ezek a “térképek” egyszerű, ám annál látványosabb értelmezést nyújtanak egy-egy meccsel kapcsolatban. Az ún. passmap egy olyan kép, amelyen a bizonyos passzszámot meghaladó kapcsolatokat nyilakkal jelzi a készítő - minél vastagabb ez a nyíl, annál gyakoribb volt a játékkapcsolat a csapattársak között. A játékosok pozícióját az határozza meg átlagosan a pálya melyik részéről indították passzaikat. Négy dologra érdemes odafigyelni ezeknél a térképeknél: minél nagyobb egy játékoshoz tartozó pötty, annál többet passzolt a mérkőzés folyamán. Minél vastagabb két játékost összekötő nyíl, annál többször járt köztük a labda. A pontosság kedvéért érdemes megjegyezni, hogy a passzok iránya is jelölve van a képeken. Az utóbbi időben a három legjobb xGChain értékkel rendelkező játékost is jelöli az oldal arany, ezüst és bronz csillaggal. Itt érdemes rögtön megjegyezni a passmap egyik hibáját: mivel átlagos pozíciókkal dolgozik, így egy félidei helycsere például szélsők esetén -, esetleg egy olyan játékos, aki rendkívül sokat változtatja a helyét a pályán, könnyen félrevezethet minket.

Példa egy futball passztérképre

A sportban egyre hangsúlyosabban megjelenő statisztikák helyes alkalmazásához elengedhetetlen, hogy az adatokat feldolgozó és felhasználó szereplők közötti kommunikáció biztosított legyen. Mint azt korábban említettük, a futballba is beszivárgó „moneyball” koncepció ebből az amerikai sportágból származik, érdemes tehát...

tags: #futball #statisztika #europa

Népszerű bejegyzések:

GRC