Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Corso di Laurea
in ECONOMIA e AZIENDA DIGITALE
Relazione Finale
Laureando:
Mani Mattia
Matricola n. 727751
Ringrazio anche i miei amici, che nonostante tutto sono stati punto di sfogo du-
rante questo lungo percorso.
Questa tesi è il frutto del lavoro di molti, e ognuno di voi ha contribuito in modo
significativo al mio successo. Grazie di cuore.
INDICE:
INTRODUZIONE: LA SFIDA........................................................................... 4
Cap. 1 – COME TUTTO È INIZIATO.............................................................. 6
1.1 – Billy Beane, un’icona nel mondo del baseball ............................. 6
1.2 – Bill James e la sabermetrica ........................................................... 10
Cap. 2 – UNO SGUARDO AL MONDO DEL CALCIO ............................ 16
2.1 – Brentford & Midtjylland: due facce della stessa medaglia ...... 16
2.2 – Il Milan di Gerry Cardinale ........................................................... 23
2.3 – La sfida ............................................................................................... 28
Cap. 3 – DATASET ............................................................................................ 33
3.1 – Itinerario: dall’idea alla creazione .................................................... 33
3.2 – Metriche ................................................................................................. 37
Cap. 4– IL PROGETTO ..................................................................................... 44
4.1 – R: Analisi e discussione del dataset ................................................. 44
4.2 – Risultati ed analisi grafica .................................................................. 52
4.3 – Il modello predittivo ........................................................................... 65
CONCLUSIONI ................................................................................................. 70
BIBLIOGRAFIA: ................................................................................................ 71
2
3
INTRODUZIONE: LA SFIDA
4
Eventuali alterazioni di prezzo, successivamente alla data sopra citata, non
vengono prese in considerazione da questa ricerca.
Si esploreranno le origini del concetto partendo dal suo primo utilizzo nel
mondo del baseball, si proseguirà analizzando alcuni esempi pionieristici
del concetto Moneyball nel mondo calcistico europeo, per poi approdare
nella vera e propria analisi e ricerca riguardante il campionato italiano. Qui,
infine, si analizzeranno i dati raccolti precedentemente scovando i giocatori
che risultano essere competitivamente vantaggiosi.
5
Cap. 1 – COME TUTTO È INIZIATO
4Connol, «Enemies of Promise (1938), Part 2: The Charlock’s Shade, Ch. 13: The Poppies
(p. 109-110)».
6
they called the talents they were checking for in a kid. There were five tools: the
abilities to run, throw, field, hit, and hit with power “. I recruiters creavano perciò
un “radar chart” in cui ogni giovane promessa veniva valutata secondo le
caratteristiche fondamentali sopra citate. Billy le possedeva tutte e cinque.
Viene selezionato come una delle migliori giovani promesse del baseball di
quegli anni. Era un predestinato il cui futuro era già stato scritto, un ragazzo
il quale avvenire era sicuramente florido… Il destino invece non aveva
programmato il futuro del ragazzo come superstar del diamante. Come
spesso accade, il continuo osannar il talento da parte dei mass media, ha
reso Billy schiavo dello stesso, ponendo sopra di lui un’enorme spada di
Damocle pronta a trafiggerlo ogni qualvolta non fosse riuscito a dimostrare
il suo potenziale. 5
Giocherà inizialmente nei New York Mets per poi passare ad altre squadre
di “MLB” e terminare la carriera da giocatore professionista agli Oakland
Athletics nel 1990. Un giocatore su cui vi erano grandissime aspettative ma
che si è palesato come unicamente mediocre. Il destino non era stato
certamente benevolo con lui, o forse serbava ancora qualcosa?
Nel momento in cui sembrava che il sipario stesse calando su un altro
giocatore qualunque che era stato “divorato dall’hype” dei mass media,
ecco che nella stessa squadra in cui aveva terminato la carriera, gli viene
proposto di diventare a sua volta talent scout. Ruolo abbastanza ironico
considerando l’esperienza avuta in passato proprio con i recruiter, ma,
nonostante ciò, Beane accetta di entrare all’interno della struttura
manageriale della squadra. Corre l’anno 1998, Billy dopo ben otto anni di
servizio viene promosso a “General Manager” degli Oakland Athletics.
La svolta definitiva nella carriera di Beane e di conseguenza ciò che ci ha
portato a leggere di questo pioniere del baseball avviene nell’estate del 2001.
Gli Athletics avevano un budget molto limitato rispetto ad alcune delle
squadre più ricche della “MLB”, una caratteristica oramai distintiva del club
che ogni anno gravava sempre più sulla solidità dello stesso. Questo ha
costretto Billy a cercare modi sempre più innovativi per riuscire a competere
alla pari con squadre che erano dei colossi finanziari. Si trattava di una vera
e propria lotta tra Davide e Golia.
Si era messo in testa che applicare l'analisi statistica avanzata nel baseball
fosse un ottimo modo per cercare di ovviare al problema monetario della
società. Entra qui in gioco Sandy Arrelson, l’allora direttore generale degli
Athletics, che una volta scoperto l’interessamento e il tentativo di approccio
di Billy verso il mondo della statistica, gli ha suggerito di recuperare i, fino
ad allora esigui, lavori di Paul DePodesta, un neolaureato ad Harvard che
7
aveva da poco svolto alcune presentazioni riguardanti l’analisi statistica
avanzata. Questo suggerimento convince sempre più Billy che la statistica
potesse essere in connubio perfetto con il mondo del baseball.
Beane inizia perciò a collaborare con DePodesta. I due entrano subito in
sintonia e cominciano passo a passo a rivoluzionare il modo in cui, fino ad
allora, si interpretava il baseball.
Si affidano unicamente ai dati. Escludono completamente il tradizionale
modo di vedere i “Tools” di un giocatore. Sanno benissimo che, se avessero
voluto fare ciò che prima di loro nessuno aveva mai compiuto, avrebbero
dovuto ottenere informazioni “per vie traverse”. Vogliono “vedere ciò che
gli altri, pur avendolo sotto il naso, non riuscivano a scovare”. Iniziano a
mettere in discussione le valutazioni tradizionali dei giocatori, tenendo in
gran considerazione i lavori statistici di Bill James. 6 Cominciano così a
cercare nuovi modi per estrapolare informazioni dai dati che possedevano,
bypassando statistiche comuni come media battuta e vittorie. Il punto focale
del loro lavoro risiede nell’idea che i giocatori che devono selezionare
vengono comprati non per il mero gusto di dover comprare un giocatore
durante il draft, o per sostituire grossolanamente un battitore, o un
lanciatore venduto nella finestra di mercato precedente, ma per comprare
vittorie. Un giocatore di baseball viene comprato per ottenere vittorie.
Comprare vittorie vuol dire comprare punti. I manager di Oakland si
chiedono quale sia, statisticamente parlando, il metodo migliore per far
punti durante una partita di baseball. Convergono sulla risposta: “base on
ball”.
Cos’è una “base on ball”? Comprende tutte quelle basi che un battitore
ottiene quando il lanciatore effettua quattro lanci in zona non valida di
strike; il battitore evita quindi di mettere in gioco la palla con una battuta e
al tempo stesso di venire eliminato con uno strikeout. 7
Una “base on ball” ha un apporto neutro rispetto alla media battuta del
battitore, ma è valida e migliora la sua percentuale di arrivi in base senza
rischiare colpi inutili. I corridori in base rappresentano opportunità per
segnare punti. È statisticamente vantaggioso puntare su giocatori che hanno
caratteristiche molto buone su questo fondamentale.
Si inizia quindi a virare verso uno stile di gioco meramente propenso alla
vittoria e non curante dei preziosismi legati allo spettacolo dato dal gioco
stesso. Sta nascendo il “Moneyball”.
8
Altro punto cardine fondamentale del lavoro svolto da Billy e Paul risiede
nel fatto che i giocatori selezionati venivano scelti in base, sia alle
caratteristiche tecnico-statistiche, sia in relazione al budget molto esiguo
dato dal club per cui lavoravano. Dovevano scovare talenti a prezzi
stracciati. L’etimologia della parola Moneyball rispecchia benissimo questo
concetto. Il termine è infatti suddivisibile in due parti:
- “Money”: riassume in modo esaustivo i limiti finanziari che il club
stava affrontando in quel momento storico.
- “Ball”: Abbreviazione di baseball che indica il componente tecnico-
statistico che deve essere perseguito.
Come potevano trovare giocatori promettenti e prenderli ad un prezzo
esiguo rispetto al loro potenziale? È vero il fatto che le statistiche avanzate
utilizzate permettevano di avere un vantaggio competitivo sui giocatori, ma
un ragazzo bravo in un determinato “tool” era comunque visibile ad altre
squadre. Cosa mancava per rendere a tutti gli effetti la strategia Moneyball
un metodo vincente?
Beane e DePodesta decisero di prendere in considerazione tutti quei giovani
talenti che per un motivo o per un altro venivano visti male, tralasciati o
persino scartati in partenza dalle altre squadre. Si guardi per esempio a
Scott Hatteberg, virtuoso lanciatore dei Boston Red Sox che nella sua ultima
stagione con i giganti del Massachusetss si era rotto un nervo del gomito e
strappato una capsula articolare. Un giocatore che per molti aveva “appeso
le scarpe al chiodo” si rivelò un punto cardine del sistema di gioco degli
Athletics. Come avrebbe potuto incidere nonostante l’infortunio?
Semplicemente cambiandolo di ruolo: portandolo in prima base e
utilizzandolo per far punti tramite la “base on ball” sopra citata. La coppia
di Oakland aveva infatti scoperto che Hatteberg aveva un’altissima
percentuale in base correlata ai punti segnati durante un game.
Oppure si guardi a David Justice, battitore esterno vincitore del premio
“Most Valuable Player” della Championship series del 2000 con i New York
Yankees, che a causa di un persistente infortunio all’inguine e alla sua età
avanzata aveva visto calare drasticamente la sua produzione (in termini di
battute). Anche per questo giocatore la squadra di Oakland aveva stimato
che, nonostante la vecchiaia, era comunque in grado di raggiungere la base
con un’alta percentuale. Il suo apporto alla squadra ha inoltre portato
esperienza e fiducia all’interno dello spogliatoio, consolidando di fatto i
giocatori “assemblati” durante la sessione di mercato.
Questi sono solo due dei numerosi giocatori comprati da Billy e Paul in quel
primo rivoluzionario anno di utilizzo della formula “Moneyball”.
Un altro fattore che ha inizialmente giovato alla buona riuscita della
strategia è il fatto che questa era completamente sconosciuta ai competitors.
9
Durante il draft, infatti, gli altri dirigenti delle squadre di MLB schernivano
e non si capacitavano delle scelte prese da Billy e Paul, rendendo di fatto il
mercato molto più semplice per i nostri pionieri.
Finita la sessione di mercato mancava solo una cosa da fare: provare a tutti
quanto si fossero sbagliati nel sottovalutare gli Athletics.
Quello stesso anno la squadra di Oaklands vinse 102 sulle 162 partite
stagionali, vedendosi sfuggire per un soffio il primo posto della “American
League West”, vinta invece dai Seattle Mariners che quell’anno fecero
record di vittorie. Si sono qualificati ai playoff come “wild card team”
venendo però eliminati dai New York Yankees.
Questo risultato è stato estremamente importante per capire che il lavoro
svolto fino ad allora stava iniziando a dare i suoi frutti. Nonostante nessuno
credesse in loro, Billy e Paul erano riusciti a risollevare una società che stava
affondando. Sono riusciti a portare la squadra con il secondo minor budget
della MLB ai playoff della World Series. Per fare un paragone più vicino ai
lettori italiani, è come se quest’anno il Cagliari Calcio si qualificasse alla
Champions League dell’anno prossimo…
I successi ottenuti dai due manager risuoneranno a gran voce in tutto il
mondo del baseball portando, negli anni, ogni singola altra squadra di MLB
ad “attrezzarsi” e a sfruttare il sistema Moneyball.
L'eredità di Billy Beane non si ferma però al singolo mondo del baseball. La
sua storia, diventata famosa al grande pubblico anche grazie al bestseller di
Michael Lewis “Moneyball: The Art of Winning an Unfair Game” e alla
trasposizione cinematografica di Bennett Miller, ha ispirato e cambiato
anche il sistema di gioco di numerosi altri sport, tra cui Basket, Football
Americano e Hockey su ghiaccio. Il lavoro svolto da Billy e Paul ha
completamente cambiato, rinnovato e migliorato l’approccio di tutto il
mondo sportivo e per questo motivo sono entrati di diritto nella storia dello
sport.
10
appassionato del diamante che passa le giornate consumando sul campo il
suo guantone di pelle.
11
dei primi a pensare a cosa realmente portasse punti a una squadra andando oltre
alla media battuta. Fu uno dei primi a cercare una risposta alla domanda “cosa devo
fare per vincere una partita in più?””.9 Il lavoro di James inizia ad ottenere i
primi riconoscimenti. Pubblicherà negli anni successivi ulteriori libri in cui
discute in modo innovativo le statistiche avanzate utilizzate nel mondo del
baseball. I suoi scritti ottengono un successo via via sempre maggiore,
rendendo di fatto, Bill James uno dei pochi scrittori che “mangiano”
statistica a raggiungere il pubblico di massa.
Era appena nata la sabermetrica. Il termine è una parola composta da
“SABR”, acronimo di Society for American Baseball Research, e “metrics”, tutte
quelle misure e metriche utilizzate nell'analisi statistica avanzata. La
sabermetrica è una branca dell'analisi statistica avanzata che si concentra
sull'applicazione di metodi statistici e analitici per studiare e valutare le
prestazioni dei giocatori e delle squadre nel baseball.
12
lanciatore ha effettuato quattro lanci consecutivi in zona non valida di
strike. At bat è semplicemente il turno di un battitore che affronta un lancia-
tore.
L'OBP è tutt’ora una delle metriche più utilizzate in MLB perché fornisce
una valutazione diretta della capacità di un battitore di mantenere la pres-
sione sulla difesa avversaria e di contribuire alle opportunità di segnare
punti per la sua squadra.
Sapendo inoltre che la Slugging Average (SLG), metrica indicante la potenza
con cui un giocatore batte la palla, è data da Total Bases (TB), numero di basi
guadagnate da un battitore con i colpi, rispetto ad AB, la formula può anche
essere scritta come :
RC = OBP * SLG * AB
I "Runs Created" risultano essere uno dei primi tentativi che riesce concre-
tamente a identificare il contributo di un giocatore al successo della squa-
dra. Bill è riuscito a creare una metrica talmente innovativa per l’epoca da
renderla una pietra miliare lungo il percorso della sabermetrica.
13
(DER). L’idea dietro questa formula consiste nel cercare di trovare quanto
un giocatore contribuisce difensivamente all’interno della propria squadra.
Indica quanta percentuale vi è che le palle messe in gioco vengano conver-
tite in out dalla difesa di una squadra.
Si calcola facendo:
𝐻𝐻 + 𝑅𝑅𝑅𝑅𝑅𝑅 − 𝐻𝐻𝐻𝐻
𝐷𝐷𝐷𝐷𝐷𝐷 = 1 −
𝑃𝑃𝑃𝑃 − 𝐾𝐾 − 𝐵𝐵𝐵𝐵 − 𝐻𝐻𝐻𝐻𝐻𝐻 − 𝐻𝐻𝐻𝐻
Dove il valore 1 rappresenta la totalità dei battitori affrontati; l’acronimo
ROE, reached on error, indica tutte quelle volte che il battitore raggiunge base
a causa dell’errore di un lanciatore; gli HR, home run, avvengono quando il
battitore colpisce la palla spedendola oltre il perimetro del terreno di gioco;
PA, plate appearance, misura quando un battitore completa un turno di bat-
tuta; K, strike out, si ottiene quando il giocatore in battuta viene eliminato a
seguito del terzo strike ricevuto; infine l’hit by pitch o HBP indica quando
viene automaticamente assegnata la prima base al battitore poiché viene
colpito dalla palla tirata dal lanciatore senza che muova la mazza.
Diamo infine un’occhiata alla formula pitagorica di Bill, nota come Pythago-
rean Expectation. La metrica è volta a stabilire il numero di partite che una
squadra, tenendo conto dei punti segnati e subiti dalla stessa, dovrebbe vin-
cere durante il campionato. Si calcola facendo:
𝑅𝑅 2
W= 2
𝑅𝑅 + 𝑅𝑅𝐴𝐴2
Dove R indica i runs scored, mentre RA i runs allowed. La formula è partico-
larmente utile per creare un quadro generale sull’aspettativa di uno speci-
fico club durante la stagione. Essa permette di vedere più precisamente
quale sarà l’andamento più probabile per la squadra. La formula sopra de-
scritta è abbastanza rudimentale e possiede un leggerissimo deficit di pre-
cisone, nonostante ciò, considerando l’epoca e il fatto che sia stata “creata
da zero”, è particolarmente efficace.
Grazie a queste innovative metriche Billy Beane e Paul DePodesta sono riu-
sciti a creare una solida base su cui sviluppare il proprio lavoro. Le formule
sviluppate da Bill unite ai dati utilizzati dai due manager hanno reso visibili
metriche e risultati che hanno fatto la fortuna della filosofia Moneyball nel
mondo del baseball. Si è perciò voluto analizzare l’innovativo lavoro di Bill
James così da poter approfondire il processo cognitivo sviluppato per ogni
singola formula creata. Durante la lettura di questa tesi si prenderanno
14
come esempio sia il processo di sviluppo con cui Billy e Paul hanno realiz-
zato la filosofia Moneyball, sia le metriche introdotte da Bill, così da poterli
trasporre come solida base su cui creare l’analisi calcistica.
15
Cap. 2 – UNO SGUARDO AL MONDO DEL CALCIO
Durante le iniziali fasi di ricerca per la stesura di questa tesi, sono incappato
in diversi interessanti articoli riguardanti il motivo del perché non si fosse
ancora diffuso in modo esponenziale il concetto Moneyball nel mondo del
calcio. Solo negli ultimi mesi, soprattutto in Italia, si è cominciato a parlare
sempre più della teoria che ha fatto così tanta fortuna sul suolo americano.
Questo è dovuto, in parte, al clamore causato dal licenziamento dei direttori
tecnico e sportivo del Milan.
Il concetto cardine del Moneyball risiede nel fatto che una squadra sportiva,
che possiede un budget limitato, deve sfruttare al massimo dati, analisi ed
informazioni sui propri giocatori per poter creare una squadra stabile e
competitiva con cui affrontare il campionato di appartenenza.
Questa filosofia non prende in considerazione concezioni comuni,
informazioni o idee riguardanti i giocatori che potrebbero in qualche modo
sviare e creare un bias durante il processo decisionale. Ogni singola azione
e decisione viene presa consultando unicamente i dati. Scompare dunque la
componente umana degli atleti e si evidenzia unicamente la potenzialità
agonistica degli stessi. In questo modo si riesce a creare un ambiente in cui
tutti i giocatori riescono a performare e rendere il massimo aumentando di
conseguenza il loro valore di mercato.
16
Questo concetto, basato prettamente su dati, statistiche e numeri, non ha
mai realmente convinto il popolo europeo. Dal momento in cui la “formula
delle meraviglie” è risultata essere efficace ed efficiente in ambito sportivo,
passano circa una decina di anni prima che venga embrionalmente
importata all’interno del mondo calcistico. Non che non vi sia mai stato
interesse da parte dei club o manager sportivi europei nell’utilizzare
statistiche per migliorare il rendimento della propria squadra, ma il
concetto di Moneyball è sempre risultato essere troppo lontano dall’idea
generale dello “sport più bello del mondo”.
Il calcio, sport principale europeo e non solo, è definito da molti come un
gioco in cui prevalgono passione, istinto e cuore rispetto ai freddi numeri
dati dalle statistiche. Ne è da esempio Walter Sabatini, ex dirigente di Roma
e Salernitana, che si è sempre espresso contrario a questo modo di veder lo
sport. Durante la conferenza stampa d’addio da Ds della Roma diceva:<< Il
presidente e i suoi collaboratori, giustamente, puntano su altre prerogative, stanno
cercando un algoritmo vincente, io vivo dentro il mio istinto, non vedo il pallone
come un oggetto sferoidale, per me la palla è qualcosa, vivo il mio calcio, un calcio
che non può essere freddamente riportato alla statistica che descrive un giocatore>>.
Si aggiunge pure che questo sport non è incentrato, come nel baseball,
prettamente sul singolo individuo ma è “un grande motore che per
funzionare al meglio ha bisogno di tutti i suoi componenti e che essi siano
al proprio posto e svolgano bene il loro compito”. È un gioco di squadra.
Per parecchi anni si è generalmente pensato che le metriche utilizzate
oltreoceano sarebbero state troppo basilari e avrebbero inciso in modo
irrisorio in un sistema complesso come il calcio. Le differenze culturali e
strutturali tra i due sport erano insormontabili, almeno fino al 12 giugno del
2012.
17
perennemente tra terza e quarta serie e avevano rischiato molteplici volte il
fallimento. 11
Il Brentford si trovava senza soldi a dover affrontare una campagna acquisti
volta a stabilizzare, migliorare e potenziare la squadra, con l’obiettivo
ultimo di rendere competitivo il club. Tutte le decisioni sotto la guida di
Benham venivano prese in riferimento alle metriche analitico-statistiche
riguardanti prestazioni e partite, in modo tale da sfruttare dati che fino ad
allora pochi riuscivano ad utilizzare al meglio. La filosofia appena descritta,
nonché il “modus operandi” di Matthew ricorda molto il credo del pioniere
del baseball Billy Beane di cui si è scritto nel capitolo precedente.
Nonostante non vi sia mai stato un vero e proprio collegamento diretto, i
due sembrano essere “sintonizzati sulla stessa onda”. Per questo motivo
moltissime persone hanno iniziato a far riferimento al progetto di Matthew
interpellandolo come “moneyball calcistico”.
11 I tifosi del Brentford F:C: vengono chiamati “Bees” a causa dello storico logo
rappresentante un’ape.
12 Fabbro, «Rasmus Ankersen, l’ossessione per i numeri per vincere nel calcio».
18
vedere la realtà stuzzicò a tal punto l’animo dello scrittore che lo portò ad
accettare l’incarico. I due svilupparono sin da subito una chimica vincente.
Il Brentford inizia la sua ascesa. Riesce a salire di lega di anno in anno fino
a che, nell’annata 2020-2021, dopo ben 74 anni dall’ultima volta, i “Bees”
riescono nella storica impresa di tornare in Premier League. Il tutto,
riuscendo a tenere il budget devoluto agli acquisti di nuovi giocatori ai
minimi livelli per ogni categoria in cui partecipavano. Le “api di Londra” si
trovano tutt’ora in Premier League stanziate a circa metà classifica per il
terzo anno di fila. Il metodo Moneyball funziona.
Si faccia un passo indietro, nel 2014 Benham decide di emulare ciò che stava
facendo con il club londinese anche nella terra natia del suo “braccio
destro”. Compra il Football Club Midtjylland, squadra in cui da giovane lo
stesso Ankersen ha militato. Dall’acquisizione, gli “Ulvene”, i “Lupi”, hanno
conquistato per ben tre volte il titolo della Superliga, vinto per la prima
volta nella loro storia la supercoppa danese e centrato la qualificazione alla
Champions League sia nel 2016 che nel 2020.
Questi risultati confermano ulteriormente il valore del lavoro svolto da
Benham e Ankersen, ma cosa precisamente ha fatto sì che il loro modello
fosse così efficace in due differenti ambienti calcistici?
19
individua la probabilità che un tiro effettuato da un calciatore porti al goal,
prendendo in considerazione solamente i tiri effettuati nello specchio della
porta (Figura 1). 13 Componenti fondamentali nel modello di Riley sono la
distanza e l’angolo di tiro. Si suddivide il campo in 46 zone e si dividono i
tiri in tre categorie: su punizione, su rigore e su azione. Ogni zona e
posizione stabilisce un punteggio che indica la probabilità di segnare in
quella specifica area di campo.
Gli Expected Goals sono indicatori fondamentali per valutare la
performance di una squadra e dei suoi giocatori. Stabiliscono, tramite la
differenza tra gol realizzati e gol attesi se essa sia al di sotto o stia andando
oltre le aspettative. Il modello su cui si basa questa metrica cambia a
seconda delle variabili che si vogliono prendere in considerazione.
Quello utilizzato da Benham sfrutta sia gli xG come tali, sia gli Expected
Points (xP), metrica derivata dagli stessi xG. I “Bees” utilizzano gli xG sia a
livello di prestazioni, verificando quindi se c’è una discrepanza tra
l’effettivo contributo dato dal giocatore all’interno e fuori della partita, sia a
livello di scouting. Per fare un esempio, come analizzato da Nicola Santolini
in un articolo per sportallate.it, <<una squadra può vincere una partita 1-0 […]
contro una che spreca molte buone occasioni (alto livello di xG). […] I tre expected
points per il match verranno in gran parte assegnati a quella […] che aveva creato
più occasioni. Questi punti attesi […] vanno a comporre una classifica parallela a
quella reale>>. La classifica così creata riduce notevolmente il bias che poteva
essere generato da eventi casuali. È una valevole raccolta di dati che
verranno poi analizzati e utilizzati per stabilire le prestazioni effettive di
squadra e giocatori.
20
giocatore B viene normalmente sottovalutato rispetto ad A a causa dei
“pochi goal segnati”, nonostante gli xG affermano che i due sono sullo
stesso livello. Il giocatore B è in realtà un investimento più saggio, che costa
meno di A e probabilmente più fruttuoso a causa della differenza tra xG e
G effettuati. Se fatto giocare nelle condizioni ideali il giocatore B nella
stagione successiva avrà un rendimento di dieci goal, aumentando perciò il
suo valore di mercato a fine campionato. Anche A, probabilmente segnerà
dieci goal nella stagione successiva, vedendo il suo rendimento calare
rispetto al campionato precedente. Si può quindi notare come vi sia una
valevole discrepanza tra dati che, per ipotesi, sono uguali. Allo stesso modo,
nella realtà, esistono discrepanze che portano a valutare i giocatori non per
quello che potrebbero realmente fruttare. Il metodo Brentford utilizza
questo bias a suo vantaggio.
L’esempio sopra riportato può essere applicato per ogni singola
caratteristica di qualsivoglia giocatore e, seppur banale, rispecchia ciò che
succede quotidianamente in club piccoli o medio piccoli quali per esempio
il Brentford. Si evidenziano i nomi di Andre Gram e Ollie Watkins che sono
stati comprati rispettivamente dal Louton per 620mila euro e dall’Exciter
per 7,2 Mln di euro per poi essere rivenduti per 12,4 Mln al Burnmay e per
34 Mln di euro all’Aston Villa. Il Brentford è riuscito ad utilizzare al meglio
il metodo sopracitato perché è strutturato per far performare nel modo
migliore i giocatori che vengono “selezionati”. Ogni singolo acquisto è
infatti mirato al miglioramento del club e funzionale alla squadra.
14 Fabbro, «Rasmus Ankersen, l’ossessione per i numeri per vincere nel calcio».
21
risultato fosse raggiungibile non sono ovviamente sempre le stesse. Ogni
singolo calcio piazzato è studiato, analizzato, applicato in allenamento e poi
in partita guardando sempre alle caratteristiche peculiari che la squadra
avversaria possiede. Se per esempio un club difende a zona, allora i
giocatori senza palla opteranno per movimenti rapidi per cercare di
disorientare gli avversari e spostare la “zona” in una posizione favorevole
per l’offensiva. Se invece la difesa piazzata è a uomo si cercheranno
movimenti ampi per avvolgere gli avversari e scardinare i giocatori che
marcano a uomo. Questi sono solo due delle molteplici tattiche che possono
essere utilizzate all’interno di una partita, ma fanno ben capire la
complessità derivata dall’analisi delle palle inattive.
22
vero esempio di filosofia “Moneyball” all’interno del “gioco più bello del
mondo”. Il lavoro svolto dai due businessmen ha ispirato notevolmente la
stesura di questa tesi e verrà utilizzato più avanti per argomentare il lavoro
svolto.
23
Liverpool (Fenway) e l’85% circa del Tolosa, squadra in cui sono state “te-
state” le statistiche da applicare al Milan. 17
Il fondo americano ha investito 600Mln di euro di capitale per l’acquisizione
dell’AC Milan dal fondo Elliot, e ha ottenuto un finanziamento puro da
parte dell’ex fondo milanista pari a 550Mln di euro da restituire in tre anni.
Nel momento in cui Gerry Cardinale “sale al potere” all’interno di “casa
Milan”, preferisce osservare e lasciare un senso di continuità con quanto
svolto precedentemente dalla vecchia proprietà piuttosto di imprimere im-
mediatamente le proprie idee rischiando di creare discontinuità e di desta-
bilizzare il modus operandi del club, e di riflesso, i possibili risultati dei
giocatori sul campo. Inizia poco alla volta a modificare la struttura gestio-
nale milanista tendendo comunque conto dell’organizzazione ereditata. In
questo modo rende “più digeribile” a tutto l’ambiente rossonero il cambia-
mento che sta apportando. Comincia da Giorgio Furlani, ex portfolio mana-
ger del fondo Elliot, che dal 5 dicembre 2022 ricopre l’incarico di ammini-
stratore delegato del club, rimpiazzando l’ex dirigente Ivan Gazidis. Il 20
febbraio 2023 rende Stefano Cocirio, anche lui all’interno del fondo Elliot
dal 2015, Chief Financial Officer del club, conferendogli le deroghe per occu-
parsi delle aree finanziarie.
La sessione estiva di calciomercato 2023 è la prima alla quale Cardinale ab-
bia potuto realmente prendere parte indicando ed incidendo sulle scelte re-
lative agli acquisti dei giocatori. Dalle figure 2 e 3 si può notare come questa
sessione sia stata alquanto movimentata per i rossoneri: dieci calciatori in
entrata e ben ventidue in uscita, con un bilancio negativo di 43,5Mln che
può potenzialmente tramutarsi in “nettamente positivo” al raggiungimento
dei diversi obiettivi dati dai giocatori ceduti in prestito con diritto o obbligo
di riscatto. 18 L’impronta dell’italo-statunitense si può nettamente notare so-
prattutto guardando alle caratteristiche dei giocatori in entrata. Cardinale,
come riportato nella lunga intervista rilasciata per Corriere della Sera del 15
settembre 2023, afferma :<<La cosa che più mi ha colpito in questo primo anno è
vedere la distanza con il Chelsea nelle due sfide di Champions. Perciò ho voluto un
Milan più fisico, più veloce, più intenso. Nelle prime partite si è visto.>>. 19 I dieci
giocatori acquisiti possiedono tutti le caratteristiche indicate dal nuovo di-
rigente del Milan e rispecchiano pienamente la filosofia che il magnate
24
americano vuole portare in Italia: creare una squadra competitiva nell’im-
mediato che ponga le basi per un ciclo vincente nel medio-lungo periodo.
Figura 2 Acquisti AC Milan
25
Figura 3 Cessioni AC Milan
Il mercato estivo del Milan non era però iniziato nel migliore dei modi. I
tifosi rossoneri hanno osservato Paolo Maldini e Ricky Massara, due dei pi-
lastri fondamentali che hanno portato al raggiungimento dello scudetto
26
dell’annata 2021-2022, andarsene dal mondo milanista poiché contrari alle
scelte gestionali del nuovo patron Cardinale. Successivamente a questa no-
tizia anche Sandro Tonali, fondamentale pedina di leadership e gioco ros-
sonera, è approdato in Inghilterra per poter mettersi in gioco nel campio-
nato più competitivo al mondo. Si può ben comprendere come gli appassio-
nati rossoneri, nel vedere andar via dal club tre delle figure che più avevano
rappresentato lo “spirito milanista” dei passati anni, non abbiano accolto
con molta gioia la “rivoluzione” che Cardinale voleva iniziare a Milanello.
La mente umana ha un’innata paura per l’ignoto, se una situazione stabile
cambia irrimediabilmente in una instabile l’uomo è portato a non porre fi-
ducia nell’avvenire. Le persone temono ciò che non conoscono, ne sono spa-
ventate e questo le porta a contrastare “a spada tratta” tutto ciò che non
comprendono. Allo stesso modo i tifosi milanisti sin dall’inizio della ses-
sione estiva di calciomercato, vedendo i propri idoli uscire dal club, hanno
iniziato a criticare aspramente l’operato di Cardinale, che fino ad allora
aveva “appena iniziato” la vera rivoluzione.
Gli animi dei tifosi hanno però cominciato a calmarsi una volta visto l’im-
pegno apportato alla campagna cessioni-acquisti rossonera, vedendo molti
giovani talenti di caratura mondiale atterrare nei pressi di Milano. Le vola-
tili opinioni della stampa e degli appassionati di calcio sono completamente
mutate nel momento in cui il “Milan 2.0” ha subito la prima e vera sonora
sconfitta perdendo per 5-1 il “Derby della madonnina” del 16 settembre
2023. Le opinioni scaturite dai vari “momenti” della squadra, sia gestionali
che del campo, sono completamente dettate “dall’hype” di una qualsivoglia
notizia che possa procurare share per le testate giornalistiche e non rispec-
chiano dunque la vera fisiologia milanista.
Nella stessa intervista per il corriere della sera cardinale continua di-
cendo:<< Ma credete che investa 1,2 miliardi per guadagnarci subito? È un pro-
getto a lungo termine: voglio vincere, ma non una volta sola, tante, nel tempo. Nel
calcio voglio essere un Berlusconi 2.0 […]. Ora, con il più alto fatturato nella storia
del Milan e un bilancio che si chiuderà in attivo per la prima volta dal 2006, affron-
tiamo una nuova fase: vogliamo essere i n.1, ma non possiamo riuscirci senza cam-
biamenti.>>.
La competitività che Cardinale vuole far raggiungere al “suo nuovo club” è
strettamente collegata al risanamento del campionato di Serie A. Il progetto
di Milano comporta, similmente alla strategia utilizzata da Matthew Ben-
ham per il Brentford, l’utilizzo di nuove strutture e ambienti moderni e
all’avanguardia che possano creare un luogo altamente funzionale e
27
comodo per la crescita e lo sviluppo della squadra AC Milan. Il progetto del
nuovo stadio di Milano renderebbe il club altamente competitivo a livello
sia italiano che europeo e, di conseguenza, creerebbe un movimento “a va-
langa” che teoricamente potrebbe riportare la lega italiana sul tetto d’Eu-
ropa. Per far sì che questo accada serve però il completo consenso e cambia-
mento da parte di tutti gli altri club della penisola.
È ovviamente troppo presto per dare una valutazione all’operato del busi-
nessman italo-americano, i dati da poter raccogliere sono ancora troppo esi-
gui e non si possiedono risultati di alcun tipo. È inutile cercare di farsi
un’idea sui micromovimenti compiuti gestionalmente da Cardinale. I primi
passi che danno fiducia all’ambiente milanese risiedono nell’ambizione me-
todica che il Milan sta assorbendo grazie alla filosofia Moneyball importata
da oltreoceano e nel bilancio che Gerry è riuscito a risanare dopo così tanto
tempo. Le caratteristiche peculiari date dall’approccio Moneyball iniziano a
“trainare le redini” di uno dei club calcistici più vincenti della storia. Spetta
solo al tempo definire se la scelta apportata dal fondo americano sia stata
fruttuosa o meno.
2.3 – La sfida
28
variare a seconda del club a cui si fa riferimento. Per esempio, un club
potrebbe valutare un giocatore 10Mln di euro mentre un altro potrebbe
valutarlo 7,5Mln. Oltre a questo, la pressione mediatica esistente a livello
sportivo e soprattutto calcistico rende i valori attribuibili agli atleti ancora
più volatili. Un episodio come uno scandalo di pubblico rilievo o un’accusa
infondata nei confronti del soggetto preso in considerazione possono
mutare notevolmente il prezzo di acquisto del cartellino. Si tenga anche
conto dell’inflazione dei prezzi dovuta o ad occasionali prestazioni positive
di un determinato talento o al fatto che questo sia di caratura mondiale o
perché esso giochi in un campionato piuttosto che in un altro. Il valore
attribuito ad un giocatore di Premier League risulterà sempre di maggior
rilievo rispetto alla valutazione attribuita allo stesso quando per esempio
giocava in Serie A, nonostante le metriche delle sue performance rimangono
invariate. Queste disparità di prezzo sono anche alimentate dalle differenze
tra diversi campionati. Si riprenda l’esempio della Premier League. Il
ricavato dei diritti televisivi inglesi è nettamente maggiore di quello
italiano. Per la stagione 2022-2023 si stima che le squadre inglesi abbiano
ricevuto più di tre miliardi di sterline da dividere tra le 20 squadre che
hanno partecipato alla competizione, mentre il campionato italiano abbia
ricevuto circa un terzo di quello guadagnato dai cugini inglesi.(figura 4) 20
Figura 4 Diritti TV
20Moore, «How Much Each Premier League Club Earned in TV Revenue»; Spadaro,
«Diritti tv, l’ultima della Premier League guadagna più della prima in Serie A | DATI».
29
Le differenze di guadagni tra i due campionati sono ben comprensibili a
causa dello share mediatico che la Premier League ha rispetto alla Serie A,
ma nonostante questo è decisamente sconvolgente. Dalla figura 4 si può
notare come il Southampton F.C., che nella scorsa stagione è retrocesso in
Championship, si stima abbia guadagnato più di 62Mln di euro dell’Inter
(tasso di cambio euro-dollaro del 30/12/2022), che è invece arrivata seconda
in campionato. Il sistema di divisione dei guadagni televisivi tra
campionato italiano e inglese è nettamente diverso. In Italia le entrate
raccolte vengono suddivise attraverso parametri stabiliti dalla legge
Melandri, mentre in Inghilterra la suddivisione è nettamente più equa tra i
partecipanti (il Manchester City guadagna circa il 25% in più del
Southampton, mentre l’Inter guadagna circa il 67% in più della
Cremonese). 21 Nonostante questa differenza di suddivisione dei soldi
ricevuti, il dislivello di incassi tra i due campionati è abissale.
L’idea alla base di tutto il lavoro svolto può essere descritta brevemente dal
pensiero espresso da Forker:<<As football clubs’ businesses rely more heavily on
labor than on capital, players are core assets for clubs and their valuation becomes
an important determinant of clubs’ financial value>>. 22 I giocatori vengono visti
come degli “asset finanziari” il cui movimento sul mercato porta possibili
guadagni al venditore. Se il valore degli asset finanziari aumenta per cause
interne o esterne agli stessi il venditore registra una plusvalenza sulla
vendita dell’asset, mentre se diminuisce registra una minusvalenza. Il
progetto pone le basi sul “recruitment method” di Benham e Ankersen già
analizzato precedentemente ponendo maggiore attenzione sulla possibile
plusvalenza che l’acquisto di un determinato “asset” possa portare.
Una delle prime limitazioni a cui si è dovuto far fronte consiste, come
precedentemente descritto, al volatile e soggettivo valore di mercato che
può essere assegnato ad un calciatore. Per cercare di evitare il bias derivante
Contracts».
30
da valutazioni soggettive e completamente mutabili all’interno di una
ricerca che fa del valore di mercato di un giocatore il punto cardine attorno
al quale ruota tutta l’analisi svolta, sono stati estrapolati dal sito
transfermarkt.com, attraverso una tecnica di data mining, i valori relativi a
tutti gli acquisti e tutte le cessioni effettuate durante il mercato estivo 2022-
2023 in Serie A. I dati raccolti presentano delle limitazioni intrinseche.
Innanzitutto, i calciatori presi in considerazione sono limitati unicamente a
quelli che hanno subito movimenti durante la sessione di mercato presa in
considerazione. Un “bias pre-calcolato” dovuto alla certezza di dover
utilizzare dei valori ufficiali. Facendo ciò si sono dovuti escludere tutti quei
calciatori che non hanno subito movimenti durante la sessione di mercato,
restringendo quindi notevolmente la dimensione del database.
In secondo luogo, si sono dovuti escludere i dati di tutti quegli atleti che
sono stati ceduti o in prestito o a titolo gratuito perché si era impossibilitati
a definire un valore specifico degli stessi.
Oltre a ciò, si sono voluti inserire i valori di mercato di giocatori considerati
“TOP di gamma” all’interno del campionato italiano. Questi valori sono
stati estratti da transfermarkt.com a fine Giugno 2023 con il solo obiettivo
di compararli con i risultati ottenuti in modo tale da osservare eventuali
differenze tra il rendimento dei “giocatori TOP” e di quelli “normali”. Si
comprende benissimo il leggero bias che il valore di mercato di questi
giocatori comporta all’interno del database, ma è comunque limitato
rispetto ai fini della ricerca, sia perché i valori di giocatori affermati sono
abbastanza stabili nel lungo periodo, sia perché questi valori incidono in
modo esiguo con lo studio svolto. I “giocatori TOP” sono stati scelti in base
ai migliori giocatori delle due passate stagioni suddivisi per fasce di gioco
(attacco, centrocampo e difesa).
Infine, si vuole rendere noto che i valori di acquisto/cessione estrapolati non
sempre corrispondono a valori altamente precisi poiché potrebbero essere
state utilizzate “formule particolari” di compravendita. Si pensi per
esempio a pagamenti rateizzati o a bonus devoluti al club solo una volta
raggiunte determinate prestazioni/risultati.
Il modello è comunque risultato utile per l’obiettivo che questo studio si
pone.
Per rendere più semplice la fruibilità del database creato si sono voluti
suddividere i calciatori in tre fasce di gioco, adattate in base alla zona di
campo di appartenenza (attacco, centrocampo e difesa). La fascia dei
portieri è stata esclusa a causa del numero troppo esiguo di trasferimenti di
31
giocatori appartenenti a quel ruolo durante il calciomercato estivo 2022-
2023.
32
Cap. 3 – DATASET
33
base di dati completamente unica nel suo genere. I siti principali da cui sono
state estratte queste informazioni sono due: fbref.com e transfermarkt.com.
34
diventato polo di attrazione non solo di appassionati del gioco più seguito
al mondo, ma anche di veri e propri club di calcio che osservano
l’andamento delle valutazioni affibbiate ai talenti del pallone. Si condivide
un passaggio estrapolato da un articolo del giornale spagnolo “El Mundo”
in cui Tobias Blaseio, responsabile di Transfermarkt Spagna, spiega
l’importanza della piattaforma online:<<Siamo un riferimento mondiale, un
riferimento per i dati calcistici. Naturalmente ci sono sempre degli errori, ma più
persone ci aiutano, più qualità possiamo offrire a tutti. […] Siamo in costante
contatto con club, giocatori e agenti, ma renderemmo un cattivo servizio a noi stessi
se partecipassero in qualche modo al valore di mercato>>. 26 I valori indicati sul
sito sono perciò una stima abbastanza fedele del potenziale di un atleta, ma
sicuramente non perfetta. Nella stessa intervista citata precedentemente
Blaseio, infatti, spiega come la stima affibbiata ai giocatori derivi da un
processo basato su più passaggi. All’inizio , in un forum dedicato, gli utenti
della piattaforma transfermarkt discutono e propongono il prezzo da dare
ad un determinato giocatore (in base a prestazioni, età, caratteristiche…).
Successivamente vengono discussi i prezzi proposti con i data scout che
fanno capo al forum nel quale è iniziato il dibattito. L’ultimo passaggio vede
i data scout riferire i valori ricavati ai lavoratori di ciascuna area nazionale
che decideranno poi il prezzo effettivo da immettere all’interno del sito. In
questo modo si ha un quadro più generale del potenziale espresso dagli
atleti, creando una stima del valore degli stessi. Esistono però bias insiti alle
valutazioni stesse. Tobias aggiunge infatti che:<<Se sei interessato al mercato
inglese, il suo valore è più alto, per effetto del denaro televisivo […] I club portoghesi
tradizionalmente vendono i loro talenti a prezzi molto alti>>.
Il fatto che il valore palesato sul sito tedesco non sempre rispecchi la qualità
del talento effettivo degli atleti e che questo possa essere “gonfiato” a
seconda del campionato di appartenenza, ha reso inevitabile la scelta di
basarsi unicamente sul prezzo al quale i vari giocatori sono realmente stati
acquistati durante la finestra estiva di mercato.
I dati necessari allo studio sono stati estrapolati grazie ad una tecnica di
“web scraping” (tecnica informatica che consiste nell'estrarre
automaticamente informazioni o dati da pagine web) volta ad ottenere
quelle statistiche non-tecniche che non si era riuscito a scaricare da
fbref.com. I pacchetti di R che si sono utilizzati durante questa fase sono
“rvest” e “polite” (rvest fornisce un'interfaccia user-friendly per scaricare il
contenuto HTML di una pagina web ed estrarre informazioni specifiche da
26 Sanchez, «Usted pone el precio que Real Madrid y Barcelona pagan por sus fichajes».
35
essa; polite invita ad essere responsabili quando si raccolgono dati dai siti
web. Impone all’utilizzatore di: presentarsi, chiedere il permesso, e poi
procedere allo scraping) 27
Lista giocatori TOP utilizzati nel database suddivisa per fasce di gioco
La seconda sezione del file Excel contiene tutte quelle statistiche che sono
state interpretate come dedicate alla fase di attacco. I dati di questa regione
indicano la produzione offensiva che l’atleta mette a disposizione per la
squadra in cui gioca. In questa area si possono osservare metriche quali i
già citati “expected goals”, gli “assist” che l’atleta ha procurato durante la
totalità delle partite giocate, o la percentuale di tiri che effettua in media
durante una partita.
36
fondamentali, completati e non, etc. L’idea di base di questa sezione è quella
di restituire un quadro generale dello stile di gioco dell’atleta tenendo ben
presente quanto sia propenso a “creare gioco” per la squadra.
Come già anticipato nel paragrafo precedente, poiché il fine ultimo della
tesi è individuare quei giocatori sottovalutati che messi nelle condizioni
adatte possano fruttare plusvalenze al club di appartenenza, le metriche
raccolte all’interno del database hanno un’impronta prettamente volta
all’azione offensiva. Nel capitolo successivo verrà esplicato maggiormente
il concetto di scelta delle variabili necessarie per l’analisi del campione di
dati e di conseguenza la caratteristica offensiva dettata da questa decisione.
3.2 – Metriche
37
la posizione prediletta dall’atleta nel campo di gioco (Si sono voluti
semplificare notevolmente i ruoli per agevolare la comparazione durante
l’analisi svolta. Non esistono quindi posizioni come terzini, mediani, ali…
ma soltanto ruoli di attacco, centrocampo e difesa); la variabile
“Squadra_Cessione” permette di capire da quale o verso quale squadra il
giocatore preso in considerazione è stato acquistato/ceduto, infine “Età”
(all'inizio della stagione) e “Nato” sono autoesplicative.
Continuiamo con le già citate “GiocatoreTOP”, variabile binaria volta ad
individuare i migliori giocatori del campionato, e “AcqValore”, pensata
invece a stabilire il prezzo a cui gli atleti all’interno del database sono stati
acquistati/venduti (si ricorda che il valore di acquisto dei giocatori TOP è
indicativo del periodo appena successivo al termine di campionato
dell’annata 2022-23. I valori di questi giocatori risultano quindi avere un
bias nei confronti dell’ultima stagione affrontata)
Tra le statistiche prese in considerazione all’interno della sezione iniziale
appartengono anche quelle che potrebbero definirsi le “generalità di un
calciatore”, ovvero quelle statistiche comuni ad ogni singolo atleta
professionista appartenete al mondo del pallone. Esse individuano le
partite giocate dall’atleta con “PG” (Le partite vengono prese in
considerazione anche se l’atleta ha partecipato ad esse per pochi minuti); la
metrica “Tit” specifica in quanti match il giocatore è partito titolare,
ovviando quindi al problema della statistica precedente; “Min” indica il
minutaggio totale del giocatore durante tutte le 38 partite di campionato,
mentre “90_min” specifica quanti minuti abbia giocato mediamente
durante un singolo match (Questa metrica non tiene conto di quelle partite
in cui il giocatore era infortunato, espulso o non abbia toccato il terreno di
gioco per motivi tecnico-tattici).
Le ultime metriche selezionate per questa prima parte di dataset sono state
create e modificate appositamente per cercare di arginare il problema
relativo alla continuità delle prestazioni dei giocatori. Si è infatti visto
attraverso svariati test svolti durante le analisi dei dati che i risultati ottenuti
palesavano un problema di costanza. Vi erano infatti alcuni giocatori che si
potrebbero definire “one shot”, ovvero atleti, i quali dati risultavano essere
di pregevole caratura unicamente in pochissimi risvolti di gioco e non nel
lungo periodo. Le metriche in questione sono: “Min_PG” ovvero i minuti
totali sulla totalità delle partite giocate, in questo modo si ottengono
indicativamente i minuti effettivi giocati dall’atleta in tutte le partite in cui
ha partecipato; “Titolarità” è invece la soluzione al problema sopra citato.
38
Questa statistica ha un risultato binario (sì e no) dato quando Min_PG > 15
minuti e contemporaneamente PG > 16 partite giocate. I 15 min. sono stati
selezionati per valorizzare quei giocatori che subentrano dalla panchina
(simile al modo in cui al fantacalcio assegnano il punteggio ai calciatori
subentrati). Il numero minimo di partite giocate inizialmente scelto era 18,
ovvero esattamente la metà dei match disputati in una stagione. Si sono
però volute abbuonare alcune partite a causa di quei giocatori che hanno
subito una cessione dopo l’inizio effettivo del campionato (Il mercato estivo
del campionato italiano termina tradizionalmente il 31 agosto. La serie A
nell’annata 2021-22 è iniziata il 21 agosto, facendo disputare 2 partite
durante la sessione di calciomercato estiva, mentre l’annata 2022-23 è
cominciata il 13 agosto, portando i giocatori a disputarne 4. Si è voluta
calcolare la media delle partite giocate durante il periodo di trasferimento
estivo, il che ha portato il numero utilizzato nella metrica a 16 (19-3)).
39
“npG” (valori interessanti per comprendere quanto l’atleta riesca ad essere
cinico davanti alla porta); “Rig_T” definisce invece quanti rigori un
giocatore abbia tentato. Si comprende bene che questi valori sono molto
interessanti per coloro che sono rigoristi all’interno delle proprie squadre,
ma non potranno mai essere rilevanti su larga scala per la stessa
motivazione sopra citata.
“Amm” sta per quanti cartellini gialli il giocatore ha ricevuto, mentre “Esp”
indica quante volte ha ricevuto cartellini rossi.
Si approcciano ora tutti quei dati definiti “expected”. Come suggerito dal
nome queste metriche valutano l’aspettativa, il valore atteso che quel
determinato evento avvenga. In termini calcistici stabiliscono la probabilità
di segnare, di fare un assist, di compiere un passaggio decisivo… Tutte
queste casistiche sono fornite direttamente da Opta Sports, multinazionale
specializzata nell’elaborazione di dati sportivi (Fbref.com, sito da cui si sono
scaricate queste metriche, utilizza i servizi forniti da Opta). 28
Si prendano in considerazione i dati su cui si basa principalmente lo studio
svolto da questo elaborato: “xG” e “xG_90” indicano rispettivamente gli
expected goals (probabilità che ogni tiro diventi goal) e gli expected goals
nei 90 min.(Il totale degli xG include i calci di rigore, ma non include i rigori
a fine partita. Minimo 30 min. giocati per entrare in graduatoria); per
“npxG” si indica l’aspettativa che un giocatore faccia goal senza segnare dal
dischetto di rigore, si può quindi comprendere come “npxG_T” metta in
relazione la metrica citata poco fa con la totalità dei tiri effettuati da un
atleta. Come precedentemente svolto con i “non penalty goals”, i dati
successivi rappresentano la differenza tra due metriche. Sono stati scaricati
per indicare la differenza tra reti segnate e l’aspettativa di esse “G-xG”, e tra
reti segnate non su rigore e la loro aspettativa “npG_npxG”.
Si conclude la “sezione offensiva” specificando i dati relativi agli expected
assist e tutti i suoi derivati. “xAG” definisce quanto ci si aspetta che un
giocatore faccia goal e fornisca un assist nella stessa partita; “xA” e “xA_90”,
simili alle metriche precedentemente citate riguardanti gli xG, stabiliscono
gli expected assists e gli expected assists nei 90 minuti. Continuando,
“Diff_A_xAG” sta per A – xAG, mentre “ Diff_A_xAG” indica assist meno
goal assistiti previsti. Si chiude la sezione con “Somm_npxG_xAG”, la
somma tra expected goal non su rigore ed expected goal assistiti.
40
Si prenda ora in considerazione la zona del dataset dedicata a tutte quelle
metriche riguardanti i passaggi e il possesso palla (come precedentemente
citato le casistiche riguardanti gli assist e i suoi derivati possono essere
indicative sia di questa sezione che di quella offensiva. Non si ripeteranno
per questo motivo).
Si inizi guardando ai dati relativi ai passaggi progressivi, ovvero tutte
quelle metriche riguardanti l’accorciare la distanza tra la palla e la porta
dell’avversario. Tutte le metriche riguardanti queste tipologie di passaggi
portano il pallone verso la linea di porta avversaria ad almeno 10 metri dal
suo punto più lontano negli ultimi sei passaggi o qualsiasi passaggio
nell’area di rigore. Primo dato rilevante è “PrgC”, ovvero i passaggi
progressivi creati (sono esclusi i passaggi che terminano nel 50% del campo
di gioco della difesa). Questa statistica è molto rilevante per stabilire quanto
un giocatore sia un “playmaker”. Si prosegue con “PrgP”, indicante i
passaggi progressivi proposti e completati (esclude i passaggi dal 40% del
campo per i difensori); ed infine “PrgR” che indica i passaggi progressivi
ricevuti (anche qui sono esclusi i passaggi dal 40% del campo per i
difensori).
Si continui con i passaggi fondamentali “Pfond”, indicanti tutti quei
passaggi che hanno portato il ricevente a tirare verso la porta (sono inclusi
gli assist);” PTerzCamp” indica i passaggi completati entrati nell'ultimo
terzo del campo di gioco più vicino alla rete, mentre “PPA” sta per passaggi
completati all’interno dell’area di rigore; “Cross-area” è abbastanza
autoesplicativa.
Si analizzi ora una zona di questa sezione dedicata alle varie tipologie di
passaggi che si possono verificare nel corso di una partita di calcio. Gli
scambi che si vengono a creare possono essere suddivisi in quattro grandi
categorie. Le quattro tipologie degli scambi analizzati sono la totalità dei
passaggi completati, i passaggi brevi, quelli medi e i lunghi. Gli scambi
appena citati vengono analizzati in maniera molto simile tra loro (le
metriche sono diverse ma possiedono le stesse trasformazioni. Per esempio,
la metrica indicante i passaggi tentati verrà proposta per gli scambi
completati, brevi, medi e lunghi.) e per questo motivo verranno riportate
solamente le statistiche riguardanti i passaggi completati totali, in modo da
evitare inutili ripetizioni. Si continui vedendo quante e quali metriche sono
state riportate per i passaggi completati.
“Compl_Tot” indica la totalità dei passaggi completati. Sulla falsa riga della
metrica precedente, si sono volute creare appositamente quattro metriche
41
per lo studio che si svolgerà nel prossimo capitolo, riguardante le
caratteristiche di gioco dei calciatori. La prima consiste in
“Pfond_Compl_Tot”, metrica indicante i passaggi fondamentali sulla totalità
di quelli completati. Questa statistica ha un peso notevole all’interno dello
studio poiché è molto malleabile. Per i difensori e i centrocampisti indica
quanto questi siano bravi a creare occasioni da goal durante una partita e di
conseguenza, quanto questi aiutino all’azione offensiva pressando in
attacco. Per gli attaccanti rappresenta invece la disposizione che lo stesso ha
per far segnare la squadra; è più egoista o gioca a disposizione dei
compagni? Ci si aspettano risultati nettamente inferiori rispetto a difensori
e centrocampisti ma risulta comunque un valore interessante da
comprendere. Si continui con “PrgC_Compl_Tot”, “PrgP_Compl_Tot” e
“PrgR_Compl_Tot”. Tre metriche strettamente collegate tra di loro che
creano un quadro generale di quanto un calciatore sia bravo a proporre,
completare e ricevere gioco (quando si usa l’espressione “creare gioco”,
poiché lo studio svolto ha un’impronta prettamente offensiva, ci si riferisce
ad azioni potenzialmente pericolose). “Ten_Tot” indica quanti passaggi
siano stati provati in totale, mentre “Perc_Compl_Tot” stabilisce la
probabilità di completare un passaggio.
Si conclude questa sezione con le metriche riguardanti la distanza totale,
espressa in iarde, percorsa dai passaggi completati in ogni direzione
“Dist_Tot” e la distanza totale, espressa in iarde, percorsa dai passaggi
completati verso la rete avversaria “Dist_Prog_Tot” (i passaggi lontani dalla
rete avversaria vengono conteggiati come zero iarde progressivi).
42
dei difensori nella tre quarti avversaria. Essa è altamente utile per verificare
quali giocatori maggiormente sviluppano il gioco propinato dallo studio di
questa tesi.
Ci si sposti ora nella sezione dedicata alle “sfide” che i calciatori affrontano
quando in fase difensiva. Le statistiche di quest’area sono totalmente
incentrate sull’approccio ai dribblatori avversari. “Dribl_Cntrs” indica
quanti dribblatori sono stati contrastati, “Dribl_Appr” quanti se ne sono
approcciati, “Perc_Dribl_Cntrs” mette in relazione le due metriche
precedenti e infine “Dribl_persi” è autoesplicativa.
Ultimo sottogruppo difensivo è incentrato sui blocchi effettuati durante la
partita. “Blocchi” è la metrica più rappresentativa di questo gruppo e indica,
come facilmente intuibile, il numero di volte in cui ha bloccato la palla
stando nella sua traiettoria; “T_blocchi” e “P_blocchi” indicano
rispettivamente i tiri e i passaggi bloccati; “Perc_P_Blocchi”, come facilmente
intuibile, esamina la percentuale di passaggi bloccati. Questa metrica è
particolarmente interessante perché è un buon indicatore della pressione
apportata dai giocatori durante la fase difensiva.
Le intercettazioni sono invece date da “Int”, con un particolare
accorgimento alla loro percentuale all’interno dei 90 minuti regolamentari
“Int_90”. “Somm_Cntrs_Int” mette invece in relazione contrasti e
intercettazioni creando quindi un quadro generale degli interventi effettuati
dall’atleta.
Si conclude l’area guardando a due facce della stessa medaglia: salvataggi
ed errori (sbagli che hanno causato un tiro da parte di un avversario) e le
loro rispettive percentuali nei 90 minuti; “Salvat”, “Salvat_90”, “Err” e
“Err_90”.
43
Cap. 4– IL PROGETTO
44
categorie indicative della fase offensiva, dei passaggi a centrocampo e di
quella difensiva dei singoli giocatori. La fase offensiva è rappresentata da:
Tiri nei 90 minuti (T_90), goal su tiri effettuati (G_T), goal non su rigore su
tiri effettuati (npxG_T), goal nei 90 minuti (G_90), aspettativa di goal nei 90
minuti (xG_90) e totalità dei passaggi fondamentali completati
(Pfond_Compl_Tot); quella a centrocampo da: assist nei 90 minuti (A_90),
aspettativa di assist nei 90 minuti (xA_90), passaggi progressivi proposti e
completati rispetto alla totalità dei passaggi completati (PrgP_Compl_Tot),
passaggi progressivi creati rispetto alla totalità dei passaggi completati
(PrgC_Compl_Tot), passaggi progressivi ricevuti rispetto alla totalità dei
passaggi completati (PrgR_Compl_Tot) e totalità dei passaggi fondamentali
completati (Pfond_Compl_Tot); ed infine la difesa da: percentuale di contrasti
vinti (Cntrs_vinti_Cntrs), percentuale di contrasti nella tre quarti offensiva
(Treq_off_Cntrs), passaggi progressivi proposti e completati rispetto alla
totalità dei passaggi completati (PrgP_Compl_Tot), percentuale dei
dribblatori contrastati (Perc_Dribl_Cntrs), salvataggi nei 90 minuti
(Salvat_90) e percentuale di passaggi bloccati (Perc_P_Blocchi). Tutte le fasi
appena indicate sono sempre prese in considerazione con il valore di
acquisto dei calciatori “AcqValore” (si ricorda che lo scopo dell’analisi è
restituire valori monetari dei giocatori sottostimati). Questi “pacchetti di
variabili” verranno più volte utilizzati all’interno dell’analisi svolta poiché
molto rap presentativi del gioco offensivo che lo studio moneyball vuole
proporre. Di seguito si riportano le tre tabelle derivate dalla correlazione
dei tre gruppi di osservazioni. 29
I valori relativi alla correlazione dei dati offensivi vedono le osservazioni
per lo più significative con il valore di acquisto degli atleti. L’ unica variabile
che ha valore neutro risulta essere “Pfond_Compl_Tot”. Ci si aspettava che
i passaggi fondamentali completati totali non avessero molta significatività
all’interno dello studio offensivo dei calciatori poiché indicano quanto un
calciatore sia cinico in area di rigore. Notoriamente gli attaccanti sono pagati
per fare goal e non per fornire assist. Si voleva comunque capire quanto i
giocatori fossero a disposizione della squadra in quelle situazioni in cui le
chance di goal aumentano se si fornisce un assist potenziale. Guardando
invece i grafici relativi ai passaggi e alla difesa, ciò che più fa riflettere è il
valore di acquisto che non è prettamente significativo con le metriche
stimate. Le variabili prese in considerazione hanno una relazione nulla e in
45
Correlazione multipla relativa alle variabili offensive studiate all’interno del modello
Correlazione multipla relativa alle variabili di centrocampo studiate all’interno del modello
46
Correlazione multipla relativa alle variabili difensive studiate all’interno del modello
47
Una volta filtrati i dati in base all’annata si sono ulteriormente filtrati in base
alla posizione di gioco dei calciatori, creando di conseguenza altri sei
subsets. Questi sono stati poi trasformati in modo tale da contenere
solamente le statistiche di riferimento date dalla posizione selezionata unite
alle metriche pertinenti alle generalità e al valore dei giocatori. Le statistiche
comuni a tutti i calciatori sono: il nome dell’atleta (giocatore), se il calciatore
è considerato TOP (GiocatoreTOP), la squadra di appartenenza (squadra), il
valore di acquisto (AcqValore), il logaritmo del valore di acquisto
(LogValore22) e la fascia di prezzo data dal quartile del valore di mercato
“QuartValore”. Quelle peculiari in base alla posizione : Tiri nei 90 minuti
(T_90), goal su tiri effettuati (G_T), goal non su rigore su tiri effettuati
(npxG_T), goal nei 90 minuti (G_90), aspettativa di goal nei 90 minuti
(xG_90) e totalità dei passaggi fondamentali completati (Pfond_Compl_Tot)
per ATTdata; assist nei 90 minuti (A_90), aspettativa di assist nei 90 minuti
(xA_90), passaggi progressivi proposti e completati rispetto alla totalità dei
passaggi completati (PrgP_Compl_Tot), passaggi progressivi creati rispetto
alla totalità dei passaggi completati (PrgC_Compl_Tot), passaggi progressivi
ricevuti rispetto alla totalità dei passaggi completati (PrgR_Compl_Tot) e
totalità dei passaggi fondamentali completati (Pfond_Compl_Tot) per
CENdata; percentuale di contrasti vinti (Cntrs_vinti_Cntrs), percentuale di
contrasti nella tre quarti offensiva (Treq_off_Cntrs), passaggi progressivi
proposti e completati rispetto alla totalità dei passaggi completati
(PrgP_Compl_Tot), percentuale dei dribblatori contrastati
(Perc_Dribl_Cntrs), salvataggi nei 90 minuti (Salvat_90) e percentuale di
passaggi bloccati (Perc_P_Blocchi) per DIFdata.
Per cercare di ridurre possibili bias derivati dall'impatto dei valori estremi
nella distribuzione dei valori di mercato dei giocatori, si è voluto
trasformare i valori di acquisto dei singoli giocatori in logaritmi degli stessi.
Così facendo si è resa più robusta l’analisi che si vuole proporre e al tempo
stesso si è cercato di ridurre una potenziale eteroschedasticità data da
questa variabile.
Una volta terminata la fase preparatoria del dataset e dei diversi subset
creati, si è iniziata la vera e propria analisi. Il primo passo svolto in questa
direzione è stato cercare di esaminare le relazioni tra più variabili all’interno
di ogni singolo subset. La funzione utilizzata per creare la matrice di
scatterplot utile a questo fine è ggpairs. 30 La peculiarità che rende questa
48
funzione la più adatta da utilizzare in questa casistica è il fatto che essa
riesce a svolgere più funzioni contemporaneamente. Consente di
visualizzare in modo rapido ed efficace sia a livello di dati che visivo le
relazioni tra tutte le copie di variabili studiate, esaminando e riportando le
correlazioni esistenti tra le stesse. Le prime matrici che si sono create usano
la metrica “QuartValore” per definire visivamente le differenti fasce di
prezzo dei giocatori, inoltre suddividono la tabella in due sezioni distinte.
Il riquadro in alto a destra dedicato alla correlazione delle variabili, mentre
quello in basso a sinistra indicante grafici scatterplots.
Una volta terminati i grafici riguardanti le fasce di valore dei giocatori, si è
nuovamente svolta la funzione ggpairs utilizzando come criterio di
colorazione la variabile “GiocatoreTOP”. In questo modo si sono potuti
confrontare i risultati ottenuti con quelli precedentemente trovati. Lo studio
specifico dei grafici fin qui ottenuti verrà affrontato in modo più dettagliato
nel paragrafo successivo.
49
del valore di mercato dei giocatori e, nel caso delle statistiche offensive, la
percentuale dei tiri nei 90 minuti.
Si è proseguito analizzando regressioni lineari multiple e verificando, di
volta in volta, la validità delle assunzioni precedentemente descritte. Si sono
creati grafici specifici per avere un riscontro visivo dell’operato. Si allega a
titolo esemplificativo la tabella riguardante le assunzioni delle ipotesi sulla
regressione lineare multipla degli attaccanti dell’annata 2021-2022 (figura 6).
Il grafico “Residual vs Fitted” prende in considerazione l’assunzione di
linearità del modello e al tempo stesso la sua omoschedasticità.
Tendenzialmente i valori del modello non dovrebbero avere un pattern
specifico e dovrebbero essere distribuiti in modo randomico (più la linea
Grafici rappresentati le assunzioni della regressione lineare multipla con modello lineare
50
Figura 7 Test assunzioni ATT Multiple Linera Model Quadratico
Grafici rappresentati le assunzioni della regressione lineare multipla con modello quadratico
Dai risultati mostrati dalla figura 7, si può dedurre che il modello quadratico
confermi le assunzioni. Questa “analisi” riguardante la regressione lineare
multipla è stata svolta per tutti i subset della tesi.
Successivamente, per far fronte alla possibilità che la varianza degli errori
residuali non sia costante in tutte le condizioni o per tutti i livelli delle
variabili indipendenti, si sono acquisiti gli errori standard robusti
all’eteroschedasticità utilizzando il modello HC1. Questi sono poi stati
utilizzati per determinare l’esito della regressione. I risultati ottenuti
verranno analizzati nel dettaglio nel paragrafo successivo insieme ai grafici
precedentemente discussi.
51
studio effettuato, si doveva necessariamente “pulire” il modello utilizzato
rendendolo “robusto” all’eteroschedasticità e agli outliers (gli
heteroskedasticity-robust standard errors ottenuti precedentemente non
modificano perennemente il modello lineare a cui fanno riferimento, ma
sono degli strumenti che possono fornire supporto solo se applicati
congiuntamente allo stesso).
Si è scelto di utilizzare il metodo di stima robusto “lmrob”. Il metodo di
stima robusto è una forma di analisi di regressione progettata per aggirare
alcune limitazioni del metodo parametrico tradizionale e non. (questa
funzione calcola uno stimatore di regressione di tipo MM (Il metodo di
stima MM è lo sviluppo dell'estensione del metodo della massima
verosimiglianza) come descritto in Yohai (1987) e Koller e Stahel (2011). Per
impostazione predefinita utilizza una funzione di punteggio ascendente
biquadrato e restituisce uno stimatore altamente robusto ed altamente
efficiente (con punto di rottura del 50% e efficienza asintotica del 95% per
errori normali)) 32.
52
(funge da divisoria tra le altre due “parti”); l’area superiore ai grafici di
densità è costituita da valori indicanti la correlazione generale tra le
variabili; la zona inferiore mostra scatterplots indicanti l’andamento delle
metriche prese in considerazione. Ogni singolo parametro rappresentato
all’interno delle figure che vanno dalla numero 8 alla numero 13, è
indicativo della suddivisione in “fasce di valore” effettuata
precedentemente. I dati sono quindi suddivisi per colore e riportano i valori
indicati dalla fascia di appartenenza (L, M-L, M-H e H).
53
Figura 8 ATT 2021-22
54
Figura 9 CEN 2021-22
55
Figura 10 DIF 2021-22
56
Figura 11 ATT 2022-23
57
Figura 12 CEN 2022-23
58
Figura 13 DIF 2022-23
59
tenere in considerazione la metrica per i motivi già affrontati nei capitoli
precedenti.
Il riquadro dedicato alla correlazione, indicante quanto le variazioni in una
variabile sono associate alle variazioni nell'altra variabile, specifica numeri-
camente il grado di relazione visualizzato precedentemente grazie agli scat-
terplots. I valori che più sono importanti per lo studio della tesi riguardano
la correlazione delle variabili indipendenti con quella dipendente. I valori
analizzati sono abbastanza significativi nonostante le metriche riguardanti
i goal e gli expected goal sul numero totale di tiri effettuati non siano parti-
colarmente rilevanti. Seppur non vi siano valori eclatanti si è comunque de-
ciso di continuare a tenere in considerazione e basare l’analisi del modello
lineare multiplo anche su queste variabili, poiché si reputa che il cinismo
identificato dalle metriche sia di notevole rilevanza per lo scopo della tesi.
60
abbastanza omogenei a eccezion fatta per quello relativo ai passaggi pro-
gressivi completati, che vede i giocatori maggiormente pagati avere valori
mediamente minori di tutti gli altri calciatori. Da questo dato si può dedurre
che mediamente i club calcistici con un’elevata disponibilità economica pre-
diligono difensori più rocciosi e tradizionali rispetto a quelli che propon-
gono passaggi progressivi e che quindi interpretano il ruolo in un modo
“più moderno” (diventando di fatto dei “playmaker” difensivi). I grafici
scatterplots palesano una relazione tra le variabili tendenzialmente neutra
e una buona distribuzione dei valori studiati. Le correlazioni con la varia-
bile dipendente sono poco significative per le motivazioni citate preceden-
temente. Durante lo studio lineare multiplo ci si aspetterà un basso R2 a
causa dell’intrinseca poca significatività riscontrata (trasposizione esempli-
ficativa dei valori di mercato che i recruiter danno a calciatori difensivi).
Figura 14 ATT lm
Linear regression model delle variabili di attacco per le annate 2021-22 e 2022-23
61
Figura 15 CEN lm
Linear regression model delle variabili di centrocampo per le annate 2021-22 e 2022-23
Figura 16 DIF lm
Linear regression model delle variabili di difesa per le annate 2021-22 e 2022-23
62
quando si sono analizzati grafici dell’annata precedente). Per questo motivo
si è deciso di lasciare le tabelle a titolo esemplificativo.
63
espressa in forma logaritmica). Per esempio, se il rateo dei non-penalty goal
su tiri al quadrato dovesse aumentare di un’unità, porterebbe la variabile
dipendente a diminuire di ben 104 unità. Come già spiegato precedente-
mente, ci si aspettava una correlazione negativa da questa metrica. Un’altra
interessante osservazione risiede nel fatto che la percentuale di goal non su
rigore rispetto ai tiri effettuati ha un apporto negativo sul prezzo dei gioca-
tori. Il prezzo di un’attaccante non sale quando questo è cinico sotto porta,
ma quando lui faccia effettivamente goal.
La controparte dedicata all’annata 2022-23 segue un modello lineare multi-
plo semplice e consta anch’essa di poca significatività da parte delle varia-
bili indipendenti. La varianza è spiegata al 29% e non possiede risultati
estremamente elevati . L’unica variabile negativa è ancora una volta dovuta
a “npxG_T”, confermando quanto appena scritto.
64
Si consideri infine la figura 16, rappresentativa della regressione lineare mul-
tipla per i valori utilizzati rispetto alle caratteristiche difensive dei calciatori.
Il modello dell’area di sinistra, relativo all’annata 2021-22, presenta signifi-
catività unicamente per la variabile dipendente. Oltre a questo, quello che
più fa riflettere è il bassissimo valore di R2. La varianza è spiegata unica-
mente al 9%, una piccolissima percentuale della variazione totale nei dati,
tenendo conto del numero di variabili indipendenti utilizzate. Ci si aspet-
tava un valore particolarmente basso a causa della poca importanza data ai
valori difensivi durante la stima del prezzo di mercato dei calciatori, ma l’
R2 individuato è comunque troppo irrisorio. In questa casistica il modello
relativo all’annata 2022-23 è utile per poter determinare se vi sia un errore
insito all’interno del modello studiato. Il confronto fa capire come l’esiguo
numero di osservazioni incida sulla stima del modello lineare multiplo. I
dati relativi ai contrasti e ai passaggi progressivi completati totali hanno
una relazione negativa con la variabile dipendente, confermando quanto ri-
portato nel paragrafo dedicato ai valori delle metriche.
Infine, l’area destra della figura rappresenta circa il 20% della varianza to-
tale nei dati (a differenza di quanto riportato dal grafico relativo all’annata
2021-22, seppur basso, il valore è accettabile). Anche in questa casistica la
significatività appartiene solamente alla variabile dipendente, mentre le va-
riabili con un’incisività negativa all’interno del modello sono:
“Treq_off_Cntrs”, “PrgP_Compl_Tot” e “Salvat_90”.
Le figure analizzate in questo capitolo sono la base su cui verrà predetto nel
paragrafo successivo il valore cardine dello studio di questa tesi.
65
lmrob utilizzata per rendere i modelli omoschedastici. A causa di un errore
di codice riscontrato durante l’utilizzo di questa funzione (in particolare,
sul modello quadratico relativo all’attacco dell’annata 2021-22), si è deciso
di utilizzare le variabili lineari semplici dedicate all’attacco dell’annata
presa in considerazione durante l’utilizzo della funzione sopra citata. In
questo modo l’errore di codice viene eliminato e si può procedere alla vera
e propria “predizione” del valore di mercato.33
33 L’errore riportato è il seguente: S-estimated scale == 0: Probably exact fit; initial estim.
'init' not converged -- will be return()ed basically unchanged
66
Si riportano ora i vari subset “Talent” dedicati alle diverse fasce di gioco
prese in considerazione per le due annate distintive dello studio effettuato
(figure che vanno dalla numero 17 alla 22).
Risultato finale indicante gli attaccanti sottovalutati dell’annata 2021-22 che possono
potenzialmente portare un surplus di oltre 5mln di euro
Risultato finale indicante gli attaccanti sottovalutati dell’annata 2022-23 che possono
potenzialmente portare un surplus di oltre 5mln di euro
67
Figura 21 Talent DIF 2021-22
Risultato finale indicante i difensori sottovalutati dell’annata 2021-22 che possono potenzialmente
portare un surplus di oltre 5mln di euro
Risultato finale indicante i difensori sottovalutati dell’annata 2022-23 che possono potenzialmente
portare un surplus di oltre 5mln di euro
68
l’annata successiva il club X riesce a costruire un ambiente ideale per lo
sviluppo del talento francese acquistato, il valore di mercato del calciatore
salirebbe a circa 17,4mln di euro (rispetto ai 10mln utilizzati per
acquistarlo), riuscendo così ad ottenere, da una immaginaria rivendita, un
surplus di circa 7,4mln di euro.
Per la seconda casistica si deve tener conto che la variabile “Età” non è
volutamente stata presa in considerazione all’interno del modello. Questa
variabile inciderebbe notevolmente sul valore di mercato stimato dei
calciatori. Se per esempio, si dovesse scegliere chi comprare tra due
calciatori con le stesse identiche caratteristiche, si sceglierebbe sempre di
acquistare il giocatore più giovane. Questo per il semplice motivo che gli
atleti vengono visti come assets finanziari che possono durare tra il medio
e il lungo periodo. Se si investisse in un calciatore le cui performance sono
in costante decrescita, il suo prezzo di mercato sarebbe anch’esso in costante
decrescita.
Per questo preciso motivo i giocatori “anziani” sono notevolmente
sottovalutati. Nonostante con l’avanzare dell’età il rendimento degli stessi
diminuisca, è comunque più vantaggioso investire nel breve periodo su un
calciatore agonisticamente “maturo” come Edin Dzeko, pagato dall’Inter
4mln di euro e con un potenziale di 24,5mln di euro, piuttosto che spendere
il triplo per un calciatore più giovane. La filosofia Moneyball non guarda
infatti all’età degli atleti presi in considerazione poiché gli stessi possono
“fruttare” all’interno della squadra non solo economicamente ma anche a
livello di esperienza (i giocatori più anziani possono condividere
l’esperienza fruttata durante gli anni di gioco con i compagni di squadra
più giovani, indirizzandoli quindi verso una crescita personale e agonistica
più rapida).
I risultati ottenuti sono consoni con quanto predetto all’interno del modello
e forniscono un interessante fotografia sui giocatori che più vengono
sottostimati all’interno del campionato di Serie A.
69
CONCLUSIONI
Gli output ricavati dallo studio individuano esattamente quei calciatori che
per svariate motivazioni sono stati sottovalutati, sia in termini monetari, che
di prestazioni, dal calciomercato. I risultati mostrano infatti tutti quegli
atleti la cui differenza di prezzo tra il valore di mercato stimato dal modello
e il valore di mercato effettivo degli atleti, sia di almeno 5mln di euro. I
calciatori così individuati rappresentano dei veri e propri asset monetari
che, se rivenduti, possono potenzialmente portare a notevoli plusvalenze.
70
alle date sopra citate. Eventuali alterazioni di prezzo o di valore dei
giocatori non vengono presi in considerazione dalla ricerca qui condotta.
71
BIBLIOGRAFIA:
72
FBref.com. «Tutto ciò che riguarda FBref.com», s.d.
https://fbref.com/it/about/index
73
aiutano-perche-serie-non-mi-ascolta-d8c8a50e-4fbb-11ee-bf2a-
fe4dfcd6f834.shtml
74