Sei sulla pagina 1di 75

DIPARTIMENTO DI ECONOMIA

Corso di Laurea
in ECONOMIA e AZIENDA DIGITALE

Relazione Finale

MONEYBALL: un'applicazione nel mercato


calcistico italiano

Relatore: Chiar.mo Prof. Mattia Guerini

Laureando:
Mani Mattia
Matricola n. 727751

Anno Accademico 2023/2024


Dedico questa tesi ai miei genitori, per il loro amore incondizionato, il sostegno
costante e l'infinita fiducia in me. Senza di voi, questo traguardo sarebbe stato
impossibile.

Ringrazio anche i miei amici, che nonostante tutto sono stati punto di sfogo du-
rante questo lungo percorso.

Un ringraziamento speciale va al mio relatore, Mattia Guerini, per la sua guida, il


suo supporto e la sua pazienza nel corso di questo progetto.

Infine, dedico questa tesi a me stesso/a, per la determinazione, l'impegno e la


perseveranza nel raggiungere questo obiettivo.

Questa tesi è il frutto del lavoro di molti, e ognuno di voi ha contribuito in modo
significativo al mio successo. Grazie di cuore.
INDICE:
INTRODUZIONE: LA SFIDA........................................................................... 4
Cap. 1 – COME TUTTO È INIZIATO.............................................................. 6
1.1 – Billy Beane, un’icona nel mondo del baseball ............................. 6
1.2 – Bill James e la sabermetrica ........................................................... 10
Cap. 2 – UNO SGUARDO AL MONDO DEL CALCIO ............................ 16
2.1 – Brentford & Midtjylland: due facce della stessa medaglia ...... 16
2.2 – Il Milan di Gerry Cardinale ........................................................... 23
2.3 – La sfida ............................................................................................... 28
Cap. 3 – DATASET ............................................................................................ 33
3.1 – Itinerario: dall’idea alla creazione .................................................... 33
3.2 – Metriche ................................................................................................. 37
Cap. 4– IL PROGETTO ..................................................................................... 44
4.1 – R: Analisi e discussione del dataset ................................................. 44
4.2 – Risultati ed analisi grafica .................................................................. 52
4.3 – Il modello predittivo ........................................................................... 65
CONCLUSIONI ................................................................................................. 70
BIBLIOGRAFIA: ................................................................................................ 71

2
3
INTRODUZIONE: LA SFIDA

Il mondo dello sport è un ambiente ricco (e a volte anche saturo) di


informazioni che aspettano solamente di essere colte, analizzate... Sono
sotto gli occhi di tutti ma non sempre vengono sfruttate efficacemente.

La presente tesi si propone di affrontare un tema molto caro all’ambito


sportivo americano ma ancora parzialmente sconosciuto al grande pubblico
europeo, un concetto originariamente applicato al baseball e ora diffuso in
varie discipline sportive, un’idea che da qui a pochi anni rivoluzionerà
anche il settore sportivo a cui questa tesi fa riferimento: il fenomeno
“Moneyball” applicato al mondo calcistico. 1

Il problema centrale affrontato da questa ricerca riguarda lo scovare


“talenti” che quotidianamente non vengono valutati come tali per le più
disparate ragioni. Individuare quei giocatori che (dati alla mano) incidono
notevolmente sul dinamismo del gioco della squadra per cui lavorano ma
che, nonostante ciò, non vengono valutati, monetariamente parlando, alla
stregua di “giocatori TOP” della stessa lega. Ci si soffermerà dunque a
valutare tutti i possibili profili calcistici che vengono sottostimati sia a livello
di prestazioni sia a livello monetario e che quindi possono risultare, a un
plausibile futuro acquirente, come un vero e proprio affare.

La ricerca si basa sull’impiego di statistiche descrittive inerenti al


campionato di Serie A durante le annate 2021/2022 e 2022/2023. 2 I dati
raccolti prendono in considerazione tutti quei giocatori che hanno avuto
“movimenti” durante la sessione di mercato estiva a cavallo tra l’annata
2021/2022 e 2022/2023. Tutti i valori utilizzati sono stati presi da Fbref e
Transfermarkt.3

Si ricorda inoltre che questo lavoro si concentra esclusivamente sul


campionato di Serie A e riguarda unicamente i dati delle due passate
stagioni calcistiche a causa dell’innumerevole mole di dati che si è dovuto,
scaricare, analizzare e trasformare. La tesi verte, infatti, su un database
creato “ad hoc” contenente circa 26.400 valori. Oltre a ciò, i dati riguardanti
il valore di mercato dei singoli giocatori sono stati raccolti il 23/03/2023,
ottenendo perciò un’immagine di quel determinato periodo temporale.

1 Lewis, «Moneyball_The Art of Winning an Unfair Game.pdf».


2 I dati sono stati raccolti in data 23/03/2023. Si tengono quindi in considerazione le partite
fino al 19/03/2023
3 «Statistiche e storia del calcio»; «Calcio e Mercato».

4
Eventuali alterazioni di prezzo, successivamente alla data sopra citata, non
vengono prese in considerazione da questa ricerca.

Si esploreranno le origini del concetto partendo dal suo primo utilizzo nel
mondo del baseball, si proseguirà analizzando alcuni esempi pionieristici
del concetto Moneyball nel mondo calcistico europeo, per poi approdare
nella vera e propria analisi e ricerca riguardante il campionato italiano. Qui,
infine, si analizzeranno i dati raccolti precedentemente scovando i giocatori
che risultano essere competitivamente vantaggiosi.

Questa ricerca risulta essere di estrema attualità. Il tema affrontato, già di


per sé innovativo dal punto di vista economico europeo, è quasi del tutto
unico nel suo genere e immette un concetto prettamente americano
all’interno del “Bel Paese”. Lo studio verte sull’immaginare i giocatori di
serie A come dei veri e propri “asset monetari”. Il “Calciomercato” da loro
un determinato valore che, a causa di innumerevoli casistiche, non sempre
rispecchia correttamente il talento del giocatore. Entra qui in gioco il
modello proposto da questa tesi che, sfruttando incertezza e volatilità del
valore degli “asset”, individua, facendo riferimento alle prestazioni storiche
degli ultimi due anni, un valore “ideale” che rappresenta al meglio il
potenziale dei giocatori. I risultati ottenuti potrebbero quindi informare
dirigenti sportivi, allenatori e studiosi su come sfruttare l'analisi dei dati per
prendere decisioni più informate durante l’acquisto di giocatori durante le
sessioni di mercato.

5
Cap. 1 – COME TUTTO È INIZIATO

Il capitolo iniziale pone le sue fondamenta sull’idea che una ricerca, un


lavoro, ma anche, banalmente, un racconto, per essere più accattivanti e
meglio recepibili al lettore/ascoltatore, devono aver l’incipit del proprio
pensiero in una biografia accattivante e che faccia emozionare il pubblico a
cui si riferisce. Per questo motivo voglio provare a scaldare l’animo di Voi
lettori partendo da una storia alquanto romantica, sperando che possa
rapirvi e trasportarvi lungo tutta la lettura di questa tesi di laurea.

Partiremo dando un’occhiata al “padre fondatore” della teoria cardine di


questo lavoro, colui che per primo ha coniato il termine che verrà più e più
volte utilizzato lungo l’intera stesura di questo testo, per poi approfondire
l’argomento analizzando l’evoluzione della formula lungo questi anni.

1.1 – Billy Beane, un’icona nel mondo del baseball

“Whom the Gods wish to destroy, they first call promising.“ 4

William Lamar Beane III, meglio noto come Billy, è un ex-giocatore


professionista di baseball la cui carriera da esterno non è mai veramente
sbocciata. Nonostante ciò, è comunque riuscito ad incidere
indissolubilmente il modo di vedere il gioco del baseball.
Si è diplomato alla Mount Carmel High School di San Diego, California,
all’età di diciotto anni per poi venir selezionato come 23° durante il draft
amatoriale del 1980 dei New York Mets.
Si apre qui una piccola parentesi per capire meglio il sistema di draft
amatoriale nel baseball. Questo è un processo attraverso il quale le squadre
della “Major League Baseball (MLB)” selezionano i giocatori provenienti
dal baseball amatoriale per arricchire le loro organizzazioni. È un sistema
di reclutamento di giovani che consente alle squadre di scegliere i migliori
talenti provenienti da università, licei e leghe giovanili e svilupparli
attraverso il loro sistema delle “minor league”. Quali sono le caratteristiche
fondamentali che un recruiter cerca in una giovane promessa? Michael
Lewis nel suo best seller “Moneyball: The Art of Winning an Unfair Game
(2003)” scriveva: “The scouts actually carried around checklists. "Tools" is what

4Connol, «Enemies of Promise (1938), Part 2: The Charlock’s Shade, Ch. 13: The Poppies
(p. 109-110)».

6
they called the talents they were checking for in a kid. There were five tools: the
abilities to run, throw, field, hit, and hit with power “. I recruiters creavano perciò
un “radar chart” in cui ogni giovane promessa veniva valutata secondo le
caratteristiche fondamentali sopra citate. Billy le possedeva tutte e cinque.
Viene selezionato come una delle migliori giovani promesse del baseball di
quegli anni. Era un predestinato il cui futuro era già stato scritto, un ragazzo
il quale avvenire era sicuramente florido… Il destino invece non aveva
programmato il futuro del ragazzo come superstar del diamante. Come
spesso accade, il continuo osannar il talento da parte dei mass media, ha
reso Billy schiavo dello stesso, ponendo sopra di lui un’enorme spada di
Damocle pronta a trafiggerlo ogni qualvolta non fosse riuscito a dimostrare
il suo potenziale. 5
Giocherà inizialmente nei New York Mets per poi passare ad altre squadre
di “MLB” e terminare la carriera da giocatore professionista agli Oakland
Athletics nel 1990. Un giocatore su cui vi erano grandissime aspettative ma
che si è palesato come unicamente mediocre. Il destino non era stato
certamente benevolo con lui, o forse serbava ancora qualcosa?
Nel momento in cui sembrava che il sipario stesse calando su un altro
giocatore qualunque che era stato “divorato dall’hype” dei mass media,
ecco che nella stessa squadra in cui aveva terminato la carriera, gli viene
proposto di diventare a sua volta talent scout. Ruolo abbastanza ironico
considerando l’esperienza avuta in passato proprio con i recruiter, ma,
nonostante ciò, Beane accetta di entrare all’interno della struttura
manageriale della squadra. Corre l’anno 1998, Billy dopo ben otto anni di
servizio viene promosso a “General Manager” degli Oakland Athletics.
La svolta definitiva nella carriera di Beane e di conseguenza ciò che ci ha
portato a leggere di questo pioniere del baseball avviene nell’estate del 2001.
Gli Athletics avevano un budget molto limitato rispetto ad alcune delle
squadre più ricche della “MLB”, una caratteristica oramai distintiva del club
che ogni anno gravava sempre più sulla solidità dello stesso. Questo ha
costretto Billy a cercare modi sempre più innovativi per riuscire a competere
alla pari con squadre che erano dei colossi finanziari. Si trattava di una vera
e propria lotta tra Davide e Golia.
Si era messo in testa che applicare l'analisi statistica avanzata nel baseball
fosse un ottimo modo per cercare di ovviare al problema monetario della
società. Entra qui in gioco Sandy Arrelson, l’allora direttore generale degli
Athletics, che una volta scoperto l’interessamento e il tentativo di approccio
di Billy verso il mondo della statistica, gli ha suggerito di recuperare i, fino
ad allora esigui, lavori di Paul DePodesta, un neolaureato ad Harvard che

5 Cicerone, «Tusculanae disputationes (libro V, capitoli 61-62),(45 a.C.)».

7
aveva da poco svolto alcune presentazioni riguardanti l’analisi statistica
avanzata. Questo suggerimento convince sempre più Billy che la statistica
potesse essere in connubio perfetto con il mondo del baseball.
Beane inizia perciò a collaborare con DePodesta. I due entrano subito in
sintonia e cominciano passo a passo a rivoluzionare il modo in cui, fino ad
allora, si interpretava il baseball.
Si affidano unicamente ai dati. Escludono completamente il tradizionale
modo di vedere i “Tools” di un giocatore. Sanno benissimo che, se avessero
voluto fare ciò che prima di loro nessuno aveva mai compiuto, avrebbero
dovuto ottenere informazioni “per vie traverse”. Vogliono “vedere ciò che
gli altri, pur avendolo sotto il naso, non riuscivano a scovare”. Iniziano a
mettere in discussione le valutazioni tradizionali dei giocatori, tenendo in
gran considerazione i lavori statistici di Bill James. 6 Cominciano così a
cercare nuovi modi per estrapolare informazioni dai dati che possedevano,
bypassando statistiche comuni come media battuta e vittorie. Il punto focale
del loro lavoro risiede nell’idea che i giocatori che devono selezionare
vengono comprati non per il mero gusto di dover comprare un giocatore
durante il draft, o per sostituire grossolanamente un battitore, o un
lanciatore venduto nella finestra di mercato precedente, ma per comprare
vittorie. Un giocatore di baseball viene comprato per ottenere vittorie.
Comprare vittorie vuol dire comprare punti. I manager di Oakland si
chiedono quale sia, statisticamente parlando, il metodo migliore per far
punti durante una partita di baseball. Convergono sulla risposta: “base on
ball”.
Cos’è una “base on ball”? Comprende tutte quelle basi che un battitore
ottiene quando il lanciatore effettua quattro lanci in zona non valida di
strike; il battitore evita quindi di mettere in gioco la palla con una battuta e
al tempo stesso di venire eliminato con uno strikeout. 7
Una “base on ball” ha un apporto neutro rispetto alla media battuta del
battitore, ma è valida e migliora la sua percentuale di arrivi in base senza
rischiare colpi inutili. I corridori in base rappresentano opportunità per
segnare punti. È statisticamente vantaggioso puntare su giocatori che hanno
caratteristiche molto buone su questo fondamentale.
Si inizia quindi a virare verso uno stile di gioco meramente propenso alla
vittoria e non curante dei preziosismi legati allo spettacolo dato dal gioco
stesso. Sta nascendo il “Moneyball”.

6James, «The Bill James Baseball Abstracts (1977)».


7Uno strikeout avviene quando il giocatore in battuta subisce tre strike sul proprio conto,
venendo direttamente eliminato dal lanciatore.

8
Altro punto cardine fondamentale del lavoro svolto da Billy e Paul risiede
nel fatto che i giocatori selezionati venivano scelti in base, sia alle
caratteristiche tecnico-statistiche, sia in relazione al budget molto esiguo
dato dal club per cui lavoravano. Dovevano scovare talenti a prezzi
stracciati. L’etimologia della parola Moneyball rispecchia benissimo questo
concetto. Il termine è infatti suddivisibile in due parti:
- “Money”: riassume in modo esaustivo i limiti finanziari che il club
stava affrontando in quel momento storico.
- “Ball”: Abbreviazione di baseball che indica il componente tecnico-
statistico che deve essere perseguito.
Come potevano trovare giocatori promettenti e prenderli ad un prezzo
esiguo rispetto al loro potenziale? È vero il fatto che le statistiche avanzate
utilizzate permettevano di avere un vantaggio competitivo sui giocatori, ma
un ragazzo bravo in un determinato “tool” era comunque visibile ad altre
squadre. Cosa mancava per rendere a tutti gli effetti la strategia Moneyball
un metodo vincente?
Beane e DePodesta decisero di prendere in considerazione tutti quei giovani
talenti che per un motivo o per un altro venivano visti male, tralasciati o
persino scartati in partenza dalle altre squadre. Si guardi per esempio a
Scott Hatteberg, virtuoso lanciatore dei Boston Red Sox che nella sua ultima
stagione con i giganti del Massachusetss si era rotto un nervo del gomito e
strappato una capsula articolare. Un giocatore che per molti aveva “appeso
le scarpe al chiodo” si rivelò un punto cardine del sistema di gioco degli
Athletics. Come avrebbe potuto incidere nonostante l’infortunio?
Semplicemente cambiandolo di ruolo: portandolo in prima base e
utilizzandolo per far punti tramite la “base on ball” sopra citata. La coppia
di Oakland aveva infatti scoperto che Hatteberg aveva un’altissima
percentuale in base correlata ai punti segnati durante un game.
Oppure si guardi a David Justice, battitore esterno vincitore del premio
“Most Valuable Player” della Championship series del 2000 con i New York
Yankees, che a causa di un persistente infortunio all’inguine e alla sua età
avanzata aveva visto calare drasticamente la sua produzione (in termini di
battute). Anche per questo giocatore la squadra di Oakland aveva stimato
che, nonostante la vecchiaia, era comunque in grado di raggiungere la base
con un’alta percentuale. Il suo apporto alla squadra ha inoltre portato
esperienza e fiducia all’interno dello spogliatoio, consolidando di fatto i
giocatori “assemblati” durante la sessione di mercato.
Questi sono solo due dei numerosi giocatori comprati da Billy e Paul in quel
primo rivoluzionario anno di utilizzo della formula “Moneyball”.
Un altro fattore che ha inizialmente giovato alla buona riuscita della
strategia è il fatto che questa era completamente sconosciuta ai competitors.

9
Durante il draft, infatti, gli altri dirigenti delle squadre di MLB schernivano
e non si capacitavano delle scelte prese da Billy e Paul, rendendo di fatto il
mercato molto più semplice per i nostri pionieri.
Finita la sessione di mercato mancava solo una cosa da fare: provare a tutti
quanto si fossero sbagliati nel sottovalutare gli Athletics.
Quello stesso anno la squadra di Oaklands vinse 102 sulle 162 partite
stagionali, vedendosi sfuggire per un soffio il primo posto della “American
League West”, vinta invece dai Seattle Mariners che quell’anno fecero
record di vittorie. Si sono qualificati ai playoff come “wild card team”
venendo però eliminati dai New York Yankees.
Questo risultato è stato estremamente importante per capire che il lavoro
svolto fino ad allora stava iniziando a dare i suoi frutti. Nonostante nessuno
credesse in loro, Billy e Paul erano riusciti a risollevare una società che stava
affondando. Sono riusciti a portare la squadra con il secondo minor budget
della MLB ai playoff della World Series. Per fare un paragone più vicino ai
lettori italiani, è come se quest’anno il Cagliari Calcio si qualificasse alla
Champions League dell’anno prossimo…
I successi ottenuti dai due manager risuoneranno a gran voce in tutto il
mondo del baseball portando, negli anni, ogni singola altra squadra di MLB
ad “attrezzarsi” e a sfruttare il sistema Moneyball.
L'eredità di Billy Beane non si ferma però al singolo mondo del baseball. La
sua storia, diventata famosa al grande pubblico anche grazie al bestseller di
Michael Lewis “Moneyball: The Art of Winning an Unfair Game” e alla
trasposizione cinematografica di Bennett Miller, ha ispirato e cambiato
anche il sistema di gioco di numerosi altri sport, tra cui Basket, Football
Americano e Hockey su ghiaccio. Il lavoro svolto da Billy e Paul ha
completamente cambiato, rinnovato e migliorato l’approccio di tutto il
mondo sportivo e per questo motivo sono entrati di diritto nella storia dello
sport.

1.2 – Bill James e la sabermetrica

Nel paragrafo precedente si è fatto riferimento a Bill James, accennando a


come Billy e Paul tenessero in grande considerazione i lavori pubblicati da
quest’uomo. I testi scritti da James sono stati la base su cui si è poggiato
tutto il pensiero innovativo dei due manager californiani.
In questo paragrafo si vuole dar credito al “pioniere della sabermetrica”,
capire brevemente il suo retaggio culturale e comprendere perché sia stato
così rilevante per la buona riuscita del sistema Moneyball.
George William James, meglio conosciuto con il nome di Bill, è nato nel 1949
a Holton, Kansas. Fin da piccolo respira e vive il mondo del baseball. È un

10
appassionato del diamante che passa le giornate consumando sul campo il
suo guantone di pelle.

In un articolo per il giornale online “Gioco Pulito”, Alberto Calò condivide


un aneddoto molto interessante riguardante un Bill James ancora
adolescente. Una sera, mentre guardava una partita dei ”Dodgers”, Bill
rimase perplesso a causa di un episodio avvenuto sul terreno di gioco.
L’allora prima base Wes Parker, difensore fenomenale ma battitore dalle
basse percentuali, aveva appena salvato la partita grazie ad un miracoloso
intervento. Nonostante l’eclatante gesto tecnico i ”Dodgers” misero Parker
in panchina per far spazio ad un battitore con percentuali migliori.
Bill rimase interdetto. Perché mettere in panchina un giocatore che ha
appena salvato la partita con un’azione difensiva straordinaria e al suo
posto far entrare un battitore con una media di battuta più elevata? Perché
la difesa all’interno del game non era vista alla stregua della fase offensiva?
Colpito da questo singolare episodio prova a scrivere a “The Sporting
News” il suo punto di vista, ma non viene ascoltato. 8
Bill nota per la prima volta che c’è qualcosa oltre al mero gioco fisico nel
baseball, ma decide di accantonare temporaneamente questo pensiero per
percorrere la via degli studi. Frequenta l’Università del Kansas, dove si
laurea in Psicologia e Inglese. Passerà un breve periodo nell’esercito per poi
ritrovarsi a lavorare come guardia notturna presso la “Stokely-Van Camp”,
una fabbrica che produce maiale e fagioli in latta.
Durante questo periodo lavorativo pensa nuovamente all’episodio dei
Dodgers avvenuto qualche anno prima, e si convince di perseguire la via
della scrittura. Invia numerosi articoli statistici a “The Sporting News”.
Questa volta il giornale risponde.
Bill inizia a scrivere sempre più pezzi e pensieri riguardanti il mondo del
baseball, tutti prettamente comprovati da analisi statistiche. Il suo modo di
vedere le cose prettamente analitico e privo di mezzi termini, da un lato è
innovativo e colpisce i lettori amanti di dati, dall’altro non convince
completamente gli editori che reputano i suoi lavori troppo diversi dagli
standard di scrittura dell’epoca.
James decide di autopubblicare le sue analisi a partire dal 1977 in un libro
annuale intitolato “The Bill James Baseball Abstract” così da poter ampliare
il suo pubblico.
Max Marchi, in un’intervista del 2016 a “L’Ultimo Uomo”, condivide un
aneddoto interessante riguardo a Bill James: “Le sue prime raccolte di dati,
chiamate Baseball Abstract, le spediva direttamente lui a casa di coloro che si erano
mostrati interessati, da lì in poi arrivarono gli accordi con le case editrici. Fu uno

8 Calò, «I rivoluzionari dello Sport».

11
dei primi a pensare a cosa realmente portasse punti a una squadra andando oltre
alla media battuta. Fu uno dei primi a cercare una risposta alla domanda “cosa devo
fare per vincere una partita in più?””.9 Il lavoro di James inizia ad ottenere i
primi riconoscimenti. Pubblicherà negli anni successivi ulteriori libri in cui
discute in modo innovativo le statistiche avanzate utilizzate nel mondo del
baseball. I suoi scritti ottengono un successo via via sempre maggiore,
rendendo di fatto, Bill James uno dei pochi scrittori che “mangiano”
statistica a raggiungere il pubblico di massa.
Era appena nata la sabermetrica. Il termine è una parola composta da
“SABR”, acronimo di Society for American Baseball Research, e “metrics”, tutte
quelle misure e metriche utilizzate nell'analisi statistica avanzata. La
sabermetrica è una branca dell'analisi statistica avanzata che si concentra
sull'applicazione di metodi statistici e analitici per studiare e valutare le
prestazioni dei giocatori e delle squadre nel baseball.

Si prendono ora in considerazione alcune delle innovative formule


statistiche create da Bill James, così da poter comprendere meglio il motivo
di alcune scelte riguardanti i dati che si utilizzeranno nei capitoli successivi.
Per poter svolgere e applicare al meglio la filosofia Moneyball all’interno
del mondo calcistico si è voluto prendere in considerazione il lavoro svolto
da uno dei padri fondatori della statistica nel mondo del baseball. Tutte le
informazioni riguardanti le metriche del baseball che da qui in poi si
affronteranno sono state prese dal sito ufficiale della MLB e da Baseball
Reference. 10

Una delle formule più importanti introdotte da Bill James è quella


riguardante i Runs Created. Corrispondono ai punti che ogni singolo
giocatore contribuisce a realizzare. Questa metrica nasce dal bisogno di
fornire più informazioni riguardanti “l’offensività” di un giocatore rispetto
alla semplice e fino ad allora utilizzata “media battuta”. La formula creata
da Bill è scritta come:
(𝐻𝐻 + 𝐵𝐵𝐵𝐵) ∗ 𝑇𝑇𝑇𝑇
𝑅𝑅𝑅𝑅 =
𝐴𝐴𝐴𝐴 + 𝐵𝐵𝐵𝐵
Dove la somma di hits (H) e base on ball (BB) divisa per la somma di at bats
(AB) e base on ball (BB), può essere riassunta come On-Base Percentage (OBP).
Per hits si intendono tutte quelle volte che il battitore raggiunge la prima
base dopo aver colpito la palla lanciata dalla squadra difendente. Base on
ball indica invece quando il battitore raggiunge la prima base perché il

9«Baseball, sabermetrica e altri pianeti».


10«MLB Stats, Scores, History, & Records»; «MLB.com | Il sito ufficiale della Major
League Baseball».

12
lanciatore ha effettuato quattro lanci consecutivi in zona non valida di
strike. At bat è semplicemente il turno di un battitore che affronta un lancia-
tore.
L'OBP è tutt’ora una delle metriche più utilizzate in MLB perché fornisce
una valutazione diretta della capacità di un battitore di mantenere la pres-
sione sulla difesa avversaria e di contribuire alle opportunità di segnare
punti per la sua squadra.
Sapendo inoltre che la Slugging Average (SLG), metrica indicante la potenza
con cui un giocatore batte la palla, è data da Total Bases (TB), numero di basi
guadagnate da un battitore con i colpi, rispetto ad AB, la formula può anche
essere scritta come :

RC = OBP * SLG * AB

I "Runs Created" risultano essere uno dei primi tentativi che riesce concre-
tamente a identificare il contributo di un giocatore al successo della squa-
dra. Bill è riuscito a creare una metrica talmente innovativa per l’epoca da
renderla una pietra miliare lungo il percorso della sabermetrica.

Per citare un’altra formula di peso indiscusso introdotta da James, si può


far riferimento al Range Factor (RF).
Questa metrica viene utilizzata per valutare ogni qualsivoglia prestazione
difensiva all’interno del campo interno del diamante. È determinata divi-
dendo la somma dei putout (PO) e degli Assist (A) di un difensore per il
numero totale di game difensivi giocati (Innings):
𝑃𝑃𝑃𝑃 + 𝐴𝐴
𝑅𝑅𝑅𝑅 =
𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼

Un putout avviene quando un difensore elimina direttamente un battitore o


prendendo al volo la palla colpita dal battitore, o toccando una base, o toc-
cando direttamente il battitore. Un Assist viene accreditato a qualsivoglia
difensore tocchi la palla prima di un out (ci possono essere più assistmen).

Di recente la formula si è evoluta per poter differenziare l’RF di chi gioca


un singolo inning da chi invece affronta l’intera partita. Per fare ciò è bastato
moltiplicare la metrica per 9, numero indicante quanti inning una squadra
di baseball gioca all’interno di un game.

Altra metrica incisiva introdotta dai lavori di Bill, nata principalmente a


causa dell’assurdo squilibrio esistente tra azioni offensive e difensive osser-
vato nel sopracitato episodio dei Dodgers, è il Defensive Efficiency Ratio

13
(DER). L’idea dietro questa formula consiste nel cercare di trovare quanto
un giocatore contribuisce difensivamente all’interno della propria squadra.
Indica quanta percentuale vi è che le palle messe in gioco vengano conver-
tite in out dalla difesa di una squadra.
Si calcola facendo:
𝐻𝐻 + 𝑅𝑅𝑅𝑅𝑅𝑅 − 𝐻𝐻𝐻𝐻
𝐷𝐷𝐷𝐷𝐷𝐷 = 1 −
𝑃𝑃𝑃𝑃 − 𝐾𝐾 − 𝐵𝐵𝐵𝐵 − 𝐻𝐻𝐻𝐻𝐻𝐻 − 𝐻𝐻𝐻𝐻
Dove il valore 1 rappresenta la totalità dei battitori affrontati; l’acronimo
ROE, reached on error, indica tutte quelle volte che il battitore raggiunge base
a causa dell’errore di un lanciatore; gli HR, home run, avvengono quando il
battitore colpisce la palla spedendola oltre il perimetro del terreno di gioco;
PA, plate appearance, misura quando un battitore completa un turno di bat-
tuta; K, strike out, si ottiene quando il giocatore in battuta viene eliminato a
seguito del terzo strike ricevuto; infine l’hit by pitch o HBP indica quando
viene automaticamente assegnata la prima base al battitore poiché viene
colpito dalla palla tirata dal lanciatore senza che muova la mazza.

Diamo infine un’occhiata alla formula pitagorica di Bill, nota come Pythago-
rean Expectation. La metrica è volta a stabilire il numero di partite che una
squadra, tenendo conto dei punti segnati e subiti dalla stessa, dovrebbe vin-
cere durante il campionato. Si calcola facendo:

𝑅𝑅 2
W= 2
𝑅𝑅 + 𝑅𝑅𝐴𝐴2
Dove R indica i runs scored, mentre RA i runs allowed. La formula è partico-
larmente utile per creare un quadro generale sull’aspettativa di uno speci-
fico club durante la stagione. Essa permette di vedere più precisamente
quale sarà l’andamento più probabile per la squadra. La formula sopra de-
scritta è abbastanza rudimentale e possiede un leggerissimo deficit di pre-
cisone, nonostante ciò, considerando l’epoca e il fatto che sia stata “creata
da zero”, è particolarmente efficace.

Grazie a queste innovative metriche Billy Beane e Paul DePodesta sono riu-
sciti a creare una solida base su cui sviluppare il proprio lavoro. Le formule
sviluppate da Bill unite ai dati utilizzati dai due manager hanno reso visibili
metriche e risultati che hanno fatto la fortuna della filosofia Moneyball nel
mondo del baseball. Si è perciò voluto analizzare l’innovativo lavoro di Bill
James così da poter approfondire il processo cognitivo sviluppato per ogni
singola formula creata. Durante la lettura di questa tesi si prenderanno

14
come esempio sia il processo di sviluppo con cui Billy e Paul hanno realiz-
zato la filosofia Moneyball, sia le metriche introdotte da Bill, così da poterli
trasporre come solida base su cui creare l’analisi calcistica.

Nonostante James abbia sviluppato le formule sopra riportate ben cin-


quant’anni fa, queste risultano comunque essere di estrema attualità e in
grado di influenzare il pensiero, lo studio ed il lavoro di numerosi appas-
sionati del diamante, e più in generale, dello sport.

15
Cap. 2 – UNO SGUARDO AL MONDO DEL CALCIO

Durante le iniziali fasi di ricerca per la stesura di questa tesi, sono incappato
in diversi interessanti articoli riguardanti il motivo del perché non si fosse
ancora diffuso in modo esponenziale il concetto Moneyball nel mondo del
calcio. Solo negli ultimi mesi, soprattutto in Italia, si è cominciato a parlare
sempre più della teoria che ha fatto così tanta fortuna sul suolo americano.
Questo è dovuto, in parte, al clamore causato dal licenziamento dei direttori
tecnico e sportivo del Milan.

In questo capitolo si vuol dunque virare l’attenzione di Voi lettori sul


mondo del calcio. Inizialmente si osserverà come la sabermetrica si è pla-
smata nel sistema calcistico Europeo, in seguito si punterà la lente d’ingran-
dimento all’interno del massimo campionato italiano, in particolar modo
sui recenti avvenimenti in casa Milan ed infine si inizierà ad approfondire
il lavoro svolto a livello empirico riguardante il concetto Moneyball in Serie
A.

2.1 – Brentford & Midtjylland: due facce della stessa medaglia

Si porti ora l’attenzione dei lettori ad una realtà completamente diversa da


quella sportiva del diamante ma comunque strettamente correlata. Si viri il
pensiero in Europa e più precisamente in uno sport completamente diverso
dal Baseball. Il mondo del calcio.
Si vuole capire il motivo del perché il sistema Moneyball, divenuto
estremamente popolare negli Stati Uniti, non sia esploso allo stesso modo
nel vecchio continente.

Il concetto cardine del Moneyball risiede nel fatto che una squadra sportiva,
che possiede un budget limitato, deve sfruttare al massimo dati, analisi ed
informazioni sui propri giocatori per poter creare una squadra stabile e
competitiva con cui affrontare il campionato di appartenenza.
Questa filosofia non prende in considerazione concezioni comuni,
informazioni o idee riguardanti i giocatori che potrebbero in qualche modo
sviare e creare un bias durante il processo decisionale. Ogni singola azione
e decisione viene presa consultando unicamente i dati. Scompare dunque la
componente umana degli atleti e si evidenzia unicamente la potenzialità
agonistica degli stessi. In questo modo si riesce a creare un ambiente in cui
tutti i giocatori riescono a performare e rendere il massimo aumentando di
conseguenza il loro valore di mercato.

16
Questo concetto, basato prettamente su dati, statistiche e numeri, non ha
mai realmente convinto il popolo europeo. Dal momento in cui la “formula
delle meraviglie” è risultata essere efficace ed efficiente in ambito sportivo,
passano circa una decina di anni prima che venga embrionalmente
importata all’interno del mondo calcistico. Non che non vi sia mai stato
interesse da parte dei club o manager sportivi europei nell’utilizzare
statistiche per migliorare il rendimento della propria squadra, ma il
concetto di Moneyball è sempre risultato essere troppo lontano dall’idea
generale dello “sport più bello del mondo”.
Il calcio, sport principale europeo e non solo, è definito da molti come un
gioco in cui prevalgono passione, istinto e cuore rispetto ai freddi numeri
dati dalle statistiche. Ne è da esempio Walter Sabatini, ex dirigente di Roma
e Salernitana, che si è sempre espresso contrario a questo modo di veder lo
sport. Durante la conferenza stampa d’addio da Ds della Roma diceva:<< Il
presidente e i suoi collaboratori, giustamente, puntano su altre prerogative, stanno
cercando un algoritmo vincente, io vivo dentro il mio istinto, non vedo il pallone
come un oggetto sferoidale, per me la palla è qualcosa, vivo il mio calcio, un calcio
che non può essere freddamente riportato alla statistica che descrive un giocatore>>.
Si aggiunge pure che questo sport non è incentrato, come nel baseball,
prettamente sul singolo individuo ma è “un grande motore che per
funzionare al meglio ha bisogno di tutti i suoi componenti e che essi siano
al proprio posto e svolgano bene il loro compito”. È un gioco di squadra.
Per parecchi anni si è generalmente pensato che le metriche utilizzate
oltreoceano sarebbero state troppo basilari e avrebbero inciso in modo
irrisorio in un sistema complesso come il calcio. Le differenze culturali e
strutturali tra i due sport erano insormontabili, almeno fino al 12 giugno del
2012.

In tale data Matthew Benham, ex vicepresidente della “Bank of America


Corporation” nonché fondatore di “Smartodds”, società specializzata
nell'analisi di dati e nelle previsioni statistiche applicate al settore delle
scommesse sportive, viene reso azionista di maggioranza all’interno del
club che tifava sin da bambino: il Brentford Football Club.
Il businessman britannico aveva già nel 2009 “toccato con mano” la delicata
situazione che l’amato club stava passando. Da quel primo momento
Matthew decide di investire ogni anno circa 700mila sterline per cercare di
risanare il club londinese. Le “api del West London” vivevano da decenni
una continua situazione di crisi all’interno del club: militavano

17
perennemente tra terza e quarta serie e avevano rischiato molteplici volte il
fallimento. 11
Il Brentford si trovava senza soldi a dover affrontare una campagna acquisti
volta a stabilizzare, migliorare e potenziare la squadra, con l’obiettivo
ultimo di rendere competitivo il club. Tutte le decisioni sotto la guida di
Benham venivano prese in riferimento alle metriche analitico-statistiche
riguardanti prestazioni e partite, in modo tale da sfruttare dati che fino ad
allora pochi riuscivano ad utilizzare al meglio. La filosofia appena descritta,
nonché il “modus operandi” di Matthew ricorda molto il credo del pioniere
del baseball Billy Beane di cui si è scritto nel capitolo precedente.
Nonostante non vi sia mai stato un vero e proprio collegamento diretto, i
due sembrano essere “sintonizzati sulla stessa onda”. Per questo motivo
moltissime persone hanno iniziato a far riferimento al progetto di Matthew
interpellandolo come “moneyball calcistico”.

Dal momento in cui Benham rilevò la squadra la situazione all’interno del


club cambiò radicalmente. Matthew credeva fermamente nell’utilizzo dei
dati e delle statistiche e riteneva fossero una valida soluzione ai problemi
che si era prefissato di risolvere. Si era in passato già affidato a metriche di
questo genere, in particolare quando aveva fondato Smartodds, e per
questo motivo era pienamente convinto dei propri mezzi. In particolare, fu
uno dei primi a vedere il potenziale degli “expected goals”, rendendoli la
struttura cardine attorno al quale risollevare l’amato club.

Altra figura di notevole peso all’interno del sistema Brantford è Rasmus


Ankersen, uno scrittore e grande appassionato di statistica di Herning,
Danimarca. Dopo aver letto alcuni dei suoi libri inerenti alle statistiche del
calcio, Benham si convince che Ankersen sia l’uomo giusto per raggiungere
l’obiettivo che si è prefissato. Uno dei punti fondamentali del pensiero del
danese che verranno importati nel sistema Brentford è come migliorare la
performance della squadra quando deve avere a che fare con palle inattive.
La collaborazione inizia grazie alla volontà di Matthew di coinvolgerlo nel
progetto, con un primo incontro così descritto dal diretto interessato: << Gli
chiesi quali risultati si aspettasse per la stagione. La sua risposta mi spiazzò
completamente. Mi disse che al momento c’era il 43,3% di possibilità di essere
promossi nella divisione superiore.>> 12 Questo modo così cinico e metodico di

11 I tifosi del Brentford F:C: vengono chiamati “Bees” a causa dello storico logo
rappresentante un’ape.
12 Fabbro, «Rasmus Ankersen, l’ossessione per i numeri per vincere nel calcio».

18
vedere la realtà stuzzicò a tal punto l’animo dello scrittore che lo portò ad
accettare l’incarico. I due svilupparono sin da subito una chimica vincente.
Il Brentford inizia la sua ascesa. Riesce a salire di lega di anno in anno fino
a che, nell’annata 2020-2021, dopo ben 74 anni dall’ultima volta, i “Bees”
riescono nella storica impresa di tornare in Premier League. Il tutto,
riuscendo a tenere il budget devoluto agli acquisti di nuovi giocatori ai
minimi livelli per ogni categoria in cui partecipavano. Le “api di Londra” si
trovano tutt’ora in Premier League stanziate a circa metà classifica per il
terzo anno di fila. Il metodo Moneyball funziona.
Si faccia un passo indietro, nel 2014 Benham decide di emulare ciò che stava
facendo con il club londinese anche nella terra natia del suo “braccio
destro”. Compra il Football Club Midtjylland, squadra in cui da giovane lo
stesso Ankersen ha militato. Dall’acquisizione, gli “Ulvene”, i “Lupi”, hanno
conquistato per ben tre volte il titolo della Superliga, vinto per la prima
volta nella loro storia la supercoppa danese e centrato la qualificazione alla
Champions League sia nel 2016 che nel 2020.
Questi risultati confermano ulteriormente il valore del lavoro svolto da
Benham e Ankersen, ma cosa precisamente ha fatto sì che il loro modello
fosse così efficace in due differenti ambienti calcistici?

Come già precedentemente accennato uno dei punti cardine fondamentali


del lavoro svolto in territorio danese ed inglese è stato quello di sfruttare al
meglio la metrica degli xG, “Expected Goals”. Altri solidi punti nella
vincente ideologia riguardano i dati inerenti al Recruitment, alle palle
inattive e al settore giovanile delle squadre.
Si guardino ora più da vicino le
caratteristiche fondamentali che hanno Figura 1 S.P.A.M.
reso possibile il vantaggio competitivo
sopracitato.

Si inizi prendendo in considerazione la


metrica che più ha impattato il sistema
calcistico delle proprietà di Matthew
Benham: gli expected goals. Il primo
modello di xG è nato dalla mente di
Paul Riley a seguito di uno studio
condotto per valutare la reale
pericolosità di un tiro in base alla
posizione, lo Shot Position Average Quanti tiri sono mediamente necessari per
Model (S.P.A.M.). La metrica di Riley segnare un goal in Premier League

19
individua la probabilità che un tiro effettuato da un calciatore porti al goal,
prendendo in considerazione solamente i tiri effettuati nello specchio della
porta (Figura 1). 13 Componenti fondamentali nel modello di Riley sono la
distanza e l’angolo di tiro. Si suddivide il campo in 46 zone e si dividono i
tiri in tre categorie: su punizione, su rigore e su azione. Ogni zona e
posizione stabilisce un punteggio che indica la probabilità di segnare in
quella specifica area di campo.
Gli Expected Goals sono indicatori fondamentali per valutare la
performance di una squadra e dei suoi giocatori. Stabiliscono, tramite la
differenza tra gol realizzati e gol attesi se essa sia al di sotto o stia andando
oltre le aspettative. Il modello su cui si basa questa metrica cambia a
seconda delle variabili che si vogliono prendere in considerazione.
Quello utilizzato da Benham sfrutta sia gli xG come tali, sia gli Expected
Points (xP), metrica derivata dagli stessi xG. I “Bees” utilizzano gli xG sia a
livello di prestazioni, verificando quindi se c’è una discrepanza tra
l’effettivo contributo dato dal giocatore all’interno e fuori della partita, sia a
livello di scouting. Per fare un esempio, come analizzato da Nicola Santolini
in un articolo per sportallate.it, <<una squadra può vincere una partita 1-0 […]
contro una che spreca molte buone occasioni (alto livello di xG). […] I tre expected
points per il match verranno in gran parte assegnati a quella […] che aveva creato
più occasioni. Questi punti attesi […] vanno a comporre una classifica parallela a
quella reale>>. La classifica così creata riduce notevolmente il bias che poteva
essere generato da eventi casuali. È una valevole raccolta di dati che
verranno poi analizzati e utilizzati per stabilire le prestazioni effettive di
squadra e giocatori.

Le due statistiche sopra citate contribuiscono notevolmente anche nel


metodo di “Recruitment” che Benham e Ankersen hanno utilizzato.
Si prendano ad esempio due giocatori fittizi, creati solo per la spiegazione
di questo concetto alquanto semplificato: il calciatore A e B. Si ipotizzi che
A e B siano attaccanti, abbiano le stesse caratteristiche e abbiano giocato le
stesse partite. Durante la passata stagione il giocatore A ha segnato 15 goal
rispetto ai 10 predetti dagli xG, mentre il giocatore B, a causa di eventi
esterni, ne abbia segnati 3, sempre rispetto ai 10 predetti dagli xG. A causa
delle loro prestazioni nella passata stagione il valore di mercato di A
aumenterà, mentre quello di B diminuirà. Un qualsivoglia recruiter è
tradizionalmente portato a valutare il giocatore A come un potenziale
investimento fruttuoso per la propria squadra, quando in realtà non lo è. Il

13 Volpi, «L’INNOVAZIONE DEGLI EXPECTED GOALS».

20
giocatore B viene normalmente sottovalutato rispetto ad A a causa dei
“pochi goal segnati”, nonostante gli xG affermano che i due sono sullo
stesso livello. Il giocatore B è in realtà un investimento più saggio, che costa
meno di A e probabilmente più fruttuoso a causa della differenza tra xG e
G effettuati. Se fatto giocare nelle condizioni ideali il giocatore B nella
stagione successiva avrà un rendimento di dieci goal, aumentando perciò il
suo valore di mercato a fine campionato. Anche A, probabilmente segnerà
dieci goal nella stagione successiva, vedendo il suo rendimento calare
rispetto al campionato precedente. Si può quindi notare come vi sia una
valevole discrepanza tra dati che, per ipotesi, sono uguali. Allo stesso modo,
nella realtà, esistono discrepanze che portano a valutare i giocatori non per
quello che potrebbero realmente fruttare. Il metodo Brentford utilizza
questo bias a suo vantaggio.
L’esempio sopra riportato può essere applicato per ogni singola
caratteristica di qualsivoglia giocatore e, seppur banale, rispecchia ciò che
succede quotidianamente in club piccoli o medio piccoli quali per esempio
il Brentford. Si evidenziano i nomi di Andre Gram e Ollie Watkins che sono
stati comprati rispettivamente dal Louton per 620mila euro e dall’Exciter
per 7,2 Mln di euro per poi essere rivenduti per 12,4 Mln al Burnmay e per
34 Mln di euro all’Aston Villa. Il Brentford è riuscito ad utilizzare al meglio
il metodo sopracitato perché è strutturato per far performare nel modo
migliore i giocatori che vengono “selezionati”. Ogni singolo acquisto è
infatti mirato al miglioramento del club e funzionale alla squadra.

Apporto fondamentale che Rasmus Ankersen ha introdotto nel sistema


Brentford è il comportamento dei giocatori con le palle inattive. Come
riporta Mattia Fabbro, appena arrivato al club londinese, Ankersen ha fatto
capire allo staff della squadra che la percentuale di goal su palle inattive
poteva essere portata a circa il 20% se avessero migliorato il modo in cui si
approcciavano alla metrica. 14 Era quindi convinto si dovesse dare molto più
peso a questa statistica durante gli allenamenti, in modo da corroborare i
fondamentali e gli schemi derivati dalla gestione della palla e dalle
situazioni di gioco. Questo concetto è stato applicato anche all’altra squadra
comprata da Benham, il Midttjyland.
Fino al 2014 il club danese riusciva, in media, a segnare sei goal dalle
occasioni create su palla inattiva. Dal momento in cui i due businessman
hanno rivoluzionato i “lupi”, questo valore è aumentato di circa il 400%,
portando quindi le reti segnate a 25. Le tattiche sfruttate per far sì che questo

14 Fabbro, «Rasmus Ankersen, l’ossessione per i numeri per vincere nel calcio».

21
risultato fosse raggiungibile non sono ovviamente sempre le stesse. Ogni
singolo calcio piazzato è studiato, analizzato, applicato in allenamento e poi
in partita guardando sempre alle caratteristiche peculiari che la squadra
avversaria possiede. Se per esempio un club difende a zona, allora i
giocatori senza palla opteranno per movimenti rapidi per cercare di
disorientare gli avversari e spostare la “zona” in una posizione favorevole
per l’offensiva. Se invece la difesa piazzata è a uomo si cercheranno
movimenti ampi per avvolgere gli avversari e scardinare i giocatori che
marcano a uomo. Questi sono solo due delle molteplici tattiche che possono
essere utilizzate all’interno di una partita, ma fanno ben capire la
complessità derivata dall’analisi delle palle inattive.

Ultimo punto fondamentale che si vuole prendere in considerazione nel


sistema Brentford-Midttjyland è l’alquanto atipico utilizzo del settore
giovanile. Come riportato da ideacalcio.net le squadre del businessman
londinese , nel momento in cui sono state rilevate, si trovavano entrambe in
un momento di profonda crisi dovuta alle scelte gestionali degli anni
precedenti. 15 Tenendo in considerazione i costi derivati dal risanare la
proprietà e quelli dati dal settore giovanile (circa un milione e mezzo di
sterline devolute ogni anno per poter mantenere l’Academy), Benham ha
deciso di tagliare completamente i fondi per questo settore e reinvestire i
soldi così risparmiati. Il motivo di una scelta così drastica e apparentemente
controproducente è dovuto al fatto che il settore giovanile di una squadra
piccola o medio piccola in realtà non riesce quasi mai a “far fruttare” gli
investimenti effettuati per gestirla. I giovani talenti del vivaio vengono
periodicamente comprati da squadre di caratura maggiore rendendo quindi
vano il motivo stesso di “formare i calciatori da sé”. Arrivato a questa
conclusione ha perciò deciso di utilizzare i soldi risparmiati per assemblare
una “seconda squadra” di calciatori provenienti da altri club. Il gruppo così
formato aveva talenti di due tipi: coloro che erano stati scartati da club più
grandi del Brentofrd e gli stranieri desiderosi di entrare in club inglesi
minori. In questo modo i “Bees” sono riusciti ad assemblare un insieme
potenzialmente pronto per giocare in prima squadra, prelevando da club
maggiori numerosi talenti inespressi che erano stati scartati per motivi di
età.

Il metodo di approccio prettamente analitico riguardante metriche e dati


statistici apportato da Matthew Benham e Rasmus Ankersen è stato il primo

15Battilana, «L’ascesa del Brentford».

22
vero esempio di filosofia “Moneyball” all’interno del “gioco più bello del
mondo”. Il lavoro svolto dai due businessmen ha ispirato notevolmente la
stesura di questa tesi e verrà utilizzato più avanti per argomentare il lavoro
svolto.

2.2 – Il Milan di Gerry Cardinale

In questa sezione si vuole porre l’attenzione sul campionato calcistico ita-


liano, guardando con particolare interesse all’Associazione Calcio Milan ac-
quisita recentemente da Redbird Capital Partners per la cifra di 1,2Mld di
euro. L’acquisizione della società calcistica italiana da parte del fondo ame-
ricano non ha creato tanto scalpore per l’acquisto in sé del club, ma più per
la filosofia che gli americani hanno portato.
Dal momento di passaggio di società il Milan utilizza ufficialmente la filo-
sofia Moneyball, talvolta disprezzata dalla stampa e dalla critica calcistica
italiana, molto legate alle tradizioni e alla passione per il “bel gioco”.

L’A.C. Milan è stato ufficialmente acquisito dal fondo Redbird in data 31


agosto 2022, ma le più eclatanti e innovative manovre decisionali si sono
potute notare solamente a partire dalla fine della stagione calcistica 2022-
2023. In tale periodo, Paolo Maldini e Ricky Massara, rispettivamente ex di-
rettore tecnico e sportivo dell’AC Milan, hanno dato le loro dimissioni a
causa di screzi dovuti a vedute differenti con la nuova proprietà milanista.
L’innovativa impronta che il club rossonero vuole e sta seguendo è quella
della filosofia Moneyball. Ne è da esempio un nome che fino a questo punto
è apparso più e più volte all’interno di questi capitoli, un uomo che fa da
filo conduttore per la stesura di questa tesi: si parla di Billy Beane. Il “pio-
niere della statistica applicata al baseball” è infatti un fidato consulente di
Gerry Cardinale e, come affermato dallo stesso italo-americano, Beane è
stato fondamentale nella decisione sull’investire o meno nel calcio europeo.

Redbird è un fondo americano privato "focalizzato sulla costruzione di so-


cietà a rapido tasso di crescita con capitale flessibile e a lungo termine". 16 È
stato fondato nel 2014 da Gerry Cardinale e dispone di circa 4,5Mld di euro
di asset principalmente finanziari. Oltre al pluripremiato club italiano, il
fondo americano possiede circa il 10% della società che controlla il

16 «RedBird Capital Partners – Principal Investment Firm».

23
Liverpool (Fenway) e l’85% circa del Tolosa, squadra in cui sono state “te-
state” le statistiche da applicare al Milan. 17
Il fondo americano ha investito 600Mln di euro di capitale per l’acquisizione
dell’AC Milan dal fondo Elliot, e ha ottenuto un finanziamento puro da
parte dell’ex fondo milanista pari a 550Mln di euro da restituire in tre anni.
Nel momento in cui Gerry Cardinale “sale al potere” all’interno di “casa
Milan”, preferisce osservare e lasciare un senso di continuità con quanto
svolto precedentemente dalla vecchia proprietà piuttosto di imprimere im-
mediatamente le proprie idee rischiando di creare discontinuità e di desta-
bilizzare il modus operandi del club, e di riflesso, i possibili risultati dei
giocatori sul campo. Inizia poco alla volta a modificare la struttura gestio-
nale milanista tendendo comunque conto dell’organizzazione ereditata. In
questo modo rende “più digeribile” a tutto l’ambiente rossonero il cambia-
mento che sta apportando. Comincia da Giorgio Furlani, ex portfolio mana-
ger del fondo Elliot, che dal 5 dicembre 2022 ricopre l’incarico di ammini-
stratore delegato del club, rimpiazzando l’ex dirigente Ivan Gazidis. Il 20
febbraio 2023 rende Stefano Cocirio, anche lui all’interno del fondo Elliot
dal 2015, Chief Financial Officer del club, conferendogli le deroghe per occu-
parsi delle aree finanziarie.
La sessione estiva di calciomercato 2023 è la prima alla quale Cardinale ab-
bia potuto realmente prendere parte indicando ed incidendo sulle scelte re-
lative agli acquisti dei giocatori. Dalle figure 2 e 3 si può notare come questa
sessione sia stata alquanto movimentata per i rossoneri: dieci calciatori in
entrata e ben ventidue in uscita, con un bilancio negativo di 43,5Mln che
può potenzialmente tramutarsi in “nettamente positivo” al raggiungimento
dei diversi obiettivi dati dai giocatori ceduti in prestito con diritto o obbligo
di riscatto. 18 L’impronta dell’italo-statunitense si può nettamente notare so-
prattutto guardando alle caratteristiche dei giocatori in entrata. Cardinale,
come riportato nella lunga intervista rilasciata per Corriere della Sera del 15
settembre 2023, afferma :<<La cosa che più mi ha colpito in questo primo anno è
vedere la distanza con il Chelsea nelle due sfide di Champions. Perciò ho voluto un
Milan più fisico, più veloce, più intenso. Nelle prime partite si è visto.>>. 19 I dieci
giocatori acquisiti possiedono tutti le caratteristiche indicate dal nuovo di-
rigente del Milan e rispecchiano pienamente la filosofia che il magnate

17 Da quando è di proprietà di Gerry Cardinale il club francese è risalito in un anno in


Ligue 1 e ha vinto la coppa di Francia.
18«Serie A - Trasferimenti 23/24».

19 Ravelli, «Gerry Cardinale».

24
americano vuole portare in Italia: creare una squadra competitiva nell’im-
mediato che ponga le basi per un ciclo vincente nel medio-lungo periodo.
Figura 2 Acquisti AC Milan

Acquisti AC Milan durante la sessione di mercato estivo 2023-24

Si guardi per esempio a giocatori come Christian Pulisic o Samuel


Chukwueze. L’americano è un talento rinomato fin da quando era piccolo.
Dotato di visione di gioco, velocità e tecnica sopra la media, ha sempre in-
ciso nelle squadre in cui ha giocato. Borussia Dortmund e Chelsea fanno
parte del suo “bagaglio personale”, rendendolo un giocatore giovane ma
dalla grande esperienza europea. Il ventiquattrenne nigeriano ha caratteri-
stiche più offensive del compagno di squadra. La scorsa stagione, mentre
vestiva la maglia del Villareal è infatti riuscito a segnare 13 goal e procurare
11 assist. Talento formatosi nella “cantera del submarino amarillo” dotato
di spiccata velocità e notevole padronanza palla al piede, è un’ala destra
mancina a cui piace dribblare gli avversari per poi accentrarsi al tiro.

Gli “investimenti” effettuati in questa sessione di mercato da parte di Car-


dinale sono volti a raggiungere l’obiettivo del club e lo “scoppiettante” mer-
cato effettuato ne è la dimostrazione.

25
Figura 3 Cessioni AC Milan

Cessioni AC Milan durante la sessione di mercato estivo 2023-24

Il mercato estivo del Milan non era però iniziato nel migliore dei modi. I
tifosi rossoneri hanno osservato Paolo Maldini e Ricky Massara, due dei pi-
lastri fondamentali che hanno portato al raggiungimento dello scudetto

26
dell’annata 2021-2022, andarsene dal mondo milanista poiché contrari alle
scelte gestionali del nuovo patron Cardinale. Successivamente a questa no-
tizia anche Sandro Tonali, fondamentale pedina di leadership e gioco ros-
sonera, è approdato in Inghilterra per poter mettersi in gioco nel campio-
nato più competitivo al mondo. Si può ben comprendere come gli appassio-
nati rossoneri, nel vedere andar via dal club tre delle figure che più avevano
rappresentato lo “spirito milanista” dei passati anni, non abbiano accolto
con molta gioia la “rivoluzione” che Cardinale voleva iniziare a Milanello.
La mente umana ha un’innata paura per l’ignoto, se una situazione stabile
cambia irrimediabilmente in una instabile l’uomo è portato a non porre fi-
ducia nell’avvenire. Le persone temono ciò che non conoscono, ne sono spa-
ventate e questo le porta a contrastare “a spada tratta” tutto ciò che non
comprendono. Allo stesso modo i tifosi milanisti sin dall’inizio della ses-
sione estiva di calciomercato, vedendo i propri idoli uscire dal club, hanno
iniziato a criticare aspramente l’operato di Cardinale, che fino ad allora
aveva “appena iniziato” la vera rivoluzione.

Gli animi dei tifosi hanno però cominciato a calmarsi una volta visto l’im-
pegno apportato alla campagna cessioni-acquisti rossonera, vedendo molti
giovani talenti di caratura mondiale atterrare nei pressi di Milano. Le vola-
tili opinioni della stampa e degli appassionati di calcio sono completamente
mutate nel momento in cui il “Milan 2.0” ha subito la prima e vera sonora
sconfitta perdendo per 5-1 il “Derby della madonnina” del 16 settembre
2023. Le opinioni scaturite dai vari “momenti” della squadra, sia gestionali
che del campo, sono completamente dettate “dall’hype” di una qualsivoglia
notizia che possa procurare share per le testate giornalistiche e non rispec-
chiano dunque la vera fisiologia milanista.
Nella stessa intervista per il corriere della sera cardinale continua di-
cendo:<< Ma credete che investa 1,2 miliardi per guadagnarci subito? È un pro-
getto a lungo termine: voglio vincere, ma non una volta sola, tante, nel tempo. Nel
calcio voglio essere un Berlusconi 2.0 […]. Ora, con il più alto fatturato nella storia
del Milan e un bilancio che si chiuderà in attivo per la prima volta dal 2006, affron-
tiamo una nuova fase: vogliamo essere i n.1, ma non possiamo riuscirci senza cam-
biamenti.>>.
La competitività che Cardinale vuole far raggiungere al “suo nuovo club” è
strettamente collegata al risanamento del campionato di Serie A. Il progetto
di Milano comporta, similmente alla strategia utilizzata da Matthew Ben-
ham per il Brentford, l’utilizzo di nuove strutture e ambienti moderni e
all’avanguardia che possano creare un luogo altamente funzionale e

27
comodo per la crescita e lo sviluppo della squadra AC Milan. Il progetto del
nuovo stadio di Milano renderebbe il club altamente competitivo a livello
sia italiano che europeo e, di conseguenza, creerebbe un movimento “a va-
langa” che teoricamente potrebbe riportare la lega italiana sul tetto d’Eu-
ropa. Per far sì che questo accada serve però il completo consenso e cambia-
mento da parte di tutti gli altri club della penisola.

È ovviamente troppo presto per dare una valutazione all’operato del busi-
nessman italo-americano, i dati da poter raccogliere sono ancora troppo esi-
gui e non si possiedono risultati di alcun tipo. È inutile cercare di farsi
un’idea sui micromovimenti compiuti gestionalmente da Cardinale. I primi
passi che danno fiducia all’ambiente milanese risiedono nell’ambizione me-
todica che il Milan sta assorbendo grazie alla filosofia Moneyball importata
da oltreoceano e nel bilancio che Gerry è riuscito a risanare dopo così tanto
tempo. Le caratteristiche peculiari date dall’approccio Moneyball iniziano a
“trainare le redini” di uno dei club calcistici più vincenti della storia. Spetta
solo al tempo definire se la scelta apportata dal fondo americano sia stata
fruttuosa o meno.

2.3 – La sfida

In questa ultima parte di capitolo ci si vuole focalizzare sul lavoro empirico


che la tesi vuole affrontare, i suoi limiti e le sue potenzialità. Il concetto
Moneyball affrontato, analizzato e ribadito fino ad ora è il cardine sul quale
si basa la ricerca e l’analisi che si spiegherà dettagliatamente nei prossimi
capitoli. Come intuibile dal titolo di questo elaborato il lavoro affrontato
riguarda l’applicazione della filosofia utilizzata per la prima volta da Billy
Beane all’interno del campionato italiano di calcio e, più precisamente,
focalizzandosi sul calciomercato italiano.

Il calciomercato è un sistema complesso di operazioni di compravendita che


mette in relazione club e società di tutto il mondo. I giocatori che vengono
acquistati/venduti possiedono un valore che è direttamente influenzato
dalla prestazione che gli stessi hanno avuto durante le partite giocate.
Questo valore viene dettato non da un ente terzo al di fuori del sistema di
compravendita ma da ogni singolo club all’interno di questa rete di scambi.
Suddetta società stabilisce il prezzo dei suoi giocatori in base a valutazioni
soggettive che possono variare in ogni momento a causa di fattori esterni.
Si può quindi ben comprendere quanto il prezzo di un giocatore possa

28
variare a seconda del club a cui si fa riferimento. Per esempio, un club
potrebbe valutare un giocatore 10Mln di euro mentre un altro potrebbe
valutarlo 7,5Mln. Oltre a questo, la pressione mediatica esistente a livello
sportivo e soprattutto calcistico rende i valori attribuibili agli atleti ancora
più volatili. Un episodio come uno scandalo di pubblico rilievo o un’accusa
infondata nei confronti del soggetto preso in considerazione possono
mutare notevolmente il prezzo di acquisto del cartellino. Si tenga anche
conto dell’inflazione dei prezzi dovuta o ad occasionali prestazioni positive
di un determinato talento o al fatto che questo sia di caratura mondiale o
perché esso giochi in un campionato piuttosto che in un altro. Il valore
attribuito ad un giocatore di Premier League risulterà sempre di maggior
rilievo rispetto alla valutazione attribuita allo stesso quando per esempio
giocava in Serie A, nonostante le metriche delle sue performance rimangono
invariate. Queste disparità di prezzo sono anche alimentate dalle differenze
tra diversi campionati. Si riprenda l’esempio della Premier League. Il
ricavato dei diritti televisivi inglesi è nettamente maggiore di quello
italiano. Per la stagione 2022-2023 si stima che le squadre inglesi abbiano
ricevuto più di tre miliardi di sterline da dividere tra le 20 squadre che
hanno partecipato alla competizione, mentre il campionato italiano abbia
ricevuto circa un terzo di quello guadagnato dai cugini inglesi.(figura 4) 20
Figura 4 Diritti TV

Differenza di guadagno tra diritti TV di Serie A e Premier League


stagione 2022/2023

20Moore, «How Much Each Premier League Club Earned in TV Revenue»; Spadaro,
«Diritti tv, l’ultima della Premier League guadagna più della prima in Serie A | DATI».

29
Le differenze di guadagni tra i due campionati sono ben comprensibili a
causa dello share mediatico che la Premier League ha rispetto alla Serie A,
ma nonostante questo è decisamente sconvolgente. Dalla figura 4 si può
notare come il Southampton F.C., che nella scorsa stagione è retrocesso in
Championship, si stima abbia guadagnato più di 62Mln di euro dell’Inter
(tasso di cambio euro-dollaro del 30/12/2022), che è invece arrivata seconda
in campionato. Il sistema di divisione dei guadagni televisivi tra
campionato italiano e inglese è nettamente diverso. In Italia le entrate
raccolte vengono suddivise attraverso parametri stabiliti dalla legge
Melandri, mentre in Inghilterra la suddivisione è nettamente più equa tra i
partecipanti (il Manchester City guadagna circa il 25% in più del
Southampton, mentre l’Inter guadagna circa il 67% in più della
Cremonese). 21 Nonostante questa differenza di suddivisione dei soldi
ricevuti, il dislivello di incassi tra i due campionati è abissale.

Si capisce bene come questo fattore, insieme a quelli già precedentemente


citati, influenzi notevolmente il calciomercato e di conseguenza il potere di
acquisto di un determinato club in esso. Per competere contro tutti questi
punti a sfavore e cercare di trovare una “zona grigia” entro la quale un club
possa agire vantaggiosamente per i propri interessi si è voluta studiare e poi
applicare la filosofia Moneyball descritta nei precedenti capitoli.

L’idea alla base di tutto il lavoro svolto può essere descritta brevemente dal
pensiero espresso da Forker:<<As football clubs’ businesses rely more heavily on
labor than on capital, players are core assets for clubs and their valuation becomes
an important determinant of clubs’ financial value>>. 22 I giocatori vengono visti
come degli “asset finanziari” il cui movimento sul mercato porta possibili
guadagni al venditore. Se il valore degli asset finanziari aumenta per cause
interne o esterne agli stessi il venditore registra una plusvalenza sulla
vendita dell’asset, mentre se diminuisce registra una minusvalenza. Il
progetto pone le basi sul “recruitment method” di Benham e Ankersen già
analizzato precedentemente ponendo maggiore attenzione sulla possibile
plusvalenza che l’acquisto di un determinato “asset” possa portare.

Una delle prime limitazioni a cui si è dovuto far fronte consiste, come
precedentemente descritto, al volatile e soggettivo valore di mercato che
può essere assegnato ad un calciatore. Per cercare di evitare il bias derivante

«DECRETO LEGISLATIVO 9 gennaio 2008, n. 9 - Normattiva».


21

Forker, «Discussion of Accounting, Valuation and Duration of Football Player


22

Contracts».

30
da valutazioni soggettive e completamente mutabili all’interno di una
ricerca che fa del valore di mercato di un giocatore il punto cardine attorno
al quale ruota tutta l’analisi svolta, sono stati estrapolati dal sito
transfermarkt.com, attraverso una tecnica di data mining, i valori relativi a
tutti gli acquisti e tutte le cessioni effettuate durante il mercato estivo 2022-
2023 in Serie A. I dati raccolti presentano delle limitazioni intrinseche.
Innanzitutto, i calciatori presi in considerazione sono limitati unicamente a
quelli che hanno subito movimenti durante la sessione di mercato presa in
considerazione. Un “bias pre-calcolato” dovuto alla certezza di dover
utilizzare dei valori ufficiali. Facendo ciò si sono dovuti escludere tutti quei
calciatori che non hanno subito movimenti durante la sessione di mercato,
restringendo quindi notevolmente la dimensione del database.
In secondo luogo, si sono dovuti escludere i dati di tutti quegli atleti che
sono stati ceduti o in prestito o a titolo gratuito perché si era impossibilitati
a definire un valore specifico degli stessi.
Oltre a ciò, si sono voluti inserire i valori di mercato di giocatori considerati
“TOP di gamma” all’interno del campionato italiano. Questi valori sono
stati estratti da transfermarkt.com a fine Giugno 2023 con il solo obiettivo
di compararli con i risultati ottenuti in modo tale da osservare eventuali
differenze tra il rendimento dei “giocatori TOP” e di quelli “normali”. Si
comprende benissimo il leggero bias che il valore di mercato di questi
giocatori comporta all’interno del database, ma è comunque limitato
rispetto ai fini della ricerca, sia perché i valori di giocatori affermati sono
abbastanza stabili nel lungo periodo, sia perché questi valori incidono in
modo esiguo con lo studio svolto. I “giocatori TOP” sono stati scelti in base
ai migliori giocatori delle due passate stagioni suddivisi per fasce di gioco
(attacco, centrocampo e difesa).
Infine, si vuole rendere noto che i valori di acquisto/cessione estrapolati non
sempre corrispondono a valori altamente precisi poiché potrebbero essere
state utilizzate “formule particolari” di compravendita. Si pensi per
esempio a pagamenti rateizzati o a bonus devoluti al club solo una volta
raggiunte determinate prestazioni/risultati.
Il modello è comunque risultato utile per l’obiettivo che questo studio si
pone.

Per rendere più semplice la fruibilità del database creato si sono voluti
suddividere i calciatori in tre fasce di gioco, adattate in base alla zona di
campo di appartenenza (attacco, centrocampo e difesa). La fascia dei
portieri è stata esclusa a causa del numero troppo esiguo di trasferimenti di

31
giocatori appartenenti a quel ruolo durante il calciomercato estivo 2022-
2023.

Si è inoltre voluto adattare tutto lo studio e l’analisi dei dati ad un


“approccio offensivo”. Poiché la ricerca si basa principalmente sul trovare
quegli asset che sono altamente sottovalutati dal mercato in modo tale da
poterli teoricamente rivendere ad un prezzo più alto ed ottenere una
plusvalenza, ci si è domandato quale sia il motivo cardine che faccia
aumentare il valore di mercato degli atleti.
Gerry Cardinale, nell’intervista rilasciata per “Corriere della Sera” già citata
precedentemente, affermava:<<I club di calcio sono creatori di contenuti e come
tali ne detengono la proprietà intellettuale: è un enorme potenziale da sbloccare per
realizzare il loro vero valore>>. I club sono visti alla stregua di “content
creator”. Hanno un’identità, propongono una filosofia di calcio che li
rispecchia e per questo motivo hanno un loro seguito. Uno dei fattori che
più hanno aiutato alla schiacciante prevalsa del campionato inglese rispetto
a quello italiano è in parte dovuto al differente stile di gioco tra i due. Il
campionato britannico ha un più vivido e vibrante modo di giocare. È
maggiormente dinamico, volto all’azione e rapido rispetto ad un sistema di
gioco tradizionalmente più difensivo ed attendista (nonostante
recentemente anche la Serie A stia adottando tattiche più dinamiche). I
media ed il mondo in generale sono più attratti (parlando unicamente di
stile di gioco) a guardare un susseguirsi di azioni potenzialmente ricche di
goal piuttosto che tattiche attendiste volte a studiare e aspettare
l’avversario. Se una squadra gioca bene è più probabile che venga seguita
maggiormente e ottenga l’attenzione dei media. Se poi, oltre a giocare bene,
riesce a prevalere con costanza sugli avversari si può ben comprendere
come lo share rivolto ad essa cresca sempre più. Se un club ottiene maggiore
share è intuibile che il valore della stessa società aumenti e di conseguenza
anche il valore dei propri giocatori. Per questo motivo si è prediletto
utilizzare metriche offensive durante lo studio della filosofia Moneyball. I
valori offensivi utilizzati verranno meglio specificati nei capitoli successivi.

Ci si augura che la ricerca e le analisi svolte possano essere di utilità a livello


calcistico e gestionale e che possano essere utilizzate per comprendere e
migliorare anche in minima parte il sistema del campionato calcistico
nazionale.

32
Cap. 3 – DATASET

Questa sezione è un capitolo di transizione della tesi. Il suo scopo principale


è quello di definire gli strumenti utilizzati durante lo sviluppo dell’analisi
riguardante la filosofia Moneyball applicata alla Serie A.

In questo capitolo si vogliono spiegare tutte quelle caratteristiche che


hanno portato alla creazione del dataset, all’utilizzo di determinate
metriche e alle regole utilizzate per renderlo fruibile.

Si inizierà spiegando il procedimento di estrapolazione dei dati, tenendo


ben presente le motivazioni che stanno alla base della scelta dell’utilizzo di
specifiche variabili. Si continuerà creando un parallelismo tra le metriche
utilizzate in questo progetto, quelle create da Billy Beane e quelle applicate
da Matthew Benham. E infine, si spiegheranno i vari procedimenti tecnici
utilizzati per la creazione vera e propria del database.

3.1 – Itinerario: dall’idea alla creazione

Il primo vero problema affrontato durante l’iniziale processo di ricerca e


analisi di dati volti alla creazione del database da poter poi analizzare e
utilizzare durante la tesi, si è palesato essere la creazione vera e propria del
suddetto insieme di dati. In un’intervista per “Il bar del baseball” l’analista
Max Marchi affermava:<<Il baseball MLB ha […] una stagione di 162 partite
(quindi grandi numeri), un flusso del gioco a eventi discreti (più o meno, ogni lancio
ha un ventaglio di esiti possibili limitato e prevedibile, molto diverso rispetto agli
sport a flusso continuo – calcio, basket, hockey…). E in più, già a partire dal XIX
secolo, c’è chi si è preso la briga di registrare ogni singola azione>>, si ben
comprende come il calcio abbia registri di dati ancora limitati rispetto ad
altri sport. 23 L’esiguo numero di partite di campionato in una singola
stagione (38) e il limitato numero di goal effettuati in media durante una
partita (una squadra di serie A durante il campionato 2022-23 ha segnato in
media 2,44 goal a partita) rende i dati derivabili dalle performance dei
calciatori molto meno precisi di quelli di giocatori partecipanti ad altri
sport.24 Per far fronte alla mancanza di completezza dei dati necessari per
lo studio voluto, si è attuato un lavoro di “patchwork”, ovvero l’unione di
diverse banche dati e informazioni ricavate da siti online volte a creare una

23Gori, «IL BASEBALL È UNA SCIENZA?»


24 «Media Gol totali - Serie A (Italia) | FootyStats».

33
base di dati completamente unica nel suo genere. I siti principali da cui sono
state estratte queste informazioni sono due: fbref.com e transfermarkt.com.

Fbref.com è, come si autodefinisce, <<un sito web dedicato al tracciamento delle


statistiche relative ai calciatori e alle squadre di calcio di tutto il
mondo>>. 25All’interno di esso si sono individuati e scaricati i dati
riguardanti la fase offensiva, difensiva e di possesso palla di ogni singolo
giocatore in Serie A sia per l’annata 2021-2022, sia per l’annata 2022-2023,
oltre ad altre informazioni generiche quali per esempio ruolo, squadra ed
età dell’atleta. Si sono inoltre dovuti acquisire i dati di tutti quei giocatori
che durante il calciomercato estivo a cavallo tra l’annata 2021-22 e 2022-23
si sono trasferiti all’estero. Lo studio attuato sull’enorme banca dati creata è
modellato come se fosse l’analisi di una serie storica avente unicamente due
periodi temporali ben precisi. Uno dei problemi derivati dal fatto che i dati
calcistici non sono ancora del tutto completi è risultato essere che, al di fuori
dei Top 5 campionati europei, non esistono dati fruibili per campionati
minori a livello globale (per esempio, mancano analisi riguardanti le
prestazioni del campionato greco, o di quello argentino, o della terza
divisione inglese). Si può ben comprendere come questa informazione
risulti particolarmente spiacevole considerando che il calciomercato è un
sistema che tende a scambiare atleti da tutto il mondo. È infatti molto
frequente che giocatori considerati minori vengano venduti a squadre non
appartenenti ai Top cinque campionati europei. Per questo motivo durante
l’analisi svolta(che verrà spiegata nel dettaglio nel prossimo capitolo), non
si attuerà una “before and after regression”. Ci sono infatti casi in cui si hanno
dati relativi ad un atleta solamente in una determinata annata, rendendo
quindi il confronto “before and after” impraticabile.

Transfermarkt.com è il secondo sito utilizzato per la creazione del dataset


per la tesi di laurea. A differenza di fbref.com, più incentrato sulle metriche
derivate dalle prestazioni degli atleti durante le partite, il sito tedesco è
maggiormente focalizzato sui trasferimenti economici dei calciatori di tutto
il mondo e sulla valutazione del loro prezzo di cartellino. Si è voluto
prendere in considerazione, come spiegato dettagliatamente nel capitolo
precedente, il valore di mercato derivato dal trasferimento di quei giocatori
selezionati a cavallo tra l’annata 2021-22 e 2022-23. In questo modo si è
cercato di “arginare” possibili bias derivati da una valutazione non precisa
dell’atleta. Si deve tener presente che l’ormai famosissimo sito tedesco è

25 «Tutto ciò che riguarda FBref.com».

34
diventato polo di attrazione non solo di appassionati del gioco più seguito
al mondo, ma anche di veri e propri club di calcio che osservano
l’andamento delle valutazioni affibbiate ai talenti del pallone. Si condivide
un passaggio estrapolato da un articolo del giornale spagnolo “El Mundo”
in cui Tobias Blaseio, responsabile di Transfermarkt Spagna, spiega
l’importanza della piattaforma online:<<Siamo un riferimento mondiale, un
riferimento per i dati calcistici. Naturalmente ci sono sempre degli errori, ma più
persone ci aiutano, più qualità possiamo offrire a tutti. […] Siamo in costante
contatto con club, giocatori e agenti, ma renderemmo un cattivo servizio a noi stessi
se partecipassero in qualche modo al valore di mercato>>. 26 I valori indicati sul
sito sono perciò una stima abbastanza fedele del potenziale di un atleta, ma
sicuramente non perfetta. Nella stessa intervista citata precedentemente
Blaseio, infatti, spiega come la stima affibbiata ai giocatori derivi da un
processo basato su più passaggi. All’inizio , in un forum dedicato, gli utenti
della piattaforma transfermarkt discutono e propongono il prezzo da dare
ad un determinato giocatore (in base a prestazioni, età, caratteristiche…).
Successivamente vengono discussi i prezzi proposti con i data scout che
fanno capo al forum nel quale è iniziato il dibattito. L’ultimo passaggio vede
i data scout riferire i valori ricavati ai lavoratori di ciascuna area nazionale
che decideranno poi il prezzo effettivo da immettere all’interno del sito. In
questo modo si ha un quadro più generale del potenziale espresso dagli
atleti, creando una stima del valore degli stessi. Esistono però bias insiti alle
valutazioni stesse. Tobias aggiunge infatti che:<<Se sei interessato al mercato
inglese, il suo valore è più alto, per effetto del denaro televisivo […] I club portoghesi
tradizionalmente vendono i loro talenti a prezzi molto alti>>.
Il fatto che il valore palesato sul sito tedesco non sempre rispecchi la qualità
del talento effettivo degli atleti e che questo possa essere “gonfiato” a
seconda del campionato di appartenenza, ha reso inevitabile la scelta di
basarsi unicamente sul prezzo al quale i vari giocatori sono realmente stati
acquistati durante la finestra estiva di mercato.
I dati necessari allo studio sono stati estrapolati grazie ad una tecnica di
“web scraping” (tecnica informatica che consiste nell'estrarre
automaticamente informazioni o dati da pagine web) volta ad ottenere
quelle statistiche non-tecniche che non si era riuscito a scaricare da
fbref.com. I pacchetti di R che si sono utilizzati durante questa fase sono
“rvest” e “polite” (rvest fornisce un'interfaccia user-friendly per scaricare il
contenuto HTML di una pagina web ed estrarre informazioni specifiche da

26 Sanchez, «Usted pone el precio que Real Madrid y Barcelona pagan por sus fichajes».

35
essa; polite invita ad essere responsabili quando si raccolgono dati dai siti
web. Impone all’utilizzatore di: presentarsi, chiedere il permesso, e poi
procedere allo scraping) 27

Una volta ottenuti i vari elementi si è creato un foglio Excel contenente il


vero e proprio dataset. Esso è suddiviso in quattro parti fondamentali.
Il dataset è stato appositamente suddiviso in queste sezioni per facilitare il
riconoscimento delle metriche durante l’analisi svolta sul software statistico
R.

La prima area contiene le generalità dei giocatori selezionati oltre ad una


colonna dedicata al fatto se gli atleti presi in considerazione siano “top di
gamma” o meno. Suddetti giocatori sono stati selezionati in base alle
prestazioni che hanno avuto in Serie A negli ultimi tre anni (figura 5). La
colonna Excel creata distingue i giocatori Top da tutti gli altri. Più nel
dettaglio, all’interno del dataset creato su foglio Excel gli atleti considerati
Top sono indicati dalla variabile binaria “TOP” vs. “NO”.
Figura 5 Giocatori TOP

Lista giocatori TOP utilizzati nel database suddivisa per fasce di gioco

La seconda sezione del file Excel contiene tutte quelle statistiche che sono
state interpretate come dedicate alla fase di attacco. I dati di questa regione
indicano la produzione offensiva che l’atleta mette a disposizione per la
squadra in cui gioca. In questa area si possono osservare metriche quali i
già citati “expected goals”, gli “assist” che l’atleta ha procurato durante la
totalità delle partite giocate, o la percentuale di tiri che effettua in media
durante una partita.

La terza riporta invece le statistiche utilizzate per definire il gioco palla al


piede dell’atleta. Si accentuano tutte quelle metriche che hanno a che fare
con i passaggi. Passaggi progressivi, nella tre quarti avversaria,

27 cran.r-project, «Polite: Be Nice on the Web».

36
fondamentali, completati e non, etc. L’idea di base di questa sezione è quella
di restituire un quadro generale dello stile di gioco dell’atleta tenendo ben
presente quanto sia propenso a “creare gioco” per la squadra.

Ultima ma non meno importante sezione è destinata alla fase difensiva


degli atleti. In questa regione si palesano interventi, contrasti ed errori
difensivi che hanno “salvato” la squadra o che hanno rallentato la creazione
del gioco del team avversario, sventando o intercettando una possibile
azione pericolosa. Si dà quindi notevole peso alla solidità e alla prontezza
nell’intervenire per contrastare le azioni avversarie.

Come già anticipato nel paragrafo precedente, poiché il fine ultimo della
tesi è individuare quei giocatori sottovalutati che messi nelle condizioni
adatte possano fruttare plusvalenze al club di appartenenza, le metriche
raccolte all’interno del database hanno un’impronta prettamente volta
all’azione offensiva. Nel capitolo successivo verrà esplicato maggiormente
il concetto di scelta delle variabili necessarie per l’analisi del campione di
dati e di conseguenza la caratteristica offensiva dettata da questa decisione.

3.2 – Metriche

In questa sezione si spiegheranno minuziosamente le caratteristiche e le


idee alla base delle metriche che sono state utilizzate per lo studio e l’analisi
di questa tesi. La spiegazione si avvarrà dello stesso approccio utilizzato
precedentemente per dividere in “sezioni” il dataset. In questo modo si
otterrà un filo conduttore caratteristico di tutti i dati della zona presa in
considerazione.

Si considerino innanzitutto le generalità contenute all’interno della prima


parte dei dati raccolti. Il dataset possiede nella sua iniziale colonna il valore
binario riferito all’annata nella quale l’atleta ha giocato. La metrica è
denominata “Anno” e rappresenta l’annata 2021-22 se rappresentata dalla
variabile “2022”, l’annata 2022-23 se indicata dalla variabile “2023”. I dati
raccolti vedono quindi un singolo giocatore avere due diversi indicatori a
seconda dell’annata di appartenenza.
Si prosegue con le vere e proprie generalità degli atleti: “squadra” si
referisce alla squadra per cui il calciatore ha giocato in un determinato
periodo di tempo; “giocatore” contiene il nome e il cognome dell’atleta; la
nazionalità dello stesso è rappresentata da “nazione”; “Ruolo” suggerisce

37
la posizione prediletta dall’atleta nel campo di gioco (Si sono voluti
semplificare notevolmente i ruoli per agevolare la comparazione durante
l’analisi svolta. Non esistono quindi posizioni come terzini, mediani, ali…
ma soltanto ruoli di attacco, centrocampo e difesa); la variabile
“Squadra_Cessione” permette di capire da quale o verso quale squadra il
giocatore preso in considerazione è stato acquistato/ceduto, infine “Età”
(all'inizio della stagione) e “Nato” sono autoesplicative.
Continuiamo con le già citate “GiocatoreTOP”, variabile binaria volta ad
individuare i migliori giocatori del campionato, e “AcqValore”, pensata
invece a stabilire il prezzo a cui gli atleti all’interno del database sono stati
acquistati/venduti (si ricorda che il valore di acquisto dei giocatori TOP è
indicativo del periodo appena successivo al termine di campionato
dell’annata 2022-23. I valori di questi giocatori risultano quindi avere un
bias nei confronti dell’ultima stagione affrontata)
Tra le statistiche prese in considerazione all’interno della sezione iniziale
appartengono anche quelle che potrebbero definirsi le “generalità di un
calciatore”, ovvero quelle statistiche comuni ad ogni singolo atleta
professionista appartenete al mondo del pallone. Esse individuano le
partite giocate dall’atleta con “PG” (Le partite vengono prese in
considerazione anche se l’atleta ha partecipato ad esse per pochi minuti); la
metrica “Tit” specifica in quanti match il giocatore è partito titolare,
ovviando quindi al problema della statistica precedente; “Min” indica il
minutaggio totale del giocatore durante tutte le 38 partite di campionato,
mentre “90_min” specifica quanti minuti abbia giocato mediamente
durante un singolo match (Questa metrica non tiene conto di quelle partite
in cui il giocatore era infortunato, espulso o non abbia toccato il terreno di
gioco per motivi tecnico-tattici).
Le ultime metriche selezionate per questa prima parte di dataset sono state
create e modificate appositamente per cercare di arginare il problema
relativo alla continuità delle prestazioni dei giocatori. Si è infatti visto
attraverso svariati test svolti durante le analisi dei dati che i risultati ottenuti
palesavano un problema di costanza. Vi erano infatti alcuni giocatori che si
potrebbero definire “one shot”, ovvero atleti, i quali dati risultavano essere
di pregevole caratura unicamente in pochissimi risvolti di gioco e non nel
lungo periodo. Le metriche in questione sono: “Min_PG” ovvero i minuti
totali sulla totalità delle partite giocate, in questo modo si ottengono
indicativamente i minuti effettivi giocati dall’atleta in tutte le partite in cui
ha partecipato; “Titolarità” è invece la soluzione al problema sopra citato.

38
Questa statistica ha un risultato binario (sì e no) dato quando Min_PG > 15
minuti e contemporaneamente PG > 16 partite giocate. I 15 min. sono stati
selezionati per valorizzare quei giocatori che subentrano dalla panchina
(simile al modo in cui al fantacalcio assegnano il punteggio ai calciatori
subentrati). Il numero minimo di partite giocate inizialmente scelto era 18,
ovvero esattamente la metà dei match disputati in una stagione. Si sono
però volute abbuonare alcune partite a causa di quei giocatori che hanno
subito una cessione dopo l’inizio effettivo del campionato (Il mercato estivo
del campionato italiano termina tradizionalmente il 31 agosto. La serie A
nell’annata 2021-22 è iniziata il 21 agosto, facendo disputare 2 partite
durante la sessione di calciomercato estiva, mentre l’annata 2022-23 è
cominciata il 13 agosto, portando i giocatori a disputarne 4. Si è voluta
calcolare la media delle partite giocate durante il periodo di trasferimento
estivo, il che ha portato il numero utilizzato nella metrica a 16 (19-3)).

Si veda ora la sezione dedicata alle statistiche offensive del dataset.


La metrica di partenza di questa area è rappresentata dai goal che il
calciatore ha segnato durante la stagione di riferimento, “G”;”G_90” indica
la probabilità della metrica precedente all’interno dei 90 minuti di gioco
regolamentari (vi è un leggero bias quando si prendono in considerazione
dati divisi per i 90 minuti di gioco poiché le statistiche potrebbero essere
state realizzate all’interno di tempistiche di recupero); si passi ora a “T”,
totalità dei tiri e “TiP”, totalità dei tiri in porta. La metrica derivante
dall’abbinamento tra le due appena viste è “Perc_TiP”, percentuale di tiri in
porta. Come visto per i goal anche tiri e tiri in porta possiedono le loro
statistiche divise per 90 minuti: “T_90” e “TiP_90”. “G_T” e “G_TiP”
mettono in relazione goal su tiri e goal su tiri in porta. Si guardi ora a “Dist”,
metrica indicante la distanza media dei tiri dalla rete. Tale dato è espresso
in iarde rispetto a tutti i tiri effettuati (calci di rigore non inclusi). “P” indica
quanti tiri su punizione un calciatore ha affrontato durante il campionato;
“A” e “A_90” sono rispettivamente numero di assist effettuati e la
percentuale degli stessi all’interno dei 90 minuti di gioco (Le metriche
indicanti gli assist dei giocatori potrebbero fare riferimento sia alla sezione
“offensiva” sia alla sezione dedicata ai “passaggi” del dataset. Per
semplicità si sono volute collocare all’interno di quest’area). “Somm_G_A”
indica la somma dei contributi offensivi che il giocatore ha portato alla
squadra.
Si guardino ora a quei dati riguardanti le produzioni su rigore “Rig”; la
differenza tra il numero di goal e i rigori che hanno portato ad una rete

39
“npG” (valori interessanti per comprendere quanto l’atleta riesca ad essere
cinico davanti alla porta); “Rig_T” definisce invece quanti rigori un
giocatore abbia tentato. Si comprende bene che questi valori sono molto
interessanti per coloro che sono rigoristi all’interno delle proprie squadre,
ma non potranno mai essere rilevanti su larga scala per la stessa
motivazione sopra citata.
“Amm” sta per quanti cartellini gialli il giocatore ha ricevuto, mentre “Esp”
indica quante volte ha ricevuto cartellini rossi.
Si approcciano ora tutti quei dati definiti “expected”. Come suggerito dal
nome queste metriche valutano l’aspettativa, il valore atteso che quel
determinato evento avvenga. In termini calcistici stabiliscono la probabilità
di segnare, di fare un assist, di compiere un passaggio decisivo… Tutte
queste casistiche sono fornite direttamente da Opta Sports, multinazionale
specializzata nell’elaborazione di dati sportivi (Fbref.com, sito da cui si sono
scaricate queste metriche, utilizza i servizi forniti da Opta). 28
Si prendano in considerazione i dati su cui si basa principalmente lo studio
svolto da questo elaborato: “xG” e “xG_90” indicano rispettivamente gli
expected goals (probabilità che ogni tiro diventi goal) e gli expected goals
nei 90 min.(Il totale degli xG include i calci di rigore, ma non include i rigori
a fine partita. Minimo 30 min. giocati per entrare in graduatoria); per
“npxG” si indica l’aspettativa che un giocatore faccia goal senza segnare dal
dischetto di rigore, si può quindi comprendere come “npxG_T” metta in
relazione la metrica citata poco fa con la totalità dei tiri effettuati da un
atleta. Come precedentemente svolto con i “non penalty goals”, i dati
successivi rappresentano la differenza tra due metriche. Sono stati scaricati
per indicare la differenza tra reti segnate e l’aspettativa di esse “G-xG”, e tra
reti segnate non su rigore e la loro aspettativa “npG_npxG”.
Si conclude la “sezione offensiva” specificando i dati relativi agli expected
assist e tutti i suoi derivati. “xAG” definisce quanto ci si aspetta che un
giocatore faccia goal e fornisca un assist nella stessa partita; “xA” e “xA_90”,
simili alle metriche precedentemente citate riguardanti gli xG, stabiliscono
gli expected assists e gli expected assists nei 90 minuti. Continuando,
“Diff_A_xAG” sta per A – xAG, mentre “ Diff_A_xAG” indica assist meno
goal assistiti previsti. Si chiude la sezione con “Somm_npxG_xAG”, la
somma tra expected goal non su rigore ed expected goal assistiti.

28«Opta Data from Stats Perform».

40
Si prenda ora in considerazione la zona del dataset dedicata a tutte quelle
metriche riguardanti i passaggi e il possesso palla (come precedentemente
citato le casistiche riguardanti gli assist e i suoi derivati possono essere
indicative sia di questa sezione che di quella offensiva. Non si ripeteranno
per questo motivo).
Si inizi guardando ai dati relativi ai passaggi progressivi, ovvero tutte
quelle metriche riguardanti l’accorciare la distanza tra la palla e la porta
dell’avversario. Tutte le metriche riguardanti queste tipologie di passaggi
portano il pallone verso la linea di porta avversaria ad almeno 10 metri dal
suo punto più lontano negli ultimi sei passaggi o qualsiasi passaggio
nell’area di rigore. Primo dato rilevante è “PrgC”, ovvero i passaggi
progressivi creati (sono esclusi i passaggi che terminano nel 50% del campo
di gioco della difesa). Questa statistica è molto rilevante per stabilire quanto
un giocatore sia un “playmaker”. Si prosegue con “PrgP”, indicante i
passaggi progressivi proposti e completati (esclude i passaggi dal 40% del
campo per i difensori); ed infine “PrgR” che indica i passaggi progressivi
ricevuti (anche qui sono esclusi i passaggi dal 40% del campo per i
difensori).
Si continui con i passaggi fondamentali “Pfond”, indicanti tutti quei
passaggi che hanno portato il ricevente a tirare verso la porta (sono inclusi
gli assist);” PTerzCamp” indica i passaggi completati entrati nell'ultimo
terzo del campo di gioco più vicino alla rete, mentre “PPA” sta per passaggi
completati all’interno dell’area di rigore; “Cross-area” è abbastanza
autoesplicativa.
Si analizzi ora una zona di questa sezione dedicata alle varie tipologie di
passaggi che si possono verificare nel corso di una partita di calcio. Gli
scambi che si vengono a creare possono essere suddivisi in quattro grandi
categorie. Le quattro tipologie degli scambi analizzati sono la totalità dei
passaggi completati, i passaggi brevi, quelli medi e i lunghi. Gli scambi
appena citati vengono analizzati in maniera molto simile tra loro (le
metriche sono diverse ma possiedono le stesse trasformazioni. Per esempio,
la metrica indicante i passaggi tentati verrà proposta per gli scambi
completati, brevi, medi e lunghi.) e per questo motivo verranno riportate
solamente le statistiche riguardanti i passaggi completati totali, in modo da
evitare inutili ripetizioni. Si continui vedendo quante e quali metriche sono
state riportate per i passaggi completati.
“Compl_Tot” indica la totalità dei passaggi completati. Sulla falsa riga della
metrica precedente, si sono volute creare appositamente quattro metriche

41
per lo studio che si svolgerà nel prossimo capitolo, riguardante le
caratteristiche di gioco dei calciatori. La prima consiste in
“Pfond_Compl_Tot”, metrica indicante i passaggi fondamentali sulla totalità
di quelli completati. Questa statistica ha un peso notevole all’interno dello
studio poiché è molto malleabile. Per i difensori e i centrocampisti indica
quanto questi siano bravi a creare occasioni da goal durante una partita e di
conseguenza, quanto questi aiutino all’azione offensiva pressando in
attacco. Per gli attaccanti rappresenta invece la disposizione che lo stesso ha
per far segnare la squadra; è più egoista o gioca a disposizione dei
compagni? Ci si aspettano risultati nettamente inferiori rispetto a difensori
e centrocampisti ma risulta comunque un valore interessante da
comprendere. Si continui con “PrgC_Compl_Tot”, “PrgP_Compl_Tot” e
“PrgR_Compl_Tot”. Tre metriche strettamente collegate tra di loro che
creano un quadro generale di quanto un calciatore sia bravo a proporre,
completare e ricevere gioco (quando si usa l’espressione “creare gioco”,
poiché lo studio svolto ha un’impronta prettamente offensiva, ci si riferisce
ad azioni potenzialmente pericolose). “Ten_Tot” indica quanti passaggi
siano stati provati in totale, mentre “Perc_Compl_Tot” stabilisce la
probabilità di completare un passaggio.
Si conclude questa sezione con le metriche riguardanti la distanza totale,
espressa in iarde, percorsa dai passaggi completati in ogni direzione
“Dist_Tot” e la distanza totale, espressa in iarde, percorsa dai passaggi
completati verso la rete avversaria “Dist_Prog_Tot” (i passaggi lontani dalla
rete avversaria vengono conteggiati come zero iarde progressivi).

Ultima sezione, ma non per importanza, è quella dedicata a tutte quelle


metriche che rappresentano lo stile di gioco difensivo.
Si inizi osservando la prima area all’interno di questa sezione, quella
riguardante i contrasti.“Cntrs” e “Cntrs_vinti” sono le metriche basiche di
questa zona, indicanti il numero di giocatori contrastati e il numero di
contrasti in cui la squadra che ha iniziato il contrasto ha poi recuperato
palla. Si continui con “Cntrs_vinti_Cntrs” metrica indicante il rapporto tra il
numero di contrasti effettuati e quelli riusciti, per proseguire poi con
statistiche indicanti le zone precise di campo in cui i contrasti son stati
effettuati: “Treq_dif”, “Treq_cen” e “Treq_off”. Dando maggior peso
all’ultima metrica citata si è voluto creare un dato indicante il rapporto tra
quanti contrasti sono stati effettuati nella trequarti offensiva rispetto al
numero di contrasti totale: “Treq_off_Cntrs”. Essendo i contrasti svolti in
fase offensiva, utilizzando la metrica creata si favorisce il pressing da parte

42
dei difensori nella tre quarti avversaria. Essa è altamente utile per verificare
quali giocatori maggiormente sviluppano il gioco propinato dallo studio di
questa tesi.
Ci si sposti ora nella sezione dedicata alle “sfide” che i calciatori affrontano
quando in fase difensiva. Le statistiche di quest’area sono totalmente
incentrate sull’approccio ai dribblatori avversari. “Dribl_Cntrs” indica
quanti dribblatori sono stati contrastati, “Dribl_Appr” quanti se ne sono
approcciati, “Perc_Dribl_Cntrs” mette in relazione le due metriche
precedenti e infine “Dribl_persi” è autoesplicativa.
Ultimo sottogruppo difensivo è incentrato sui blocchi effettuati durante la
partita. “Blocchi” è la metrica più rappresentativa di questo gruppo e indica,
come facilmente intuibile, il numero di volte in cui ha bloccato la palla
stando nella sua traiettoria; “T_blocchi” e “P_blocchi” indicano
rispettivamente i tiri e i passaggi bloccati; “Perc_P_Blocchi”, come facilmente
intuibile, esamina la percentuale di passaggi bloccati. Questa metrica è
particolarmente interessante perché è un buon indicatore della pressione
apportata dai giocatori durante la fase difensiva.
Le intercettazioni sono invece date da “Int”, con un particolare
accorgimento alla loro percentuale all’interno dei 90 minuti regolamentari
“Int_90”. “Somm_Cntrs_Int” mette invece in relazione contrasti e
intercettazioni creando quindi un quadro generale degli interventi effettuati
dall’atleta.
Si conclude l’area guardando a due facce della stessa medaglia: salvataggi
ed errori (sbagli che hanno causato un tiro da parte di un avversario) e le
loro rispettive percentuali nei 90 minuti; “Salvat”, “Salvat_90”, “Err” e
“Err_90”.

43
Cap. 4– IL PROGETTO

Si è finalmente giunti alla sezione della tesi dedicata al vero e proprio


progetto tanto decantato durante i precedenti capitoli. Ciò che si analizzerà
all’interno di questa sezione è il cuore pulsante di tutto il lavoro svolto
finora, la matrice alla quale le varie ricerche effettuate fanno riferimento.

In questo capitolo si analizzerà in primis il procedimento cognitivo e pratico


utilizzato all’interno del software R. In questo modo si comprenderanno le
varie scelte effettuate lungo la scrittura del codice necessario all’analisi del
database ampiamente descritto nello scorso capitolo.

Si proseguirà osservando e analizzando i grafici creati all’interno dello


studio e si fornirà una spiegazione dettagliata degli stessi.

Infine, si discuteranno i risultati ottenuti dalla regressione effettuata per


stabilire i “giocatori sottovalutati” tanto ricercati all’interno di questo
elaborato.

4.1 – R: Analisi e discussione del dataset

Si discute in questo paragrafo il procedimento svolto durante l’analisi del


dataset precedentemente descritto in modo tale da poter giungere al
risultato di individuare quei calciatori che vengono sottovalutati all’interno
del sistema calcistico e di scouting del campionato italiano.
Il processo “Moneyball” appena descritto vede l’utilizzo del software
statistico R come metodo utilizzato al fine di raggiungere l’obiettivo
proposto. Dopo aver caricato il dataset all’interno del processore, il primo
passo che si è svolto prima di iniziare l’effettiva l’analisi, è stato rimuovere
tutte quelle variabili che riportavano valori mancanti NA all’interno dei dati
raccolti. Nonostante un’iniziale “scrematura”(che si era compiuta quando
si stavano studiando le variabili su Excel) che ha visto la rimozione di tutti
quei giocatori che sono stati ceduti gratuitamente o in prestito, si è dovuto
utilizzare la funzione na.omit per pulire le osservazioni di cui non si avevano
informazioni complete. Il dataset è passato da 376 osservazioni a 248, con
un totale di 92 variabili.
Successivamente si è svolto un rapido test di correlazione di Pearson per
verificare il grado di associazione tra le metriche prese in considerazione.
Per poterle stabilire si sono volute suddividere le osservazioni in tre grandi

44
categorie indicative della fase offensiva, dei passaggi a centrocampo e di
quella difensiva dei singoli giocatori. La fase offensiva è rappresentata da:
Tiri nei 90 minuti (T_90), goal su tiri effettuati (G_T), goal non su rigore su
tiri effettuati (npxG_T), goal nei 90 minuti (G_90), aspettativa di goal nei 90
minuti (xG_90) e totalità dei passaggi fondamentali completati
(Pfond_Compl_Tot); quella a centrocampo da: assist nei 90 minuti (A_90),
aspettativa di assist nei 90 minuti (xA_90), passaggi progressivi proposti e
completati rispetto alla totalità dei passaggi completati (PrgP_Compl_Tot),
passaggi progressivi creati rispetto alla totalità dei passaggi completati
(PrgC_Compl_Tot), passaggi progressivi ricevuti rispetto alla totalità dei
passaggi completati (PrgR_Compl_Tot) e totalità dei passaggi fondamentali
completati (Pfond_Compl_Tot); ed infine la difesa da: percentuale di contrasti
vinti (Cntrs_vinti_Cntrs), percentuale di contrasti nella tre quarti offensiva
(Treq_off_Cntrs), passaggi progressivi proposti e completati rispetto alla
totalità dei passaggi completati (PrgP_Compl_Tot), percentuale dei
dribblatori contrastati (Perc_Dribl_Cntrs), salvataggi nei 90 minuti
(Salvat_90) e percentuale di passaggi bloccati (Perc_P_Blocchi). Tutte le fasi
appena indicate sono sempre prese in considerazione con il valore di
acquisto dei calciatori “AcqValore” (si ricorda che lo scopo dell’analisi è
restituire valori monetari dei giocatori sottostimati). Questi “pacchetti di
variabili” verranno più volte utilizzati all’interno dell’analisi svolta poiché
molto rap presentativi del gioco offensivo che lo studio moneyball vuole
proporre. Di seguito si riportano le tre tabelle derivate dalla correlazione
dei tre gruppi di osservazioni. 29
I valori relativi alla correlazione dei dati offensivi vedono le osservazioni
per lo più significative con il valore di acquisto degli atleti. L’ unica variabile
che ha valore neutro risulta essere “Pfond_Compl_Tot”. Ci si aspettava che
i passaggi fondamentali completati totali non avessero molta significatività
all’interno dello studio offensivo dei calciatori poiché indicano quanto un
calciatore sia cinico in area di rigore. Notoriamente gli attaccanti sono pagati
per fare goal e non per fornire assist. Si voleva comunque capire quanto i
giocatori fossero a disposizione della squadra in quelle situazioni in cui le
chance di goal aumentano se si fornisce un assist potenziale. Guardando
invece i grafici relativi ai passaggi e alla difesa, ciò che più fa riflettere è il
valore di acquisto che non è prettamente significativo con le metriche
stimate. Le variabili prese in considerazione hanno una relazione nulla e in

29 Le tabelle sono state create grazie al software R

45
Correlazione multipla relativa alle variabili offensive studiate all’interno del modello

Correlazione multipla relativa alle variabili di centrocampo studiate all’interno del modello

alcuni casi leggermente negativa con il valore di acquisto dei calciatori.


L’enorme peso dettato dalle statistiche offensive, e più nel dettaglio, dalle
metriche relative al segnare/proporre goal, influenzano notevolmente il
valore dei giocatori selezionati.
Durante questo primo “approccio” alle metriche del dataset si sono
riscontrati diversi problemi relativi al peso delle variabili e allo studio delle
stesse. In seguito, si vedono nel dettaglio le contromisure prese per rendere
l’analisi affidabile.

46
Correlazione multipla relativa alle variabili difensive studiate all’interno del modello

In primis, si è voluto risolvere il problema derivante dallo squilibrio di peso


dato al valore di mercato dei calciatori (i giocatori sono notoriamente pagati
maggiormente se hanno un ruolo offensivo piuttosto che uno difensivo). Si
è deciso di creare una nuova metrica, “QuartValore”, suddividendo la
statistica “AcqValore” in quattro quartili (L, M-L, M e H) indicanti la fascia
di prezzo a cui il giocatore è stato acquistato. Si è data ad ognuna di queste
fasce di prezzo un peso specifico inversamente proporzionale al valore
indicato dalla stessa, in modo tale da stabilizzare il prezzo di mercato anche
per quei giocatori che non sono attaccanti. Un difensore che performa bene
ha ora un peso simile ad un attaccante che performa nella stessa maniera.
Si passi ora alla risoluzione del problema dato dai giocatori definibili “one
shot” già citati in questo elaborato, ovvero quei calciatori le cui prestazioni
sono estremamente positive unicamente durante l’esiguo minutaggio in cui
hanno giocato (o per motivi fisici o tattici). Si sono voluti filtrare i dati presi
in considerazione in base alla variabile “Titolarità” creata durante lo studio
del dataset in Excel (si sono esclusi i valori binari “NO”).
Successivamente si sono creati due subsets filtrando i dati relativi all’annata
2021-2022 e 2022-2023, in modo tale da poter svolgere il lavoro prefissato
sulle diverse annate di gioco. Da questo punto in poi ogni trasformazione,
analisi, appunto o correzione effettuata al dataset verrà applicata a entrambi
i subsets (per semplificazione si riporteranno i passaggi effettuati
unicamente per l’annata 2021-2022, tranne per alcune interessanti
casistiche).

47
Una volta filtrati i dati in base all’annata si sono ulteriormente filtrati in base
alla posizione di gioco dei calciatori, creando di conseguenza altri sei
subsets. Questi sono stati poi trasformati in modo tale da contenere
solamente le statistiche di riferimento date dalla posizione selezionata unite
alle metriche pertinenti alle generalità e al valore dei giocatori. Le statistiche
comuni a tutti i calciatori sono: il nome dell’atleta (giocatore), se il calciatore
è considerato TOP (GiocatoreTOP), la squadra di appartenenza (squadra), il
valore di acquisto (AcqValore), il logaritmo del valore di acquisto
(LogValore22) e la fascia di prezzo data dal quartile del valore di mercato
“QuartValore”. Quelle peculiari in base alla posizione : Tiri nei 90 minuti
(T_90), goal su tiri effettuati (G_T), goal non su rigore su tiri effettuati
(npxG_T), goal nei 90 minuti (G_90), aspettativa di goal nei 90 minuti
(xG_90) e totalità dei passaggi fondamentali completati (Pfond_Compl_Tot)
per ATTdata; assist nei 90 minuti (A_90), aspettativa di assist nei 90 minuti
(xA_90), passaggi progressivi proposti e completati rispetto alla totalità dei
passaggi completati (PrgP_Compl_Tot), passaggi progressivi creati rispetto
alla totalità dei passaggi completati (PrgC_Compl_Tot), passaggi progressivi
ricevuti rispetto alla totalità dei passaggi completati (PrgR_Compl_Tot) e
totalità dei passaggi fondamentali completati (Pfond_Compl_Tot) per
CENdata; percentuale di contrasti vinti (Cntrs_vinti_Cntrs), percentuale di
contrasti nella tre quarti offensiva (Treq_off_Cntrs), passaggi progressivi
proposti e completati rispetto alla totalità dei passaggi completati
(PrgP_Compl_Tot), percentuale dei dribblatori contrastati
(Perc_Dribl_Cntrs), salvataggi nei 90 minuti (Salvat_90) e percentuale di
passaggi bloccati (Perc_P_Blocchi) per DIFdata.
Per cercare di ridurre possibili bias derivati dall'impatto dei valori estremi
nella distribuzione dei valori di mercato dei giocatori, si è voluto
trasformare i valori di acquisto dei singoli giocatori in logaritmi degli stessi.
Così facendo si è resa più robusta l’analisi che si vuole proporre e al tempo
stesso si è cercato di ridurre una potenziale eteroschedasticità data da
questa variabile.

Una volta terminata la fase preparatoria del dataset e dei diversi subset
creati, si è iniziata la vera e propria analisi. Il primo passo svolto in questa
direzione è stato cercare di esaminare le relazioni tra più variabili all’interno
di ogni singolo subset. La funzione utilizzata per creare la matrice di
scatterplot utile a questo fine è ggpairs. 30 La peculiarità che rende questa

30«ggpairs function - RDocumentation».

48
funzione la più adatta da utilizzare in questa casistica è il fatto che essa
riesce a svolgere più funzioni contemporaneamente. Consente di
visualizzare in modo rapido ed efficace sia a livello di dati che visivo le
relazioni tra tutte le copie di variabili studiate, esaminando e riportando le
correlazioni esistenti tra le stesse. Le prime matrici che si sono create usano
la metrica “QuartValore” per definire visivamente le differenti fasce di
prezzo dei giocatori, inoltre suddividono la tabella in due sezioni distinte.
Il riquadro in alto a destra dedicato alla correlazione delle variabili, mentre
quello in basso a sinistra indicante grafici scatterplots.
Una volta terminati i grafici riguardanti le fasce di valore dei giocatori, si è
nuovamente svolta la funzione ggpairs utilizzando come criterio di
colorazione la variabile “GiocatoreTOP”. In questo modo si sono potuti
confrontare i risultati ottenuti con quelli precedentemente trovati. Lo studio
specifico dei grafici fin qui ottenuti verrà affrontato in modo più dettagliato
nel paragrafo successivo.

Una volta constatato il valore dei dati a disposizione, si è proceduto


approcciandosi ad uno studio di regressione lineare multipla.
La regressione lineare multipla è una tecnica di analisi statistica volta a
studiare la relazione tra la variabile dipendente “LogValore” e le variabili
indipendenti relative alle caratteristiche peculiari del ruolo dei giocatori
presi in considerazione (ATT, CEN o DIF). Prima di proseguire
effettivamente con la regressione bisogna prendere in considerazione le
assunzioni fondamentali della stessa. In primis si assume che ci sia linearità
tra la variabile predittiva e quella di risultato. In secondo luogo, che i residui
siano indipendenti l’uno dall’altro (gli errori di un’osservazione non
devono dipendere da quelli di un’altra osservazione). Si assume che vi sia
omoschedasticità poiché l’eteroschedasticità potrebbe portare ad errori o
alla non affidabilità del modello; che gli errori siano distribuiti in modo
normale, ed infine, che non vi sia multicollinearità tra le variabili predittive
(si verifica quando due o più variabili predittive sono altamente correlate
tra loro, rendendo difficile distinguere i loro effetti individuali sulla
variabile di risultato). 31

Inizialmente si è voluto utilizzare l’approccio della regressione lineare


semplice, con il quale si è iniziata a studiare la dipendenza tra il logaritmo

31 Stock e Watson, Introduction to Econometrics.

49
del valore di mercato dei giocatori e, nel caso delle statistiche offensive, la
percentuale dei tiri nei 90 minuti.
Si è proseguito analizzando regressioni lineari multiple e verificando, di
volta in volta, la validità delle assunzioni precedentemente descritte. Si sono
creati grafici specifici per avere un riscontro visivo dell’operato. Si allega a
titolo esemplificativo la tabella riguardante le assunzioni delle ipotesi sulla
regressione lineare multipla degli attaccanti dell’annata 2021-2022 (figura 6).
Il grafico “Residual vs Fitted” prende in considerazione l’assunzione di
linearità del modello e al tempo stesso la sua omoschedasticità.
Tendenzialmente i valori del modello non dovrebbero avere un pattern
specifico e dovrebbero essere distribuiti in modo randomico (più la linea

Figura 6 Test assunzioni ATT Multiple Linera Model

Grafici rappresentati le assunzioni della regressione lineare multipla con modello lineare

rossa si presenta parallela all’asse dei Fitted Values, più conferma


l’assunzione). Q-Q Residuals fa comprendere se il modello selezionato ha o
meno una distribuzione normale; quello dedicato alla Scale-Location è
incentrato maggiormente sul capire se ci sia o meno eteroschedasticità; ed
infine, Residuals vs Leverage visualizza se ci sono outliers e se vi siano
squilibri di peso all’interno dei valori del modello.
Per ovviare al palese problema dato dalla figura 6 (in particolar modo nel
primo grafico) si è deciso di trasformare il modello preso in considerazione

50
Figura 7 Test assunzioni ATT Multiple Linera Model Quadratico

Grafici rappresentati le assunzioni della regressione lineare multipla con modello quadratico

da lineare a quadratico (in questo modo si riduce l’eteroschedasticità


palesatasi).
Dopo aver trasformato il modello, si è svolto un rapido test grafico per
verificare se la condizione delle assunzioni fosse migliorata (figura 7).

Dai risultati mostrati dalla figura 7, si può dedurre che il modello quadratico
confermi le assunzioni. Questa “analisi” riguardante la regressione lineare
multipla è stata svolta per tutti i subset della tesi.
Successivamente, per far fronte alla possibilità che la varianza degli errori
residuali non sia costante in tutte le condizioni o per tutti i livelli delle
variabili indipendenti, si sono acquisiti gli errori standard robusti
all’eteroschedasticità utilizzando il modello HC1. Questi sono poi stati
utilizzati per determinare l’esito della regressione. I risultati ottenuti
verranno analizzati nel dettaglio nel paragrafo successivo insieme ai grafici
precedentemente discussi.

Una volta ottenuti i modelli di regressione lineare multipla delle diverse


fasce di gioco, si è proceduto ad utilizzare la funzione predict per generare
l’output necessario allo studio di questa tesi. Prima di ottenere
effettivamente il valore di mercato predetto dal modello, ci si è resi conto
che per poter ricavare un risultato più fedele e maggiormente consono allo

51
studio effettuato, si doveva necessariamente “pulire” il modello utilizzato
rendendolo “robusto” all’eteroschedasticità e agli outliers (gli
heteroskedasticity-robust standard errors ottenuti precedentemente non
modificano perennemente il modello lineare a cui fanno riferimento, ma
sono degli strumenti che possono fornire supporto solo se applicati
congiuntamente allo stesso).
Si è scelto di utilizzare il metodo di stima robusto “lmrob”. Il metodo di
stima robusto è una forma di analisi di regressione progettata per aggirare
alcune limitazioni del metodo parametrico tradizionale e non. (questa
funzione calcola uno stimatore di regressione di tipo MM (Il metodo di
stima MM è lo sviluppo dell'estensione del metodo della massima
verosimiglianza) come descritto in Yohai (1987) e Koller e Stahel (2011). Per
impostazione predefinita utilizza una funzione di punteggio ascendente
biquadrato e restituisce uno stimatore altamente robusto ed altamente
efficiente (con punto di rottura del 50% e efficienza asintotica del 95% per
errori normali)) 32.

I passaggi successivi all’utilizzo della funzione lmrob prendono in


considerazione i valori di mercato dei vari giocatori utilizzando la funzione
predict. Grazie all’utilizzo di questa funzione , si “predicono” i valori di
mercato dei calciatori utilizzando la regressione lineare multipla
precedentemente ricavata. Infine, si sono svolti alcuni passaggi necessari a
trasformare i dati appena ottenuti in modo da renderli maggiormente
appetibili visivamente. I risultati e i commenti relativi verranno affrontati
nel capitolo apposito dedicato alle conclusioni sul lavoro svolto.

4.2 – Risultati ed analisi grafica

In questo capitolo si vogliono raggruppare e spiegare tutti i grafici creati


durante lo studio e l’analisi del progetto di tesi. Tutte le figure analizzate in
questo paragrafo sono originali e sono state prodotte utilizzando il software
R studio. I primi grafici affrontati, come già accennato nello scorso
paragrafo, sono derivati dalla funzione ggpairs e mettono in relazione le
variabili dei subset dedicati al ruolo dei giocatori selezionati (figure che
vanno dalla n. 8 alla n. 13). Si possono dividere queste figure in tre parti ben
distinte: la diagonale, costituita da grafici indicanti la densità delle variabili

32Almetwally e Almongy, «Different Estimators»; Yohai, Stahel, e Zamar, «A Procedure


for Robust Estimation and Inference in Linear Regression».

52
(funge da divisoria tra le altre due “parti”); l’area superiore ai grafici di
densità è costituita da valori indicanti la correlazione generale tra le
variabili; la zona inferiore mostra scatterplots indicanti l’andamento delle
metriche prese in considerazione. Ogni singolo parametro rappresentato
all’interno delle figure che vanno dalla numero 8 alla numero 13, è
indicativo della suddivisione in “fasce di valore” effettuata
precedentemente. I dati sono quindi suddivisi per colore e riportano i valori
indicati dalla fascia di appartenenza (L, M-L, M-H e H).

Si proceda analizzando la figura 8. L’analisi esplorativa derivata da questa


tabella mette in relazione sette variabili numeriche, una dipendente
“LogValore” e sei indipendenti: "T_90", "G_T", "npxG_T", "G_90", "xG_90" e
"Pfond_Compl_Tot".
La prima “sezione” che si vuole prendere in considerazione consiste nella
diagonale di grafici di densità. Il primo valore, indicante il logaritmo del
valore dei calciatori, ci indica che mediamente in serie A, durante l’annata
2021-22 le squadre hanno acquistato/venduto giocatori con un prezzo
tendenzialmente medio (valori color verde e azzurro). Proseguendo
l’analisi si nota come la distribuzione di densità del valore dei giocatori sia
tendenzialmente rispettata, ma con alcune eccezioni. Viene confermato
come i giocatori che vengono pagati maggiormente abbiano delle
caratteristiche generali molto soddisfacenti e che per questo motivo abbiano
una distribuzione per lo più tendente alla “parte destra” del riquadro di
riferimento (area viola all’interno dei grafici). I valori indicanti le altre
tipologie di “fasce prezzo” sono invece spesso non corrispondenti
all’effettiva performance o aspettativa di performance indicata dalle
metriche. Questa distorsione avvalora l’ipotesi data dal lavoro svolto da
questa tesi. Esistono infatti giocatori sottovalutati/sopravvalutati il cui
valore di mercato non indica fedelmente le caratteristiche peculiari degli
stessi. Esistono infatti numerosi bias che portano a valutare atleti in maniera
non idonea al loro potenziale. Per fare un esempio, l’aspettativa dei mass
media e degli stessi club rispetto al talento effettivo degli atleti.
I grafici di dispersione, indicanti la relazione tra le variabili quantitative,
sono per lo più indicanti relazioni positive tra le variabili, eccetto in alcune
casistiche dove la relazione tra le metriche è pressoché nulla. Durante la fase
di scelta delle metriche da utilizzare per la fase offensiva dei giocatori, si era
tenuto conto di come i passaggi fondamentali completati totali non fossero
prettamente utili a rappresentare un attaccante, ma si è comunque voluto

53
Figura 8 ATT 2021-22

54
Figura 9 CEN 2021-22

55
Figura 10 DIF 2021-22

56
Figura 11 ATT 2022-23

57
Figura 12 CEN 2022-23

58
Figura 13 DIF 2022-23

59
tenere in considerazione la metrica per i motivi già affrontati nei capitoli
precedenti.
Il riquadro dedicato alla correlazione, indicante quanto le variazioni in una
variabile sono associate alle variazioni nell'altra variabile, specifica numeri-
camente il grado di relazione visualizzato precedentemente grazie agli scat-
terplots. I valori che più sono importanti per lo studio della tesi riguardano
la correlazione delle variabili indipendenti con quella dipendente. I valori
analizzati sono abbastanza significativi nonostante le metriche riguardanti
i goal e gli expected goal sul numero totale di tiri effettuati non siano parti-
colarmente rilevanti. Seppur non vi siano valori eclatanti si è comunque de-
ciso di continuare a tenere in considerazione e basare l’analisi del modello
lineare multiplo anche su queste variabili, poiché si reputa che il cinismo
identificato dalle metriche sia di notevole rilevanza per lo scopo della tesi.

Si passi ora alla figura 9, indicante le statistiche adatte ad un centrocampista


relative all’annata 2021-2022.
A differenza della figura precedente, i grafici di densità sono (eccetto per le
variabili “A_90” e “xA_90”) abbastanza uniformi. Questo è dovuto al bias
esistente all’interno del sistema di valorizzazione dei calciatori. Notoria-
mente un attaccante viene valutato maggiormente di chi gioca in altre posi-
zioni a causa dell’esiguo numero di goal che vengono in media segnati in
una partita (in Serie A, durante la stagione 2022-23 vi è stata una media goal
di 2,44 reti a partita). Per questo motivo chi riesce a “buttare la palla in rete”
viene valutato maggiormente di chi effettivamente riesce a creare occasioni
da goal. Dai grafici di densità si deduce come un calciatore pagato profu-
matamente abbia in media le stesse caratteristiche di passaggio dei suoi
compagni meno valorizzati.
Le sezioni dedicate agli scatterplots e alla correlazione tra variabili avvalo-
rano quanto appena descritto. Le relazioni individuate dai grafici di disper-
sione sono per lo più neutre e, di conseguenza, le correlazioni individuate
presentano lo stesso andamento. Nonostante la significatività delle variabili
che non prendono in considerazione gli assist non siano prettamente signi-
ficative, si è comunque voluto lasciarle all’interno dello studio effettuato per
le motivazioni precedentemente descritte. I passaggi progressivi sono una
valevole rappresentazione dello sviluppo di gioco offensivo proposto da
questa tesi.

La figura 10 è rappresentativa delle variabili relative all’approccio difensivo


dei calciatori. Come nella figura precedente i grafici di densità sono

60
abbastanza omogenei a eccezion fatta per quello relativo ai passaggi pro-
gressivi completati, che vede i giocatori maggiormente pagati avere valori
mediamente minori di tutti gli altri calciatori. Da questo dato si può dedurre
che mediamente i club calcistici con un’elevata disponibilità economica pre-
diligono difensori più rocciosi e tradizionali rispetto a quelli che propon-
gono passaggi progressivi e che quindi interpretano il ruolo in un modo
“più moderno” (diventando di fatto dei “playmaker” difensivi). I grafici
scatterplots palesano una relazione tra le variabili tendenzialmente neutra
e una buona distribuzione dei valori studiati. Le correlazioni con la varia-
bile dipendente sono poco significative per le motivazioni citate preceden-
temente. Durante lo studio lineare multiplo ci si aspetterà un basso R2 a
causa dell’intrinseca poca significatività riscontrata (trasposizione esempli-
ficativa dei valori di mercato che i recruiter danno a calciatori difensivi).

Le figure 11,12 e 13, rappresentano rispettivamente i dati relativi alle varia-


bili di attacco, centrocampo e difesa dell’annata 2022-2023, sono per lo più

Figura 14 ATT lm

Linear regression model delle variabili di attacco per le annate 2021-22 e 2022-23

61
Figura 15 CEN lm

Linear regression model delle variabili di centrocampo per le annate 2021-22 e 2022-23

Figura 16 DIF lm

Linear regression model delle variabili di difesa per le annate 2021-22 e 2022-23

simili alle figure precedentemente analizzate. Grafici di densità tendenzial-


mente omogenei, scatterplots positivi e neutri e correlazioni generalmente
neutre o positive. (gli unici valori che cambiano sono già stati esplicati

62
quando si sono analizzati grafici dell’annata precedente). Per questo motivo
si è deciso di lasciare le tabelle a titolo esemplificativo.

Si proceda ora ad analizzare le ultime tre tabelle derivate dall’analisi svolta


su R studio. Le tabelle numero 14, 15 e 16 rappresentano le stime dei modelli
di regressione lineare multipla delle variabili di attacco, centrocampo e di-
fesa già selezionate precedentemente. Le tabelle sono suddivise in due co-
lonne in modo tale da poter mettere più facilmente a confronto i risultati
delle due annate prese in considerazione nel dataset. Inoltre, ogni singola
sezione ha al suo interno l’esito di tutti i linear models che si sono effettuati
durante lo studio delle tre diverse fasce di gioco. Si vuole anticipare che in
diverse casistiche le variabili all’interno del modello studiato non mostre-
ranno significatività. Seppur questo risultato porterebbe normalmente
all’esclusione delle “variabili non significative” dal modello lineare, si è de-
ciso di continuare lo studio lineare multiplo a causa del bias derivato dal
limitato numero di osservazioni di ogni singolo modello. Per questo preciso
motivo si sono volute creare le figure in modo che potessero essere consul-
tate guardando all’andamento delle variabili nelle due annate di riferi-
mento (in diversi casi variabili che nel 2021-22 non sono significative risul-
tano esserlo nell’annata successiva, e viceversa). Questo per cercare di limi-
tare la “falsa” non significatività delle metriche prese in considerazione.

Si inizi prendendo in considerazione l’output derivato dall’analisi di regres-


sione lineare multipla per le variabili offensive del dataset.
Innanzitutto, si può notare come l’area a sinistra della figura 14 (relativa
all’annata 2021-22) abbia più variabili indipendenti rispetto a quella di de-
stra (annata 2022-23). Come spiegato nel paragrafo dedicato ai passaggi
svolti durante lo studio del dataset, dopo aver analizzato i risultati dell’ana-
lisi svolta sul modello lineare multiplo semplice, ci si è resi conto di come le
ipotesi di linearità del modello stesso non fossero completamente rispettate.
Una volta avuta la controprova visiva data dall’esempio della figura 6, si è
optato per rendere il modello quadratico.
Come si può notare, nel modello quadratico le variabili indipendenti non
sono prettamente significative (come già osservato dai grafici precedenti).
Nonostante questo, l’ adjusted R2 (misura corretta della bontà di adattamento
del modello lineare multiplo) identifica il 59% della varianza spiegata dalle
varie metriche prese in considerazione. I regressori “npxG_T”, “npxG_T2” e
“Pfond_Compl_Tot2” fanno riflettere a causa dell’enorme peso che hanno
sulla variabile dipendente (si ricorda che la variabile dipendente è ancora

63
espressa in forma logaritmica). Per esempio, se il rateo dei non-penalty goal
su tiri al quadrato dovesse aumentare di un’unità, porterebbe la variabile
dipendente a diminuire di ben 104 unità. Come già spiegato precedente-
mente, ci si aspettava una correlazione negativa da questa metrica. Un’altra
interessante osservazione risiede nel fatto che la percentuale di goal non su
rigore rispetto ai tiri effettuati ha un apporto negativo sul prezzo dei gioca-
tori. Il prezzo di un’attaccante non sale quando questo è cinico sotto porta,
ma quando lui faccia effettivamente goal.
La controparte dedicata all’annata 2022-23 segue un modello lineare multi-
plo semplice e consta anch’essa di poca significatività da parte delle varia-
bili indipendenti. La varianza è spiegata al 29% e non possiede risultati
estremamente elevati . L’unica variabile negativa è ancora una volta dovuta
a “npxG_T”, confermando quanto appena scritto.

Si guardi ora alla figura 15, indicante le metriche relative al centrocampo.


L’area sinistra dell’immagine palesa come gli expected assists e i passaggi
fondamentali completati totali siano significativi per determinare l’esito
della variabile dipendente “LogValore22”. L’ adjusted R2 in questa casistica
spiega il 46% della varianza derivata dalle metriche indipendenti. Le metri-
che indicanti un calciatore volto a ricevere palla in zona offensiva e a fornire
passaggi potenzialmente pericolosi, incidono negativamente sul valore di
mercato degli atleti. Come già notato durante lo studio proposto, le variabili
indicanti il pressing da parte dei calciatori influenzano mediamente in
modo negativo il valore di mercato degli stessi, nonostante queste siano un
buon indicatore della proposizione offensiva e dello stile di gioco della
squadra. Questo a riprova del fatto che il sistema calcistico italiano ha an-
cora un’impronta tecnico-tattica più attendista e “difensiva” rispetto alla
Premier League.
Si prenda ora in considerazione la parte destra della figura 15. Le variabili
significative sono maggiori della controparte sinistra e corrispondono alla
totalità delle variabili indipendenti eccetto “PrgP_Compl_Tot”,
“Prgc_Compl_Tot” e “Pfond_Compl_Tot”. Questo data può essere letto con lo
stesso criterio utilizzato per la controparte del 2021-22. Il modello di regres-
sione lineare si adatta ai dati al 37% e presenta una relazione negativa quasi
del tutto speculare a quanto visto per la parte sinistra della figura. L’unica
variabile che in questa annata possiede un andamento leggermente nega-
tivo è quella indicante i passaggi progressivi tentati e completati rispetto al
numero totale di passaggi effettuati.

64
Si consideri infine la figura 16, rappresentativa della regressione lineare mul-
tipla per i valori utilizzati rispetto alle caratteristiche difensive dei calciatori.
Il modello dell’area di sinistra, relativo all’annata 2021-22, presenta signifi-
catività unicamente per la variabile dipendente. Oltre a questo, quello che
più fa riflettere è il bassissimo valore di R2. La varianza è spiegata unica-
mente al 9%, una piccolissima percentuale della variazione totale nei dati,
tenendo conto del numero di variabili indipendenti utilizzate. Ci si aspet-
tava un valore particolarmente basso a causa della poca importanza data ai
valori difensivi durante la stima del prezzo di mercato dei calciatori, ma l’
R2 individuato è comunque troppo irrisorio. In questa casistica il modello
relativo all’annata 2022-23 è utile per poter determinare se vi sia un errore
insito all’interno del modello studiato. Il confronto fa capire come l’esiguo
numero di osservazioni incida sulla stima del modello lineare multiplo. I
dati relativi ai contrasti e ai passaggi progressivi completati totali hanno
una relazione negativa con la variabile dipendente, confermando quanto ri-
portato nel paragrafo dedicato ai valori delle metriche.
Infine, l’area destra della figura rappresenta circa il 20% della varianza to-
tale nei dati (a differenza di quanto riportato dal grafico relativo all’annata
2021-22, seppur basso, il valore è accettabile). Anche in questa casistica la
significatività appartiene solamente alla variabile dipendente, mentre le va-
riabili con un’incisività negativa all’interno del modello sono:
“Treq_off_Cntrs”, “PrgP_Compl_Tot” e “Salvat_90”.

Le figure analizzate in questo capitolo sono la base su cui verrà predetto nel
paragrafo successivo il valore cardine dello studio di questa tesi.

4.3 – Il modello predittivo

In questo paragrafo si vogliono descrivere gli ultimi passaggi effettuati per


riuscire a raggiungere l’obiettivo ultimo di questa tesi: individuare quei
giocatori che per diversi motivi vengono sottovalutati dal mercato.
Per poter raggiungere questo obiettivo, come già accennato in precedenza,
si è utilizzata la funzione predict. Questa funzione consente di effettuare
previsioni o stime basate su modelli statistici precedentemente addestrati.
In questa casistica utilizza i modelli lineari multipli che si sono creati in
precedenza per poter stabilire l’output desiderato: il valore di mercato
(logaritmico) dei calciatori presi in considerazione.

Prima di iniziare con il procedimento che ha portato al risultato finale


dell’elaborato, si vuole fare un appunto per quanto riguarda la funzione

65
lmrob utilizzata per rendere i modelli omoschedastici. A causa di un errore
di codice riscontrato durante l’utilizzo di questa funzione (in particolare,
sul modello quadratico relativo all’attacco dell’annata 2021-22), si è deciso
di utilizzare le variabili lineari semplici dedicate all’attacco dell’annata
presa in considerazione durante l’utilizzo della funzione sopra citata. In
questo modo l’errore di codice viene eliminato e si può procedere alla vera
e propria “predizione” del valore di mercato.33

Il primo passaggio svolto è stato quello di utilizzare la funzione predict per


ottenere i risultati di predizione di ogni singola fascia di gioco dedicata ai
calciatori selezionati. Il risultato è quindi una striscia di valori logaritmici
corrispondenti ai calciatori attaccanti, centrocampisti e difensori delle due
annate prese in considerazione. Una volta ottenuta la “striscia di valori”, si
è aggiunta ai vari subset di attacco, centrocampo e difesa, creando una
nuova variabile dal nome “pred”.
Si sono svolti gli stessi identici passaggi per un’altra variabile, “predValue”,
creata appositamente facendo l’inverso del logaritmo dei valori della
stringa “pred”. In questo modo si possiedono i valori dei calciatori di Serie
A stimati dal modello creato.

Il passaggio successivo vede la creazione di un’ulteriore variabile,


denominata “surplus”, derivata dalla differenza tra la metrica appena creata
“predValue” e “AcqValore”. Procedendo in questa maniera si sono
individuati tutti quei calciatori che porterebbero ad un guadagno (o ad una
perdita) se acquistati durante la fase di mercato (si prende in considerazione
una fotografia temporale dei dati e dei valori dei calciatori nel periodo
storico di riferimento della stessa).

Si è poi voluta realizzare la nuova variabile “Talent”. Questa metrica


consiste in una stringa binaria di elementi qualitativi che assumono valore
“sì” quando la variabile surplus è maggiore o uguale a 5mln di euro, “no”
quando ha valore inferiore.

L’ultimo passaggio svolto ha visto la nascita di un nuovo subset di dati


“Talent” (si è deciso di chiamarlo allo stesso modo dell’ultima variabile
creata), formato dall’unione delle variabili dedicate ai valori predetti dal
modello ed alcune generalità base dei calciatori. Il subset appena descritto
contiene al suo interno queste metriche: “giocatore”, “squadra”, “AcqValore”,
“predValue”, “surplus”, “Talent”, “GiocatoreTOP” e “Età”.

33 L’errore riportato è il seguente: S-estimated scale == 0: Probably exact fit; initial estim.
'init' not converged -- will be return()ed basically unchanged

66
Si riportano ora i vari subset “Talent” dedicati alle diverse fasce di gioco
prese in considerazione per le due annate distintive dello studio effettuato
(figure che vanno dalla numero 17 alla 22).

Figura 17 Talent ATT 2021-22

Risultato finale indicante gli attaccanti sottovalutati dell’annata 2021-22 che possono
potenzialmente portare un surplus di oltre 5mln di euro

Figura 18 Talent ATT 2022-23

Risultato finale indicante gli attaccanti sottovalutati dell’annata 2022-23 che possono
potenzialmente portare un surplus di oltre 5mln di euro

Figura 19 Talent CEN 2021-22

Risultato finale indicante i centrocampisti sottovalutati dell’annata 2021-22 che possono


potenzialmente portare un surplus di oltre 5mln di euro

Figura 20 Talent CEN 2022-23

Risultato finale indicante i centrocampisti sottovalutati dell’annata 2022-23 che possono


potenzialmente portare un surplus di oltre 5mln di euro

67
Figura 21 Talent DIF 2021-22

Risultato finale indicante i difensori sottovalutati dell’annata 2021-22 che possono potenzialmente
portare un surplus di oltre 5mln di euro

Figura 22 Talent DIF 2022-23

Risultato finale indicante i difensori sottovalutati dell’annata 2022-23 che possono potenzialmente
portare un surplus di oltre 5mln di euro

Si ricorda che i calciatori rappresentati all’interno delle figure appena


proposte sono “filtrati” secondo uno stile di gioco prettamente offensivo e
dedicato alla maggior produzione possibile di occasioni da goal. Lo studio
si è infatti proposto di trovare quei giocatori sottovalutati dal mercato
nonostante le ottime caratteristiche dedicate alle aree offensive. In questo
modo si è voluta sfruttare la filosofia moneyball per ottenere due output
potenzialmente favorevoli alla strategia adottata da un immaginario club di
calcio. Lo studio effettuato è ottimo sia per una strategia volta alla rivendita
dei calciatori, sia ad una strategia volta allo scovare “talenti” a basso prezzo
di mercato.
Si prenda in considerazione la prima casistica: la strategia cardine della
società calcistica di riferimento consiste nel ricavare il maggior surplus
possibile dalla rivendita degli atleti individuati dal modello studiato. Come
già spiegato precedentemente, il valore di calciomercato dei giocatori ha un
bias insito nella produzione offensiva degli stessi. Il campo da calcio è un
ottimo palcoscenico entro il quale mostrare il talento di questi giocatori. Più
un calciatore gioca in modo offensivo, più il suo prezzo di mercato
aumenterà. Si ipotizzi che l’immaginario club di calcio precedentemente
citato decida di acquistare, durante la sessione di calciomercato a cavallo tra
l’annata 2021-22 e 2022-23, Armand Laurienté (in questa ipotesi il calciatore
si trasferisce nel club immaginario X al posto che al Sassuolo). Se durante

68
l’annata successiva il club X riesce a costruire un ambiente ideale per lo
sviluppo del talento francese acquistato, il valore di mercato del calciatore
salirebbe a circa 17,4mln di euro (rispetto ai 10mln utilizzati per
acquistarlo), riuscendo così ad ottenere, da una immaginaria rivendita, un
surplus di circa 7,4mln di euro.
Per la seconda casistica si deve tener conto che la variabile “Età” non è
volutamente stata presa in considerazione all’interno del modello. Questa
variabile inciderebbe notevolmente sul valore di mercato stimato dei
calciatori. Se per esempio, si dovesse scegliere chi comprare tra due
calciatori con le stesse identiche caratteristiche, si sceglierebbe sempre di
acquistare il giocatore più giovane. Questo per il semplice motivo che gli
atleti vengono visti come assets finanziari che possono durare tra il medio
e il lungo periodo. Se si investisse in un calciatore le cui performance sono
in costante decrescita, il suo prezzo di mercato sarebbe anch’esso in costante
decrescita.
Per questo preciso motivo i giocatori “anziani” sono notevolmente
sottovalutati. Nonostante con l’avanzare dell’età il rendimento degli stessi
diminuisca, è comunque più vantaggioso investire nel breve periodo su un
calciatore agonisticamente “maturo” come Edin Dzeko, pagato dall’Inter
4mln di euro e con un potenziale di 24,5mln di euro, piuttosto che spendere
il triplo per un calciatore più giovane. La filosofia Moneyball non guarda
infatti all’età degli atleti presi in considerazione poiché gli stessi possono
“fruttare” all’interno della squadra non solo economicamente ma anche a
livello di esperienza (i giocatori più anziani possono condividere
l’esperienza fruttata durante gli anni di gioco con i compagni di squadra
più giovani, indirizzandoli quindi verso una crescita personale e agonistica
più rapida).

I risultati ottenuti sono consoni con quanto predetto all’interno del modello
e forniscono un interessante fotografia sui giocatori che più vengono
sottostimati all’interno del campionato di Serie A.

69
CONCLUSIONI

Il presente studio si è posto l’obiettivo di utilizzare i concetti e la filosofia


“Moneyball”, tanto cari al mondo sportivo americano, per riuscire ad
individuare “talenti nascosti” all’interno del sistema calcistico italiano.

Per poter riuscire in questo proposito si è inizialmente voluto fare chiarezza


su cosa effettivamente sia il Moneyball.
Siccome il concetto affrontato è nato e si è sviluppato a livello sportivo
principalmente all’interno del continente nordamericano, il percorso
iniziale proposto dall’elaborato vede un’iniziale focus sul “cammino”
svolto da questa filosofia di gioco: dai primi utilizzi nel mondo del baseball
alla vera e propria consacrazione a livello sportivo americano, dall’espatrio
in Europa alle prime applicazioni calcistiche in territorio italiano

Concluso questo passaggio si è proceduto alla vera e propria analisi


empirica volta al raggiungimento dell’obiettivo prefissato dall’elaborato. La
ricerca si è basata sull’impiego di statistiche descrittive inerenti al
campionato di Serie A durante le annate 2021/2022 e 2022/2023. Il processo
di analisi è stato effettuato quasi principalmente sul software statistico R.
I dati utilizzati sono stati filtrati in modo tale da poter individuare quei
calciatori che propongono uno stile di gioco incentrato sull’offensività (sia
che questi siano attaccanti, centrocampisti o difensori). Questo è stato
attuato poiché si è riconosciuto un notevole bias nel modo in cui si valutano
i prezzi di mercato (è notoriamente riconosciuto come gli attaccanti
vengano valutati maggiormente rispetto ai centrocampisti o ai difensori,
seppur molte volte le statistiche suggerirebbero il contrario. Allo stesso
modo un’azione offensiva è valutata in maniera migliore di un intervento
difensivo o di un passaggio fondamentale).

Gli output ricavati dallo studio individuano esattamente quei calciatori che
per svariate motivazioni sono stati sottovalutati, sia in termini monetari, che
di prestazioni, dal calciomercato. I risultati mostrano infatti tutti quegli
atleti la cui differenza di prezzo tra il valore di mercato stimato dal modello
e il valore di mercato effettivo degli atleti, sia di almeno 5mln di euro. I
calciatori così individuati rappresentano dei veri e propri asset monetari
che, se rivenduti, possono potenzialmente portare a notevoli plusvalenze.

Lo studio effettuato è volto esclusivamente all’individuare i giocatori


“potenzialmente valevoli” e non tratta della possibile rivendita degli stessi.
Inoltre, i dati utilizzati e gli output ottenuti fanno unicamente riferimento

70
alle date sopra citate. Eventuali alterazioni di prezzo o di valore dei
giocatori non vengono presi in considerazione dalla ricerca qui condotta.

Nonostante i successi della ricerca effettuata, è importante notare che ci


sono alcune limitazioni che potrebbero essere affrontate in studi futuri. In
primis, si potrebbe ampliare lo studio ad una ricerca su larga scala. Il
modello è tanto più efficace quanto più il dataset di riferimento è preciso ed
esteso. In secondo luogo, lo studio può essere filtrato attraverso diversi
parametri. A differenza di quanto svolto si potrebbe voler trovare giocatori
con caratteristiche più difensive o non dedicate all’attacco. A seconda dei
filtri utilizzati il modello individuerà output valevoli differenti. Infine, si
potrebbe provare a creare un modello che riesca a tener conto di valori di
mercato quali cessioni a titolo gratuito o prestiti.

Il presente studio è di estrema attualità e riporta una nitida fotografia degli


squilibri valutativi all’interno del calciomercato italiano.
Alla luce dei risultati ottenuti, si può affermare che il modello creato è una
valevole rappresentazione di come il sistema di valutazione dei giocatori di
calcio possa essere “sfruttato” attraverso “investimenti mirati”.
Si spera che questa ricerca possa contribuire all'approfondimento della
conoscenza della filosofia Moneyball e possa essere utilizzata per prendere
decisioni informate e sviluppare politiche di investimento più efficaci.

71
BIBLIOGRAFIA:

 Almetwally, Ehab Mohamed, e Hisham Mohamed Almongy.


«Different Estimators», 2018.

 Baseball-Reference.com. «MLB Stats, Scores, History, & Records»,


s.d. https://www.baseball-reference.com/

 Battilana, Matteo. «L’ascesa del Brentford: il coraggio di agire». Idea


Calcio. https://www.ideacalcio.net/il-gioco-piu-bello/uno-sguardo-
sul-calcio-estero/brentford.html

 «Calcio e Mercato», s.d. https://www.transfermarkt.it/

 Calò, Alberto. «I rivoluzionari dello Sport: Bill James, l’inventore


dell’algoritmo vincente». Gioco Pulito (blog).
https://giocopulito.it/i-rivoluzionari-dello-sport-bill-james-
linventore-dellalgoritmo-vincente/

 Cicerone. «Tusculanae disputationes (libro V, capitoli 61-62),(45


a.C.)».
https://it.wikipedia.org/w/index.php?title=Damocle&oldid=1259745
76

 Connol, Cyril. «Enemies of Promise (1938), Part 2: The Charlock’s


Shade, Ch. 13: The Poppies (p. 109-110)». Quotepark.com, s.d.
http://quotepark.com/quotes/787402-cyril-connolly-whom-the-
gods-wish-to-destroy-they-first-call-pro/

 cran.r-project. «Polite: Be Nice on the Web», s.d.

 «DECRETO LEGISLATIVO 9 gennaio 2008, n. 9 - Normattiva», s.d.


https://www.normattiva.it/atto/caricaDettaglioAtto?atto.dataPubbli
cazioneGazzetta=2008-02-
01&atto.codiceRedazionale=008G0019&tipoDettaglio=multivigenza
&qId=&tabID=0.7950515131379223&title=Atto%20multivigente&blo
ccoAggiornamentoBreadCrumb=true

 Fabbro, Mattia. «Rasmus Ankersen, l’ossessione per i numeri per


vincere nel calcio». SOCIAL MEDIA SOCCER.
https://www.socialmediasoccer.com/it/articolo/rasmus-ankersen-
lossessione-per-i-numeri-per-vincere-nel-calcio.html

 FBref.com. «Statistiche e storia del calcio», s.d. https://fbref.com/it/

72
 FBref.com. «Tutto ciò che riguarda FBref.com», s.d.
https://fbref.com/it/about/index

 Forker, John. «Discussion of Accounting, Valuation and Duration of


Football Player Contracts». Journal of Business Finance & Accounting
32, fasc. 3–4 (2005): 587–98. https://doi.org/10.1111/j.0306-
686X.2005.00605.x

 «ggpairs function - RDocumentation», s.d.


https://www.rdocumentation.org/packages/GGally/versions/1.5.0/t
opics/ggpairs

 Gori, Ignazio. «IL BASEBALL E’ UNA SCIENZA? Intervista a Max


Marchi - Il Bar Del Baseball». Il bar del baseball (blog).
https://www.ilbardelbaseball.com/il-baseball-e-una-scienza-
intervista-a-max-marchi/

 James, Bill. «The Bill James Baseball Abstracts (1977)».


https://en.wikipedia.org/w/index.php?title=Bill_James&oldid=11724
03720

 Lewis, Michael. «Moneyball_The Art of Winning an Unfair Game», s.d.

 L’Ultimo Uomo. «Baseball, sabermetrica e altri pianeti», 10 ottobre


2016. https://www.ultimouomo.com/baseball-sabermetrica-e-altri-
pianeti/

 «Media Gol totali - Serie A (Italia) | FootyStats», s.d.


https://footystats.org/it/italy/serie-a/average-total-goals-table

 «MLB.com | Il sito ufficiale della Major League Baseball», s.d.


https://www.mlb.com/

 Moore, Chris. «How Much Each Premier League Club Earned in TV


Revenue». World Soccer Talk. https://worldsoccertalk.com/tv/how-
much-each-premier-league-club-earned-in-tv-revenue-20230531-
WST-435435.html

 Ravelli, Venanzio Postiglione e Arianna. «Gerry Cardinale: “Per il


mio Milan vorrei essere un Berlusconi 2.0. Gli algoritmi ci aiutano,
perché la serie A non mi ascolta?”» Corriere della Sera, 15 settembre
2023. https://www.corriere.it/sette/incontri/23_settembre_15/gerry-
cardinale-per-mio-milan-vorrei-essere-berlusconi-20-algoritmi-ci-

73
aiutano-perche-serie-non-mi-ascolta-d8c8a50e-4fbb-11ee-bf2a-
fe4dfcd6f834.shtml

 «RedBird Capital Partners – Principal Investment Firm», s.d.


https://redbirdcap.com/

 Sanchez, Javier. «Usted pone el precio que Real Madrid y Barcelona


pagan por sus fichajes». ELMUNDO, 16 luglio 2019.
https://www.elmundo.es/deportes/futbol/2019/07/16/5d2cd526fddd
ff92078b4691.html

 «Serie A - Trasferimenti 23/24», s.d.


https://www.transfermarkt.it/serie-a/transfers/wettbewerb/IT1

 Spadaro, Mirko. «Diritti tv, l’ultima della Premier League guadagna


più della prima in Serie A | DATI». CalcioWeb.
https://www.calcioweb.eu/2023/06/diritti-tv-stagione-2022-2023-
dati-serie-a-premier-league/10555040/

 Stats Perform. «Opta Data from Stats Perform», s.d.


https://www.statsperform.com/opta/

 Stock, James H., e Mark W. Watson. Introduction to Econometrics.


Fourth edition, Global edition. The Pearson Series in Economics.
Harlow, England London New York Boston San Francisco Toronto
Sydney Dubai Singapore Hong Kong Tokyo Seoul Taipei New
Delhi Cape Town Sao Paulo Mexico City Madrid Amsterdam
Munich Paris Milan: Pearson, 2020.

 Volpi, Andrea. «L’INNOVAZIONE DEGLI EXPECTED GOALS»,


s.d.

 Yohai, Victor J., Werner A. Stahel, e Ruben H. Zamar. «A Procedure


for Robust Estimation and Inference in Linear Regression». In
Directions in Robust Statistics and Diagnostics, di Werner Stahel e
Sanford Weisberg, 365–74. The IMA Volumes in Mathematics and
Its Applications. New York, NY: Springer New York, 1991.
https://doi.org/10.1007/978-1-4612-4444-8_20

74

Potrebbero piacerti anche