Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INDICE
1. INTRODUZIONE………………………………………………………………………………………………………………………3
2. ANALISI DELLA LETTERATURA SCIENTIFICA…………………………………………………………………………..…3
2.1. F1 MANAGER 22: variabili tecniche del gioco…………………………………………………………………………………3
4. RISULTATI EMPIRICI………………………………………………………………………………………………………..……..8
4.1. Modelli di regressione lineare semplice………………………………………………………………………………………….8
4.7. Confronto………………………………………………………………………………………………….…………………………………16
5. CONCLUSIONI……………………………………………………………………………………………………………………….16
Riferimenti bibliografici……………….………………………………………………………………………...
1. INTRODUZIONE AL CASO DI STUDIO
Al giorno d’oggi, il mondo della realtà virtuale e dei simulatori sta prendendo sempre più piede tanto che
per poter vivere esperienze adrenaliniche, non è più necessario scendere in pista ma basta sedersi comodi
e accendere il computer, la playstation o qualunque dispositivo tecnologico. È il caso del simulatore F1
MANAGER 2022.
Gli innumerevoli passi in avanti fatti grazie all’innovazione, hanno permesso di aumentare il realismo e le
dinamiche di gioco di questi simulatori di anno in anno con i continui aggiornamenti dei piloti, delle
macchine, dei team e ogni dettaglio connesso. Sembrerà quindi di correre con l’esatta copia dei piloti
esistenti, con le loro stesse tattiche e il loro stesso stile di guida.
Potrebbe risultare banale, ma come fa un videogioco a replicare in modo così preciso le abilità di un pilota?
Sulla base di cosa il sistema sceglierà di rendere più forte un pilota piuttosto che un altro?
Secondo ciò che fornisce il sito stesso dello sviluppatore del videogioco, EA Sports, e grazie al contributo di
figure come David Croft, Alex Jacques e Anthony Davidson, i Rating di F1 manager 22 e quindi la valutazione
generale dei singoli piloti in gioco, si andrà a basare su numerosi fattori diversi, la cui media determinerà la
valutazione generale. Essi sono:
EXP: Esperienza, che si basa sul numero di partenze in gara nel corso della carriera di un pilota
RAC: Racecraft, che consiste nella capacità di farsi strada nel gruppo da parte di un pilota, e di
concludere la gara in una posizione migliore di quella in cui è partito
AWA: Consapevolezza, ottenuta sulla base del minor tempo trascorso nella stanza del commissario
di gara da parte di un pilota, in quanto i valori ottenuti nelle gare reali impattano su tale variabile
del gioco
PAC: Pace, ovvero un vantaggio che viene assegnato a chi si avvicina di più ai tempi più veloci in
qualifica e in gara. Viene considerato anche se un pilota batte il suo compagno di squadra
Queste quattro macro categorie di abilità, sono a loro volta ottenute sulla base di ulteriori variabili tecniche
di gara. Dall’elenco che segue, le prime tre variabili contribuiscono all’ottenimento della variabile Pace, il
secondo terzetto alla variabile Consapevolezza, mentre l’ultimo terzetto alla variabile Racecraft. Le singole
variabili prese in considerazioni sono:
Sterzata (STE), calcolata sulla base della qualità dei cambi di direzione;
Frenata (FRE), misurata valutando i tempi di reazione durante la frenata;
Riflessi (RIF), valutati in base ai risultati ottenuti dai test psicofisici;
Controllo (CON), dato dalla qualità di tenuta del veicolo durante il passo gara;
Precisione (PRE), determinato dalla capacità di non scomporsi durante il percorso;
Fluidità (FLU), definita dalla pulizia delle traiettorie;
Adattabilità (ADA), considerata sulla base delle capacità di performare sotto diverse condizioni;
Sorpasso (SOR), capacità di superare gli avversari;
Difesa (DIF), abilità di mantenere la posizione sotto attacco.
A ciò si va ad aggiungere in ultimo luogo la crescita potenziale di un pilota, e la sua aggressività, in continuo
aggiornamento sulla base delle gare corse e dei prospetti a lungo termine del pilota stesso.
Nella seguente tabella vengono illustrate le valutazioni generali con le relative variabili dipendenti dei piloti
fondamentali nel videogioco, ovvero coloro che corrono nel campionato mondiale. Tuttavia all’interno del
gioco, sono comunque presenti alcuni dei maggiori piloti dei campionati secondari Formula2 e Formula3.
Ritenendo che ciò sia un punto di debolezza per la potenziale valutazione delle performance di un pilota,
l’analisi potrebbe essere estesa ulteriormente.
Sulla base di queste considerazioni, è stato pensato un ampliamento del modello. Nel modello considerato
in seguito, si andranno ad analizzare variabili quantificabili alternative e apparentemente ininfluenti sul
livello delle performance, e che non siano altamente correlate tra loro, come spesso accade all’interno del
videogioco.
3.MODELLO ECONOMICO E ECONOMETRICO
3.1. Illustrazione del modello economico sviluppato
Il modello economico in questione è rappresentativo della valutazione generale di un pilota all’interno del
videogioco F1 MANAGER 2022, applicando le modifiche degli aspetti precedentemente individuati. Le
variabili utilizzate vogliono spiegare attraverso i dati biologici dei piloti e i risultati in gara (meno tecnici),
quanto impattano sulla valutazione generale. Le variabili scelte sono le seguenti:
Queste variabili sono applicate nel modello, su una popolazione di numerosità pari a 81. Tali osservazioni
sono ricavate dal database dei piloti presenti all’interno del videogioco F1 2022.
Attraverso lo sviluppo di questo modello, si cerca di rispondere all’obiettivo di intuire in che misura le
variabili indipendenti andranno ad impattare su quella che è la variabile dipendente.
La distribuzione di u condizionata a X ha media nulla, e ciò implica che 𝛽1 non è distorto. Cioè
𝐸(𝑢|𝑋 = 𝑥) = 0;
Le osservazioni sono indipendentemente e identicamente distribuite, ovvero provengono dalla
stessa distribuzione campionaria e hanno la stessa probabilità di essere estratte;
Gli outlier, ovvero i valori più estremi, sono rari.
Per il modello di regressione lineare multipla e per quelli di regressione non lineare, valgono le stesse
assunzioni, ma con l’aggiunta di una quarta:
𝑦𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑒
Dove:
Per poter stimare al meglio i singoli coefficienti, si ricorre al modello OLS (Ordinary Least Squares), ovvero
un modello che permette di minimizzare la somma degli scarti, dati dalla differenza tra i valori reali e attesi:
Dove:
𝑘 = 6, 𝑛 = 81
La variabile indipendente “campionato” (𝑘 = 6) presenta come valori 𝑋6 = 1,2,3. Nello specifico, si
considera il valore 1 qualora il pilota nella stagione 2022 dovesse correre in F1, 2 se dovesse correre in F2 e
3 se dovesse correre in F3.
Nello sviluppo del modello econometrico, tale variabile verrà trasformata in variabile dummy, che può
assumere due valori, 0 o 1. Nello specifico, se un pilota corre in F1, la variabile assumerà valore 1, altrimenti
0
Le variabili utilizzate inoltre, sono state attentamente selezionate affinché non si potesse incorrere nella
cosiddetta “distorsione da variabili omesse”, che si ottiene nel caso in cui la variabile omessa:
In seguito alla selezione delle variabili considerate, sono state scartate appositamente ulteriori variabili
classificabili come omesse. Uno dei tanti esempi è il ‘numero di titoli di campione del mondo’, in quanto
contribuisce in modo rilevante alla determinazione della ‘valutazione_generale’ (variabile dipendente), ed è
altamente correlato con le altre variabili dipendenti considerate.
Sarebbe stato opportuno considerare ulteriori variabili meno correlate a quella dipendente, come il peso,
ma a causa dell’insufficienza di dati, è stata omessa.
In questa prima fase, è possibile osservare alcune caratteristiche specifiche delle variabili prese in esame.
Analizzando le statistiche descrittive per ogni variabile considerata, gli aspetti più rilevanti che si possono
notare riguardano:
Si possono inoltre considerare statistiche più specifiche e mirate attraverso l’utilizzo di una tabella pivot, in
grado di filtrare le variabili considerando solo il valore della variabile dummy pari a 1. In tal modo si
otterranno le statistiche descrittive riguardanti i soli piloti che corrono in F1.
Sulla base di queste statistiche descrittive, possiamo notare delle differenze rilevanti determinate dal
correre in F1. Infatti è chiaro come la valutazione generale sia maggiore per i piloti di questo campionato,
tanto che il minimo di tale variabile corrisponde a 73, maggiore della media della stessa variabile
considerando il dataset intero.
Per quanto riguarda le vittorie, nonostante la media sia nettamente maggiore, vi sono comunque piloti che
non hanno mai vinto un gran premio. Inoltre possiamo notare come i piloti più giovani siano distribuiti
maggiormente all’interno dei due campionati inferiori, F2 ed F3.
4. RISULTATI EMPIRICI
4.1. Modelli di regressione lineare semplice
Avendo considerato un modello di regressione lineare multipla, prima di analizzarlo, è possibile studiare le
singole regressioni lineari semplici che lo vanno a comporre, analizzando quindi la variabile dipendente con
le variabili indipendenti, una per volta.
_______________________________________________________________________________________
𝑉𝑎𝑙𝑢𝑡𝑎𝑧𝑖𝑜𝑛𝑒_𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒 = 𝛽0 + 𝛽1 𝑔𝑟𝑎𝑛_𝑝𝑟𝑒𝑚𝑖_𝑐𝑜𝑟𝑠𝑖
Interpretando tali risultati, si nota innanzitutto una significatività molto buona, pari al 99%, con un
corrispondente p-value di 6,86𝑒 − 10.
Per quanto riguarda la bontà di adattamento della retta espressa dal modello, essendo pari a 0,4 non è
ottima, in quanto non supera nemmeno il minimo considerabile pari a 0,6.
Riguardo al coefficiente 𝛽1 , possiamo dire che all’aumentare di un gran premio corso, la valutazione
generale aumenterà in media di 0,131560.
Inoltre riguardo 𝛽0 , il valore medio della valutazione generale con 0 gran premi corsi è di 56,0578.
_______________________________________________________________________________________
Come si può notare, il livello di significatività è pari al 99%, con un p-value pari a 0,000217, ed una bontà
di adattamento del modello piuttosto basso, pari a 0,132.
Il coefficiente 𝛽0 è pari a 63,0992 ovvero il valore in media della valutazione generale per vittorie pari 0.
Il coefficiente 𝛽1 , invece dice che all’aumentare di una vittoria la valutazione generale del pilota aumenta in
media di 0,396444.
Questi risultati descrivono un’ottima significatività, pari al 99%, con un corrispondente p-value di 1,74e-10.
Per quanto concerne la bontà di adattamento della retta espressa dal modello, essendo pari a 0,37 non è
conveniente considerarla.
Avremo inoltre, che per il coefficiente 𝛽1 , all’aumentare di un anno di età, la valutazione generale
aumenterà in media di 1,76620
Riguardo 𝛽0 , il valore medio della valutazione generale con 0 anni d’età, sarà 23,4822 nonostante nella
realtà non abbia alcuna rilevanza.
______________________________________________________________________________________
Rispetto alle analisi precedenti, possiamo notare come questo modello non presenti significatività, motivo
per il quale non ha ragione di essere incluso nell’analisi
______________________________________________________________________________________
Riguardo p-value, livello di significatività e 𝑅 2, non ci si discosta più di tanto dai commenti
precedentemente effettuati.
Ciò che risalta maggiormente è il coefficiente 𝛽1 , molto più basso degli altri, a dimostrazione del fatto che,
dato un range molto ampio dei punti [8;4482], un punto in più impatta davvero poco in media sulla
valutazione generale.
_______________________________________________________________________________________
La variabile indipendente usata è frutto della trasformazione della variabile “campionato”, in variabile
dummy. In tal modo si considera si considera l’impatto che assume il correre in Formula 1.
Il livello di significatività è molto buono, pari al 99%, con un p-value ottimale. La bontà di adattamento
risulta essere discreta, in quanto pari a 0,526092.
L’impatto del correre in F1 si descrive tramite il 𝛽1 , dimostrando che tale condizione, in media, aumenta la
valutazione generale di 24,0780.
_______________________________________________________________________________________
4.2. Modelli di regressione lineare multipla
Una volta analizzati i singoli modelli di regressione lineare semplice, si può procedere con il considerare più
variabili simultaneamente, attraverso il modello di regressione lineare multipla.
̅̅̅2̅ e non più il classico 𝑅 2. Questo
A differenza dei modelli visti in precedenza, ora si va ad analizzare l’𝑅
poiché il secondo va ad aumentare ogni volta che si aggiunge un ulteriore regressore. L’𝑅 ̅̅̅2̅ permette di
risolvere tale problema, non andando ad aumentare all’aggiunta di essi.
_______________________________________________________________________________________
Se il numero di gran premi corsi e l’età fosse pari a zero (anche se solo ipoteticamente), la
valutazione generale sarebbe pari al 𝛽0 , ovvero 39,7961.
Il coefficiente 𝛽1 indica la variazione attesa della valutazione generale, al variare di un’unità dei
gran premi corsi, quando l’età assume un valore costante. In questo caso è pari a 0,0900359.
Viceversa per il coefficiente 𝛽2
Per avere una maggiore chiarezza sul modello di regressione lineare multipla, esso non sarà più in grado di
fornire un’interpretazione grafica attraverso la retta di regressione, ma si utilizzerà l’iperpiano.
_______________________________________________________________________________________
Attraverso questo modello individueremo un ̅𝑅̅̅2̅ pari a 0,553664. Analizzando i coefficienti avremo:
𝛽0 definisce una valutazione generale pari a 57,2055 nel caso in cui i punti siano pari a zero, e in più
il pilota non corra il F1 ma nelle due competizioni minori.
𝛽1 indica la variazione attesa della valutazione generale, all’ aumentare di un’unità dei punti,
mantenendo costante il fatto che corra in F1. In tal caso, e pari a 0,00476360.
𝛽2 , invece, indica la variazione attesa della valutazione generale mantenendo costante i punti, al
variare del campionato in cui gareggia. In questo caso di 20,4956.
Al fine di non rendere l’analisi troppo noiosa, e per via di una mancanza di significatività tra variabili nel
modello di regressione lineare multipla, è stato scelto di non ripetere numerose volte gli stessi concetti e le
stesse combinazioni tra variabili.
4.3. Modelli di regressione non lineari
Affinché si possa avere un’analisi più dettagliata, considerando che in alcuni casi i modelli lineari non
risultano particolarmente efficienti, si utilizzano i modelli di regressione non lineari. Per poter fare ciò però
è necessario operare una trasformazione non lineare sulle variabili.
Nello specifico si possono considerare due tipi di modelli di regressione non lineare:
Polinomiali: in tal caso la funzione di regressione viene approssimata da una quadratica, una cubica,
o una polinomiale di grado più alto
Logaritmiche: in questo caso le x o la y vengono trasformate con un logaritmo, che le approssima in
maniera percentuale. Nello specifico, si considerano i modelli:
- Linear - log: la variabile x si trasforma in logaritmo
- Log - linear: la variabile y si trasforma in logaritmo
- Log - log: entrambe le variabili si trasformano in logaritmo
Dopo aver effettuato una trasformazione quadratica della variabile “vittorie”, ottenendo la variabile
“sq_vittorie”, si considera l’equazione: 𝑉𝑎𝑙𝑢𝑡𝑎𝑧𝑖𝑜𝑛𝑒_𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒 = 𝛽0 + 𝛽1 𝑣𝑖𝑡𝑡𝑜𝑟𝑖𝑒 + 𝛽2 𝑠𝑞_𝑣𝑖𝑡𝑡𝑜𝑟𝑖𝑒
Per l’interpretazione, non è possibile effettuarla sui singoli coefficienti, ma è necessario considerare la
funzione, attraverso una valutazione delle differenze calcolabili per mezzo dei delta.
Considerando una pendenza non costante, bisognerà studiare l’impatto della variabile indipendente su
diversi settori della parabola che si andrà a delineare.
In particolare, essendo il range delle [0;103] è stato scelto di considerare, in un primo momento, l’intervallo
[5;10] e in seguito [85;90]. Una volta ottenuti i singoli ∆, si andranno a confrontare.
∆1 = 4,807
(𝑌|𝑋 = 85) = 61,8464 + 1,08513 ∙ 85 − 0,00825937 ∙ 852 = 94,409
∆2 = 1,801
Questo spiega, essendo ∆1 > ∆2 , come una variazione delle vittorie, in media, impatta maggiormente se si
ha una valutazione generale bassa, piuttosto che una valutazione generale alta
A causa di mancanza di significatività in altre possibili variabili da inserire, non è stato possibile effettuare
l’analisi anche per quanto riguarda il modello di regressione non lineare polinomiale cubico.
Attraverso questi modelli, è possibile modellare le relazioni in termini “percentuali”, invece che
linearmente. Per tale motivo è stato infatti scelto di trasformare la variabile “punti”, in quanto più adatta a
spiegare il fenomeno e la sua variazione in termini percentuali, rispetto alle altre variabili presenti.
_______________________________________________________________________________________
Modello linear-log
Dall’interpretazione effettuata, possiamo dire che una variazione dell’1% dei punti, determina una
variazione pari a 0,038865 (0,01 ∙ 𝛽1 ) nella valutazione generale.
_______________________________________________________________________________________
Modello log-linear
In questo modello si andrà ad effettuare la trasformazione logaritmica sulla variabile dipendente, e non su
quella indipendente, ottenendo quindi: 𝑙_𝑣𝑎𝑙𝑢𝑡𝑎𝑧𝑖𝑜𝑛𝑒_𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒 = 𝛽0 + 𝛽1 𝑝𝑢𝑛𝑡𝑖 + 𝑢
Dall’interpretazione del modello, si ottiene che una variazione di un punto, determina una variazione pari a
0,01673 (100 ∙ 𝛽1 %) nella valutazione generale.
_______________________________________________________________________________________
Modello log-log
Dall’analisi del modello, partendo da una variazione dell’1% nei punti, determina una variazione pari allo
0,0608717% (𝛽1 %) nella valutazione generale.
4.7. Confronto tra i modelli logaritmici
Affinché si possa comprendere al meglio quale, tra i modelli logaritmici, risulta essere il più appropriato, È
possibile effettuare un confronto tra i singoli indicatori della bontà di adattamento.
̅̅̅2̅
Nello specifico, per la valutazione tra il modello log-lin e log-log, si confronteranno l’𝑅 2 del primo, con l’𝑅
del secondo.
𝑅 2 log-lin= 0,219105
̅𝑅̅̅̅2 log-log= 0,256706
Confrontandoli, possiamo notare che sia ̅𝑅̅̅2̅ log-log > 𝑅 2 log-lin. Motivo per cui, il modello log-log sarà più
appropriato rispetto al modello log-lin.
In questo caso, confrontando gli indicatori di bontà del modello, dimostrano che sarà più opportuno
considerare il modello di regressione lineare semplice.
Non possiamo tuttavia confrontare il modello linear log con log-log attraverso gli indicatori di bontà di
adattamento, poiché le variabili dipendenti sono differenti nei due modelli.
5. CONCLUSIONI
Attraverso questi risultati abbiamo cercato di dimostrare sulla base di cosa viene attribuita una valutazione
più o meno alta a un pilota nel videogioco. Quindi, per rispondere alle classiche domande che un
utilizzatore del simulatore può porsi, ci siamo chiesti: ha senso scegliere il pilota con più esperienza?
E ancora, per poter arrivare nelle prime posizioni, conviene scegliere il pilota con più vittorie?
Come già detto, la risposta è nei dati, i quali ci dicono chiaramente che la variabile che impatta
maggiormente, per quanto possa essere banale, è il campionato d’appartenenza. Infatti, i piloti che
correranno in F1 saranno coloro che, in media, avranno una valutazione generale più alta.
Al contrario di ciò che si potrebbe pensare guardando la vera classifica di F1, un dato che salta
particolarmente all’occhio, è quello dei punti. È stato dimostrato come, in realtà, tale variabile impatti
pochissimo rispetto alle altre nonostante si è più propensi a pensare l’opposto.
Essendo il nostro studio più focalizzato su aspetti meno tecnici, rispetto alle performance che definiscono la
valutazione generale del pilota nel caso di studio da cui siamo partiti, un possibile spunto futuro potrebbe
essere quello di aggiungere variabili più legate alla carriera e all’esperienza del pilota non escludendo gli
aspetti tecnici già considerati.
Riferimenti bibliografici
https://www.statsf1.com/it/statistiques/pilote/gp/nombre.aspx
https://www.f1manager.com/it-IT/2022/notizie/f1r-manager-2022-valutazioni-pilota-e-
sviluppo-del-personale
https://www.f1manager.com/it-IT/2022
https://www.motorbox.com/auto/sport/f1/piloti/