Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Plot, Distribuzione Normale e Ma
Plot, Distribuzione Normale e Ma
Come si costruisce un box-plot Si calcola per la variabile statistica X il primo ed il terzo quartile, la mediana, il valore minimo e quello massimo della distribuzione riportando i valori in un piano cartesiano (asse delle ascisse o delle ordinate in modo indifferente, nel seguito tutti i valori
saranno riportati sullasse delle ascisse)
x min
Q1
Med
Q3
x max
x min
Q1
Med
Q3
x max
Si determinano il limite inferiore e superiore applicando le seguenti formule L inf = Q1 1,5(Q 3 Q1 ) L sup = Q 3 + 1,5(Q 3 Q1 ) Per rappresentare i baffi del box-plot nel piano cartesiano si verifica la seguente disuguaglianza per il baffo inferiore se x min < L inf si rappresenta sul piano cartesiano L inf diversamente x min se x max > L sup si rappresenta sul piano cartesiano L sup diversamente x max Per x min < L inf e x max > L sup i baffi devono essere riportati nel grafico nel seguente modo
x min
L inf Q1
Med
Q3
L sup x max
Diversamente
x min
Q1
Med
Q3
x max
Il Box-plot racchiude al proprio interno le seguenti informazioni a. Indice di posizione (misurato con la mediana ed i quartili) e rappresentata nel grafico con una linea allinterno del box (mediana) ed i due estremi del box stesso (primo e terzo quartile). Spesso, inoltre, nel box rappresentato con un simbolo il valore medio della distribuzione. b. Indice di variabilit (misurato con la differenza interquartile) e rappresentato dalla diversa ampiezza della scatola
bassa media alta
c. Simmetria che presente se Med Q1 = Q 3 Med oppure Q1 x min = x max Q 3 asimmetria positiva Med Q1 < Q 3 Med oppure Q1 x min < x max Q 3 asimmetria negativa Med Q1 > Q 3 Med oppure Q1 x min > x max Q 3 d. Presenza di valori anomali che si verifica solo quando x min < L inf e/o x max > L sup . In tali casi ci sono delle unit statistiche della distribuzione che sono compresi tra il limite inferiore e il valore minimo della distribuzione e/o tra il limite superiore ed il valore massimo della distribuzione (viene rappresentato nel grafico in genere con un simbolo per ogni valore anomalo).
x min
L inf Q1
Med
Q3
L sup
x max
e. il box-plot particolarmente utile nel caso in cui si vuole confrontare due o pi distribuzioni.
40 00
30 00
C APU A
VITU LAZIO
20 00
MAR C IAN ISE SAN T'AN GEL O D 'ALIFE 10 00 PAR ETE VILLA LITER N O
E _ gic lo nar o
- 10 00
N =
22
1
19
2
4
3
14
4
17
5
11
6
17
7
Le misure di asimmetria
Una distribuzione simmetrica rispetto ad un polo quale la M (Mo o Med) se considerata una costante k i valori M - k e M + k assumono la stessa frequenza. In una distribuzione unimodale e simmetrica, la media, la mediana e la moda coincidono
Oltre che con listogramma anche il box-plot pu evidenziare la presenza di asimmetria Indici di asimmetria
Q 1 + Q 3 2 Med dove 1 AS IN 1 Q 3 Q1 AS < 0 asimmetria negativa AS > 0 asimmetria positiva Coefficiente di asimmetria Fisher- Pearson
ASIN =
(x
1 =
i =1
M)
n 3
1 = 0 non necessariamente vi simmetria; 1 > 0 la distribuzione asimmetrica positiva; 1 < 0 la distribuzione asimmetrica negativa.
1 < 0
1 > 0
(x
1* =
1* < 0 1* = 0 1* > 0
i =1
M)
n 4
Esempi Asimmetria positiva con valore soglia non inferiore a Et degli studenti iscritti allUNO
Asimmetria negativa con valore di soglia non superiore a Tempo di risposta che un callcenter dedica ad ogni chiamata con blocco di telefonata oltre un certo tempo
Asimmetria negativa Tempo di risposta che un callcenter dedica ad ogni chiamata con formazione ai centralinisti di bloccare quando la telefonata durata troppo