Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Esempio:
ESEMPI:
o Il 2% delle lavatrici vendute da un negozio X presenta difetti di funzionamento.
Esempio: Se in questa classe l’altezza media è 172cm, è possibile asserire che 172 cm
è l’altezza media della popolazione costituita dagli studenti UNIBAS?
Qualora la risposta fosse positiva, sono sicuro al 100% della validità di questa asserzione?
E. Di Nardo, a.a. 15/16 5
Esempi: A) Se gli studenti in questa classe si disponessero per altezza, come i signori di
questa fotografia, potremmo «proiettare» il profilo di questa curva su tutta la popolazione
di studenti UNIBAS?
Valori Discreti
Classi di
Modalità
Continui
Quantitative
La temperatura
L’altezza
Il peso
La velocità
Il tempo
Neri 10
Castani Frequenze
6 assolute
modalità Rossi 1
biondi 5
totale 22
> obj<-table(dati)
> obj
dati Colore capelli N° persone
Biondi Castani Neri Rossi (carattere) (frequenza assoluta)
5 6 10 1
> summary(obj) Neri
Number of cases in table: 22
10
Number of factors: 1 Castani 6
Rossi 1
Per avere la tabella iniziale:
biondi 5
> data<-data.frame(obj)
> data totale 22
dati Freq
1 Biondi 5
2 Castani 6
3 Neri 10
4 Rossi 1
Esempio di serie
statistica
(variabile: potenziale)
Modalità
Veneto
Valle D'Aosta
Umbria
Trentino
Toscana
Sicilia
Sardegna
Puglia
Piemonte La Lombardia ha il
Molise
maggior numero di
Marche
Lombardia incidenti.
Liguria
Lazio
Friuli
Emilia Rom.
Campania
Calabria
Basilicata
Abbruzzo
…aprendo il file…
Tasso%
Valle D'Aosta
Trentino
Sicilia
Puglia
Tasso
Molise
Tasso%
Lombardia
Lazio
Emilia Rom.
Calabria
Abbruzzo
0,00 0,50 1,00 1,50 2,00 2,50
Valle D'Aosta
Trentino
Sicilia
Molise
Lombardia
Lazio
Emilia Rom.
Calabria
Abbruzzo
0 10000 20000 30000 40000 50000 60000 70000 80000
E. Di Nardo, a.a. 15/16 32
Diagrammi circolari (torte)
Biondi
Castani
Neri
Rossi
28.6% 23.8%
42.9%
Prod.zucche qt
Mary 10
Anne 20
Jo 40
30
Domanda: E’ possibile
ipotizzare che il peso e
l’altezza degli studenti siano
legati da una relazione lineare?
assenze
lunedì
50
40
30
20
venerdì martedì
10
0
assenze
giovedì mercoledì
Freq.relative % 16%
20%
Atlanta
12% Boston Diagramma a torta
18% Chicago
15% Los Angeles
19% New York
Washington
15,0; 23,7; 19,7; 15,4; 18,3; 23,0; 14,2; 20,8; 13,5; 20,7; 17,4; 18,6;
12,9; 20,3; 13,7; 21,4; 18,3; 29,8; 17,1; 18,9; 10,3; 26,1; 15,7; 14,0; 17,8;
33,8; 23,2; 12,9; 27,1; 16,6
sarebbe significativo. 35
30
25
20
Ore
15
10
5
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
E. Di Nardo; a.a. 15/16 43
Istogrammi usando R
Determinare il numero delle classi di modalità.
In tal caso taglia= 30: 30 5,47~6
> ore<-read.table(‘datasetore.txt',header=TRUE)
> attach(ore)
> head(ore)
ORE
1 15.0
2 23.7
3 19.7
4 15.4 > ore_frame<-data.frame(ore)
5 18.3
6 23.0
> ore_frame$ORE
[1] 15.0 23.7 19.7 15.4 18.3 23.0 14.2 20.8 13.5 20.7 17.4 18.6 12.9 20.3 13.7
[16] 21.4 18.3 29.8 17.1 18.9 10.3 26.1 15.7 14.0 17.8 33.8 23.2 12.9 27.1 16.6
0.073
0.06
0.053
0.047
0.04
Density
0.02
0.02
0.007
0.00
10 15 20 25 30 35
ore di studio
E. Di Nardo, a.a. 15/16 45
> str(objhist)
List of 6
$ breaks : num [1:6] 10 15 20 25 30 35
$ counts : int [1:5] 8 11 7 3 1
$ density : num [1:5] 0.05333 0.07333 0.04667 0.02 0.00667
$ mids : num [1:5] 12.5 17.5 22.5 27.5 32.5
$ xname : chr "ore_frame$ORE"
$ equidist: logi TRUE
- attr(*, "class")= chr "histogram"
> sum(objhist$counts)
[1] 30
> sum(objhist$density)*5
[1] 1
La somma delle aree dei rettangoli è pari a
0.0533*5+0.07333*5+0.04667*5+0.02*5+0.00667*5
26 28 ...
0.067 0.067 0.067
$ counts : int [1:12] 1 5 4 4 5 4 3 0 2 1 ...
0.06
0.04
0.033 27 29 ...
$ xname : chr "ore_frame$ORE"
$ equidist: logi TRUE
0.02
0 0
0.00
10 15 20 25 30
ore di studio
0,30
0,25
0,20
0,15
0,10
0,05
0,00
[10;10.5)
[11.5;12)
[13;13.5)
[14.5;15)
[16;16.5)
[17.5;18)
[19;19.5)
[20.5;21)
[22;22.5)
[23.5;24)
[25;25.5)
[26.5;27)
[28;28.5)
[29.5;30)
[31;31.5)
[32.5;33)
E. Di Nardo, a.a. 15/16 48
> lines(density(ore_frame$ORE),col='red',lwd=3)
ore di studio
0.073
0.06
0.053
0.04 0.047
Density
0.02
0.02
0.007
0.00
10 15 20 25 30 35
ore di studio
Esempio: Il Signor X vuole confontare i risultati ottenuti con quelli di un’altra scuola
ad indirizzo diverso. Gli vengono forniti i dati di un secondo campione di 26 studenti.
25,8; 23,2; 10,1; 24,2; 21,0; 22.3; 15,1; 22,4; 28,3; 25,7; 19,8; 21,4;
17,7; 19,3; 18,2; 21,5; 23,3; 24,3; 20,9; 27,0; 22,3; 20,9; 21,1; 25,1;
23,9; 21,1
ore di studio
E’ possibile confrontare
i due istogrammi?
0.073
0.06
ampiezza diversa
Density
0.02
c) Gli assi sono diversi!
0.02
0.007
0.00
10 15 20 25 30 35
ore di studio
E. Di Nardo, a.a. 15/16 50
> objhist1<-hist(ore_frame$ORE,prob=TRUE, col='blue',labels=T,breaks=6,
main='Ore di studio I scuola',xlab='ore di studio',ylim=range(0,0.12))
> str(objhist1)
List of 6
Ore di studio I scuola
$ breaks : num [1:6] 10 15 20 25 30 35
$ counts : int [1:5] 8 11 7 3 1
0.12
0.073
- attr(*, "class")= chr "histogram"
Density
0.06
0.053
0.047
Il modo corretto di confrontare
i due insiemi di dati è
0.04
0.007
0.00
10 15 20 25 30 35
ore di studio
0.115
0.10
0.08
0.06
0.04
0.038 0.038
0.02
0.008
0.00
10 15 20 25 30 35
ore di studio