Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LE DISTRIBUZIONI DOPPIE
In questa lezione presenteremo le distribuzioni doppie ed alcune loro importanti caratteristiche come la
costruzione della distribuzione di freuenze e le distribuzioni !ar"inali# Impareremo, inoltre, alcuni
termini propri delle distribuzioni secondo due caratteri.
Supponiamo di voler rilevare su un collettivo di studenti universitari due caratteri: l'altezza ed il peso.
Ovviamente mi trover davanti ad una distribuzione unitaria come la seguente:
Sui nostri n studenti abbiamo rilevato due caratteri, il peso e l'altezza ( per facilit ho preso caratteri
quantitativi !" quindi ad o"ni unit$ corrispondono due nu!eri. #ome si $ visto nelle distribuzioni semplici,
$ utile passare dalla distribuzione unitaria ad una distribuzione di freuenze. %uesto passaggio $ un po'
pi& delicato di quanto visto nelle distribuzioni semplici in quanto non dobbiamo semplicemente contare
quante volte una modalit si presenta nella popolazione (quindi calcolarne la frequenza assoluta!, ma
dobbia!o %edere uante %olte una data coppia &altezza' peso( si presenta nella popolazione#
'ediamo un esempio numerico considerando la seguente distribuzione:
%uella appena costruita $ una tabella doppia di frequenze: vediamo in particolare quali sono le sue parti.
(e due aree colorate in rosa ci indicano quali sono i caratteri presi in considerazione ( in questo caso
abbiamo altezza e peso !" nelle due aree gialline troviamo le modalit con cui si presentano i suddetti
caratteri, in particolare l'area posta sotto il carattere altezza $ indicata con il termine testata ed indica le
modalit con cui si $ presentata l'altezza" la colonna giallina accanto al peso $ detta colonna !adre ed
indica le modalit assunte dal peso. ('area in verde ci dice come peso e altezza si accoppiano in ogni unit,
ovvero, in corrispondenza delle modalit )* e +,- troviamo un +, questo indica che nel nostro collettivo c'$
una persona alta +,- cm e che pesa )* .g. #os/ via per tutte le coppie di modalit.
0elle due aree celesti troviamo i totali per colonna (area in basso! e per riga (area in alto!" queste due
distribuzioni sono molto importanti in quanto ci permettono di passare dalla distribuzione doppia del peso e
1
dell'altezza alle distribuzioni !ar"inali del peso, separato dall'altezza. Infatti prendendo in considerazione
la colonna madre e la colonna del totale abbiamo la seguente distribuzione marginale del peso:
1d analogamente troviamo la distribuzione marginale delle altezze:
(e distribuzioni marginali viste non sono altro che distribuzioni semplici.
'ediamo quali altre informazioni possiamo desumere da una distribuzione doppia: ad esempio, prendendo
la colonna madre ed un'altra colonna qualsiasi della distribuzione abbiamo la distribuzione parziale della
distribuzione doppia.
%uesta nuova tabella ci dice la distribuzione del peso fra le persone alte +2, cm.
In generale daremo alle distribuzioni doppie la seguente forma:
(a generica 34 indica una modalit del carattere 3, analogamente la generica 5i indica una modalit del
carattere 5" il generico elemento n i 4 indica la frequenza delle unit che presentano modalit 5i e 34 . %uesta
appena vista $ la distribuzione delle frequenze assolute, per passare alla distribuzione delle frequenze
relative basta dividere tutto per n:
2
6er ulteriori approfondimenti e per il calcolo di importanti misure vedere il documento ) Distribuzioni
doppie ).
In questa lezione abbiamo presentato le distribuzioni secondo due caratteri, chiamate distribuzioni doppie"
abbiamo visto come si costruisce una tabella doppia e come si costruiscono distribuzioni marginali e parziali
secondo un solo carattere o una sola modalit.
Do!ande
7 cosa servono le distribuzioni doppie8
Si pu passare da una distribuzione doppia ad una semplice relativa ad uno solo dei due caratteri in
studio8
#he cosa $ una distribuzione parziale e come si ottiene8
#osa $ e come si costruisce una distribuzione marginale8
#ome si arriva ad una distribuzione di frequenze relative doppie8
*lossario
+
+REO*R+,,+
6articolare tipo di rappresentazione grafica in cui la frequenza o la quantit di una data modalit vengono
rappresentate attraverso l'area di una figura piana. In particolare tale area dovr essere proporzionale alla
frequenza rappresentata.
+,PIEZZ+ DELL+ -L+SSE
('ampiezza di una data classe si calcola facendo la differenza fra l'estremo superiore e quello inferiore della
classe in esame.
-
-+,PIONE
6arte della popolazione costruita in modo tale da rappresentare al meglio la popolazione da cui viene
estratto. (o scopo della costruzione di un campione $ quello di lavorare su un collettivo pi& piccolo della
popolazione, per poi espandere i risultati ottenuti a tutta la popolazione.
-+,PO DI .+RI+ZIONE
Il campo di variazione $ una misura della variabilit di una distribuzione e si ottiene calcolando la differenza
fra il termine pi& grande e quello pi& piccolo della distribuzione.
-+R+TTERE
In ogni ricerca statistica studiamo una o pi& caratteristiche delle unit rilevate" queste caratteristiche vengono
definite con il termine carattere. Il carattere si manifesta nelle unit attraverso varie modalit.
3
-ENSI,ENTO
9ilevazione generale della popolazione di un paese" il censimento si effettua ogni +- anni e va a rilevare
alcune caratteristiche di tutta la popolazione.
-ENTRO
:ata una distanza, il centro di una distribuzione $ il valore che, rispetto alla distanza considerata,
rappresenta al meglio la popolazione
-L+SSI
(e classi sono il frutto della divisione delle modalit di un carattere in gruppi. In particolare, le modalit di un
carattere come il peso o l'altezza, per semplificare il lavoro, possono essere raggruppate insieme, creando
un'unica modalit, generalmente rappresentata dal valore centrale della classe.
-ON-ENTR+ZIONE
7ttributo che si d ad un carattere quantitativo trasferibile. Si dice che, in una distribuzione la concentrazione
$ massima quando tutto l'ammontare del carattere si trova in una sola unit" al contrario, si dice che un
carattere $ equidistribuito quando l'ammontare $ equamente diviso fra tutte le unit della popolazione. (a
concentrazione rientra nelle misure della variabilit di una distribuzione.
-O*R+DU+ZIONE
(a tabella di cograduazione si calcola in ambito di dissomiglianza e serve per gestire pi& facilmente i dati
cograduati. In particolare ci dice che modalit presentano i dati cograduati.
-O*R+DU+TI &D+TI(
:efiniamo termini cograduati di una distribuzione quei termini che occupano lo stesso posto nella
graduatoria dei termini di una distribuzione.
D
D+TO +NO,+LO
;n dato $ definito anomalo quando $ molto diverso dagli altri dati della distribuzione. <ale diversit pu
attribuirsi ad errore (di rilevazione o inserimento! o all'inizio di una nuova fase del fenomeno.
DETER,IN+ZIONE &indice di(
'isto nell'ambito della regressione, l'indice r
*
indica la bont di accostamento di ciascuna delle rette di
regressione ai dati osservati. 7bbiamo che
Se r
*
= - allora le due rette di regressione coincidono con gli assi cartesiani (con origine posta nel
baricentro!. Se r
*
= + allora i punti osservati sono allineati e le due rette di regressione sono sovrapposte. In
altre parole, tanto pi& l'indice di determinazione $ vicino a + tanto pi& le rette descriveranno meglio la
distribuzione osservata.
DE.I+NZ+ TOT+LE
In ambito di regressione, definiamo devianza totale la distanza fra ogni valore osservato 34 e la media 3. 1'
valida la seguente relazione: :1'. <O<. = :1'. 91>. ? :1'. 91S
4
DE.I+NZ+ DI RE*RESSIONE
In ambito di regressione $ la distanza fra i valori teorici 3
@
4 e la media 3. 1' anche chiamata devianza spiegata
dalla regressione.
DE.I+NZ+ RESIDU+
In ambito di regressione, indica la distanza fra la distribuzione osservata e la distribuzione teorica
rappresentata dai punti della retta di regressione.
DIPENDENZ+ IN ,EDI+
:ata una distribuzione secondo due caratteri, diciamo che se 3 $ indipendente in media da 5 allora le
distribuzioni parziali secondo il carattere 3 hanno la stessa media aritmetica. 9icordiamo che una situazione
di connessione nulla implica indipendenza in media. ;n indice di dipendenza in media $ quello proposto da
6earson (vedi lezioni!
che assume valore + nel caso di dipendenza perfetta di 3 da 5" assume invece valore - nel caso di
indipendenza in media.
,
,OD+LIT+/
Ogni carattere si presenta nelle unit attraverso delle modalit. 7d esempio il carattere sesso si presenta con
le modalit maschio e femmina.
.
.+LORE -ENTR+LE DI UN+ -L+SSE
Il valore centrale di una classe $ la misura che pi& frequentemente si usa nelle elaborazioni di caratteri divisi
in classi. Si trova sommando gli estremi della classe e dividendo il risultato per *.
5