Sei sulla pagina 1di 5

LEZIONE 9

LE DISTRIBUZIONI DOPPIE
In questa lezione presenteremo le distribuzioni doppie ed alcune loro importanti caratteristiche come la
costruzione della distribuzione di freuenze e le distribuzioni !ar"inali# Impareremo, inoltre, alcuni
termini propri delle distribuzioni secondo due caratteri.
Supponiamo di voler rilevare su un collettivo di studenti universitari due caratteri: l'altezza ed il peso.
Ovviamente mi trover davanti ad una distribuzione unitaria come la seguente:

Sui nostri n studenti abbiamo rilevato due caratteri, il peso e l'altezza ( per facilit ho preso caratteri
quantitativi !" quindi ad o"ni unit$ corrispondono due nu!eri. #ome si $ visto nelle distribuzioni semplici,
$ utile passare dalla distribuzione unitaria ad una distribuzione di freuenze. %uesto passaggio $ un po'
pi& delicato di quanto visto nelle distribuzioni semplici in quanto non dobbiamo semplicemente contare
quante volte una modalit si presenta nella popolazione (quindi calcolarne la frequenza assoluta!, ma
dobbia!o %edere uante %olte una data coppia &altezza' peso( si presenta nella popolazione#
'ediamo un esempio numerico considerando la seguente distribuzione:


%uella appena costruita $ una tabella doppia di frequenze: vediamo in particolare quali sono le sue parti.
(e due aree colorate in rosa ci indicano quali sono i caratteri presi in considerazione ( in questo caso
abbiamo altezza e peso !" nelle due aree gialline troviamo le modalit con cui si presentano i suddetti
caratteri, in particolare l'area posta sotto il carattere altezza $ indicata con il termine testata ed indica le
modalit con cui si $ presentata l'altezza" la colonna giallina accanto al peso $ detta colonna !adre ed
indica le modalit assunte dal peso. ('area in verde ci dice come peso e altezza si accoppiano in ogni unit,
ovvero, in corrispondenza delle modalit )* e +,- troviamo un +, questo indica che nel nostro collettivo c'$
una persona alta +,- cm e che pesa )* .g. #os/ via per tutte le coppie di modalit.
0elle due aree celesti troviamo i totali per colonna (area in basso! e per riga (area in alto!" queste due
distribuzioni sono molto importanti in quanto ci permettono di passare dalla distribuzione doppia del peso e
1
dell'altezza alle distribuzioni !ar"inali del peso, separato dall'altezza. Infatti prendendo in considerazione
la colonna madre e la colonna del totale abbiamo la seguente distribuzione marginale del peso:

1d analogamente troviamo la distribuzione marginale delle altezze:

(e distribuzioni marginali viste non sono altro che distribuzioni semplici.
'ediamo quali altre informazioni possiamo desumere da una distribuzione doppia: ad esempio, prendendo
la colonna madre ed un'altra colonna qualsiasi della distribuzione abbiamo la distribuzione parziale della
distribuzione doppia.

%uesta nuova tabella ci dice la distribuzione del peso fra le persone alte +2, cm.
In generale daremo alle distribuzioni doppie la seguente forma:

(a generica 34 indica una modalit del carattere 3, analogamente la generica 5i indica una modalit del
carattere 5" il generico elemento n i 4 indica la frequenza delle unit che presentano modalit 5i e 34 . %uesta
appena vista $ la distribuzione delle frequenze assolute, per passare alla distribuzione delle frequenze
relative basta dividere tutto per n:
2

6er ulteriori approfondimenti e per il calcolo di importanti misure vedere il documento ) Distribuzioni
doppie ).
In questa lezione abbiamo presentato le distribuzioni secondo due caratteri, chiamate distribuzioni doppie"
abbiamo visto come si costruisce una tabella doppia e come si costruiscono distribuzioni marginali e parziali
secondo un solo carattere o una sola modalit.

Do!ande
7 cosa servono le distribuzioni doppie8
Si pu passare da una distribuzione doppia ad una semplice relativa ad uno solo dei due caratteri in
studio8
#he cosa $ una distribuzione parziale e come si ottiene8
#osa $ e come si costruisce una distribuzione marginale8
#ome si arriva ad una distribuzione di frequenze relative doppie8
*lossario
+
+REO*R+,,+
6articolare tipo di rappresentazione grafica in cui la frequenza o la quantit di una data modalit vengono
rappresentate attraverso l'area di una figura piana. In particolare tale area dovr essere proporzionale alla
frequenza rappresentata.
+,PIEZZ+ DELL+ -L+SSE
('ampiezza di una data classe si calcola facendo la differenza fra l'estremo superiore e quello inferiore della
classe in esame.
-
-+,PIONE
6arte della popolazione costruita in modo tale da rappresentare al meglio la popolazione da cui viene
estratto. (o scopo della costruzione di un campione $ quello di lavorare su un collettivo pi& piccolo della
popolazione, per poi espandere i risultati ottenuti a tutta la popolazione.
-+,PO DI .+RI+ZIONE
Il campo di variazione $ una misura della variabilit di una distribuzione e si ottiene calcolando la differenza
fra il termine pi& grande e quello pi& piccolo della distribuzione.
-+R+TTERE
In ogni ricerca statistica studiamo una o pi& caratteristiche delle unit rilevate" queste caratteristiche vengono
definite con il termine carattere. Il carattere si manifesta nelle unit attraverso varie modalit.
3
-ENSI,ENTO
9ilevazione generale della popolazione di un paese" il censimento si effettua ogni +- anni e va a rilevare
alcune caratteristiche di tutta la popolazione.
-ENTRO
:ata una distanza, il centro di una distribuzione $ il valore che, rispetto alla distanza considerata,
rappresenta al meglio la popolazione
-L+SSI
(e classi sono il frutto della divisione delle modalit di un carattere in gruppi. In particolare, le modalit di un
carattere come il peso o l'altezza, per semplificare il lavoro, possono essere raggruppate insieme, creando
un'unica modalit, generalmente rappresentata dal valore centrale della classe.
-ON-ENTR+ZIONE
7ttributo che si d ad un carattere quantitativo trasferibile. Si dice che, in una distribuzione la concentrazione
$ massima quando tutto l'ammontare del carattere si trova in una sola unit" al contrario, si dice che un
carattere $ equidistribuito quando l'ammontare $ equamente diviso fra tutte le unit della popolazione. (a
concentrazione rientra nelle misure della variabilit di una distribuzione.
-O*R+DU+ZIONE
(a tabella di cograduazione si calcola in ambito di dissomiglianza e serve per gestire pi& facilmente i dati
cograduati. In particolare ci dice che modalit presentano i dati cograduati.
-O*R+DU+TI &D+TI(
:efiniamo termini cograduati di una distribuzione quei termini che occupano lo stesso posto nella
graduatoria dei termini di una distribuzione.
D
D+TO +NO,+LO
;n dato $ definito anomalo quando $ molto diverso dagli altri dati della distribuzione. <ale diversit pu
attribuirsi ad errore (di rilevazione o inserimento! o all'inizio di una nuova fase del fenomeno.
DETER,IN+ZIONE &indice di(
'isto nell'ambito della regressione, l'indice r
*
indica la bont di accostamento di ciascuna delle rette di
regressione ai dati osservati. 7bbiamo che

Se r
*
= - allora le due rette di regressione coincidono con gli assi cartesiani (con origine posta nel
baricentro!. Se r
*
= + allora i punti osservati sono allineati e le due rette di regressione sono sovrapposte. In
altre parole, tanto pi& l'indice di determinazione $ vicino a + tanto pi& le rette descriveranno meglio la
distribuzione osservata.
DE.I+NZ+ TOT+LE
In ambito di regressione, definiamo devianza totale la distanza fra ogni valore osservato 34 e la media 3. 1'
valida la seguente relazione: :1'. <O<. = :1'. 91>. ? :1'. 91S
4
DE.I+NZ+ DI RE*RESSIONE
In ambito di regressione $ la distanza fra i valori teorici 3
@
4 e la media 3. 1' anche chiamata devianza spiegata
dalla regressione.
DE.I+NZ+ RESIDU+
In ambito di regressione, indica la distanza fra la distribuzione osservata e la distribuzione teorica
rappresentata dai punti della retta di regressione.
DIPENDENZ+ IN ,EDI+
:ata una distribuzione secondo due caratteri, diciamo che se 3 $ indipendente in media da 5 allora le
distribuzioni parziali secondo il carattere 3 hanno la stessa media aritmetica. 9icordiamo che una situazione
di connessione nulla implica indipendenza in media. ;n indice di dipendenza in media $ quello proposto da
6earson (vedi lezioni!
che assume valore + nel caso di dipendenza perfetta di 3 da 5" assume invece valore - nel caso di
indipendenza in media.

,
,OD+LIT+/
Ogni carattere si presenta nelle unit attraverso delle modalit. 7d esempio il carattere sesso si presenta con
le modalit maschio e femmina.
.
.+LORE -ENTR+LE DI UN+ -L+SSE
Il valore centrale di una classe $ la misura che pi& frequentemente si usa nelle elaborazioni di caratteri divisi
in classi. Si trova sommando gli estremi della classe e dividendo il risultato per *.

5

Potrebbero piacerti anche