Barabesi - Statistica Non Parametrica

Elementi di statistica non parametrica
Lucio Barabesi
Indice
1 L'equivalenza in distribuzione 1.1 L'equivalenza in distribuzione 1.2 L'equivalenza in distribuzione e le variabili casuali simmetriche Le statistiche distribution-free 2.1 I modelli statistici distribution-free 2.2 Le statistiche distribution-free 2.3 Le statistiche segno 2.4 Le statistiche rango 2.5 Le statistiche rango dei valori assoluti Il test statistico distribution-free 3.1 I test statistici distribution-free 3.2 L'efficienza asintotica relativa 3.3 La significativit osservata Gli intervalli di confidenza distribution-free 4.1 Gli intervalli di confidenza distribution-free 4.2 Gli intervalli di confidenza distribution-free per grandi campioni I test basati su statistiche lineari dei ranghi con segno 5.1 I test basati su statistiche lineari dei ranghi con segno 5.2 I test basati su statistiche lineari dei ranghi con segno localmente pi potenti 5.3 La distribuzione per grandi campioni delle statistiche lineari dei ranghi con segno I tests per un parametro di posizione: un campione e due campioni appaiati 6.1 Il test dei segni 6.2 Le prestazioni del test dei segni 6.3 Il test dei segni e gli intervalli di confidenza per la mediana 6.4 Il test dei segni per due campioni appaiati 6.5 Il test di Wilcoxon 6.6 Le prestazioni del test di Wilcoxon 6.7 Il test di Wilcoxon e gli intervalli di confidenza per la mediana 6.8 Il test di Wilcoxon per due campioni appaiati I test basati su statistiche lineari dei ranghi 7.1 Le statistiche lineari dei ranghi 7.2 La distribuzione per grandi campioni delle statistiche lineari dei ranghi 1 1 4 8 8 9 10 11 16 20 20 24 35 36 36 40 43 43 47 49 56 56 58 59 60 61 64 65 66 67 67 74
I test per i parametri di posizione: due campioni indipendenti 8.1 Le statistiche lineari dei ranghi per i parametri di posizione 8.2 La distribuzione per grandi campioni delle statistiche lineari dei ranghi per i parametri di posizione 8.3 Il test di Mann-Whitney-Wilcoxon 8.4 Il test della mediana 8.5 Le prestazioni del test di Mann-Whitney-Wilcoxon e del test della mediana I test per i parametri di scala: due campioni indipendenti 9.1 Le statistiche lineari dei ranghi per i parametri di scala 9.2 La distribuzione per grandi campioni delle statistiche lineari dei ranghi per i parametri di scala 9.3 Il test di Mood 9.4 Il test di Ansari-Bradley 9.5 Le prestazioni del test di Mood e del test di Ansari-Bradley I test per l'associazione 10.1 Verifica di ipotesi sull'associazione 10.2 Il test di correlazione di Spearman 10.3 Il test di correlazione di Kendall L'analisi della varianza 11.1 Ulteriori risultati per le statistiche rango 11.2 Il test di Kruskal-Wallis 11.3 Il test di Friedman 11.4 Il test di concordanza di Kendall I test funzionali 13.1 Il test Chi-quadrato per la bont di adattamento 13.2 Il test Chi-quadrato per la bont di adattamento con 5 campioni 13.3 La statistica di Kolmogorov 13.4 Il test di Kolmogorov 13.5 La statistica di Kolmogorov-Smirnov 13.6 Il test di Kolmogorov-Smirnov
77 77 82 84 86 88 90 90 96 99 101 103 106 106 106 111 120 120 122 124 127 129 129 134 137 141 143 146 148 148 152 152 158 181 181
10
11
12
Appendice A.1 Alcune distribuzioni e relative caratteristiche A.2 Alcuni risultati matematici A.3 Alcuni risultati di teoria delle probabilit Tavole Bibliografia essenziale Riferimenti bibliografici
Capitolo 1 L'equivalenza in distribuzione

1.1. L'equivalenza in distribuzione. L'equivalenza in distribuzione una particolare relazione di equivalenza tra variabili casuali. Definizione 1.1.1. Le variabili casuali \ e ] , con rispettive funzioni di ripartizione J e K , sono dette equivalenti in distribuzione se J B KB , aB . In modo analogo, i vettori di variabili casuali \" \# \8 e ]" ]# ]8 , con rispettive funzioni di ripartizione congiunte J8 e K8 , sono detti equivalenti in distribuzione se J8 B" B# B8 K8 B" B# B8 , aB" B# B8 8 . Per indicare che \ e ] sono equivalenti in distribuzione si adotta la notazione
. \ ] ,
mentre per indicare che \" \# \8 e ]" ]# ]8 sono equivalenti in distribuzione si adotta la notazione
. \" \# \8 ]" ]# ]8 . . Si noti che rappresenta in effetti una relazione di equivalenza, in quanto immediato verificare che essa risulta riflessiva, ovvero . \ \,
simmetrica, ovvero
. . \ ] ] \,
e transitiva, ovvero
. . . \ ],] ^ \ ^.
Esempio 1.1.1. Si consideri le variabili casuali \ e ] , con rispettive funzioni di ripartizione J e K, dove KB J B - (- ). E' immediato verificare che la trasformata ^ . ] - ha per funzione di ripartizione J , per cui dalla Definizione 1.1.1 risulta \ ^ . Di . conseguenza, si ha \ ] -. Alternativamente, si consideri le variabili casuali \ e ] , con rispettive funzioni di ripartizione J e K, dove KB J B$ ($ ). Anche in questo caso, immediato verificare che la trasformata ^ ] $ ha per funzione di ripartizione J , . . per cui dalla Definizione 1.1.1 risulta \ ^ e dunque \ ] $ .
L'equivalenza in distribuzione
Esempio 1.1.2. Si consideri le variabili casuali \ e ] equivalenti in distribuzione e sia J la loro funzione di ripartizione comune. Inoltre, sia data una trasformata misurabile Y per cui EY \ . Dalla definizione di valor medio si ha EY \ ( Y B .J B ( Y C .J C EY ] ,

dal momento che \ e ] possiedono la stessa funzione di ripartizione. Dunque, si pu concludere che se \ e ] sono equivalenti in distribuzione allora possiedono i medesimi momenti. Analogamente, se \" \# \8 e ]" ]# ]8 sono vettori di variabili casuali equivalenti in distribuzione e se Y" Y# Y5 un vettore di trasformate misurabili per cui EY4 \" \# \8 , allora risulta EY4 \" \# \8 EY4 ]" ]# ]8 , 4 " # 5 . Si noti infine che la proposizione inversa non valida, ovvero possono esistere due variabili casuali \ e ] che possiedono i medesimi momenti, ma non sono equivalenti in distribuzione. Esempio 1.1.3. Si consideri le variabili casuali \ e ] equivalenti in distribuzione. Tenendo presente il risultato dell'Esempio 1.1.2, per un dato insieme misurabile E risulta dunque EIE \ EIE ] . Dal momento che EIE \ Pr\ E e EIE ] Pr] E, allora si ha che Pr\ E Pr] E .
Esempio 1.1.4. Si consideri i vettori di variabili casuali \" \# \8 e ]" ]# ]8 equivalenti in distribuzione. Se E B" B# B8 B" B# B8 8 B" B# B8 , allora tenendo presente il risultato dell'Esempio 1.1.3, risulta EIE \" \# \8 EIE ]" ]# ]8 . Essendo EIE \" \# \8 Pr\" \# \8 e EIE ]" ]# ]8 Pr]" ]# ]8 , si deve concludere che Pr\" \# \8 Pr]" ]# ]8 .
Esempio 1.1.5. Si consideri i vettori di variabili casuali \" \# \8 e ]" ]# ]8 , . tali che \3 ]3 (3 " # 8). Si noti che non si pu affermare che \" \# \8 equivalente in distribuzione a ]" ]# ]8 , come si potrebbe ingenuamente concludere in un primo momento. Infatti, \" \# \8 e ]" ]# ]8 possiedono in generale funzioni di ripartizione congiunte differenti, anche se con identiche funzioni di ripartizione marginali. Il seguente teorema estende l'equivalenza in distribuzione a trasformate, nel senso che l'equivalenza rimane valida applicando una trasformata misurabile ad ambo i membri della stessa. Teorema 1.1.2. Se \ e ] sono variabili casuali equivalenti in distribuzione e se Y una trasformata misurabile, allora
. Y \ Y ] .
Inoltre, se \" \# \8 e ]" ]# ]8 sono vettori di variabili casuali equivalenti in distribuzione e se Y" Y# Y5 un vettore di trasformate misurabili, allora
. Y" \" \# \8 Y# \" \# \8 Y5 \" \# \8 . Y" ]" ]# ]8 Y# ]" ]# ]8 Y5 ]" ]# ]8 .
Dimostrazione. Se J la funzione di ripartizione comune alle variabili casuali \ e ] e se E un dato insieme misurabile, allora PrY \ E ( IE Y B .J B ( IE Y C .J C PrY ] E .

Dal momento che la precedente relazione vera per ogni insieme misurabile E, dalla . Definizione 1.1.1 risulta Y \ Y ] . E' analoga la dimostrazione nel caso di due vettori di variabili casuali. Esempio 1.1.6. Se \ e ] sono variabili casuali equivalenti in distribuzione, si consideri la trasformata Y B B -$ , con - e $ costanti. Dal Teorema 1.1.2 si ha \- . ] , $ $ ovvero in una equivalenza in distribuzione possibile aggiungere o moltiplicare i membri per una costante. Esempio 1.1.7. Si noti che il risultato dell'Esempio 1.1.6 non rimane valido in generale se si aggiunge o si moltiplica i membri per una quantit stocastica. Si consideri infatti una . variabile casuale \ continua con funzione di ripartizione J e tale che \ \ . Se si moltiplica ambo i membri dell'equivalenza per \ si dovrebbe concludere che le variabili casuali ] \ # e ^ \ # sono equivalenti in distribuzione. E' immediato constatare che questa affermazione falsa in quanto ] ovviamente una variabile casuale il cui supporto contenuto in , mentre ^ una variabile casuale il cui supporto contenuto in . Infatti la funzione di ripartizione di ] risulta KC Pr] C Pr\ # C [J C J C] I! C , LD Pr^ D Pr \ # D [" J D J D] I! D I! D . Questo esempio serve a sottolineare che si deve porre una certa cautela nell'applicare la nozione di equivalenza in distribuzione. In particolare si noti che il Teorema 1.1.2 rimane valido solo se si considera trasformate misurabili. Esempio 1.1.8. Se \" \# \8 e ]" ]# ]8 sono vettori di variabili casuali equivalenti in distribuzione, allora si consideri il vettore di trasformate Y" Y# Y8 tale
mentre la funzione di ripartizione di ^ risulta
. che Y3 B" B# B8 B3 (3 " # 8). Dal Teorema 1.1.2 risulta dunque \3 ]3 (3 " # 8), ovvero si deve concludere che se due vettori di variabili casuali sono equivalenti in distribuzione allora anche le singole componenti dei vettori sono ordinatamente equivalenti in distribuzione.
Il seguente teorema consente di ottenere una relazione di equivalenza in distribuzione per un vettore di variabili casuali indipendenti e ugualmente distribuite. Teorema 1.1.3. Se \" \# \8 un vettore di variabili casuali indipendenti e ugualmente distribuite e " # 8 una qualsiasi permutazione di " # 8, allora
. \" \# \8 \" \# \8 .
Dimostrazione. Se J la funzione di ripartizione marginale di \3 (3 " # 8), allora la funzione di ripartizione congiunta di \" \# \8 data da J8 B" B# B8 $ J B3 .
8 3"
Dal momento che la funzione di ripartizione congiunta di \" \# \8 risulta K8 B" B# B8 $ J B3 $ J B3 J8 B" B# B8 ,
8 8 3" 3"
allora si ha K8 B" B# B8 J8 B" B# B8 per ogni B" B# B8 8 , e dalla . Definizione 1.1.1 si conclude che \" \# \8 \" \# \8 . 1.2. L'equivalenza in distribuzione e le variabili casuali simmetriche. In questa sezione vengono introdotte alcune relazioni di equivalenza in distribuzione per variabili casuali simmetriche. A questo fine si consideri innanzitutto la definizione di variabile casuale simmetrica. Definizione 1.2.1. Una variabile casuale \ con funzione di ripartizione J detta simmetrica rispetto ad una costante - se J - B " J - B Pr\ - B , aB .
Esempio 1.2.1. Se \ una variabile casuale continua simmetrica rispetto a - con funzione di ripartizione J e funzione di densit 0 , allora dalla Definizione 1.2.1 risulta J - B " J - B , aB , da cui si ha inoltre 0 - B 0 - B , aB . Se invece \ una variabile casuale discreta simmetrica rispetto a - con funzione di ripartizione J e funzione di probabilit :, allora dalla Definizione 1.2.1 risulta J - B " J - B :- B , aB , da cui si ottiene inoltre
:- B :- B , aB .
Nel seguente teorema si ottiene una condizione necessaria e sufficiente per la simmetria rispetto ad una costante. Teorema 1.2.2. La variabile casuale \ ha una distribuzione simmetrica rispetto alla costante - se e solo se
. \- -\ .
Dimostrazione. Si dimostra innanzitutto che la condizione necessaria. Se \ simmetrica rispetto a - con funzione di ripartizione J , allora la funzione di ripartizione della trasformata ] \ - data da KC Pr] C Pr\ - C Pr\ - C J - C , mentre, tenendo presente la definizione di variabile casuale simmetrica, la funzione di ripartizione della trasformata ^ - \ risulta LD Pr^ D Pr- \ D Pr\ - D " J - D Pr\ - D J - D . Dal momento che ] e ^ possiedono la medesima funzione di ripartizione, dalla Definizione . . 1.1.1 si ha ] ^ , ovvero \ - - \ . Si dimostra ora che la condizione sufficiente. . Se \ - - \ , allora dalla definizione di equivalenza in distribuzione risulta Pr\ - B Pr- \ B . Tenendo presente la precedente relazione si ha J - B Pr\ - B Pr\ - B Pr- \ B Pr\ - B " J - B Pr\ - B , ovvero \ simmetrica rispetto a -.
. Esempio 1.2.2. Sia \" \# un vettore di variabili casuali tale che \" \# \# \" e si consideri la trasformata Y B" B# B" B# . Dal Teorema 1.1.2 si ottiene dunque . \" \ # \# \" ,
ovvero
. \" \ # \" \# .
Dunque, per il Teorema 1.2.2 la trasformata \" \# simmetrica rispetto a !.
Esempio 1.2.3. Sia \ una variabile casuale simmetrica rispetto a - con E\ . Dal . Teorema 1.2.2 si ha \ - - \ . Dal momento che variabili casuali equivalenti in distribuzione hanno la stessa media vedi Esempio 1.1.2, allora E\ - E- \ ,
6 ovvero E\ - - E\ , da cui infine risulta E\ -.
Il seguente teorema considera un insieme di equivalenze in distribuzione per un vettore di variabili casuali le cui componenti sono indipendenti e simmetriche. Teorema 1.2.3. Se \" \# \8 un vettore di variabili casuali indipendenti tali che \3 simmetrica rispetto a -3 (3 " # 8), allora
. . . \" -" \# -# \8 -8 -" \ " \ # -# \ 8 -8 . -" \ " -# \ # - 8 \ 8 ,
dove l'equivalenza in distribuzione estesa a tutte le possibili #8 configurazioni di vettori. Dimostrazione. Si dimostra la prima delle equivalenze in distribuzione. Per il Teorema 1.2.2 . -3 \3 , ovvero dalla definizione di la simmetria di \3 rispetto a -3 implica \3 -3 equivalenza in distribuzione si ottiene Pr\3 -3 B Pr-3 \3 B , 3 " # 8 . Data l'indipendenza delle componenti di \" \# \8 , risulta dunque Pr\" -" B" \# -# B# \8 -8 B8 $ Pr\3 -3 B3 Pr-" \" B" $ Pr\3 -3 B3
8 8 3" 3#
Pr-" \" B" \# -# B# \8 -8 B8 ,

. ovvero si ha \" -" \# -# \8 -8 -" \" \# -# \8 -8 . In modo analogo si ottiene la dimostrazione delle altre equivalenze in distribuzione.
Esempio 1.2.4. Sia \" \# \8 un campione casuale da una variabile casuale \ simmetrica rispetto a -. Dal Teorema 1.2.3 risulta dunque
. \" - \# - \8 - - \ " - \ # - \ 8 .
Inoltre, se si considera la trasformata Y B" B# B8 8" ha " 8 ovvero . \- -\ ,

8
. \3 -
8 3" B3 ,
dal Teorema 1.1.2 si
3"
" 8
- \ 3 ,
3"
dove \ 8" 8 3" \3 la media campionaria. Tenendo presente il Teorema 1.2.2, la precedente equivalenza in distribuzione ci porta dunque a concludere che in questo caso la media campionaria simmetrica rispetto a -. Esempio 1.2.5. Sia \" \# \8 un campione casuale da una variabile casuale \ continua e simmetrica rispetto a !. Dal Teorema 1.2.3 risulta
. \" \# \8 \" \# \ 8 .
Si consideri ora il vettore di trasformate Y" Y# Y8 tale che Y3 B" B# B8 B3 , dove B3 rappresenta l'3-esimo elemento ordinato nel vettore B" B# B8 (3 " # 8). Si noti che Y3 B" B# B8 B83" (3 " # 8), in quanto cambiando il segno agli elementi del vettore B" B# B8 se ne inverte l'ordinamento. Dal Teorema 1.1.2 si ottiene dunque
. \" \# \8 \8 \8" \" ,
dove \3 rappresenta l'3-esima statistica ordinata (3 " # 8). In particolare, tenendo . presente l'Esempio 1.1.8, si ottiene \3 \83" (3 " # 8). E' analogo verificare che se \" \# \8 un campione casuale da una variabile casuale \ continua e simmetrica rispetto a -, allora
. \" - \# - \8 - - \8 - \8" - \" , . - \83" 3 " # 8. che implica \3 -
Esempio 1.2.6. Sia \" \# \8 un campione casuale da una variabile casuale \ continua e simmetrica rispetto a !. Tenendo presente l'Esempio 1.2.5, si applichi . all'equivalenza in distribuzione \" \# \8 \8 \8" \" la trasformata Y , dove Y B" B# B8 B6 con 6 8 "# se 8 dispari e Y B" B# B8 B6 B6" # con 6 8# se 8 pari. Dal Teorema 1.1.2 per 8 dispari si ha dunque
. \6 \6 ,
mentre per 8 pari si ha " " . \6 \6" \6 \6" . # # ~ Dal momento che la mediana campionaria usualmente definita come \ \6 con ~ 6 8 "# se 8 dispari ed definita come \ \6 \6" # con 6 8# se 8 pari, allora risulta ~ . ~ \ \ , ovvero, tenendo presente il Teorema 1.2.2, si deve concludere che in questo caso la mediana campionaria simmetrica rispetto a !. Risulta analogo verificare che se \" \# \8 un campione casuale da una variabile casuale \ continua e simmetrica rispetto a -, allora la mediana campionaria simmetrica rispetto a -.
Capitolo 2 Le statistiche distribution-free

2.1. I modelli statistici distribution-free. Nella statistica inferenziale classica si assume nota la morfologia funzionale delle funzioni di ripartizione congiunte specificate dal modello statistico e in particolare si assume che queste siano dello stesso tipo a meno di un insieme di parametri. Invece, nella statistica moderna si tende a non fare assunzioni funzionali sulla distribuzione congiunta del campione, ovvero si considera i cosiddetti modelli statistici distribution-free (una definizione anglosassone ormai consolidata anche nella terminologia statistica italiana). Un modello statistico distribution-free ha la seguente definizione formale. Definizione 2.1.1. Si consideri il campione \" \# \8 con funzione di ripartizione congiunta J8 Y , dove Y una classe di funzioni di ripartizione congiunte, ovvero un modello statistico. Se Y contiene pi di una famiglia di funzioni di ripartizione congiunte, allora detto modello statistico distribution-free. Esempio 2.1.1. Il modello statistico Y J8 J8 B" B# B8 $ FB3 .5 . 5
8 3"
non distribution-free, in quanto contiene una sola famiglia di funzioni di ripartizione congiunte, ovvero le funzioni di ripartizione congiunte di un campione casuale da una R . 5# . Il precedente modello statistico tipico nell'inferenza classica. Invece, se V8 rappresenta la classe delle funzioni di ripartizione di un vettore di 8 variabili casuali continue, allora Y J8 J8 V8 costituisce un modello statistico distribution-free.
Frequentemente il modello statistico del tipo Y< , ovvero indicizzato mediante un insieme di parametri < non necessariamente reali. Importanti modelli statistici distribution-free possono essere indicizzati in questa maniera. Ad esempio nel seguito sar fatto riferimento al modello statistico distribution-free VJ J8 J8 B" B# B8 $ J B3 J V ,
8 3"
dove V rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua. Ovviamente, VJ rappresenta il modello statistico relativo ad un campione casuale
Le statistiche distribution-free
proveniente da una variabile casuale continua. Una importante sottoclasse di VJ data dal modello statistico distribution-free `-J J8 J8 B" B# B8 $ J B3 - J ` - ,
8 3"
dove ` rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua con mediana pari a !, ovvero ` J J V J ! "# . Si noti che `-J rappresenta il modello statistico relativo ad un campione casuale proveniente da una variabile casuale continua con funzione di ripartizione J B - e con mediana pari a -. Una sottoclasse di `-J data dal modello statistico distribution-free f-J J8 J8 B" B# B8 $ J B3 - J f - ,
8 3"
dove f rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua e simmetrica rispetto a !, ovvero f J J V J B " J B . Dunque, f-J rappresenta il modello statistico relativo ad un campione casuale proveniente da una variabile casuale continua con funzione di ripartizione J B - e simmetrica rispetto a -. Due ulteriori sottoclassi di VJ di uso frequente sono rappresentati dai modelli statistici distribution-free _JJ e i(J J8 J8 B" B# B8 $ J B3 $ J B3 ( J V ( ,
8" 8 3" 38" "
J8 J8 B" B# B8 $ J B3 $ J B3 J J V J ,
8" 8 3" 38" "
dove " 8" 8. 2.2. Le statistiche distribution-free. Le statistiche distribution-free hanno la seguente definizione formale. Definizione 2.2.1. Si consideri il campione \" \# \8 con funzione di ripartizione congiunta J8 Y , dove Y un modello statistico. La statistica X X \" \# \8 detta distribution-free su Y se la sua funzione di ripartizione rimane invariata per ogni J8 Y . Esempio 2.2.1. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 Y5 , dove Y5 J8 J8 B" B# B8 $ FB3 5 5 .
8 3"
10
Il modello statistico Y5 ovviamente quello relativo ad un campione casuale da una R ! 5# . Se \ e W # rappresentano rispettivamente la media campionaria e la varianza campionaria corretta, allora noto che la statistica X 8\W distribuita come una > di Student con 8 " gradi di libert. Poich la distribuzione di X non dipende dal parametro 5, allora X una statistica distribution-free su Y5 . L'Esempio 2.2.1 evidenzia che una tipica statistica dell'inferenza classica pu essere considerata distribution-free su un particolare modello statistico classico. Tuttavia, usualmente una statistica detta distribution-free quando il modello statistico Y anch'esso distribution-free. Quando si dispone di campioni di numerosit elevata risulta interessante considerare statistiche distribution-free per grandi campioni, che sono definite formalmente di seguito. Definizione 2.2.2. Si consideri il campione \" \# \8 con funzione di ripartizione congiunta J8 Y , dove Y un modello statistico per ogni 8. La statistica X X8 X8 \" \# \8 detta distribution-free per grandi campioni su Y , se per . 8 risulta X8 Z per ogni J8 Y , dove Z una data variabile casuale limite. Esempio 2.2.2. Si consideri il modello statistico distribution-free Y5J J8 J8 VJ E\ ! Var\ 5# . Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y5J , si consideri la statistica X X8 8\W dell'Esempio 2.2.1. Si noti che X pu essere espressa come \ 5 X . 58 W Dal momento che W # 5# per 8 (vedi Esempio A.3.4), per il Teorema di Sverdrup : (Teorema A.3.4) si ha W 5 per 8 . Inoltre, per il Teorema Fondamentale Classico del . Limite (Teorema A.3.6) si ha 8\5 R ! ". Combinando questi risultati mediante il Teorema di Slutsky (Teorema A.3.5) si ottiene infine \ . X R ! " . W8 Si deve dunque concludere che la statistica X distribution-free per grandi campioni su Y5J . 2.3. Le statistiche segno. In questa sezione viene introdotta una prima classe di statistiche distribution-free, ovvero le cosiddette statistiche segno. Definizione 2.3.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `!J . Si definiscono statistiche segno le trasformate ^3 I! \3 , 3 " # 8 . Il vettore di statistiche ^" ^# ^8 detto vettore dei segni.
:
11
Si noti che ogni statistica segno ^3 assume valore " se \3 ! (ovvero se \3 maggiore della mediana) e il valore ! altrimenti (3 " # 8) e ovviamente da questo fatto deriva la loro denominazione. Il seguente teorema fornisce la distribuzione congiunta delle statistiche segno. Teorema 2.3.2. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `!J , il relativo vettore dei segni ^" ^# ^8 ha componenti indipendenti ed ugualmente distribuite come F3" "#. Dimostrazione. Dal momento che dalla Definizione 2.3.1 ogni statistica segno ^3 trasformata solo della relativa \3 (3 " # 8) e poich il campione casuale \" \# \8 ha componenti indipendenti, allora anche le componenti del vettore dei segni ^" ^# ^8 sono indipendenti. Inoltre si noti che il supporto della statistica segno ^3 (3 " # 8) l'insieme ! ". Dalla assunzione di continuit fatta per \3 si ha Pr^3 " Pr\3 ! " J ! e di conseguenza Pr^3 ! " Pr^3 " " , 3 " # 8 . # " , 3 " # 8 , #
E' immediato dunque concludere che la statistica segno ^3 F3" "#.
Corollario 2.3.3. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `!J . Se X X ^" ^# ^8 , ovvero X una statistica basata solo sul vettore dei segni, allora X distribution-free su `!J . Dimostrazione. Il risultato segue immediatamente dal Teorema 2.3.2 e dalla Definizione 2.3.1, in quanto per qualsiasi distribuzione congiunta J8 `!J la statistica X distribuita come una trasformata di un vettore di variabili casuali indipendenti ed ugualmente distribuite come F3" "#. Esempio 2.3.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `!J . Si consideri la statistica
8
F
3"
^3 ,
che ovviamente rappresenta il numero di osservazioni positive nel campione. Utilizzando il Teorema 2.3.2 si verifica facilmente che F F38 "#. Di conseguenza, poich la funzione di ripartizione di F rimane invariata per ogni funzione di ripartizione congiunta di `!J , allora F una statistica distribution-free su `!J . Questo risultato pu essere ottenuto immediatamente dal Corollario 2.3.3. 2.4. Le statistiche rango. La classe delle statistiche rango fondamentale per costruire statistiche distribution-free. La seguente la definizione formale di statistica rango. Definizione 2.4.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ . Si definiscono statistiche rango le seguenti trasformate
12
V3
4"
I! \3 \4 , 3 " # 8 .
Il vettore di statistiche V" V# V8 detto vettore dei ranghi.
Si noti che la statistica V3 rappresenta la posizione di \3 all'interno del campione ordinato, ovvero \3 \V3 , 3 " # 8 , e da questo deriva ovviamente la denominazione di statistiche rango. Definizione 2.4.2. Si definisce insieme delle permutazioni l'insieme e8 8 dato da e8 <" <# <8 <" <# <8 una permutazione di " # 8 . Nel seguente teorema viene ottenuta la distribuzione congiunta del vettore dei ranghi. Teorema 2.4.3. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora la funzione di probabilit congiunta del relativo vettore dei ranghi V" V# V8 data da PrV" <" V# <# V8 <8 " , <" <# <8 e8 . 8x
Dimostrazione. E' immediato verificare che il vettore di variabili casuali V" V# V8 discreto con supporto e8 . Si noti inoltre che per un prefissato <" <# <8 e8 risulta PrV" <" V# <# V8 <8 Pr\" \<" \# \<# \8 \<8 Pr\." \.# \.8 , dove .3 la posizione del numero 3 (3 " # 8) nella permutazione <" <# <8 . Dal . Teorema 1.1.3 si ha \" \# \8 \." \.# \.8 , che implica (vedi Esempio 1.1.4) Pr\." \.# \.8 Pr\" \# \8 . Dunque PrV" <" V# <# V8 <8 Pr\" \# \8 PrV" " V# # V8 8 . Inoltre, dal momento che #e8 8x, si ha PrV" <" V# <# V8 <8
<" <# <8 e8
<" <# <8 e8
PrV" " V# # V8 8 8x PrV" " V# # V8 8 .
Le statistiche distribution-free Infine, essendo PrV" <" V# <# V8 <8 " ,

<" <# <8 e8
13
allora si ha PrV" " V# # V8 8 Si deve concludere dunque che PrV" <" V# <# V8 <8 PrV" " V# # V8 8 " , <" <# <8 e8 , 8x " . 8x
ovvero il vettore dei ranghi V" V# V8 distribuito uniformemente su e8 . Dal Teorema 2.4.3 possibile ricavare i seguenti quattro corollari.
Corollario 2.4.4. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ . La funzione di probabilit della statistica rango V3 (3 " # 8) risulta PrV3 < " , < " # 8 , 8
la funzione di probabilit congiunta di una scelta di due statistiche rango V3 V4 (3 4 " # 8) risulta PrV3 <" V4 <# " , <" <# " # 8 , 88 "
mentre la funzione di probabilit congiunta di una scelta di 5 statistiche rango V3" V3# V35 (3" 3# 35 " # 8) risulta PrV3" <" V3# <# V35 <5 " , 88 " 8 5 "
5 " # 8 , <" <# <5 " # 8 . Dimostrazione. Dal Teorema 2.4.3 risulta che ogni determinazione del vettore V" V# V8 in e8 ugualmente probabile. Inoltre vi sono 8 "x elementi di e8 per cui V3 < (< " # 8), e dunque si ha PrV3 < 8 "x " " , < " # 8 . 8x 8 per cui V3 <" e V4 <#
Analogamente, vi sono 8 #x elementi di e8 (<" <# " # 8), e quindi PrV3 <" V4 <# 8 #x
" " , <" <# " # 8 . 8x 88 "
14
Infine, si noti che vi sono 8 5x elementi di e8 per cui V3" <" V3# <# V35 <5 (<" <# <5 " # 8), e quindi PrV3" <" V3# <# V35 <5 8 5x " " , 8x 88 " 8 5 "
5 " # 8 , <" <# <5 " # 8 .
Corollario 2.4.5. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ . Si ha EV3 " 8 " , 3 " # 8 , # " 8# " , 3 " # 8 , "# " 8 " , 3 4 " # 8 . "#
VarV3 e
CovV3 V4
Dimostrazione. Dal Corollario 2.4.4 e tenendo presente il Teorema A.2.1, si ha " EV3 8 Analogamente
# EV3 8
<
<"
" 8 " , 3 " # 8 . #
" 8
<#
<"
" 8 "#8 " , 3 " # 8 , '
da cui VarV3 " " " 8 "#8 " 8 "# 8# " , 3 " # 8 . ' % "#
8 8 8 " <# 88 " <" 8
Di nuovo dal Corollario 2.4.4 e tenendo presente il Teorema A.2.1, si ha EV3 V4 " 88 " <" <#
<" "<# <" "
<#
<"
" " " 8# 8 "# 88 "#8 " 88 " % ' " 8 "$8 # , 3 4 " # 8 , "#
per cui CovV3 V4 EV3 V4 EV3 EV4
15
" " " 8 "$8 # 8 "# 8 " , 3 4 " # 8 . "# % "#
Corollario 2.4.6. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ . Se X X V" V# V8 , ovvero X una statistica basata solo sul vettore dei ranghi, allora X distribution-free sulla classe VJ . Dimostrazione. Il risultato segue immediatamente dal Teorema 2.4.3, in quanto per qualsiasi distribuzione congiunta di J8 VJ la statistica X distribuita come una trasformata di un vettore di variabili casuali uniformemente distribuito su e8 . Corollario 2.4.7. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ . Si consideri una scelta di 5 statistiche rango V3" V3# V35 e sia V3" V3# V35 il relativo vettore di statistiche rango ordinato in senso crescente (3" 3# 35 " # 8). Si ha 8 " PrV3" <" V3# <# V35 <5 , 5 5 " # 8 , " <" <# <5 8 . Dimostrazione. Sia <" <# <5 una scelta di 5 elementi di " # 8 tale che " <" <# <5 8. Dal Corollario 2.4.4 si ha PrV3" <" V3# <# V35 <5 " . 88 " 8 5 "
Tuttavia questa solo una possibile permutazione di V3" V3# V35 per cui si ha V3" <" V3# <# V35 <5 . Poich esistono 5x di tali permutazioni ed ognuna ugualmente probabile, allora PrV3" <" V3# <# V35 <5 5x " 88 " 8 5 "
8 " , 5 " # 8 , " <" <# <5 8 . 5
Esempio 2.4.1. Si consideri due campioni casuali \" \# \8" e ]" ]# ]8# provenienti da due variabili casuali continue ed equivalenti in distribuzione. Dunque, se 8 8" 8# , si noti che il campione misto \" \# \8" ]" ]# ]8# formato dai due campioni casuali originali pu essere considerato sua volta un campione casuale con funzione di ripartizione congiunta J8 VJ . Di conseguenza, siano V" V# V8" i ranghi assegnati a \" \# \8" e V8" " V8" # V8 i ranghi assegnati a ]" ]# ]8# nel campione misto. Si consideri la statistica
8"
[
3"
V3 ,
che fornisce evidentemente la somma dei ranghi assegnati a \" \# \8" . Si noti che quando i ranghi assegnati a \" \# \8" sono i pi bassi (ovvero " # 8" ) si ottiene " il valore minimo che [ pu assumere, dato da 8 3" 3 8" 8" "#. Alternativamente,
16
quando i ranghi assegnati a \" \# \8" sono i pi elevati (ovvero 8# " " 8# # 8) si ottiene il valore massimo che [ pu assumere, dato da 8 3" 8# 3 8" 8 8# "#. Di conseguenza, immediato verificare che il supporto di [ risulta 8" 8" "# 8" 8" "# " 8" 8 8# "#. Se -8" 8# A rappresenta il numero di sottoinsiemi di 8" interi di " # 8 la cui somma A, dal momento che
8"
[
3"
V3 ,
allora tenendo presente il Corollario 2.4.7 la funzione di probabilit di [ data da 8 " :8" 8# A Pr[ A -8" 8# A , 8" A 8" 8" "# 8" 8" "# " 8" 8 8# "# . Poich la distribuzione di [ rimane invariata per ogni funzione di ripartizione congiunta di VJ , allora si deve concludere che [ distribution-free su VJ . Questo risultato pu essere ottenuto immediatamente dal Corollario 2.4.6. 2.5. Le statistiche rango dei valori assoluti. Le statistiche rango dei valori assoluti costituiscono un'ulteriore importante classe di statistiche distribution-free. Definizione 2.5.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J . Si definiscono come statistiche rango dei valori assoluti le seguenti trasformate
8 V3 4" Il vettore di statistiche V" V# V8 detto vettore dei ranghi dei valori assoluti.
I! \3 \4 , 3 " # 8 .
E' immediato constatare che V" V# V8 non altro che il vettore dei ranghi assegnati ai valori assoluti degli elementi del campione casuale originale. Il seguente teorema fornisce la distribuzione congiunta delle statistiche rango dei valori assoluti.
Teorema 2.5.2. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J , allora la funzione di probabilit congiunta del relativo vettore dei ranghi dei valori assoluti V" V# V8 data da
PrV" <" V # <# V 8 <8
" , <" <# <8 e8 . 8x
Dimostrazione. E' immediato verificare che \" \# \8 ancora un campione casuale. Dunque, poich V" V# V8 un vettore dei ranghi relativo ad un campione casuale, allora dal Teorema 2.4.3 si ha che V" V# V8 uniformemente distribuito su e8 . Si noti che se una variabile casuale continua simmetrica il punto di simmetria coincide con la mediana. Dunque, essendo f!J `!J , la distribuzione congiunta del vettore dei segni
17
quella ottenuta nel Teorema 2.3.2. I seguenti teoremi forniscono la distribuzione congiunta del vettore dei segni e del vettore dei ranghi dei valori assoluti. Teorema 2.5.3. Se \ una variabile casuale con funzione di ripartizione J f , allora le variabili casuali trasformate ] \ e ^ I! \ sono indipendenti. Dimostrazione. Per un dato B ! si ha Pr] B ^ " Pr] B ^ " Pr \ B \ ! Pr^ " Pr\ !
Pr! \ B J B J ! . Pr\ ! " J !
Dal momento che J ! "# e che la funzione di ripartizione di ] data da #J B "I! B, si ha Pr] B ^ " J B "# #J B " Pr] B . "#
Analogamente, per un dato B ! si ha Pr] B ^ ! Pr] B ^ ! Pr \ B \ ! Pr^ ! Pr\ !
Pr B \ ! J ! J B , Pr\ ! J !
da cui, tenendo presente che J B " J B, si ha Pr] B ^ ! "# " J B #J B " Pr] B . "#
Poich il supporto di ^ l'insieme ! ", allora dalle precedenti relazioni si ottiene che Pr] B ^ D Pr] B (D ! "), da cui si conclude che le variabili casuali ] e ^ sono indipendenti. Teorema 2.5.4. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J i relativi vettori di statistiche ^" ^# ^8 e V" V# V8 sono indipendenti. Dimostrazione. Dal Teorema 2.5.3, si ottiene che ^3 e \3 sono indipendenti (3 " # 8). Dunque ogni statistica segno ^3 (3 " # 8) indipendente dal campione trasformato \" \# \8 , in quanto questo vettore costituisce un campione casuale. Di conseguenza dal momento che per la Definizione 2.5.1 ogni statistica rango dei valori assoluti V3 (3 " # 8) dipende solo dal campione trasformato \" \# \8 , allora risulta indipendente dal vettore dei segni ^" ^# ^8 . Quindi si deve concludere ^" ^# ^8 e V" V# V8 sono vettori di statistiche indipendenti. Corollario 2.5.5. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J . Se X X ^" ^# ^8 V" V# V8 , ovvero X una statistica
18
basata solo sul vettore dei segni e sul vettore dei ranghi dei valori assoluti, allora X distribution-free su f!J . Dimostrazione. Segue immediatamente dai Teoremi 2.3.2 e 2.5.2, in quanto per ogni distribuzione congiunta J8 f!J la statistica X una trasformata di un vettore di variabili casuali indipendenti ed ugualmente distribuite come F3" "# e di un vettore uniformemente distribuito su e8 . Teorema 2.5.6. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J . Si consideri una scelta di 5 statistiche rango dei valori assoluti V3 V3 V3 e sia V3 V3 V3 il relativo vettore dei ranghi dei valori assoluti " # 5 " # 5 ordinato in senso crescente (3" 3# 35 " # 8). Sia inoltre ^3" ^3# ^35 la scelta di 5 statistiche segno associata a V3 V3 V3 . Se O 8 3" ^3 , si ha " # 5
PrV3 <" V3 <# V3 <5 O 5 ^3" " ^3# " ^35 " " # 5
#8 , 5 ! " 8 , " <" <# <5 8 . Dimostrazione. Dal Corollario 2.4.7 si ha 8 " PrV3 < V < V < O 5 , " # 5 3 3 " # 5 5 5 ! " 8 , " <" <# <5 8 . Inoltre dal Teorema 2.3.2 immediato verificare che 8 PrO 5 #8 , 5 ! " 8 , 5 da cui si ottiene
PrV3 <" V3 <# V3 <5 O 5 " # 5 PrV3 <" V3 <# V3 <5 O 5PrO 5 " # 5
8 " 8 #8 #8 , 5 ! " 8 , " <" <# <5 8 . 5 5

Tenendo presente che V3 V3 V3 indipendente da ^3" ^3# ^35 per il Teorema " # 5 2.5.4, allora si ha PrV3 <" V3 <# V3 <5 O 5 ^3" " ^3# " ^35 " " # 5 PrV3 <" V3 <# V3 <5 O 5 #8 , " # 5
5 ! " 8 , " <" <# <5 8 .
Esempio 2.5.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J . Si consideri dunque la statistica
19
3"
^3 V3 .
E' immediato verificare che il supporto di [ risulta ! " 88 "#. Se -8 A rappresenta il numero di sottoinsiemi di interi di " # 8 la cui somma A, allora dal Teorema 2.5.6 segue che la funzione di probabilit di [ data da :8 A Pr[ A #8 -8 A , A ! " 88 "# . Poich la distribuzione di [ rimane invariata per ogni funzione di ripartizione congiunta di f!J , allora [ distribution-free su f!J . Questo risultato poteva essere ottenuto immediatamente dal Corollario 2.5.5. Infine, si noti che dal momento che ad ogni sottoinsieme di interi di " # 8 la cui somma A corrisponde un sottoinsieme complementare la cui somma 88 "# A, allora si ottiene -8 A -8 88 "# A. Quindi, :8 A :8 88 "# A ovvero :8 88 "% A :8 88 "% A per A ! " 88 "#. Tenendo presente l'Esempio 1.2.1 si pu dunque concludere che [ simmetrica rispetto a 88 "%.
Capitolo 3 Il test statistico distribution-free

3.1. I test statistici distribution-free. Se si dispone di un campione \" \# \8 , si pu stabilire un insieme L delle ipotesi ammissibili sulla relativa funzione di ripartizione congiunta J8 . Se gli insiemi L! e L" costituiscono una partizione di L , il problema della verifica delle ipotesi consiste nel verificare l'ipotesi di base L! J8 Y! contro l'ipotesi alternativa L" J8 Y Y! , dove Y il modello statistico e Y! una sua sottoclasse. L'insieme L delle ipotesi ammissibili e la sua partizione in L! e L" detto sistema di ipotesi. Si noti che se il modello statistico indicizzato mediante un insieme di parametri <, quando il contesto probabilistico in cui si lavora evidente, per semplicit di notazione il sistema di ipotesi pu essere indicato con L! < R! contro L" < R R! , dove R rappresenta lo spazio dei parametri e R! un suo sottoinsieme. Esempio 3.1.1. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 f-J . Si vuole verificare che il punto di simmetria un particolare valore -! , ovvero l'ipotesi di base L! J8 f-! J contro l'ipotesi alternativa L" J8 f-J f-! J . Si noti che il modello statistico distribution-free ed indicizzato da due parametri, ovvero < - J . Il sistema di ipotesi pu dunque essere espresso pi semplicemente come L! - -! J f contro L" - -! J f . In maniera analoga, in un contesto di statistica classica si potrebbe considerare un modello statistico Y- f-J del tipo Y- J8 J8 B" B# B8 $ FB3 - - .
8 3"
Ovviamente, Y- contiene una sola famiglia di funzioni di ripartizione congiunte ed in particolare rappresenta il modello statistico relativo ad un campione casuale da R - ". Il modello Y- indicizzato solo attraverso -, ovvero < -, e quindi in questo caso il sistema di ipotesi si riduce a verificare L! - -! contro L" - -! . Si deve notare tuttavia che pu risultare poco plausibile in pratica assumere un modello statistico classico, ovvero assumere una specifica morfologia funzionale per J . Lo strumento statistico che sulla base dei dati campionari consente di concludere in favore dell'una o dell'altra ipotesi il cosiddetto test. Definizione 3.1.1. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Se k8 lo spazio campionario, ovvero il supporto di J8 , allora si dice test la funzione H k8 L! L" .
Il test statistico distribution-free
21
Dunque, il test in effetti una regola decisionale che suddivide k8 negli insiemi complementari k! e k" in modo che si accetta L! se la realizzazione del campione in k! , mentre si accetta L" se la realizzazione del campione in k" . L'insieme k" detto regione critica del test. Definizione 3.1.2. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Se X X \" \# \8 una statistica con supporto g , si definisce test basato sulla statistica X la funzione H g L! L" . La statistica X detta statistica test. Si noti che il test basato sulla statistica X una regola decisionale che suddivide g negli insiemi complementari g! e g" , in modo che si accetta L! se la realizzazione di X in g! , mentre si accetta L" se la realizzazione di X in g" . L'insieme g" detto regione critica del test basato sulla statistica X . Definizione 3.1.3. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Un test per questo sistema di ipotesi detto distribution-free se basato su una statistica X X \" \# \8 distribution-free su Y< per ogni < R! . Uno strumento per misurare la capacit discriminatoria del test basato su una statistica X dato dalla funzione potenza. Definizione 3.1.4. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . La funzione potenza del test basato sulla statistica X data da TX < Pr< X g" , dove Pr< indica che la probabilit quella indotta da J8 con il valore del parametro pari a < . E' immediato notare che per ogni < R! la funzione potenza TX < fornisce la probabilit di respingere L! quando questa vera, ovvero la probabilit di commettere un errore di I specie. Analogamente, per ogni < R R! la quantit " TX < fornisce la probabilit di accettare L! quando vera L" , ovvero la probabilit di commettere un errore di II specie. Definizione 3.1.5. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Si dice che il test basato sulla statistica X al livello di significativit se
< R!
sup TX < .
Ovviamente, il livello di significativit rappresenta la massima probabilit di errore di I specie. Quando il test basato su una statistica discreta, allora si noti che esiste solo un numero finito o al pi contabile di possibili livelli di significativit, che vengono detti livelli di significativit naturali. Sebbene esistano tecniche per ottenere un qualsiasi livello di significativit per un test basato su una statistica discreta (la cosiddetta casualizzazione del test) tuttavia risultano artificiose ed preferibile considerare in pratica solo livelli di significativit naturali.
22
Definizione 3.1.6. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Un test basato sulla statistica X al livello di significativit con funzione potenza TX < detto corretto al livello di significativit se TX < , a< R R! .
Si noti che la propriet della correttezza assicura che la probabilit di accettare L" quando vera risulta maggiore della probabilit di commettere un errore di I specie. Esempio 3.1.2. Si consideri un campione casuale \" \# \8 con funzione di ripartizione J8 Y- , dove il modello statistico Y- definito nell'Esempio 3.1.1. Si vuole verificare L! - ! contro L" - ! mediante il test basato sulla statistica X 8\ . Se vera L! la statistica X distribuita come una R ! ". Dunque, dato che g , si pu scegliere g! D" ] e g" D" . Se vera L" la statistica X distribuita come una R 8- " e perci la funzione potenza, che in questo caso dipende ovviamente dal solo parametro -, risulta TX - Pr- X g" " FD" 8- , - ! .
Dal momento che TX ! , allora il test al livello di significativit . Inoltre, essendo TX - una funzione crescente, il test corretto al livello di significativit . Esempio 3.1.3. Si consideri un campione casuale \" \# \8 con funzione di ripartizione J8 f-J . Si vuole verificare L! - ! J f contro L" - ! J f . Si consideri dunque il test basato sulla statistica
8
F
3"
^3 ,
definita nell'Esempio 2.3.1. Si noti che se vera L! , allora la statistica F distribuita come una F38 "# essendo f!J `!J . Dal momento che g ! " 8, si pu scegliere g! ! " ,8" e g" ,8" " 8. Se vera L" risulta Pr\3 ! " J - J - (3 " # 8), per cui F F38 J -. La funzione potenza dunque data da
8
TF - J Pr-J F g"
,,8"
8 J -, [" J -]8, , - ! . , "
Essendo J ! "#, allora risulta TF ! J per ogni J f e quindi si deve concludere che il test al livello di significativit . Inoltre, dal momento che si pu dimostrare che TF - J una funzione crescente di - per ogni J f , allora il test corretto al livello di significativit . La seguente definizione enuncia una propriet desiderabile per grandi campioni 8 della funzione potenza di un test. Definizione 3.1.7. Si consideri il sistema di ipotesi L! < R! contro L" < R R! . Data la statistica X X8 , si consideri inoltre la successione di test al livello di significativit basati sulla successione di statistiche X8 . La successione di test detta coerente se
23
lim T < 8 X8 per ogni < R R! .
",
Ovviamente la propriet della coerenza assicura che la probabilit di commettere un errore di II specie tende a ! per 8 . Esempio 3.1.4. Si consideri il sistema di ipotesi dell'Esempio 3.1.2 e sia X8 la successione di statistiche data da 8\. Dal momento che la successione di funzioni FD" 8- converge uniformemente alla funzione nulla per - !, allora si ha lim T - 8 X8 ",-!. Dunque la successione di test basata sulla successione di statistiche X8 coerente.
Il seguente teorema stabilisce delle condizioni per cui una successione di test basata su una successione di statistiche X8 coerente. Teorema 3.1.8. Si consideri il sistema di ipotesi L! < R! contro L" < R R! . Data la statistica X X8 , si consideri inoltre la successione di test al livello di significativit basati sulla successione di statistiche X8 , tale che la regione critica del test basato su X8 data da g"8 > > -8 . Se esiste una funzione 1< per cui : i X8 1<, a< R , ii 1< 1! , a< R! , iii 1< 1! , a< R R! , iv 8lim - 1! , 8 allora la successione di test basata su X8 coerente. Dimostrazione. Per un dato < R R! , sia % 1< 1! #. Dalla condizione iii si ha ovviamente che % ! e dunque per 8 sufficientemente elevato dalla condizione iv si ha -8 1! % 1< %. Di conseguenza si ha lim T < 8 X8 Pr X8 -8 8lim Pr X8 1< % 8lim < <
8lim Pr 1< % X8 1< % 8lim Pr X8 1< % . < < Per la condizione i si ha che lim8 Pr< X8 1< % ", da cui si ha lim T < 8 X8 " , a< R R! ,
ovvero dalla Definizione 3.1.7 si ha che la successione di test basata su X8 coerente.
Esempio 3.1.5. Se si considera il sistema di ipotesi dell'Esempio 3.1.3, si vuole verificare che la successione di test basata sulla successione di statistiche F8 coerente. Si devono dunque verificare le condizioni i-iv del Teorema 3.1.8. A questo fine si considera la successione di test basata sulla successione di statistiche F8 8, che ovviamente ha le stesse propriet di quella basata sulla successione di statistiche F8 . Per quanto riguarda i, si noti che per la Legge Debole dei Grandi Numeri di Khintchine Teorema A.3.1 si ottiene : F8 8 1- J J - per ogni - !. Inoltre, per quanto riguarda ii e iii, si ha 1! 1! J "# da cui 1- J J - 1! per ogni - !. Infine, per quanto riguarda iv, si
24
noti che g"8 , , ,8" 8. Per il Teorema Fondamentale Classico del Limite Teorema A.3.6, se L! vera risulta F8 8 "# . R ! " , "%8
da cui ,8" 8 "# D" %8 per 8 elevato. Dunque si ha che lim8 ,8" 8 "# 1! . Le condizioni i-iv del Teorema 3.1.8 sono pertanto soddisfatte e dunque la successione di test basata sulla successione di statistiche F8 8 coerente. Di conseguenza anche la successione di test basata sulla successione di statistiche F8 coerente. 3.2. L'efficienza asintotica relativa. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Se si dispone di due statistiche test X e Y sorge a questo punto il problema di determinare quale delle due preferibile. Un modo di procedere quello di fissare il livello di significativit dei due test ad un medesimo valore preassegnato (ovvero di controllare l'errore di I specie) e di considerare le relative funzioni potenza TX < e TY <. Se risulta TX < TY < per ogni < R R! , allora viene preferita la statistica test X , mentre se risulta TX < TY < per ogni < R R! , allora viene preferita la statistica test Y . Tuttavia, si deve notare che quando si considera test distribution-free in generale non possibile determinare un test uniformemente pi potente come nella statistica classica, dato che la struttura del sistema di ipotesi non in questo caso rigida abbastanza da consentire un risultato come ad esempio il Lemma di Neyman-Pearson. Per determinati sistemi di ipotesi una possibilit alternativa quella di ottenere il test localmente pi potente, ovvero il test che ha la maggiore potenza dove la discriminazione fra L! e L" pi difficoltosa, ovvero in prossimit del punto di soglia delle due ipotesi (questi test verrano discussi nei prossimi capitoli). In questa sezione viene considerato piuttosto un confronto locale dei test per grandi campioni. Sia dunque \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , dove ) un parametro reale e J rappresenta la funzione di ripartizione della variabile casuale \ da cui proviene il campione. Si consideri il problema di verificare l'ipotesi di base L! ) K! J Y contro l'alternativa L" ) K K! J Y , dove K lo spazio parametrico relativo a ) e K! un suo sottoinsieme, mentre Y una classe di funzioni di ripartizione. Se per verificare questo sistema di ipotesi si considera i test basati sulle statistiche X e Y , allora il problema stabilire quale dei due test preferibile. A questo fine utile la seguente definizione. Definizione 3.2.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , e si consideri il sistema di ipotesi L! ) K! J Y contro L" ) K K! J Y . Data la statistica X X8 , si consideri inoltre la successione di test basata sulla successione di statistiche X8 . Se la regione critica del test basato su X8 data da g"8 , allora per un dato (! ") sia TX8 ) J Pr)J X8 g"8 , a) K! , 8 " # . Se R il pi piccolo valore di 8 tale che per un dato " " " risulta TXR ) J Pr)J X8 g"8 " , a) K K! , allora si dice che R la minima numerosit campionaria del test al livello di significativit basato sulla statistica X per raggiungere la potenza " per l'alternativa ) K K! .
25
La quantit R ovviamente funzione di , " , ) e della funzione di ripartizione J , ovvero R R " ) J . Ovviamente, per una determinata alternativa ) e per e " fissati, un test maggiormente preferibile quanto minore risulta R " ) J . Questa considerazione conduce alla seguente definizione. Definizione 3.2.2. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , e si consideri il sistema di ipotesi L! ) K! J Y contro L" ) K K! J Y . Siano inoltre R " ) J e Q " ) J le minime numerosit campionarie dei test al livello di significativit basati sulle statistiche X e Y per raggiungere la potenza " per l'alternativa ) K K! . Si dice dunque efficienza relativa del test basato sulla statistica X rispetto al test basato sulla statistica Y la quantit /X Y " ) J Q " ) J , ) K K! . R " ) J
Se /X Y " ) J " allora si dice che il test basato su X pi efficiente di quello basato su Y , mentre se /X Y " ) J " vero l'opposto. Si noti che l'efficienza relativa una misura locale dell'efficienza di un test rispetto ad un altro, nel senso che dipende dalle quantit , " , ) e J . Al fine di eliminare almeno la dipendenza da , " , ) e quindi di ottenere una misura pi globale dell'efficienza conveniente introdurre un indice basato su un confronto per grandi campioni in un particolare sistema di ipotesi. Definizione 3.2.3. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , e si consideri il sistema di ipotesi L! ) )! J Y contro L" ) )3 J Y dove )3 una successione di alternative tali che lim3 )3 )! . Date le statistiche X X8 e Y Y8 , si consideri le due successioni di test al livello di significativit basati sulle successioni di statistiche X83 e Y73 . Se le regioni critiche dei test basati su X83 e Y73 sono date da g"83 > > -83 e h"73 ? ? .73 , allora siano TX83 )3 J Pr)3 J X83 -83 e TY73 )3 J Pr)3 J Y73 .73 le rispettive potenze per l'alternativa )3 3 " # . Se 83 e 73 sono due successioni crescenti di interi tali che lim TX83 )3 J lim TY73 )3 J " ,
3 3
allora si definisce efficienza asintotica relativa del test basato su X rispetto a quella basato su Y la seguente quantit 73 EARX Y lim , 3 83 dove il limite deve essere costante per qualsiasi successione 83 e 73 ed essere indipendente dalla successione )3 .
26
Si noti che EARX Y il limite del rapporto delle numerosit campionarie necessarie ad ottenere la medesima potenza dei due test per la stessa successione di alternative (che converge al valore specificato sotto ipotesi di base) a un livello di significativit costante. Ovviamente, EARX Y EARX Y J , ovvero l'efficienza asintotica relativa dipende comunque dalla struttura funzionale della funzione di ripartizione J . Il seguente teorema permette di determinare una espressione di EARX Y pi conveniente dal punto di vista computazionale. Teorema 3.2.4. (Teorema di Noether) Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , e si consideri il sistema di ipotesi L! ) )! J Y contro L" ) )3 J Y dove )3 una successione di alternative tali che lim3 )3 )! . Date le statistiche X X8 e Y Y8 , siano X83 e Y73 due successioni di statistiche a cui sono associate le successioni .X83 ), 5X83 ), .Y73 ) e 5Y73 ), dove 83 e 73 sono due successioni crescenti di interi. Siano inoltre g"83 > > -83 e h"73 ? ? .73 le regioni critiche dei test al livello di significativit basati sulle statistiche X83 e Y73 . Se: i quando )3 il vero valore di ) , per una certa variabile casuale limite Z si ha X83 .X83 )3 . Z 5X83 )3 e Y 73 . Y 7 3 )3 . Z ; 5Y73 )3 ii stessa condizione i con )! al posto di )3 ; iii si ha
3
lim
5X83 )3 5Y73 )3 lim "; 5X83 )! 3 5Y73 )!
iv le derivate ` .X ) .wX8 ) `) 8 e ` .Y ) .wY7 ) `) 7 sono continue in intorno di ) )! e .wX8 )! !, .wY7 )! !; v si ha

3
lim
.wX8 )3
3
.wX8 )!
3
lim
.wY7 )3
3
.wY7 )!
3
";
vi si ha
27
OX 8lim e
.wX8 )! ! 85X8 )!
.wY7 )! OY 7lim !; 75Y7 )! allora EARX Y

# OX # . OY
Dimostrazione. In base alla condizione iv si pu ottenere la seguente espansione in serie di Taylor di .X83 ) a ) )!
.X83 )3 .X83 )! )3 )! .wX8 )3 , )! )3 )3 .
3
Analogamente, per .Y73 ) si ha

.Y73 )3 .Y73 )! )3 )! .wY7 )3 , )! )3 )3 .
3
Si noti ora che dalle assunzioni fatte risulta

3
lim TX83 )! J lim Pr)! J X83 -83

3
lim Pr)! J
3
X83 .X83 )! - 8 3 . X 83 ) ! . 5X83 )! 5X83 )!
Tenendo presente la condizione ii, per il Teorema A.3.12 la precedente relazione implica che -83 .X83 )! @" , 3 5X83 )! lim dove @" il quantile di ordine " della variabile casuale Z . Impiegando la precedente relazione e la condizione iii si ha - 83 . X 8 3 ) 3 -83 .X83 )! .X83 )! .X83 )3 5X83 )! lim 3 3 5X83 )3 5X83 )! 5X83 )3 lim @" lim Supponiamo ora che
3
.X83 )! .X83 )3 . 3 5X83 )!
lim TX83 )3 J lim Pr)3 J X83 -83 " ,

3
ovvero che il limite della potenza della successione di test basata sulla successione di statistiche X83 per la successione di alternative )3 sia " . Con un procedimento simile a quello visto in precedenza, tenendo presente la condizione i, per il Teorema A.3.12 si ha che
28
-83 .X83 )3 @"" . 3 5X83 )3 lim Analogamente, si ha

3
lim TY73 )! J lim Pr)! J Y73 .73 ,

3
da cui .73 . Y 7 3 )3 . Y73 )! . Y73 ) 3 @" lim , 3 3 5Y73 )3 5Y73 )! lim mentre se si suppone che
3
lim TY73 )3 J lim Pr)3 J Y73 .73 " ,

3
allora .73 . Y 7 3 )3 @"" . 3 5Y73 )3 lim Combinando le relazioni ottenute si ha dunque .X83 )! .X83 )3 . Y 73 ) ! . Y 73 ) 3 lim , 3 3 5X83 )! 5Y73 )! lim ovvero .X83 )! .X83 )3 5Y73 )! ". 3 5X83 )! . Y 73 )! . Y 73 ) 3 lim Sostituendo in questa ultima espressione le opportune espansioni in serie di Taylor si ha
3
lim
)3 )! .wX8 )3
3
5X83 )!
5Y73 )! ", )3 )! .wY7 )3

3
ovvero
.wX8 )3 73 5Y7 )! 83 3 3 lim ". w 3 73 83 5X )! . Y7 )3 83

3
Tenendo presente la condizione iv, v vi si ha dunque
83 OX lim ", OY 3 73 73 O# X # . 83 OY
da cui si ottiene infine EARX Y lim

3
Definizione 3.2.5. Se sono soddisfatte le condizioni del Teorema 3.2.4, la quantit
29
OX 8lim
.wX8 )! 85X8 )!
detta efficacia del test basato sulla statistica X ed denotata con effX .
Si noti che nell'espressione di effX la quantit .wX8 )! non altro che una misura del tasso di variazione del parametro di posizione .X8 ) per valori di ) prossimi a )! . La quantit 5X8 )! serve ovviamente a standardizzare la quantit al numeratore. Sostanzialmente, quindi l'efficacia non altro che il limite del tasso di variazione standardizzato del parametro di posizione di X8 per alternative prossime a )! . Ovviamente, pi questo tasso di variazione sensibile alle alternative pi alta l'efficacia del test. Inoltre, il Teorema 3.2.4 implica .X83 )3 .X83 )! @" @"" , 3 5X83 )! lim ovvero
3
lim 83 )3 )!
83 5X83 )!
3
.wX8 )3
@" @"" ,
da cui
lim 83 )3 )!
@" @"" . OX
dove lim3 83 183 !. Di conseguenza, si deve concludere che il Teorema 3.2.4 implicitamente assume una struttura particolare per la successione di alternative )3 , che quindi possono essere espresse in funzione della numerosit campionaria. In effetti, la successione di alternative )3 equivalente ad una successione di alternative del tipo )! -83 con - costante, che detto sistema di alternative di Pitman. Esempio 3.2.1. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 Y-J , dove Y-J J8 J8 f-J Var\ 5# . Dall'Esempio 1.2.3 immediato verificare che E\ -. Si consideri il sistema di ipotesi L! - ! J Y contro L" - -3 J Y , dove -3 una successione di alternative tali che -3 -83 con - costante. Inoltre, Y rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua e simmetrica rispetto a ! con varianza finita. Si noti che non si perde di generalit nel considerare questo sistema di ipotesi, in quanto se il sistema di ipotesi risulta L! - -! J Y contro L" - -3 -! -83 , J Y , allora si pu ottenere il sistema di ipotesi originale considerando il campione trasformato \" -! \# -! \8 -! . Si vuole determinare l'efficacia del test basato sulla statistica di Student
Dunque, la successione di alternative )3 deve essere tale che @" @"" )3 )! 183 , 83 OX
30 \ . W8
X X8
Si deve dunque verificare le condizioni del Teorema 3.2.4. Innanzitutto, si sceglie .X83 - 83 -5 e 5X83 - ". Per quanto riguarda la verifica della condizione i si noti che X83 .X83 -3 \ -83 5 \ -3 - 5 " . 5X83 -3 W83 5 83 5 83 W 5 W
:
Dal momento che W # 5# per 3 (vedi Esempio A.3.5), dal Teorema di Svedrup : (Teorema A.3.4) si ha W 5 per 3 . Inoltre, tenendo presente il Corollario A.3.8 al . Teorema Fondamentale di Lindberg del Limite, si ottiene 83 \ -83 5 R ! " per 3 . Combinando questi risultati mediante il Teorema di Slutsky (Teorema A.3.5) si ha X 83 . X 8 3 - 3 . R ! " , 5X83 -3 e quindi la condizione i verificata. Anche la condizione ii verificata, in quanto se vera : . L! si ha W 5 e 83 \5 R ! " per 3 vedi Esempio 2.2.2. Di conseguenza, applicando il Teorema di Slutski (Teorema A.3.5) si ha X83 .X83 ! \ 5 . R ! " . 5X83 ! 5 83 W E' banale verificare la condizione iii. Anche la condizione iv verificata, in quanto .wX8 - 8 ` ` . X8 - , `` - 58 5
una funzione continua in un intorno di ! e .wX8 ! !. E' banale verificare anche la condizione v. Infine, per quanto riguarda la condizione vi, si ha 85 .wX8 ! " OX 8lim lim !. 5 85X8 ! 8 8 " . 5
Le condizioni del Teorema 3.2.4 sono dunque soddisfatte e quindi si ha effX
Questa quantit sar utilizzata per determinare l'efficienza asintotica relativa di questo test classico rispetto ad alcuni test distribution-free. Esempio 3.2.2. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 Y-J , dove Y-J J8 J8 f-J ! J w ! 0 ! .
31
Si consideri inoltre il sistema di ipotesi L! - ! J Y contro L" - -3 J Y , dove -3 una successione di alternative tali che -3 -83 con - costante. Inoltre, Y rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua e simmetrica rispetto a ! con funzione di densit finita e non nulla a !. Si vuole determinare l'efficacia del test basato sulla statistica considerata nell'Esempio 2.3.1
8
F F8
3"
^3 .
Si deve dunque verificare le condizioni del Teorema 3.2.4. Si noti che se vera L" , allora Pr\ ! " J - J -. Dunque, conveniente scegliere .F83 - 83 J - e 5F83 - 83 J -[" J -]. Si noti che inoltre risulta E^3 J -83 e Var^3 J -83 [" J -83 ]. Dunque, la condizione i verificata, dal momento che per il Corollario A.3.8 al Teorema Fondamentale di Lindberg del Limite per 3 si ha F83 .F83 -3 F83 83 J -3 F83 83 J -3 . 83 R ! " . 83 J -3 [" J -3 ] J -3 [" J -3 ] 5F83 -3 Anche la condizione ii verificata, in quanto dal Teorema Fondamentale Classico del Limite (Teorema A.3.6) si ha F83 .F83 ! F83 83 # F83 83 "# . 83 R ! " . 83 4 "4 5F83 ! E' banale verificare la condizione iii. La condizione iv verificata, in quanto .wF8 - ` ` .F8 - 8J - 80 - , ``-
una funzione continua in un intorno di ! e .wX8 ! !. E' banale verificare anche la condizione v. Infine, per quanto riguarda la condizione vi, si ha OF 8lim .wF8 ! 80 ! 8lim #0 ! ! . 85F8 ! 8# effF #0 ! . Utilizzando i risultati dell'Esempio 3.2.1, l'efficienza asintotica relativa del test basato sulla statistica F rispetto al test basato sulla statistica X di Student risulta EARFX
# OF %0 !# %5# 0 !# . # "5# OX
Le condizioni del Teorema 3.2.4 sono dunque soddisfatte e quindi si ha
Si noti che se il campione casuale proviene da una R - 5# , dal momento che 0 ! "#15# , allora EARFX #1 !'$''. Tuttavia, se il campione casuale proviene da una I.- $ , dal momento che in questo caso 5# #$ # e 0 ! "#$ allora EARFX #. Quindi, evidente che se cade l'assunzione di normalit si pu avere una notevole perdita di efficienza dei test classici.
32
Esempio 3.2.3. Si consideri i due campioni casuali indipendenti \" \# \8" e ]" ]# ]8# , tali che se 8 8" 8# , allora \" \# \8" ]" ]# ]8# costituisce un campione misto con funzione di ripartizione congiunta J8 YJJ , dove YJJ J8 J8 _JJ Var\ 5# . E' immediato verificare che con questa assunzione risulta anche Var] 5# e inoltre senza perdita di generalit si pu supporre E\ !, da cui segue E] J. Si consideri il sistema di ipotesi L! J ! J Y contro L" J J3 J Y dove J3 una successione di alternative tali che J3 -83 con - costante. In questo caso Y rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua con varianza finita. Siano inoltre 8"3 e 8#3 due successioni tali che lim3 8"3 83 / e lim3 8#3 83 " / ! / ". Si vuole dunque determinare l'efficacia del test basato sulla statistica di Student per due campioni indipendenti, data da ] \ X X8 , W 88" 8# dove \ e ] rappresentano le medie campionarie, mentre
8" " W \3 \# 8 # 3" # 8# 4"
]4 ] #
" # # 8" "WB 8# "WC , 8#
# # dove WB e WC rappresentano le varianze campionarie corrette. Si deve dunque verificare le condizioni del Teorema 3.2.4. Innanzitutto si sceglie .X83 J 8"3 8#3 83 J5 e 5X83 J ". Per quanto riguarda la verifica della condizione i, si noti che
X83 .X83 J3 ] \ J3 5X83 J3 W 83 8" 3 8# 3 5 83 8" 3 8# 3 - 8" 3 8 # 3 5 ] -83 \ 5 " . 5 83 W 583 8" 3 8# 3 W
: . Analogamente all'Esempio 3.2.1 si ha WC 5 e 8# 3 ] -83 5 R ! " per : . 3 . Inoltre, dall'Esempio 2.2.2 si ha WB 5 e 8"3 \5 R ! " per 3 . Di conseguenza, applicando il Teorema di Sverdrup (Teorema A.3.4), per 3 si ha
W#
:
# # 8#3 "WC 8"3 "WB : /5# " / 5# 5# , 83 # 83 #
da cui W 5. Inoltre, applicando il Metodo Delta (Teorema A.3.10) alle variabili casuali indipendenti 8" 3 \5 e 8# 3 ] -83 5 mediante la funzione 1B C C B, per 3 si ottiene ] -83 \ ] -83 \ . R ! " . 5# 8" 3 5# 8# 3 583 8" 3 8# 3 Per il Teorema di Slutski (Teorema A.3.5), combinando i precedenti risultati, per 3 risulta infine
33
X 83 . X 8 3 J 3 . R ! " . 5X83 J3 La condizione ii verificata, in quanto con un procedimento analogo a quello considerato per verificare la condizione i per 3 si ha X83 .X83 ! . R ! " . 5X83 ! E' banale verificare la condizione iii. La condizione iv verificata, dal momento che .wX8 J ` ` J " . X 8 J , `J ` J 588" 8# 588" 8#
una funzione continua in un intorno di ! e .wX8 ! !. E' banale verificare anche la condizione v. Infine, per quanto riguarda la condizione vi, si ha .wX8 ! " 8" 8 # " OX 8lim lim / " / ! . 8 5 5 85X8 ! 8 8 " / " / . 5
Questa quantit sar utilizzata per determinare l'efficienza asintotica relativa di questo test classico rispetto ad alcuni test distribution-free. Esempio 3.2.4. Si consideri i due campioni casuali indipendenti \" \# \8" e ]" ]# ]8# , tali che se 8 8" 8# , allora \" \# \8" ]" ]# ]8# costituisce un campione misto con funzione di ripartizione J8 Y(J , dove Y(J J8 J8 i(J E\ % .% E' immediato verificare che risulta E\ < (< E] < . Di conseguenza se Var\ 5# si ha Var] (# 5# e se # # E\ % Var\# .% 5% si ha E] % Var] # (% # # . Si consideri il sistema di ipotesi L! ( " J Y contro L" ( (3 J Y dove (3 una successione di alternative tali che (3 " -83 con - costante. Inoltre, Y rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua con quarto momento finito. Siano inoltre 8"3 e 8#3 due successioni tali che lim3 8"3 83 / e lim3 8#3 83 " / ! / ". Si vuole determinare l'efficacia del test basato sulla statistica di Snedecor per l'omogeneit delle varianze, data da
# WC X X8 # , WB # # dove WB e WC rappresentano le varianze campionarie corrette. Si deve dunque verificare le condizioni del Teorema 3.2.4. Innanzitutto, si sceglie .X8 ( (# e 5X8 ( 88" 8# (# # 5# . Per quanto riguarda la condizione i, si noti che
34
# # # # # # # # X83 .X83 (3 WC WB (3 WC (3 5 (3 WB 5# 5# . # # # 5 # # # 8 8 8 83 8" 3 8# 3 (3 5X83 (3 WB (3 3 "3 #3
Applicando il Corollario A.3.8 al Teorema Fondamnetale di Lindberg del Limite, si ottiene # # # # . che 8#3 WC (3 5 #(3 R ! " per 3 . Inoltre, dall'Esempio A.3.4 si ha : . # # WB 5# per 3 e dall'Esempio A.3.6 si ha 8"3 WB 5# # R ! " per 3 . Inoltre, applicando il Metodo Delta Teorema A.3.10 alle variabili casuali indipendenti # # # # # 8" 3 WB 5# # e 8# 3 WC (3 5 #(3 mediante la funzione 1B C C B, per 3 si ottiene
# # # # # # # # # # WC (3 5 (3 WB 5# WC (3 5 (3 WB 5# . R ! " . # # # 8 # # 8 # # 8 8 8 (3 (3 "3 #3 3 "3 #3
Per il Teorema di Slutski (Teorema A.3.5), combinando i precedenti risultati, per 3 risulta infine X83 .X83 (3 . R ! " . 5X83 (3 La condizione ii verificata, in quanto con un procedimento analogo a quello considerato per verificare la condizione i per 3 si ha X83 .X83 " . R ! " . 5X83 " La condizione iii verificata in quanto dal momento che
3
lim
# 83 8" 3 8# 3 (3 5X83 (3 # 5 # # lim lim (3 ". # 3 3 83 8" 3 8# 3 # 5 5X83 "
Inoltre, si ha .wX8 ( ` ` # . X8 ( ( #( , `( `(
che una funzione continua in un intorno di " e .wX8 " ! e quindi anche la condizione iv verificata. E' banale verificare anche la condizione v. Infine, per quanto riguarda la condizione vi, si ha .wX8 " #5# 8" 8# #5# OX 8lim lim / " / ! . # 85X8 " 8 # 8 8 #5# / " / . #
Questa quantit sar utilizzata per determinare l'efficienza asintotica relativa di questo test classico rispetto ai test distribution-free.
35
3.3. La significativit osservata. Anche se per sviluppare la teoria necessario fissare il livello di significativit , quando si lavora operativamente non esiste nessuna regola ragionevole per stabilirne la scelta. Questa considerazione porta al concetto di significativit osservata o valore-P. Definizione 3.3.1. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Se la regione critica del test basato su X data da g" > > -, per un determinato valore campionario > si definisce significativit osservata la quantit 9== sup Pr< X > .
< R!
Alternativamente, se la regione critica del test basato su X data da g" > > -, per un determinato valore campionario > si definisce significativit osservata la quantit 9== sup Pr< X > .
< R!
Dalla definizione immediato constatare che la significativit osservata rappresenta la probabilit di ottenere, quando L! vera, un valore campionario > di X estremo (nella appropriata direzione) almeno quanto quello osservato. La significativit osservata fornisce dunque una misura su quanto l'ipotesi di base risulta compatibile con i dati campionari. Una significativit osservata esigua porta dunque a ritenere poco compatibile con i dati campionari l'ipotesi di base, mentre con una significativit osservata elevata vera l'affermazione contraria. Di conseguenza in una verifica di ipotesi si pu semplicemente riportare la significativit osservata, oppure si pu arrivare ad una decisione sull'accettazione di L! fissando un livello di significativit . Se la significativit osservata minore o uguale ad , allora si respinge L! , altrimenti si accetta L! . La significativit osservata diventa in questo caso il pi elevato livello di significativit per cui si accetta L! . Si noti tuttavia che in questo caso la significativit osservata diventa non solo uno strumento per la decisione nella verifica di ipotesi, ma anche misura quantitativa di questa decisione. Infine, la seguente definizione di significativit osservata utile quando la statistica test X simmetrica. Definizione 3.3.2. Sia \" \# \8 un campione con funzione di ripartizione congiunta J8 Y< e si consideri il sistema di ipotesi L! < R! contro L" < R R! . Se X una statistica simmetrica e se la regione critica del test basato su X data da g" > > -" > -# , per un determinato valore campionario > si definisce significativit osservata la quantit 9== # min sup Pr< X > sup Pr< X > .
< R! < R!
Capitolo 4 Gli intervalli di confidenza distribution-free

4.1. Gli intervalli di confidenza distribution-free. La seguente la definizione formale di intervallo di confidenza distribution-free. Definizione 4.1.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , dove ) un parametro reale e J rappresenta la funzione di ripartizione della variabile casuale da cui proviene il campione. Supponiamo inoltre che ) K e J Y , dove K uno spazio relativo a ) mentre Y una classe di funzioni di ripartizione. Sia inoltre T T \" \# \8 ) una quantit pivot distribution-free su Y)J , ovvero una trasformata la cui funzione di ripartizione rimane invariata per ogni J8 Y)J . Se -" e -# sono due valori tali che Pr)J -" T \" \# \8 ) -# 1 , ! " , ) K , J Y , e se P P\" \# \8 e Y Y \" \# \8 sono statistiche tali che per ogni ) B" B# B8 -" T B" B# B8 ) -# B" B# B8 PB" B# B8 ) Y B" B# B8 , allora l'intervallo casuale P Y detto intervallo di confidenza di ) distribution-free su Y)J al livello di confidenza " . Si noti che quando la quantit pivot una variabile casuale discreta, allora esiste un numero finito o contabile di livelli di confidenza ottenibili, che vengono detti livelli di confidenza naturali. Nel seguito saranno considerati solo livelli di confidenza naturali. Sia ora \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J e si consideri il sistema di ipotesi L! ) )! J Y contro L" ) )! J Y , dove ) un parametro reale e J rappresenta la funzione di ripartizione della variabile casuale da cui proviene il campione. Si abbia inoltre un test basato sulla statistica X X \" \# \8 distribution-free su Y)J al livello di significativit e sia k! B" B# B8 -" X B" B# B8 -# la relativa regione di accettazione. Ovviamente, si ha Pr)! J -" X -# " , che evidenzia come la regione di accettazione k! dipenda dal valore prefissato )! di ) . Dunque, esiste una quantit pivot T T \" \# \8 ) per cui si ha Pr)J -" T \" \# \8 ) -# Pr)! J -" X -# 1 .
Gli intervalli di confidenza distribution-free
37
Di conseguenza, se possibile costruire l'intervallo di confidenza P Y a partire dalla quantit pivot T , allora si deve concludere che esiste una equivalenza tra la regione critica del test nel sistema di ipotesi considerato e l'intervallo di confidenza di ). Questa considerazione consente di costruire un intervallo di confidenza per un dato parametro partendo da un opportuno sistema di ipotesi. Esempio 4.1.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `-J e si consideri il sistema di ipotesi L! - ! J ` contro L" - ! J `. Dal momento che - rappresenta la mediana della variabile casuale da cui proviene il campione a partire da questo sistema di ipotesi si pu dunque costruire un intervallo di confidenza per la mediana. In questo caso, un test opportuno basato sulla statistica F F\" \# \8 dell'Esempio 2.3.1. La statistica test F distributionfree su `!J e se vera l'ipotesi di base si distribuisce come una F38 "#. Dunque, scelto un livello di significativit , si ha Pr!J ,8# F\" \# \8 8 ,8# " . Si noti che in questo caso la quantit pivot associata a F data da T F\" - \# - \8 -, per cui tenendo presente l'Esempio 1.1.1 e la definizione della classe `-J , si ha Pr-J ,8# F\" - \# - \8 - 8 ,8# " . Ovviamente, la quantit pivot F\" - \# - \8 - rappresenta il numero di \3 maggiori di - (3 " # 8). Se dunque \" \# \8 la statistica ordinata, si ottiene che B" B# B8 FB" - B# - B8 - 8 ,8# equivalente a B" B# B8 B,8# " - . Analogamente B" B# B8 ,8# FB" - B# - B8 - equivalente a B" B# B8 - B8,8# . Dunque P \,8# " e Y \8,8# , ovvero \,8# " \8,8# un intervallo di confidenza della mediana - distribution-free su `-J al livello di confidenza " . Il seguente teorema permette di costruire intervalli di confidenza di un parametro ) distribution-free su una classe Y)J se la statistica test su cui si basa il sistema di ipotesi associato ha una particolare struttura. Teorema 4.1.2. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , dove ) un parametro reale e J rappresenta la funzione di ripartizione della variabile casuale da cui proviene il campione () K , J Y ). Si consideri inoltre l'insieme di statistiche Z3 Z3 \" \# \8 (3 " # 5 ), tali che
38
X X Z" Z# Z5
3"
I! Z3
una statistica distribution-free su Y!J . Sia inoltre Pr!J -" X Z" Z# Z5 -# Pr)J -" X Z" ) Z# ) Z5 ) -# " . Se Z" Z# Z5 la statistica ordinata relativa al vettore di statistiche Z" Z# Z5 , allora Z5"-# Z5-" un intervallo di confidenza di ) distribution-free su Y)J al livello di confidenza " . Dimostrazione. Si noti innanzitutto che X Z" ) Z# ) Z5 ) una quantit pivot. Inoltre, dal momento che X Z" ) Z# ) Z5 ) rappresenta il numero di Z3 maggiori di ) (3 " # 5 ), si ottiene che @" @# @5 X @" ) @# ) @5 ) -# equivalente a @" @# @5 @5"-# ) . Analogamente @" @# @5 -" X @" ) @# ) @5 ) equivalente a @" @# @5 ) @5-" . Di conseguenza, in base alla Definizione 4.1.1, si ha che Z5"-# Z5-" un intervallo di confidenza di ) distribution-free su Y)J al livello di confidenza " . Esempio 4.1.2. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J . In questo caso - rappresenta la mediana della variabile casuale da cui proviene il campione. Si consideri inoltre la statistica [ distribution-free su f!J dell'Esempio 2.5.1. Se \" \# \8 la statistica ordinata, allora si noti che si ha I! \3 \4 # " se e solo se \3 ! e \3 \4 (4 3), mentre si ha I! \3 \3 # " se e solo se \3 !. Di conseguenza, le variabili casuali ^3 V3 possono essere espresse come
3 ^3 V3
4"
I! \3 \4 # , 3 " # 8 ,
per cui una rappresentazione alternativa di [ data da

8 3 8 3
[
3" 4"
I! \3 \4 #
3" 4"
I! \3 \4 # .
39
Dunque la statistica [ basata sulle 5 88 1# statistiche Z34 \3 \4 # (3 4 " # 8) dette anche medie di Walsh. Se si indicizzano di nuovo le statistiche Z34 denotandole con [3 (3 " # 5 ), si ottiene
5
[ [" [# [5
3"
I! [3 ,
ovvero la statistica [ pu essere espressa nella forma richiesta dal Teorema 4.1.2. Inoltre, dal momento che Z34 - " " \3 \4 - \3 - \4 - , 3 4 " # 8 , # # Pr!J A# [ [" [# [5 5 A# Pr-J A# X [" - [# - [5 - 5 A# " , dove A rappresenta il quantile di ordine della distribuzione di [ e dove si tenuto presente che [ simmetrica rispetto a 5# (vedi Esempio 2.5.1). Dunque se [" [# [5 rappresenta la statistica ordinata relativo al vettore di statistiche [" [# [5 , allora risulta che [A# " [5A# un intervallo di confidenza della mediana - distribution-free su f-J al livello di confidenza " . Si noti che questo intervallo di confidenza distribution-free su una classe pi ristretta di quello ottenuto nell'Esempio 4.1.1, dal momento che f-J `-J . Esempio 4.1.3. Si consideri i due campioni casuali indipendenti \" \# \8" e ]" ]# ]8# , tali che se 8 8" 8# , allora \" \# \8" ]" ]# ]8# costituisce un campione misto con funzione di ripartizione congiunta J8 _JJ . Si consideri inoltre la statistica [ distribution-free su _!J dell'Esempio 2.4.1. Si noti che ovviamente le classi _!J e VJ coincidono. Se \" \# \8" e ]" ]# ]8# sono le statistiche ordinate relative ai due campioni, allora (vedi Esempio 2.4.1)
8#
allora, tenendo presente l'Esempio 1.1.1 e la definizione della classe f-J , si ha
V3
4"
I! \3 ]4 3 , 3 " # 8" ,
per cui una rappresentazione alternativa di [ risulta

8" 8#
[
3" 4"
I! \3 ]4
" 8" 8" " . #
Dalla precedente espressione immediato ricavare che la statistica [ equivalente alla statistica Y data da
8" 8# 8" 8#
Y
3" 4"
I! \3 ]4
3" 4"
I! \3 ]4 .
E' facile dimostrare che la statistica Y ha supporto ! " 8" 8# ed simmetrica rispetto a 8" 8# #. Inoltre si noti che Y basata sulle 5 8" 8# statistiche Z34 \3 ]4
40
(3 " # 8" 4 " # 8# ). Se si indicizzano di nuovo le statistiche Z34 denotandole con H3 (3 " # 5 ), si ha
5
Y H" H# H5
3"
I! H3 ,
ovvero la statistica Y pu essere espressa nella forma richiesta dal Teorema 4.1.2. Inoltre, dal momento che Z34 J \3 ]4 J , 3 " # 8" , 4 " # 8# , allora, tenendo presente l'Esempio 1.1.1 e la definizione della classe _JJ , si ha Pr!J ?# Y H" H# H5 5 ?# PrJJ ?# Y H" J H# J H5 J 5 ?# " , dove ? rappresenta il quantile di ordine della distribuzione di Y e dove si tenuto presente che Y simmetrica rispetto a 5#. Dunque, se H" H# H5 rappresenta la statistica ordinata relativa al vettore di statistiche H" H# H5 , allora risulta che H?# " H5?# un intervallo di confidenza di J distribution-free su _JJ al livello di confidenza " . 4.2. Gli intervalli di confidenza distribution-free per grandi campioni. Di seguito viene definito il concetto di intervallo di confidenza distribution-free per grandi campioni. Definizione 4.2.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 Y)J , dove ) un parametro reale e J rappresenta la funzione di ripartizione della variabile casuale da cui proviene il campione. Supponiamo inoltre che ) K e J Y , dove K lo spazio relativo a ) mentre Y una classe di funzioni di ripartizione. Sia inoltre T8 T8 \" \# \8 ) una quantit pivot distribution-free per grandi campioni su . Y)J , ovvero una trasformata tale che T8 Z (8 ) per ogni J8 Y)J . Se -" e -# sono due valori tali che
8
lim Pr)J -" T8 \" \# \8 ) -# " , ! " , ) K , J Y ,
e se P8 P8 \" \# \8 e Y8 Y8 \" \# \8 sono statistiche tali che per ogni ) B" B# B8 -" T8 B" B# B8 ) -# B" B# B8 P8 B" B# B8 ) Y8 B" B# B8 , allora l'intervallo casuale P8 Y8 detto intervallo di confidenza di ) distribution-free per grandi campioni su Y)J al livello di confidenza 1 . Esempio 4.2.1. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 Y-J , dove la classe Y-J definita nell'Esempio 3.2.1. Sia inoltre T8 8\ -W una quantit pivot. Dal momento che per ogni J8 Y-J risulta . che T8 R ! ", allora T8 una quantit pivot distribution-free per grandi campioni su Y-J . Scelto dunque un livello di confidenza pari a " , si ha
Gli intervalli di confidenza distribution-free lim Pr-J D"# 8\ -W D"# " .
41
Dal momento che
allora P8 \ D"# W8 e Y8 \ D"# W8, per cui \ D"# W8 \ D"# W8 un intervallo di confidenza di - distribution-free per grandi campioni su Y-J al livello di confidenza " . Esempio 4.2.2. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 Y5J , dove
. Si noti innanzitutto che dall'Esempio A.3.6 si ha 8W # 5# # R 0 1, dove # # .% 5% . Inoltre, se Q% rappresenta il quarto momento centrale campionario, allora applicando la Legge Debole dei Grandi Numeri di Khintchine (Teorema A.3.1) e il Teorema : di Sverdrup Teorema A.3.4, si pu facilmente dimostrare che K# Q% W % # # . Di . conseguenza, applicando il Teorema di Slutsky risulta T8 8W # 5# K R ! " per ogni J8 Y5J , ovvero la quantit pivot T8 distribution-free per grandi campioni su Y5J . Scelto dunque un livello di confidenza pari a " , si ha 8
D"# =8 - B D"# =8 , B" B# B8 B
-= D"# B" B# B8 D"# 8B
Y5J J8 J8 VJ Var\ 5# E\ % .% .
lim Pr5J D"# 8W # 5# K D"# " .
Dal momento che
allora P8 W # D"# K8 e Y8 W # D"# K8, per cui W # D"# K8 W # D"# K8 un intervallo di confidenza di 5# distribution-free per grandi campioni su Y5J al livello di confidenza " . Esempio 4.2.3. Si consideri un campione casuale \" \# \8 con funzione di ripartizione congiunta J8 `-J . Sia inoltre
8
B" B# B8 =# D"# 18 5# =# D"# 18 ,
B" B# B8 D"# 8=# 5# 1 D"#
T8 F8 \" - \# - \8 -
3"
I! \3 -
la quantit pivot dell'Esempio 4.1.1. Dal Teorema Fondamentale Classico del Limite (Teorema A.3.6) si ha T8 8# . R ! " 8%
42
per ogni J8 `-J , ovvero la quantit pivot T8 distribution-free per grandi campioni su `-J . Scelto dunque un livello di confidenza pari a " , si ha
8
lim Pr-J D"# T8 8#8% D"# " .
Tenendo presente che F8 \" - \# - \8 - pu assumere solo valori interi, posto 6 8# D"# 8%, dove rappresenta la funzione troncamento, analogamente all'Esempio 4.1.1 si ha B" B# B8 D"# F8 B" - B# - B8 - 8# D"# 8%
B" B8 8# D"# 8% F8 B" - B8 - 8# D"# 8% B" B# B8 6 F8 B" - B# - B8 - 8 6 B6" - B86 . Di conseguenza \6" \86 un intervallo di confidenza di - distribution-free per grandi campioni su `-J al livello di confidenza " .
Capitolo 5 I test basati su statistiche lineari dei ranghi con segno

5.1. I test basati su statistiche lineari dei ranghi con segno. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J e si consideri il sistema di ipotesi L! - ! J f contro una alternativa bilaterale L" - ! J f o direzionale L" - ! (- !) J f . Questo sistema di ipotesi del tutto generale. Infatti, se l'ipotesi di base data da L! - -! J f , allora si ritorna al sistema di ipotesi precedente semplicemente considerando il campione trasformato \" -! \# -! \8 -! . Una classe di statistiche test distribution-free opportuna in questo sistema di ipotesi quella delle statistiche lineari dei ranghi con segno. Definizione 5.1.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J e siano ^" ^# ^8 e V" V# V8 i relativi vettori dei segni e dei ranghi dei valori assoluti. Siano inoltre i punteggi un insieme di valori +3 (3 " # 8) tali che ! +" +# +8 , +8 ! . Allora una statistica del tipo
8
X
3"
^3 +V3 ,
detta statistica lineare dei ranghi con segno.
Si noti che in base al Corollario 2.5.5 la statistica X distribution-free sulla classe f!J , ovvero fornisce un test distribution-free per il sistema di ipotesi considerato. Inoltre, evidente che la statistica test X sensibile a variazioni nel parametro di posizione, in quanto se non vera l'ipotesi di base X tende ad assumere o valori piccoli o valori elevati. Ovviamente, la scelta dei punteggi influisce sul peso che si vuole assegnare ad ogni singolo rango dei valori assoluti. Esempio 5.1.1. Se i punteggi sono scelti come +3 3 (3 " # 8), allora si ottiene la cosiddetta statistica di Wilcoxon (introdotta nell'Esempio 2.5.1), ovvero
8
[
3"
^3 V3 .
44
I test basati su statistiche lineari dei ranghi con segno
Se i punteggi sono scelti come +3 " (3 " # 8), allora si ottiene la cosiddetta statistica dei segni (introdotta nell'Esempio 2.3.1), ovvero
8
F
3"
^3 .
Si noti che per la statistica [ i punteggi vengono scelti come funzione lineare crescente dei ranghi dei valori assoluti, ovvero in modo da assegnare un peso maggiore ai ranghi assoluti pi elevati. Al contrario per la statistica F i punteggi sono costanti per tutti i ranghi dei valori assoluti. Il seguente teorema permette di ottenere una importante equivalenza in distribuzione per le statistiche lineari dei ranghi con segno quando vera l'ipotesi di base. Teorema 5.1.2. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J , per una statistica lineare dei ranghi con segno X si ha
8 8 . ^3 +V3 3" 3"
^3 +3 .
Dimostrazione. Dal momento che per il Teorema 2.5.4 i vettori di statistiche ^" ^# ^8 e V" V# V8 sono indipendenti, allora per ogni <" <# <8 e8 si ha
X V" <" V # <# V 8 <8 8 8 ^3 +V3 3"
V"
<" V #
<# V 8
<8
3"
^3 +<3 .
Se .3 la posizione del numero 3 (3 " # 8) nel vettore <" <# <8 , allora ovviamente si ha
8 8
^3 +<3
3" 4"
^.4 +4 .
Tuttavia, dal momento che il vettore dei segni ^" ^# ^8 ha componenti indipendenti . per il Teorema 2.3.2, allora dal Teorema 1.1.3 si ha ^" ^# ^8 ^." ^.# ^.8 essendo ." .# .8 una permutazione di " # 8. Dunque, risulta
8 X V" <" V # <# V 8 <8 4"
. ^.4 +4
^3 +3 .
3"
Dal momento che questa equivalenza in distribuzione vale per ogni <" <# <8 e8 , allora il teorema dimostrato. Esempio 5.1.2. Si consideri la statistica [ dell'Esempio 5.1.1. Dal Teorema 5.1.2 immediato verificare che
45
8 . ^3 V3
3"
3^3 ,
3"
ovvero, tenendo presente il Teorema 2.3.2, la statistica [ distribuita come una combinazione lineare di F3" "# in cui i pesi sono dati da " # 8. Il seguente teorema fornisce la media e la varianza di una statistica lineare dei ranghi con segno quando vera l'ipotesi di base. Teorema 5.1.3. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J , allora per una statistica lineare dei ranghi con segno X si ha EX e " VarX %
8
" #
+3
3"
+3# .
3"
Dimostrazione. Dal momento che il Teorema 2.3.2 implica che E^3 "#, allora dal Teorema 5.1.2 si ha
8 8 ^3 +V3 3" 8
EX E
E
3"
^3 +3
3"
" E^3 +3 #
+3 ,
3"
Inoltre, il Teorema 2.3.2 implica anche che Var^3 "% (3 " # 8) e tenendo presente che ^" ^# ^8 ha componenti indipendenti, dal Teorema 5.1.2 si ha
8 8 ^3 +V3 3" 8
VarX Var
Var
3"
^3 +3
3"
" Var^3 +3 %
#
+3# .
3"
Esempio 5.1.3. Si consideri la statistica [ dell'Esempio 5.1.1. Tenendo presente il Teorema A.2.1, dal Teorema 5.1.3 immediato verificare che " E[ #
8
3
3"
" 88 " %
e " Var[ %
8
3#
3"
" 88 "#8 " . #%
Nel seguente teorema si dimostra la simmetria rispetto alla media di ogni statistica lineare dei ranghi con segno quando vera l'ipotesi di base. Teorema 5.1.4. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J , allora una statistica lineare dei ranghi con segno X simmetrica rispetto a EX .
46
Dimostrazione. Si noti che il Teorema 2.3.2 implica la simmetria di ogni statistica segno ^3 (3 " # 8) rispetto alla media, ovvero tenendo presente il Teorema 1.2.2 risulta
. ^" "# ^# "# ^8 "# "# ^" "# ^# "# ^8 .
Tenendo presente l'Esempio 1.1.6, dalla precedente relazione si ha

. ^" ^# ^8 " ^" " ^# " ^8 .
Di conseguenza, dal Teorema 5.1.2 segue che

8
. X EX . ^3 +3 EX
" ^3 +3 EX
3"
3" 8 8
3"
+3
3"
. ^3 +3 EX #EX X EX EX X .
Il Teorema 1.2.2 permette infine di concludere che X simmetrica rispetto a EX .
Il seguente teorema fornisce la funzione generatrice di probabilit di una statistica lineare dei ranghi con segno nel caso che i punteggi siano valori interi. Teorema 5.1.5. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J , allora la funzione generatrice di probabilit di una statistica lineare dei ranghi con segno X risulta PX > #
8
$ " >+3 , > " .

8 3"
Dimostrazione. Tenendo presente il Teorema 5.1.2 e il Teorema 2.3.2, dalla definizione di funzione generatrice di probabilit si ha PX > E> E$ >
X 8 3" +3^3
$ E>+3^3
8 3"
$ # " >
8 " 3"
+3
$ " >+3 , > " .

8 3"
Si noti che quando i punteggi non sono interi allora per impiegare il precedente teorema sufficiente determinare una trasformata biunivoca che discretizza i punteggi originali. Dal momento che la distribuzione di una statistica lineare dei ranghi con segno sotto l'ipotesi di base L! - ! J f si pu ottenere mediante il Teorema 5.1.5, allora si pu determinare le appropriate regioni critiche del test. Se l'alternativa bilaterale, ovvero L" - ! J f , allora si ha Pr^3 " "# e quindi si respingere l'ipotesi di base per determinazioni sia troppo elevate che troppo piccole di X . Fissato quindi un livello di significativit , poich la distribuzione della statistica X simmetrica se vera l'ipotesi di base, allora la regione critica data dall'insieme
g" > > > 8# > >8"# ,
47
dove > per una numerosit 8 rappresenta il quantile di ordine della distribuzione di X campionaria pari a 8. Ovviamente, data la simmetria di X , si noti che > 8"# " 8 3" +3 >8# . Se l'alternativa direzionale del tipo L" - ! J f , allora si ha Pr^3 " "# e quindi si respinge l'ipotesi di base per determinazioni troppo elevate di X . Fissato quindi un livello di significativit , si ha la seguente regione critica
g" > > > 8" . Al contrario, se l'alternativa direzionale del tipo L" - ! J f , allora si ha Pr^3 " "# e quindi si respinge l'ipotesi di base per determinazioni troppo piccole di X . Fissato quindi un livello di significativit , si ha la seguente regione critica g" > > > 8 . Si noti infine che il test basato sulla X per i precedenti sistemi di ipotesi corretto al livello di significativit . Infatti, dal momento che si pu facilmente dimostrare che TX - J Pr-J X g" una funzione monotona crescente per - ! e monotona decrescente per - ! per ogni J f , allora risulta TX - J , ovvero il test corretto. 5.2. I test basati su statistiche lineari dei ranghi con segno localmente pi potenti. Risulta ora interessante se possibile determinare una scelta ottima dei punteggi della statistica test per verificare un ipotesi del tipo L! - ! J J! contro un'alternativa direzionale L" - ! (- !) J J! , ovvero quando si verifica ipotesi sul parametro di posizione fissando la struttura della funzione di ripartizione J . Dal momento che non possibile determinare una scelta ottima dei punteggi per ottenere un test uniformemente pi potente, allora utile introdurre un concetto di test localmente pi potente. Definizione 5.2.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J e si consideri il sistema di ipotesi L! - ! J J! contro L" - ! (- !) J J! , dove J! f . Il test basato sulla statistica lineare dei ranghi con segno X detto localmente pi potente se esiste un % ! tale che per ogni livello di significativit naturale si ha TX - TX - , ! - % , per ogni statistica lineare dei ranghi con segno X .
Il prossimo teorema fornisce la scelta ottima dei punteggi per la costruzione del test localmente pi potente per verificare ipotesi sul parametro di posizione. Ovviamente, l'utilit di questo teorema consiste solamente nell'evidenziare la struttura ottima dei punteggi al variare della funzione di ripartizione, dal momento che questa non mai nota in pratica. Teorema 5.2.2. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J e sia 0 la funzione di densit relativa a J . Si assuma inoltre che 0 w esista, sia assolutamente continua e che
w ( 0 B .B .
Il test localmente pi potente per verificare il sistema di ipotesi L! - ! J J! contro L" - ! (- !) J J! basato sulla statistica lineare dei ranghi con segno
48
8 X
3"
^3 + V3 ,
dove + 3 E 0 w ]3 , 3 " # 8 , 0 ]3 al campione casuale
e ]" ]# ]8 la statistica ordinata relativa \" \ # \ 8 . Dimostrazione. Si veda Hettmansperger e McKean (1998).
Supponiamo ora che J B KB$ , ovvero che 0 B "$ 1B$ , dove K e 1 sono rispettivamente la funzione di ripartizione e la funzione di densit di una variabile casuale standard. Si noti che se 03 rappresenta la funzione di densit di ]3 allora risulta 03 B "$ 13 B$ , dove 13 la funzione di densit della variabile casuale standard ordinata Z3 ]3 $ (3 " # 8). Dunque, si ha 0 w ]3 0 w B + 3 E ( 03 B .B 0 ]3 0 B 1w Z3 " 1w B " 13 B .B E . ( $ 1B $ 1Z3
Di conseguenza, se i punteggi ottimi sono ottenuti sulla base della distribuzione standardizzata, allora immediato verificare che la relativa statistica test ottima data da $ X , che ovviamente una statistica test equivalente a X . Dal momento che la statistica test ottima non dipende dal parametro di scala della distribuzione, allora i punteggi ottimi possono essere calcolati semplicemente a partire dalla distribuzione standard. Esempio 5.2.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J , dove J la funzione di ripartizione di una R ! ". E' facile dimostrare che le condizioni del Teorema 5.2.2 sono soddisfatte. Inoltre, dal momento che in questo caso 0 w B B0 B, allora si ha 0 w B B. 0 B Di conseguenza, la scelta ottimale dei punteggi data da + 3 E]3 , 3 " # 8 , dove ]" ]# ]8 la statistica ordinata relativa ai valori assoluti di un campione casuale da una R ! ". Esempio 5.2.2. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J , dove J la funzione di ripartizione di una P9! ". E' facile dimostrare che tutte le condizioni del Teorema 5.2.2 sono soddisfatte. Inoltre, immediato
49
verificare che in questo caso 0 B J B J B# , ovvero 0 w B 0 B#J B ", da cui 0 w B #J B " . 0 B
Di conseguenza, la scelta ottimale dei punteggi data da + 3 E#J ]3 " , 3 " # 8 , dove ]" ]# ]8 la statistica ordinata relativa ai valori assoluti di un campione casuale da una P9! ". Tuttavia dal momento che dal Teorema dell'Integrale di Probabilit . (vedi Feller, 1971) si ha #J ]3 " Y3 (3 " # 8), dove Y" Y# Y8 rappresenta la statistica ordinata relativa ad un campione casuale da una Y ! ", allora risulta + 3 EY3 3 , 3 " # 8 . 8"
8 ^3 V3 3"
Si noti che la statistica lineare dei ranghi con segno costruita su questi punteggi data da
X
" 8"
[ , 8"
dove [ la statistica di Wilcoxon. Quindi X e [ forniscono test equivalenti, ovvero la scelta dei punteggi fatta per la statistica di Wilcoxon risulta ottima per una variabile casuale logistica.
Esempio 5.2.3. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J , dove J la funzione di ripartizione di una I.! ". E' facile dimostrare che tutte le condizioni del Teorema 5.2.2 sono soddisfatte. Inoltre, dal momento che in questo caso risulta 0 w B segnB0 B, dove segnB #I! B ", allora 0 w B segnB . 0 B
Dunque, la scelta ottimale dei punteggi data da + 3 Esegn]3 , 3 " # 8 , dove ]" ]# ]8 la statistica ordinata relativa ai valori assoluti di un campione casuale da una I.! ". Dal momento che Esegn]3 ", allora risulta + 3 " (3 " # 8). Si noti che questa scelta dei punteggi fornisce la statistica dei segni F . 5.3. La distribuzione per grandi campioni delle statistiche lineari dei ranghi con segno. In questa sezione vengono considerate le propriet per grandi campioni delle statistiche lineari dei ranghi con segno. Di seguito vengono considerati due risultati preliminari. Lemma 5.3.1. Se i punteggi sono tali che +8 3 938 " , 3 " # 8 ,
50
dove 9 una funzione punteggio non negativa e non decrescente che non dipende da 8 per cui ! ( 9?# .? ,
" !
allora lim 8 Dimostrazione. Innanzitutto sia

8
" 8
8 3"
+8 3# ( 9?# .? .
" !
;8 ?
3"
938 " I3"838 ?
una discretizzazione della funzione 9. Dal momento che I3"838 ?# I3"838 ? (3 " # 8) e che I3"838 ?I4"848 ? ! (3 4 " # 8), allora si ha ( ;8 ? .? (
" # " ! ! 8
938 " I3"838 ?# .?

3" 8
" 8 ! 3"
938 " I3"838 ?.?

3" 8 3"
938 " ( I3"838 ?.?

# " ! 8
" 8
" 938 " 8

#
+8 3# .
3"
Inoltre, poich 9 una funzione non negativa e non decrescente, si ha

3"8 " " 938 "# 938# ( 9?# .? , " 3 8 " , 8 8 38
e " " 8" " # # 988 " 988 " 9?# .? . ( 8" 8 8 88" Di conseguenza si ha " ( ;8 ? .? 8 !
" # 8" 8
938 "#
3"
3"
3"8 38
9?# .?
8" " 9?# .? ( 8 88"
I test basati su statistiche lineari dei ranghi con segno 8" " ( 9? .? 9?# .? , ( 8 "8 88"
" #
51
da cui lim sup( ;8 ? .? ( 9?# .? .

" # "
8
Inoltre, per il Lemma di Fatou si ha

# inf ;8 ?# .? . ( 9? .? lim 8 ( " " ! !
Si deve concludere dunque che lim ;8 ?# .? ( 9?# .? , 8 (

" " ! !
ovvero " lim 8 8

8 3"
+8 3# ( 9?# .? .
" !
Lemma 5.3.2. Se sono valide le condizioni del Lemma 5.3.1 si ha lim 8 Dimostrazione. Si noti che
8 # 3" +8 3 lim 8 max + 3# 8 "38 # # lim "8 8 "8 8 3" +8 3 3" +8 3 8 8lim . "8 max + 3# lim "8 max +8 3# 8 8
"38 "38
"38
+8 3# . max +8 3#
8 3"
Dal Lemma 5.3.1 si ha che il numeratore della precedente espressione finito e positivo. Inoltre, poich 9 non decrescente, allora " " 8" " 9?# .? , max +8 3# 988 "# ( 8 "38 8 8 88" per cui
8
lim
" max +8 3# ! , 8 "38
da cui segue immediatamente la tesi.
Nel prossimo teorema si ottiene la distribuzione per grandi campioni delle statistiche lineari dei ranghi con segno sotto ipotesi di base. Teorema 5.3.3. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f!J , allora per una statistica lineare dei ranghi con segno
52
X8
3"
^3 +8 V3 ,
i cui punteggi +8 3 (3 " # 8) soddisfano le condizioni del Lemma 5.3.1, risulta

X8 EX8 . R ! " , VarX8 dove EX8 e VarX8 sono definite nel Teorema 5.1.3. Dimostrazione. Dal Teorema 5.1.2 si ottiene che 8 X8 8 . ^3 +8 V3 3" 3"
^3 +8 3 .
Tenendo presente il Teorema 2.3.2 si ha E ^3 "# $ ") e Var^3 "%, da cui

8 3"
E ^3 +8 3 +8 3# $ $# 8 3" Var^3 +8 3
8 3"
8 $ $ 3" +8 3 E ^3 "# 8 3" +8 3# Var^3 $#
8 $ 3" +8 3 8 # $# 3" +8 3
+8 3# max +8 4
"48
8 3"
+8 3# $#
"38
max +8 3
8 3"
8 3"
+8 3#
+8 3# $#
"38
max +8 3#
8 3"
+8 3#
Di conseguenza dal Lemma 5.3.2 si ha lim

8 3"
max +8 3# E ^3 +8 3 +8 3# $ "38 8lim !. 8 # $# 8 3" +8 3 3" Var^3 +8 3
Applicando il Teorema Fondamentale di Lyapunov del Limite (Teorema A.3.9) con $ ", si ottiene quindi
8 3" ^3 +8 3 EX8 . R ! " , VarX8
ovvero, dato che

X8 EX8 . VarX8 8 3" ^3 +8 3 EX8 , VarX8
si ha la tesi.
w Si noti che se si considera la statistica X8 i cui punteggi sono dati da w +8 3 ,8 938 " ,8 +8 3 , 3 " # 8 , w allora risulta X8 ,8 X 8 con w EX8 ,8 EX8
e
w # VarX8 ,8 VarX8 .
I test basati su statistiche lineari dei ranghi con segno Di conseguenza, si ha

w w X8 EX8 ,8 X 8 ,8 EX8 X8 EX8 , w # VarX8 ,8 VarX8 VarX8
53
w da cui segue evidentemente che X8 e X8 hanno le medesime propriet per grandi campioni. Dunque, la costante ,8 non influenza il comportamento per grandi campioni della statistica dei ranghi con segno, mentre la scelta della funzione punteggio 9 determinante sotto questo punto di vista. Esempio 5.3.1. Si consideri la statistica [ [8 di Wilcoxon. Al fine di determinare la distribuzione per grandi campioni di [8 conveniente considerare la statistica X8 ,8 [ 8 con ,8 "8 " che ovviamente ha le medesime propriet per grandi campioni della statistica [8 . La funzione punteggio relativa alla statistica X8 , data da 9? ?I!" ?, una funzione positiva e crescente. Inoltre si ha # # ( 9? .? ( ? .? " " ! !
" . $
Le condizioni del Teorema 5.3.3 sono dunque soddisfatte. Tenendo presente l'Esempio 5.1.3 si deve concludere che
[8 E[8 [8 88 "% . R ! " . Var[8 88 "#8 "#%
Tenendo presente i precedenti risultati, fissato un livello di significativit , la regione critica per verificare L! - ! J f contro l'alternativa L" - ! J f , pu essere dunque approssimata dall'insieme
> EX D . VarX8 > > EX8 D# VarX8 "# 8
Analogamente, la regione critica per verificare l'alternativa L" - ! J f , pu essere approssimata dall'insieme
, > > EX8 D" VarX8
mentre la regione critica per verificare l'alternativa L" - ! J f , pu essere approssimata dall'insieme
. > > EX8 D VarX8
Inoltre, mediante il Teorema 3.1.8 si pu dimostrare che la successione di test basata su X8 coerente. Il seguente teorema permette di ottenere l'efficacia di una statistica lineare dei ranghi con segno. Teorema 5.3.4. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J e si consideri il sistema di ipotesi L! - ! J f contro L" - -3 J f , dove -3 una successione di alternative tali che -3 -83 con costante. Data una statistica lineare dei ranghi con segno
54
X8
3"
^3 +8 V3 ,
i cui punteggi +8 3 (3 " # 8) soddisfano le condizioni del Lemma 5.3.1, allora l'efficacia del test basato su X8 risulta effX ( 9?90 ? .?( 9?# .? ,
" " ! !
dove 90 ? 0 w J " "# ?# . 0 J " "# ?#
(1967). Dimostrazione. Si veda Hayek e idak
Esempio 5.3.2. Si consideri la statistica dei segni F F8 . La relativa funzione punteggio 9? I!" ?, una funzione positiva e non decrescente, per cui si ha ( 9? .? ( .? " .
" # " ! !
Le condizioni del Teorema 5.3.4 sono dunque soddisfatte. Inoltre, risulta ( 9?90 ? .? (
" ! "
0 w J " "# ?# .? , 0 J " "# ?#
da cui, mediante la trasformazione di variabile B J " "# ?# con ? #J B " e .? #0 B.B, tenendo presente la simmetria di 0 , si ha ( 9?90 ? .? # (
" ! !
0 w B 0 B .B #0 B ! #0 ! . 0 B
Quindi, l'efficacia del test basato sulla statistica dei segni risulta effF ( 9?90 ? .?( 9?# .? #0 ! ,
" " ! !
come era gi noto dall'Esempio 3.2.2.
Esempio 5.3.3. Si consideri la statistica [ [8 del test dei ranghi con segno di Wilcoxon. Dall'Esempio 5.3.1 noto che le condizioni del Lemma 5.3.1 sono soddisfatte. Inoltre, risulta
( 9?90 ? .? (
" !
"
0 w J " "# ?# ? .? , 0 J " "# ?#
da cui, mediante la trasformazione di variabile B J " "# ?# con ? #J B " e .? #0 B.B, tenendo presente la simmetria di 0 , si ha
I test basati su statistiche lineari dei ranghi con segno ( 9?90 ? .? # (

" !
55
0 w B#J B " .B 0 B# .B # (

#0 B#J B " ! %(
0 B# .B .
Quindi, l'efficacia del test basato sulla statistica di Wilcoxon risulta eff[ ( 9?90 ? .?( 9?# .? #$ (
" " ! !
0 B# .B .
Utilizzando i risultati dell'Esempio 3.2.1, l'efficienza asintotica relativa del test basato sulla statistica [ rispetto al test basato sulla statistica X risulta dunque EAR[ X
# O[ # "# 5 ( 0 B# .B# . # OX
Si noti che se \ distribuito come una R - 5# , allora dal momento che (

0 B# .B "#15 ,
si ha che EAR[ X $1 !*&%*. Dunque il test basato su [ quasi equivalente al test basato su X dal punto di vista dell'efficienza asintotica relativa anche sotto assunzione di normalit.
Capitolo 6 I test per un parametro di posizione: un campione e due campioni appaiati

6.1. Il test dei segni. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `-J . Il test dei segni basato sulla statistica dei segni
8
F
3"
^3 ,
descritta nell'Esempio 2.3.1. Mediante il test dei segni si pu dunque verificare una ipotesi di base del tipo L! - ! J `. Si noti che F pu essere considerata una statistica lineare dei ranghi con segno con la scelta dei punteggi +3 " (3 " # 8), come gi evidenziato nell'Esempio 5.1.1. Tuttavia, il test dei segni pu essere costruito anche senza ipotizzare la simmetria della variabile casuale dalla quale proviene il campione e quindi questa assunzione sar evitata. Se l'ipotesi di base vera, dall'Esempio 2.3.1 noto che F una F38 "#. Dunque, se :8 , PrF ,, allora 8 :8 , #8 , , ! " 8 . , 8 , # 8 . %
E' immediato verificare che EF e VarF
Inoltre, dal Corollario 2.3.3 risulta che la statistica F distribution-free su `!J e dunque il test dei segni distribution-free. Dal momento che la distribuzione della statistica F sotto ipotesi di base specificata, le appropriate regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 5.1. Esempio 6.1.1. Una fabbrica produce un tipo specifico di sfere di acciaio del diametro di 1 micron. Alla fine di una giornata di produzione stato estratto un campione casuale di 10 sfere ed stato misurato il loro diametro, ottenendo i dati della Tavola 6.1.1. Per vedere se il livello medio della produzione si discosta dallo standard, si vuole verificare dunque il sistema di ipotesi L! - " J ` contro L" - " J `.
I test per un parametro di posizione: un campione e due campione appaiati
57
Tavola 6.1.1. Diametro delle sfere in micron.

sfera " # $ % & ' ( ) * "! B3 "") "%# !'* !)) "'# "!* "&$ "!# ""* "$# B3 " !") !%# !$" !"# !'# !!* !&$ !!# !"* !$# D3 " " ! ! " " " " " "
Fonte: Romano (1977) Dal momento che per questi dati immediato verificare che , ), allora per 8 "! si ha PrF ) !!&%( e quindi la significativit osservata risulta 9== # !!&%( !"!*%. Di conseguenza si pu accettare L! ad ogni livello di significativit !"!*%. Per quanto riguarda la distribuzione per grandi campioni della statistica F F8 , dal Teorema Fondamentale Classico del Limite (Teorema A.3.6) immediato ottenere che se vera l'ipotesi di base si ha F8 8# . R ! " . 8% La convergenza della statistica F8 alla normalit particolarmente veloce anche per campioni moderati (8 "&). Le approssimazioni per grandi campioni delle regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 5.3. Tavola 6.1.2. Rapporto dei lati dei rettangoli.
rettangolo " # $ % & ' ( ) * "! "" "# "$ "% "& "' "( ") "* #! B3 !'*$ !''# !'*! !'!' !&(! !(%* !'(# !'#) !'!* !)%% !'&% !'"& !'') !'!" !&(' !'(! !'!' !'"" !&&$ !*$$ B3 3 !!(& !!%% !!(# !!"# !!%) !"$" !!&% !!"! !!!* !##' !!$' !!!$ !!&! !!"( !!%# !!&# !!"# !!!( !!'& !$"& D3 " " " ! ! " " " ! " " ! " ! ! " ! ! ! "
Fonte: Dubois (1970)
58
I test per un parametro di posizione: un campione e due campioni appaiati
Esempio 6.1.2. Gli antichi greci indicavano come rettangolo aureo un rettangolo con un rapporto fra i lati dato da 3 " & "# !'"). Questo tipo di rettangolo era spesso adoperato nella loro architettura (per esempio nella struttura del Partenone). I dati della Tavola 6.1.2 riguardano il rapporto fra i lati di rettangoli usati dai nativi americani Shoshoni per decorare le loro tende. Si vuole verificare se gli Shoshoni avessero conoscenza del rettangolo aureo, ovvero si vuole verificare il sistema di ipotesi L! - 3 J ` contro L" - 3 J `. Dal momento che per questi dati immediato verificare che , "", allora si ha PrF "" " F"" "!& " F!%%(# !$#(# ,
per cui la significativit osservata risulta 9== # !$#(# !'&%%. Dato che la significativit osservata piuttosto elevata l'evidenza empirica porta a concludere che gli Shoshoni avevano conoscenza del rettangolo aureo. Infatti, si pu accettare L! ad ogni livello di significativit !'&%%. 6.2. Le prestazioni del test dei segni. E' interessante confrontare il test dei segni con la sua controparte classica, ovvero il test di Student. Sebbene sia possibile determinare analiticamente la funzione potenza del test dei segni (vedi Esempio 3.1.3), questa operazione risulta proibitiva nel caso del test di Student quando il campione proviene da una variabile casuale che non normale. Di conseguenza, le potenze di questi test per varie distribuzioni simmetriche state calcolate mediante simulazione per le numerosit campionarie 8 & "! "&. Le alternative scelte sono state - !! 5 !# 5 !% 5 !' 5 !) 5, dove 5 # rappresenta la varianza della distribuzione ipotizzata. Nel caso della distribuzione di Chauchy si noti che 5 denota il valore per cui Pr\ 5 F". Inoltre, il test dei segni stato casualizzato al fine di ottenere un livello di significativit esattamente pari a !!& per entrambi i test. I risultati della simulazione sono riportati nella Tavola 6.2.1. Tavola 6.2.1. Potenza del test dei segni (potenza del test di Student).
distribuzione Y -"# " R - " P9- " I.- " G2- " 0.05 0.#5 0.%5 0.'5 0.)5 8& !!&!!& !!)!"! !"#!"' !!&!!& !!*!"" !"&!"* !!&!!& !"!!"" !")!#! !!&!!% !"$!"# !#%!#$ !!&!!# !"#!!( !#"!"& 8 "! Y -"# " !!&!!& !"!!"$ !")!#) R - " !!&!!& !"$!"& !#'!$# P9- " !!&!!& !"%!"& !$!!$$ I.- " !!&!!& !"*!"' !%"!$' G2- " !!&!!# !"(!!* !$(!") 8 "& Y -"# " !!&!!& !"#!"( !##!%" R - " !!&!!& !"&!") !$#!%% P9- " !!&!!& !"(!") !$(!%& I.- " !!&!!& !#&!#! !&"!%( G2- " !!&!!# !##!!* !%(!#! !")!#& !#'!$( !#'!$! !$&!%$ !#)!$$ !%!!%) !$&!$) !%'!&# !$"!#% !$*!$$ !#*!&# !%#!&& !%*!&' !'!!&* !&$!#* !$)!(! !&&!(" !'$!(# !(&!($ !'*!$! !%$!(% !'!!(' !')!(( !('!() !'(!$* !&)!*" !('!*! !)#!*! !)*!)* !)#!%"
Anche se il test dei segni dimostra scarse prestazioni per distribuzioni a code leggere come l'uniforme, si noti come diventi invece particolarmente efficiente per distribuzioni a code pesanti come l'esponenziale doppia. Questo comportamento risulta in generale ancora pi
59
evidente con distribuzioni a code particolamente pesanti quali per esempio quelle che non posseggono varianza finita come la distribuzione di Chauchy. Per quest'ultima distribuzione si noti che il test di Student non mantiene neppure il livello di significativit. Si potrebbe verificare inoltre che le prestazioni del test dei segni risultano generalmente superiori (talvolta in modo molto marcato) a quelle del test di Student quando si considerano distribuzioni asimmetriche. Per quanto riguarda le prestazioni per grandi campioni del test dei segni, dall'Esempio 3.2.2 si ha effF #0 ! . Inoltre, ancora dall'Esempio 3.2.2, noto che l'efficienza asintotica relativa del test dei segni rispetto al test di Student risulta EARFX %5# 0 !# . La Tavola 6.2.2 fornisce i valori dell'efficienza asintotica relativa EARFX per alcune distribuzioni. Anche per grandi campioni il test dei segni dimostra scarse prestazioni per distribuzioni a code leggere, e ottime prestazioni per distribuzioni a code pesanti. In generale, Noether (1967) ha provato che EARFX "$ e il limite inferiore raggiunto nel caso di una distribuzione uniforme. Tavola 6.2.2. EAR del test dei segni rispetto al test di Student.
distribuzione EARF X Y - $ "$ !$$$$ R . 5 # #1 !'$'' 1# "# !)##% P9- $ I.. $ # G2- $
6.3. Il test dei segni e gli intervalli di confidenza per la mediana. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 `-J . Dall'Esempio 4.1.1 noto che se \" \# \8 la statistica ordinata allora \,8# " \8,8# un intervallo di confidenza della mediana distribution-free su `-J al livello di confidenza " . Esempio 6.3.1. Si considerino ancora i dati dell'Esempio 6.1.1. Dal momento che PrF " !!"!( per 8 "!, si pu scegliere un livello di confidenza naturale pari a " " # !!"!( !*()'. Dunque, una volta ordinato il campione si ottiene facilmente che !)) "&$ un intervallo di confidenza della mediana distribution-free su `-J al livello di confidenza del *()'%. Alternativamente, quando la numerosit campionaria elevata, dall'Esempio 4.2.3 si ha che \6" \86 , dove 6 8# D"# 8%, un intervallo di confidenza della mediana distribution-free per grandi campioni su `-J al livello di confidenza " . Esempio 6.3.2. I dati della Tavola 6.3.1 riguardano i tempi di sopravvivenza dal momento della diagnosi di 43 pazienti malati di leucemia.
60
Tavola 6.3.1. Tempi di sopravvivenza dei malati di leucemia (in giorni).

paziente " # $ % & ' ( ) * "! "" "# "$ "% "& "' "( ") "* #! #" ## B3 ( %( &) (% "(( #$# #($ #)& $"( %#* %%! %%& %&& %') %*& %*( &$# &(" &(* &)" '&! (!# paziente #$ #% #& #' #( #) #* $! $" $# $$ $% $& $' $( $) $* %! %" %# %$ B3 ("& ((* ))" *!! *$! *') "!(( ""!* "$"% "$$% "$'( "&$% "("# "()% ")(( "))' #!%& #!&' ##'! #%#* #&!*
Fonte: Bryson e Siddiqui (1969) Scelto un livello di confidenza pari a " !*&, si ottiene che 6 %$# "*&((%$% "&!) "&, per cui %*( *') un intervallo di confidenza della mediana distribution-free per grandi campioni su `-J al livello di confidenza del *&%. 6.4. Il test dei segni per due campioni appaiati. I campioni appaiati si ottengono quando sulle unit campionarie si effettuano misure ripetute. Ad esempio, le misure sulle unit campionarie potrebbero essere fatte prima e dopo un certo trattamento e l'obiettivo potrebbe essere quello di verificare se il trattamento stesso efficace. Pi formalmente, supponiamo che \" ]" \# ]# \8 ]8 sia un campione casuale proveniente dal vettore di variabili casuali bivariato \ ] , dove \ riferita al pre-trattamento ed ] riferita al posttrattamento. Supponiamo inoltre che il campione casuale trasformato H" H# H8 , dove H3 ]3 \3 (3 " # 8), abbia funzione di ripartizione congiunta J8 `-J . Basandosi sul campione trasformato, la verifica dell'efficacia del trattamento si riduce di conseguenza alla verifica dell'ipotesi L! - ! J `, contro una opportuna alternativa e dunque il test dei segni pu essere applicato in maniera analoga a quanto visto nella 6.1. Esempio 6.4.1. Su 8 pazienti con anemia cronica grave stato misurato l'indice di infarto prima e dopo un trattamento medico e i relativi dati sono stati riportati nella Tavola 6.4.1. Per vedere se il trattamento stato effettivo e quindi per determinare se l'indice di infarto diminuito, si vuole verificare dunque il sistema di ipotesi L! - ! J ` contro L" - 0 J `. Dal momento che per questi dati immediato verificare che , ", per 8 ) si ha PrF " !!$&# e quindi la significativit osservata risulta 9== !!$&#.
61
Tavola 6.4.1. Indice di infarto dei pazienti con anemia in ml/battito/m# .

paziente prima " "!* # &( $ &$ % &( & ') ' (# ( &" ) '& dopo &' %% && %! '# %' %* %" .3 &$ "$ # "( ' #' # #% D3 ! ! " ! ! ! ! !
Fonte: Bhatia, Manchanda e Roy (1969) Sulla base dell'evidenza empirica si deve dunque concludere che il trattamento efficace, in quanto si pu respingere L! ad ogni livello di significativit !!$&#. 6.5. Il test di Wilcoxon. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J . Il test di Wilcoxon basato sulla statistica
8
[
3"
^3 V3 ,
descritta nell'Esempio 2.5.1, e mediante di esso si pu verificare una ipotesi di base del tipo L! - ! J f . Ovviamente, la statistica [ una statistica lineare dei ranghi con segno con i punteggi scelti come +3 3 (3 " # 8). Inoltre, dal Teorema 5.1.2 immediato verificare che
8
. [
3^3 ,
3"
ovvero la statistica [ equivalente in distribuzione ad una combinazione lineare di F3" "# indipendenti in cui i pesi sono dati da (" # 8). Se l'ipotesi di base vera, denotando la funzione di probabilit di [ con :8 A Pr[ A, allora dall'Esempio 2.5.1 si ha :8 A #8 -8 A , A ! " 88 "# , dove -8 A rappresenta il numero di sottoinsiemi di interi di " # 8 la cui somma A. Sebbene esistano delle relazioni ricorrenti per il calcolo diretto della funzione di probabilit di [ , la distribuzione di questa statistica si ottiene pi facilmente attraverso la funzione generatrice delle probabilit. Si noti infatti che dal Teorema 5.1.5 risulta P[ > #8 $ " >3 , > " .
8 3"
Esempio 6.5.1. Per 8 $ si ha P[ > #$ " >" ># " >$ " " > ># 2>$ >% >& >' . )
Poich le probabilit :$ A corrispondono ai coefficienti del polinomio P[ >, immediato ottenere la Tavola 6.5.1.
62
I test per un parametro di posizione: un campione e due campioni appaiati Tavola 6.5.1. Funzione di probabilit di [ per 8 $.
A :$ A ! ") " ") # ") $ #) % ") & ") ' ")
Se l'ipotesi di base vera, dall'Esempio 5.1.3 si ha E[ e Var[ " 88 "#8 " . #% " 88 " , %
Inoltre, dal Teorema 5.1.4 risulta che [ simmetrica rispetto a E[ . Infine, dal Corollario 2.5.5 si ha che la statistica [ distribution-free su f!J e di conseguenza anche il test di Wilcoxon distribution-free. Dal momento che la distribuzione della statistica [ sotto ipotesi di base specificata, le appropriate regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 5.1. Esempio 6.5.2. Il numero trascendente 1 pu essere calcolato mediante simulazione alla seguente maniera. Innanzitutto, si consideri un cerchio di raggio unitario ed il relativo quadrato circoscritto e successivamente si generi uniformemente un certo numero di punti casuali all'interno del quadrato. Ovviamente, la probabilit che un punto cada all'interno del cerchio data da 1%, per cui se : rappresenta la proporzione di punti casuali caduti all'interno del cerchio, allora %: una stima di 1. Con questa procedura si sono ottenute 10 stime di 1, ognuna basata sulla generazione di 10 000 punti pseudo-casuali, che sono state riportate nella Tavola 6.5.2. Al fine di verificare se si sono ottenute delle stime credibili di 1, si deve dunque verificare il sistema di ipotesi L! - 1 $"%"' J f contro L" - 1 J f . Tavola 6.5.2. Stime di 1.
stima " # $ % & ' ( ) * "! B3 $"$%) $"&#! $"$$# $"&%! $"#*) $"%!% $"%!! $"#%! $"$$' $"(%% B3 1 !!!') !!"!% !!!)% !!"#% !!"") !!!"# !!!"' !!"(' !!!)! !!$#)
<3 $ ' & ) ( " # * % "! D3 <3 ! ' ! ) ! ! ! ! ! "!
Dal momento che per questi dati immediato verificare che A #%, per 8 "! si ottiene Pr[ #% !$)%) e quindi la significativit osservata risulta 9== # !$)%) !('*', un valore elevato che porta ad accettare l'ipotesi di base. In particolare si pu accettare L! ad ogni livello di significativit !('*'.
63
Per quanto riguarda la distribuzione per grandi campioni della statistica [ [8 , se vera l'ipotesi di base dall'Esempio 5.3.1 risulta [8 88 1% . R ! " . 88 "#8 "#%
La convergenza della statistica di Wilcoxon abbastanza veloce anche per campioni moderati (8 #&). Si noti inoltre che le approssimazioni per grandi campioni delle regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 5.3. Esempio 6.5.3. Su un campione di 20 soggetti in sovrappeso (con un peso corporeo superiore a 100 chilogrammi) stato misurato il livello di colesterolo ottenendo i dati della Tavola 6.5.3. Tavola 6.5.3. Livello di colesterolo in mg per 100 ml.
soggetto " # $ % & ' ( ) * "! "" "# "$ "% "& "' "( ") "* #! B3 $$% ")& #'$ #%' ##% #"# ")) #&! "%) "'* ##' "(& #%# #&# "&$ ")$ "$( #!# "*% #"$ B3 "*! "%% & ($ &' $% ## # '! %# #" $' "& &# '# $( ( &$ "# % #$
<3 #! $ "* "' "! ) " "( "$ ( "" ' "% ") "# % "& & # * D3 <3 #! ! "* "' "! ) ! "( ! ! "" ! "% ") ! ! ! & # *
Fonte: Selvin (1991) Da numerose esperienze cliniche risulta che il livello di colesterolo in una persona sana di circa 190 mg per 100 ml. Si sospetta che i soggetti in forte sovrappeso abbiano un livello del colesterolo pi alto della norma e dunque si vuole quindi verificare il sistema di ipotesi L! - "*! J f contro L" - "*! J f . Dal momento che per questi dati immediato verificare che A "%*, allora Pr[ "%* F"%* #! #"%#! #" %"#% " F"'%#' !!&!" ,
per cui la significativit osservata risulta 9== !!&!". L'evidenza empirica sembra confermare che i soggetti in sovrappeso hanno un livello del colesterolo pi alto della norma, dal momento che si pu respingere L! ad ogni livello di significativit !!&!". L'approssimazione normale molto buona, in quanto il valore esatto risulta Pr[ "%* !!&#(.
64
6.6. Le prestazioni del test di Wilcoxon. Analogamente a quanto fatto nella 6.2 per il test dei segni, stato confrontato il test di Wilcoxon con il test di Student. Anche in questo caso le potenze dei due test sono state calcolate mediante simulazione per le medesime distribuzioni e numerosit considerate nella 6.2. Inoltre, il test di Wilcoxon stato casualizzato al fine di ottenere un livello di significativit esattamente pari a !!& per entrambi i test. I risultati della simulazione sono riportati nella Tavola 6.6.1. Da questa tavola evidente che il test di Wilcoxon dimostra ottime prestazioni rispetto al test di Student per tutte le distribuzioni, anche sotto ipotesi di normalit. Inoltre, confrontando la Tavola 6.6.1 con la Tavola 6.2.1, si nota che il test di Wilcoxon risulta generalmente superiore al test dei segni eccetto che per la distribuzione di Cauchy. Tavola 6.6.1. Potenza del test di Wilcoxon potenza del test di Student.
distribuzione Y -"# " R - " P9- " I.- " G2- " Y -"# " R - " P9- " I.- " G2- " Y -"# " R - " P9- " I.- " G2- " 0.05 !!&!!& !!&!!& !!&!!& !!&!!% !!&!!# !!&!!& !!&!!& !!&!!& !!&!!& !!&!!# !!&!!& !!&!!& !!&!!& !!&!!& !!&!!# 0.%5 8& !!*!"! !"%!"' !"!!"" !"(!"* !""!"" !#!!#! !"$!"# !#'!#$ !"#!!( !##!"& 8 "! !"$!"$ !#)!#) !"%!"& !$"!$# !"'!"& !$&!$$ !"*!"' !%"!$' !"'!!* !$#!") 8 "& !"(!"( !$(!%" !")!") !%#!%% !#!!") !%&!%& !#%!#! !&#!%( !"*!!* !%!!#! 0.#5 0.'5 0.)5 !##!#& !$#!$( !#*!$! !%#!%$ !$#!$$ !%'!%) !$*!$) !&"!&# !$$!#% !%#!$$ !%'!&# !&#!&& !&'!&' !'#!&* !%'!#* !'%!(! !(!!(" !($!(# !()!($ !'!!$! !')!(% !($!(' !((!(( !)!!() !&)!$* !)&!*" !)*!*! !*!!*! !*$!)* !($!%"
Per quanto riguarda le prestazioni per grandi campioni del test di Wilcoxon, dall'Esempio 5.3.3 si ha che eff
[
# $ (
0 B# .B ,
per cui l'efficienza asintotica relativa del test di Wilcoxon rispetto al test di Student risulta EAR[ X "#5 (
#
0 B# .B# .
La Tavola 6.6.2 fornisce i valori dell'efficienza asintotica relativa EAR[ X per alcune distribuzioni. Tavola 6.6.2. EAR del test di Wilcoxon rispetto al test di Student.
distribuzione EAR[ X Y - $ " R . 5 # $1 !*&%* 1# * "!*'' P9- $ I.. $ $# "& G2- $
65
Anche per grandi campioni il test di Wilcoxon dimostra ottime prestazioni per tutte le distribuzioni considerate. In generale Noether (1967) ha provato che EAR[ X "!&"#& !)'% quando la variabile casuale in oggetto di studio distribuita in modo simmetrico. Si noti infine che l'efficienza asintotica relativa del test di Wilcoxon rispetto al test dei segni risulta EAR[ F
$ 0 B# .B# . ( 0 !#
La Tavola 6.6.3 fornisce i valori dell'efficienza asintotica relativa EAR[ F per alcune distribuzioni. Anche per grandi campioni il test dei segni fornisce prestazioni buone per distribuzioni a code pesanti, mentre risulta molto meno efficiente per distribuzionia code leggere. Tavola 6.6.3. EAR del test di Wilcoxon rispetto al test dei segni.
distribuzione EAR[ F Y - $ $ R . 5 # $# "& P9- $ %$ "$$$$ I.. $ $% !(& G2- $ $% !(&
6.7. Il test di Wilcoxon e gli intervalli di confidenza per la mediana. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 f-J , allora possibile costruire mediante il test dei segni un intervallo di confidenza per la mediana - distributionfree su f-J . Analogamente all'Esempio 4.1.2, si denoti le medie di Walsh relative al campione casuale con [" [# [5 , dove 5 88 "#. Se [" [# [5 la statistica ordinata relativa alle medie di Walsh, allora [A8# " [5A8# un intervallo di confidenza della mediana distribution-free su f-J al livello di confidenza " . Esempio 6.7.1. Su un campione di cinque regioni italiane stata considerata l'et media delle donne alla nascita del primogenito e si sono ottenuti i dati della Tavola 6.7.1. Tavola 6.7.1. Et media della madre alla nascita del primogenito in anni.
regione Sicilia Toscana Liguria Lombardia Puglia B3 #&" #(( #)$ #(& #&(
Fonte: Repubblica del 4 novembre 1995, inserto Salute Vi sono & '# "& medie di Walsh e il relativo vettore ordinato risulta #&" #&% #&( #'$ #'% #'' #'( #'( #(! #(& #(' #(( #(* #)! #)$ . Dal momento che si ha Pr[ " !!'#& per 8 &, allora si pu scegliere un livello di confidenza naturale pari a " " # !!'#& !)(&. Dunque si deve concludere che
66
#&% #)! un intervallo di confidenza distribution-free su f-J per la mediana al livello di confidenza del )(&%. Alternativamente, quando la numerosit campionaria elevata, con un procedimento del tutto analogo a quello dell'Esempio 4.2.3, si ha che [6" [56 , dove 6 88 "% D"# 88 "#8 "#%, un intervallo di confidenza della mediana distribution-free per grandi campioni su f-J al livello di confidenza " . 6.8. Il test di Wilcoxon per due campioni appaiati. Analogamente a quanto fatto per il test dei segni, quando si dispone di un campione casuale di osservazioni appaiate \" ]" \# ]# \8 ]8 si pu considerare il campione casuale trasformato H" H# H8 , dove H3 ]3 \3 (3 " # 8), con funzione di ripartizione congiunta J8 f-J . Basandosi sul campione trasformato, si vuole verificare dunque l'ipotesi L! - ! J f contro una opportuna alternativa e di conseguenza il test di Wilcoxon pu essere applicato in maniera analoga a quanto visto nella 6.4. Esempio 6.8.1. Sono stati considerati 15 coppie di semi della medesima et, di cui uno prodotto con fecondazione incrociata e l'altro con auto-fecondazione, e le piante relative ad ogni coppia sono state cresciute vicine nelle medesime condizioni ambientali. Tavola 6.8.1. Altezze delle piante (pollici).
coppia " # $ % & ' ( ) * "! "" "# "$ "% "& incrociata #$& "#! #"! ##! "*" #"& ##" #!% ")$ #"' #$$ #"! ##" #$! "#! auto "(% #!% #!! #!! ")% ")' ")' "&$ "'& ")! "'$ ")! "#) "&& ")! .3 '" )% "! #! !( #* $& &" ") $' (! $! *$ (& '!
<3 "" "% # % " & ( * $ ) "# ' "& "$ "! D3 <3 "" ! # % " & ( * $ ) "# ' "& "$ !
Fonte: Darwin (1876) La Tavola 6.8.1 riporta le altezze finale delle coppie di piante ottenute in questo modo dopo un periodo fissato di tempo. Al fine di determinare se la fecondazione incrociata risulta pi efficace dell'auto-fecondazione, si vuole verificare dunque il sistema di ipotesi L! - ! J f contro L" - ! J f . Dal momento che per questi dati si ottiene A *', allora per 8 "& si ha Pr[ *' !!#!' e quindi la significativit osservata risulta 9== !!#!'. Si deve dunque concludere che la fecondazione incrociata pi efficace dell'auto-fecondazione, in quanto si pu respingere L! ad ogni livello di significativit !!#!'.
Capitolo 7 I test basati su statistiche lineari dei ranghi

7.1. Le statistiche lineari dei ranghi. Una classe molto generale di statistiche distributionfree pu essere definita nella seguente maniera. Definizione 7.1.1. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ e sia V" V# V8 il relativo vettore dei ranghi. Una statistica del tipo
8
X
3"
-3+V3 ,
detta statistica lineare dei ranghi, mentre le costanti +" +# +8 e -" -# -8 sono dette rispettivamente punteggi e costanti di regressione. Si noti che in base al Corollario 2.4.6 la statistica X distribution-free sulla classe VJ . Ovviamente, differenti scelte dei punteggi e delle costanti di regressione consentono di costruire statistiche test per una vasta gamma di sistemi di ipotesi, come sar evidenziato nel seguito. Esempio 7.1.1. Se \" \# \8" e ]" ]# ]8# sono campioni casuali indipendenti provenienti dalla stessa variabile casuale continua e se 8 8" 8# , allora il campione misto \" \8" ]" ]8# un campione casuale con funzione di ripartizione congiunta J8 VJ . Di conseguenza, se V" V# V8" sono i ranghi assegnati a \" \# \8" e se V8" " V8" # V8 sono i ranghi assegnati a ]" ]# ]8# nel campione misto, con la seguente scelta delle costanti di regressione -3 si ottiene la statistica
8 8"
" !
3 " # 8" 3 8" " 8
X
3"
-3+V3
3"
+V3 ,
che ovviamente rappresenta la somma dei punteggi assegnati a \" \# \8" . In particolare, se i punteggi sono scelti come +3 3 (3 " # 8), allora si ottiene la cosiddetta statistica di Mann-Whitney-Wilcoxon, ovvero
8"
[
3"
V3 ,
68
I test basati su statistiche lineari dei ranghi
che fornisce la somma dei ranghi assegnati a \" \# \8" . Se i punteggi sono scelti invece come +3 allora si ottiene la statistica
8"
" !
3 8# , 3 " # 8 , 3 8#
P
3"
+V3 ,
che fornisce il numero di \" \# \8" maggiori della mediana del campione misto. Per questo motivo P detta statistica della mediana. Il seguente risultato preliminare utile nella determinazione della media e della varianza di una statistica lineare dei ranghi. Lemma 7.1.2. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora E+V3 + " 8
8
+< , 3 " # 8 ,
<" 8
Var+V3 =# +
" 8
# , 3 " # 8 , +< +
<"
Cov+V3 +V4
" =# , 3 4 " # 8 . 8" +

8 <"
Dimostrazione. Dal Corollario 2.4.4 si ottiene " E+V3 +<PrV3 < 8 <" e
8 8
, 3 " # 8 , +< +
Var+V3
<" 8 <"
# PrV3 < +< +
" 8
# =# , 3 " # 8 . +< + +
Di nuovo dal Corollario 2.4.4 si ottiene

8 8
Cov+V3 +V4
PrV3 < V4 = +< ++= +
<" =<"
I test basati su statistiche linearti dei ranghi
69
" 88 "
+< ++= +
<" =<" 8 <"
8 " # +< + 88 " <" 8 <"
# +< +
" 88 "
# +< +
" =# , 3 4 " # 8 . 8" +
Il seguente teorema fornisce la media e la varianza di una statistica lineare dei ranghi. Teorema 7.1.3. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , per una statistica lineare dei ranghi X risulta EX 8+ e VarX dove " - 8 e =# - " 8
8 3" 8
8# # =# + =- , 8"
-3
3"
-3 -# .
Dimostrazione. Tenendo presente il Lemma 7.1.2 si ha

8
EX
3"
-3E+V3 +
8 3"
-3 8+ -
e
8 8 8
VarX
3"
-3# Var+V3
3" 43" 8 8
-3-4Cov+V3 +V4
=# +
3"
" -3 =# 8" +
# 8
-3-4
3" 43" 8 8
" =# 8 " 8" +
-3#
3" 3" 43"
-3-4
70
" =# 8 8" + 8# " =# + 8" 8

8
-3
3" 3"
-3#
-3 -#
3"
8# # # =+ =- . 8"
Esempio 7.1.2. Si consideri la statistica [ dell'Esempio 7.1.1. Dal momento che " + 8 e " - 8 dal Teorema 7.1.3 si ottiene " E[ 8+ - 8" 8 " . # Inoltre, risulta =# + " 8 e =# - da cui Var[ 8# " # =# 8" 8# 8 " . + =- 8" "# " 8
8" 8 8 8" 8
<
<"
" 8 " #
"
3"
8" , 8
" " < 8 "# # 8 <"
<#
<"
" 8 "# %
" " " 8 "#8 " 8 "# 8# " ' % "#
"
3"
8# 8" 8 8" 8" 8# " , # # 8 8 8#
Esempio 7.1.3. Si consideri la statistica P dell'Esempio 7.1.1. Dal momento che " + 8 e =# + " 8
8# 8#
"
<"
8# 8
"
<"
8## 8#8 8# , # 8 8#
mentre - e =# - sono stati ottenuti nell'Esempio 7.1.2, allora dal Teorema 7.1.3 si ottiene
71
8" 8# EP 8+ - 8 e VarP 8# 8" 8# 8#8 8# # =# . + =- 8" 8# 8 " 8" #
Nel caso particolare che 8 sia pari, allora risulta EP e VarP 8" 8 # . %8 "
Il seguente risultato preliminare viene impiegato per ottenere importanti equivalenze in distribuzione per le statistiche lineari dei ranghi. Lemma 7.1.4. Sia \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ . Se V" V# V8 il vettore dei ranghi e se Y" Y# Y8 e8 e8 un vettore di trasformate biunivoche tali che Y" V" V# V8 Y# V" V# V8 Y8 V" V# V8 , allora si ha PrY" ?" Y# ?# Y8 ?8 " , ?" ?# ?8 e8 . 8x un
Dimostrazione. Dal momento che ad ogni ?" ?# ?8 corrisponde <" <# <8 e8 , dove <3 X3" ?" ?# ?8 (3 " # 8), allora PrY" ?" Y# ?# Y8 ?8 PrV" <" V# <# V8 <8 " . 8x
Dal momento che questa relazione valida per ogni ?" ?# ?8 e8 , il teorema dimostrato. Teorema 7.1.5. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , per una statistica lineare dei ranghi X si ha
8 8
. -3+V3
X
3"
+3-V3 .
3"
Dimostrazione. Si consideri il vettore di trasformate Y" Y# Y8 , tale che Y3 rappresenta la posizione di 3 nel vettore V" V# V8 . Ovviamente, per il vettore . Y" Y# Y8 valgono le condizioni del Lemma 7.1.4 e quindi si ha Y" Y# Y8 V" V# V8 , da cui
8 8 8
X
3"
-3+V3
3"
+3-Y3
3"
+3-V3 .
Teorema 7.1.6. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ e se inoltre - w " - w # - w 8 e +w " +w # +w 8 sono
72
permutazioni di -" -# -8 e +" +# +8 rispettivamente, per una statistica lineare dei ranghi X si ha
8 8
X
3"
-3+V3
3"
- w 3+w V3 .
Dimostrazione. Sia 3 la posizione di - w 3 nella permutazione -" -# -8 e sia "3 la posizione di +w 3 nella permutazione +" +# +8. Di conseguenza, si ha che -" -# -8 - w " - w # - w 8 e che +"" +"# +"8 +w " +w # +w 8, per cui
8 8
- w 3+w V3
3" 3"
-3 +"V3 .
Dal momento che per il vettore "V" "V# "V8 valgono le condizioni del Lemma 7.1.4, . allora si ottiene "V" "V# "V8 V" V# V8 , da cui
8 8
-3 +"V3
3" 3"
-3 +V3 .
Se ora #3 rappresenta la posizione di 3 nella permutazione " # 8 , si ottiene

8 8
-3 +V3
3" 3"
-3+V#3 .
Dal momento che per il vettore V#" V## V#8 valgono le condizioni del Teorema 7.1.4, . allora si ha V#" V## V#8 V" V# V8 , da cui
8 8
-3+V#3
3" 3"
-3+V3 .
Si deve dunque concludere che

8
. - w 3+w V3
8
. -3 +V3
-3+V3 X .
3"
3"
3"
Il seguente teorema fornisce le condizioni per cui una statistica lineare dei ranghi possiede una distribuzione simmetrica rispetto alla media. Teorema 7.1.7. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ e se - " - # - 8 e + " + # + 8 rappresentano rispettivamente i valori ordinati di -" -# -8 e +" +# +8, allora una statistica lineare dei ranghi X simmetrica rispetto a EX 8+ - se + 3 + 8 " 3 5 , 3 " # 8 , o - 3 - 8 " 3 5 , 3 " # 8 , con 5 costante.
73
Dimostrazione. Si dimostra il teorema per la prima condizione. Se si assume vere le 8 relazioni, sommando e dividendo per 8 si ha " 5 8 " 8
8 3" 8 3" 8 3"
" + 3 8
+ 8 " 3
3" 8 3" 8 3"
" +3 8
" +8 " 3 8
" +3 8
. +3 #+
Sostituendo il valore ottenuto per 5 nelle relazioni originali si ha quindi + 3 + 8 " 3 , 3 " # 8 , #+ ovvero + + 8 " 3 , 3 " # 8 . + 3 + Data ora la statistica lineare dei ranghi
8
X
3"
-3+ V3 ,
. per il Teorema 7.1.6 si ha X X . Tenendo presente questa equivalenza in distribuzione, allora sufficiente dimostrare che X simmetrica rispetto a EX EX 8+ - . Si noti che dalla relazione ottenuta in precedenza si ottiene
X 8+ -
8 3"
-3+ V3 +
8 3"
+ 8 " V3 . -3+
Dal momento che per il Lemma 7.1.4 si ha

. 8 " V" 8 " V# 8 " V8 V" V# V8 ,
allora X 8+ -
8 3"
. + 8 " V3 -3+
8 3"
+ V3 8+ -3+ - X ,
. La dimostrazione della ovvero per il Teorema 1.2.2 si ha che X simmetrica rispetto a 8+seconda condizione segue immediatamente dal Teorema 7.1.5 mediante la stessa dimostrazione della prima condizione. Esempio 7.1.4. Si consideri la scelta di costanti di regressione dell'Esempio 7.1.1 e si supponga 8" 8# . Dal momento che immediato verificare che - 3 -8 " 3 (3 " # 8), allora risulta - 3 - 8 " 3 " , 3 " # 8 , ovvero dal Teorema 7.1.7 si ottiene che la relativa statistica lineare dei ranghi X simmetrica.
74
Esempio 7.1.5. Si consideri la statistica [ dell'Esempio 7.1.1. Dal momento che immediato verificare che + 3 +3 3 (3 " # 8), risulta + 3 + 8 " 3 3 8 " 3 8 " , 3 " # 8 , per cui dal Teorema 7.1.7 e tenendo presente l'Esempio 7.1.2, si ha che [ simmetrica rispetto a E[ 8" 8 "#. Esempio 7.1.6. Si consideri la statistica P dell'Esempio 7.1.1 e si supponga che 8 sia pari. Dal momento che immediato verificare che + 3 +3 (3 " # 8), risulta + 3 + 8 " 3 " , 3 " # 8 , per cui dal Teorema 7.1.7 e tenendo presente l'Esempio 7.1.3, si ha che P simmetrica rispetto a EP 8" #. 7.2. La distribuzione per grandi campioni delle statistiche lineari dei ranghi. In questa sezione vengono discusse le propriet delle statistiche lineari dei ranghi per grandi campioni. Definizione 7.2.1. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora data una statistica lineare dei ranghi
8
X X8
3"
-8 3+8 V3 ,
si dice che le costanti di regressione -8 " -8 # -8 8 soddisfano alla condizione di Noether se lim 8 dove " -8 8
8
"38
-8 3 - 8 # , - 8 # max -8 3
8 3"
-8 3 .
3"
Esempio 7.2.1. Si consideri le costanti di regressione definite nell'Esempio 7.1.1. Dal momento che - 8 8" 8, si ha
8 3"
-8 3 - 8 #
8 3"
# 8" 8 # . -8 3# 88 8
Inoltre " " # # # " max -8 3 - 8 # max- 8 # # max8" 8# # max8" 8# # , 8 "38 8 8 per cui -8 3 - 8 # 8" 8 # 8 min8" 8# 8 , # # max -8 3 - 8 max8" 8# max8" 8#
8 3"
"38
ovvero la condizione di Noether soddisfatta quando 8" 8# contemporaneamente.
75
Nel seguente teorema si ottiene la distribuzione per grandi campioni delle statistiche lineari dei ranghi. Teorema 7.2.2. Si consideri punteggi tali che +8 3 938 " , 3 " # 8 , dove 9 una funzione punteggio esprimibile come differenza di due funzioni non decrescenti che non dipende da 8 per cui ! ( 9? 9# .? ,
" !
" dove 9 ! 9? .?. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora per una statistica lineare dei ranghi
8
X8
3"
-8 3+8 V3 ,
le cui costanti di regressione soddisfano la condizione di Noether, si ha X8 EX8 . R ! " , VarX8 dove EX8 e VarX8 sono definite nel Teorema 7.1.3. e idak (1967). Dimostrazione. Vedi Hajek
w Si noti che se si considera la statistica X8 i cui punteggi sono dati da w +8 3 ,8 938 " .8 ,8 +8 3 .8 , 3 " # 8 , w 8 .8 con allora risulta X8 ,8 X8 8w 8 .8 EX8 ,8 EX8 8-
e
w # VarX8 ,8 VarX8 .
Di conseguenza, si ha
w w 8 .8 ,8 EX8 8 8 .8 X8 EX8 ,8 X8 8X8 EX8 , w # VarX VarX8 ,8 VarX8 8 w da cui segue evidentemente che X8 e X8 hanno le medesime propriet per grandi campioni. Dunque, le costanti ,8 e .8 non influenzano il comportamento per grandi campioni della statistica dei ranghi, mentre la scelta della funzione punteggio 9 determinante sotto questo punto di vista.
Esempio 7.2.2. Si consideri la statistica [ [8 di Mann-Whitney-Wilcoxon. Dall'Esempio 7.2.1 noto che le relative costanti di regressione soddisfano alla condizione di Noether. Inoltre, al fine di determinare la distribuzione per grandi campioni di [8 conveniente considerare la statistica X8 ,8 [8 con ,8 "8 " che ha le medesime propriet per grandi campioni della statistica [8 . La funzione punteggio relativa alla statistica X8 , data da
76
9? ?I!" ?, pu essere ovviamente espressa come differenza di due funzioni non decrescenti. Inoltre, risulta
" " " # # . ( 9? 9 .? ( ? "# .? "# ! !
Dunque, tutte le condizioni del Teorema 7.2.2 sono soddisfatte. Quindi, tenendo presente anche l'Esempio 7.1.2, si ha [8 E[8 [8 8" 8 "# . R ! " . Var[8 8" 8# 8 ""#
Esempio 7.2.3. Si consideri la statistica P P8 della mediana. Dall'Esempio 7.2.1 noto che le relative costanti di regressione soddisfano alla condizione di Noether. La funzione punteggio della statistica P8 , data da 9? I"#" ?, pu essere ovviamente espressa come differenza di due funzioni non decrescenti. Inoltre, risulta # ( 9? 9 .? (
" ! "# !
"## .? (
" "#
" "## .?
" . %
Dunque, tutte le condizioni del Teorema 7.2.2 sono soddisfatte. Quindi, tenendo presente anche l'Esempio 7.1.3, dal Teorema 7.2.2 si ottiene P8 EP8 P8 8" 8#8 . R ! " . VarP8 8" 8# 8#8 8#8# 8 "
Capitolo 8 I test per i parametri di posizione: due campioni indipendenti

8.1. Le statistiche lineari dei ranghi per i parametri di posizione. Si consideri due campioni casuali indipendenti \" \# \8" e ]" ]# ]8# e supponiamo che il campione misto \" \8" ]" ]8# abbia funzione di ripartizione congiunta J8 _JJ , dove 8 8" 8# . Dalla definizione della classe _JJ si noti che in questo caso il parametro J rappresenta in effetti la differenza fra i parametri di posizione relativi alle variabili casuali da cui provengono i due campioni. Risulta interessante dunque verificare il sistema di ipotesi L! J ! J V ovvero l'omogeneit dei parametri di posizione contro un'alternativa bilaterale L" J ! J V o direzionale L" J ! J ! J V. Una classe di statistiche test distribution-free opportuna in questo sistema di ipotesi definita di seguito. Definizione 8.1.1. Siano \" \# \8" e ]" ]# ]8# due campioni casuali indipendenti, tali che il campione misto abbia funzione di ripartizione congiunta J8 _!J , dove 8 8" 8# . Siano inoltre V" V# V8" i ranghi assegnati a \" \# \8" e siano V8" " V8" # V8 i ranghi assegnati a ]" ]# ]8# nel campione misto. Se le costanti di regressione nella Definizione 7.1.1 sono date da -3 " ! 3 " # 8" 3 8" " 8
e i punteggi +3 (3 " # 8) sono tali che ! +" +# +8 , +" +8 , allora una statistica del tipo
8 8"
X
3"
-3+V3
3"
+V3
detta statistica lineare dei ranghi per i parametri di posizione.
Si noti che per il Corollario 2.4.6 sotto ipotesi di base la statistica X distribution-free sulla classe _!J VJ . La statistica X sensibile a variazioni nel parametro J, in quanto se non vera l'ipotesi di base X tende ad assumere valori piccoli o elevati. Esempio 8.1.1. Dall'Esempio 7.1.1 immediato verificare che la statistica [ di MannWhitney-Wilcoxon e la statistica P della mediana sono statistiche lineari dei ranghi per i parametri di posizione.
78
I test per i parametri di posizione:due campioni indipendenti
Il seguente teorema fornisce la media e la varianza di una statistica lineare dei ranghi per i parametri di posizione quando vera l'ipotesi di base. Teorema 8.1.2. Se il campione casuale misto \" \8" ]" ]8# possiede funzione di ripartizione congiunta J8 _!J , allora per una statistica lineare dei ranghi per i parametri di posizione X si ha EX 8" + e VarX 8" 8# # = , 8" +
e =# sono definite nel Lemma 7.1.2. dove + + Dimostrazione. Con la stessa simbologia del Teorema 7.1.3 si ha " - 8 e =# - " 8
8" 8"
"
3"
8" 8
"
3"
8# 8" 8# 8" 8 8" 8" 8# " " , # # # 8 8 8 8 8#
e quindi ancora dal Teorema 7.1.3 risulta EX 8+ e VarX 8# 8" 8 # 8" 8 # # =# = . + # 8" 8 8" + 8" 8" + 8
Il seguente teorema fornisce le condizioni per cui una statistica lineare dei ranghi per i parametri di posizione risulta simmetrica quando vera l'ipotesi di base. Teorema 8.1.3. Se il campione casuale misto \" \8" ]" ]8# possiede funzione di ripartizione congiunta J8 _!J , allora una statistica lineare dei ranghi per i parametri di posizione X simmetrica rispetto a EX se si ha 8" 8# , o +3 +8 " 3 5 , 3 " # 8 , dove 5 una costante. Dimostrazione. E' immediata considerando il Teorema 7.1.7 e l'Esempio 7.1.4.
Il seguente teorema consente di ottenere la funzione generatrice di probabilit di una statistica lineare dei ranghi per i parametri di posizione nel caso che i punteggi siano valori interi.
I test per i parametri di posizione: due campioni indipendenti
79
8 lineare dei ranghi per i parametri di posizione X data da 8 "
Teorema 8.1.4. Se il campione casuale misto \" \8" ]" ]8# possiede funzione di ripartizione congiunta J8 _!J , allora la funzione generatrice di probabilit di una statistica
"
volte il coefficiente di
ordine 8" del polinomio in ?
$ " ?@+3 .
8 3"
Dimostrazione. In base al Teorema 7.1.5 risulta

8
. X
^3 +3 ,
3"
dove ^3 -V3 (3 " # 8). Ovviamente, ^3 una variabile casuale che vale " se V3 8" e ! altrimenti (3 " # 8) ed inoltre risulta 8 3" ^3 8" . Supponiamo inoltre che 8" sia la realizzazione di una variabile casuale R" distribuita come una F38 "#. Per 8 un dato 8" , dal momento che vi sono 8 modi di assegnare gli 8" ranghi pi bassi al " campione casuale, allora si ha 8 Pr^" D" ^8 D8 R" 8" 8" da cui Pr^" D" ^# D# ^8 D8 Pr^" D" ^# D# ^8 D8 R" 8" PrR" 8" 8 8"
" " 8
, D3 ! " , 3 " # 8 ,
3"
D3 8" ,
8 8"
#8 #8 , D3 ! " , 3 " # 8 .
Si dunque noti che le ^3 risultano indipendenti ed ugualmente distribuite come F3" "# (3 " # 8). Inoltre, dal momento che la funzione generatrice delle probabilit congiunta di ^3 e di X3 ^3 +3 risulta P^3 X3 ?3 @3 " #
" D3 !
3 3 ?D 3 @3
D +3
" +3 " ?3 @3 , 3 " # 8 , #
8 e dal momento che R" 8 3" ^3 e X 3" X3 sono somme di 8 variabili casuali indipendenti, allora la funzione generatrice delle probabilit congiunta di R" e X risulta
PR" X ? @ $ P^3 X3 ? @ #8 $ " ?@+3 .

8 8 3" 3"
Inoltre, denotando con PX @ 8" la funzione generatrice delle probabilit di X condizionata al valore 8" di R" , risulta anche
80
PR" X ? @
8" !
PX @ 8" PrR" 8" ?
8"
8 8" !
8 PX @ 8" ?8" , 8"
distribuzione di R" stata scelta semplicemente per convenienza.
8 8 ovvero 8 PX @ 8" il coefficiente di ordine 8" di #3" " ?@+3 . Si noti che la "
Quando i punteggi non sono interi il precedente teorema pu essere ancora impiegato determinando una trasformata biunivoca che discretizza i punteggi originali. Dal momento che la distribuzione di una statistica lineare dei ranghi per i parametri di posizione sotto l'ipotesi di base L! J ! J V si pu ottenere mediante il Teorema 8.1.4, allora si pu determinare le appropriate regioni critiche del test. Se l'alternativa bilaterale, ovvero L" J ! J V, allora il primo campione tende ad assumere i ranghi pi bassi o elevati e quindi si respingere l'ipotesi di base per determinazioni sia troppo elevate che troppo piccole di X . Fissato quindi un livello di significativit , allora si sceglie come regione critica l'insieme g" > > >8" 8# # > >8" 8# "# , dove >8" 8# rappresenta il quantile di ordine della distribuzione di X per numerosit campionarie pari a 8" e 8# . Se l'alternativa direzionale del tipo L" J ! J V, allora il secondo campione tende ad assumere i ranghi pi elevati e quindi si respinge l'ipotesi di base per determinazioni basse di X . Fissato quindi un livello di significativit , si ha la seguente regione critica g" > > >8" 8# . Al contrario se l'alternativa direzionale del tipo L" J ! J V, allora si il primo campione tende ad assumere i ranghi pi elevati e quindi si respinge l'ipotesi di base per determinazioni troppo elevate di X . Fissato quindi un livello di significativit , si ha la seguente regione critica g" > > >8" 8# " . Si noti infine che il test basato sulla X per i precedenti sistemi di ipotesi corretto al livello di significativit . Infatti, dal momento che si pu dimostrare che TX J J PrJJ X g" una funzione monotona crescente per J ! e monotona decrescente per J ! per ogni J V, allora risulta TX J J , ovvero il test corretto. Risulta ora interessante determinare la scelta dei punteggi che fornisce il test localmente pi potente per verificare il sistema di ipotesi L! J ! J J! contro L" J ! J J! . In questo caso si ha la seguente definizione di test localmente pi potente. Definizione 8.1.5. Se il campione casuale misto \" \# \8" ]" ]# ]8# possiede funzione di ripartizione congiunta J8 _JJ , dove 8 8" 8# , allora si consideri il sistema di ipotesi L! J ! J J! contro L" J ! J J! , dove J! V. Il test basato sulla statistica lineare dei ranghi per i parametri di posizione X detto localmente pi potente se esiste un % ! tale che per ogni livello di significativit naturale si ha TX J TX J , ! J % , per ogni statistica lineare dei ranghi per i parametri di posizione X .
81
Il prossimo teorema fornisce la scelta ottima dei punteggi per la costruzione del test localmente pi potente. Ovviamente, si noti che l'utilit di questo teorema consiste solamente nell'evidenziare la struttura ottima dei punteggi al variare della funzione di ripartizione, dal momento che questa non mai nota in pratica. Teorema 8.1.6. Si consideri il campione casuale misto \" \# \8" ]" ]# ]8# con funzione di ripartizione congiunta J8 _JJ , e sia 0 la funzione di densit corrispondente alla funzione di ripartizione J . Si assuma inoltre che 0 w esista, sia assolutamente continua e
w ( 0 B .B .
Allora il test localmente pi potente per verificare il sistema di ipotesi L! J ! J J! contro L" J ! J J! basato sulla statistica lineare dei ranghi per i parametri di posizione
8"
X
3"
+ V3 ,
dove 0 w Z3 + 3 E , 3 " # 8 , 0 Z3 e Z" Z# Z8 la statistica ordinata relativa al campione casuale misto \" \8" ]" ]8# . Dimostrazione. Si veda Hettmansperger e McKean (1998). Analogamente a quanto visto per la scelta ottima dei punteggi nel caso di una statistica lineare dei ranghi con segno, anche in questo caso si pu dimostrare che la scelta ottima dei punteggi non dipende dal parametro di posizione e di scala della distribuzione. Esempio 8.1.2. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _JJ , dove J la funzione di ripartizione di una R ! " e 0 rappresenta la relativa funzione di densit. E' facile dimostrare che le condizioni del Teorema 8.1.6 sono soddisfatte. Inoltre, analogamente all'Esempio 5.2.1, si ha 0 w B0 B B, per cui la scelta ottimale dei punteggi data da + 3 EZ3 , 3 " # 8 , dove Z" Z# Z8 la statistica ordinata relativa ad un campione casuale proveniente da una R ! ". Esempio 8.1.3. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _JJ , dove J la funzione di ripartizione di una P9! " e 0 rappresenta la relativa funzione di densit. E' facile dimostrare che le condizioni del Teorema 8.1.6 sono soddisfatte. Inoltre, analogamente all'Esempio 5.2.2, si ha 0 w B0 B #J B ", per cui la scelta ottimale dei punteggi data da + 3 E#J Z3 " #EJ Z3 " , 3 " # 8 ,
82
dove Z" Z# Z8 la statistica ordinata relativa ad un campione casuale proveniente . da una P9! ". Tuttavia, dal momento che J Z3 Y3 (3 " # 8), dove Y" Y# Y8 rappresenta la statistica ordinata relativa ad una campione casuale proveniente da una Y ! ", si ottiene anche + 3 #EY3 " #3 " , 3 " # 8 . 8"
Si noti che la statistica lineare dei ranghi per i parametri di posizione costruita su questi punteggi data da
8"
X
3"
#V3 # 8" [ 8" , 8" 8"
dove [ la statistica lineare dei ranghi di Mann-Whitney-Wilcoxon. Quindi X e [ forniscono test equivalenti, ovvero la scelta fatta per la statistica di Mann-Whitney-Wilcoxon risulta ottima per una variabile casuale logistica. 8.2. La distribuzione per grandi campioni delle statistiche lineari dei ranghi per i parametri di posizione. In questa sezione vengono considerate le propriet per grandi campioni delle statistiche lineari dei ranghi per i parametri di posizione. Teorema 8.2.1. Se \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _!J , allora per una statistica lineare dei ranghi per i parametri di posizione
8"
X X8
3"
+8 V3 ,
i cui punteggi +8 3 (3 " # 8) soddisfano le condizioni del Teorema 7.2.2, risulta X8 EX8 . R ! " , VarX8 dove EX8 e VarX8 sono definite nel Teorema 8.1.2. Dimostrazione. Segue dall'Esempio 7.2.1 e dal Teorema 7.2.2.
Fissato un livello di significativit , per 8 la regione critica per verificare L! J ! J V contro l'alternativa L" J ! J V, pu essere approssimata dall'insieme > > EX8 D# VarX8 > EX8 D"# VarX8 . > > EX8 D VarX8 ,
Analogamente per 8 la regione critica per verificare l'alternativa L" J ! J V, pu essere approssimata dall'insieme
mentre la regione critica per verificare l'alternativa L" J ! J V, pu essere approssimata dall'insieme
I test per i parametri di posizione: due campioni indipendenti > > EX8 D" VarX8 .
83
Mediante il Teorema 3.1.8 si pu dimostrare inoltre che la successione di test basata su X8 coerente. Per quanto riguarda l'efficacia delle statistiche lineari dei ranghi per i parametri di posizione si ha il seguente teorema. Teorema 8.2.2. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _JJ , e si consideri il sistema di ipotesi L! J ! J V contro L" J J3 J V, dove J3 una successione di alternative tali che J3 -83 con - costante. Data una statistica lineare dei ranghi per i parametri di posizione
8"
X X8
3"
+8 V3 ,
i cui punteggi +8 3 (3 " # 8) soddisfano le condizioni del Teorema 8.2.1, allora l'efficacia del test basato su X8 risulta effX / " / ( 9?90 ? .?( 9? 9# .? ,
" " ! !
dove / 8lim 8 8 (! / ") e " 90 ? 1967. Dimostrazione. Vedi Hayek e idak 0 w J " ? . 0 J " ?
Esempio 8.2.1. Si consideri la statistica [ [8 del test di Mann-Whitney-Wilcoxon dell'Esempio 8.1.1. Dall'Esempio 7.2.2 risulta che le condizioni del Teorema 8.2.2 sono soddisfatte. Inoltre, si ha ( 9?90 ? .? (
" ! "
0 w J " ? ? .? , 0 J " ?
da cui, mediante la trasformazione di variabile B J " ? con ? J B e .? 0 B.B, si ha ( 9?90 ? .? (

" !
0 w B J B0 B .B ( 0 w BJ B .B 0 B
0 BJ B (
0 B# .B (
0 B# .B .
Quindi, tenendo presente l'Esempio 7.2.2, l'efficacia del test di Mann-Whitney-Wilcoxon risulta eff[ "#/ " / (

0 B# .B .
Esempio 8.2.2. Si consideri la statistica P P8 del test della mediana dell'Esempio 8.1.1. Dall'Esempio 7.2.3 risulta che le condizioni del Teorema 8.2.2 sono soddisfatte. Inoltre, si ha
84
I test per i parametri di posizione:due campioni indipendenti 0 w J " ? .? , ( 9?90 ? .? ( 0 J " ? ! "#
" "
da cui, mediante la trasformazione di variabile B J " ? con ? J B e .? 0 B.B, se J B!& "#, si ha ( 9?90 ? .? (
" !
B!&
0 w B 0 B .B ( 0 w B .B 0 B B!& 0 B!& . 0 B B!&
Quindi, tenendo presente l'Esempio 7.2.3, l'efficacia del test della mediana risulta effP / " / 0 B!& %/ " / 0 B!& . "%
8.3. Il test di Mann-Whitney-Wilcoxon. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _JJ . Il test di Mann-WhitneyWilcoxon basato sulla statistica
8"
[
3"
V3 ,
descritta nell'Esempio 2.4.1. Mediante questo test si pu verificare un'ipotesi di base del tipo L! J ! J V. Ovviamente, la statistica [ una statistica lineare dei ranghi per i parametri di posizione con i punteggi scelti come +3 3 (3 " # 8). Se l'ipotesi di base vera, dall'Esempio 2.4.1 noto che la funzione di probabilit della statistica [ risulta :8" 8# A 8 8"
"
-8" 8# A , A 8" 8" "# 8" 8 8# "# ,
dove -8" 8# A il numero di sottoinsiemi di 8" interi dell'insieme (" # 8) la cui somma A. Sebbene esistano delle relazioni ricorrenti per il calcolo della funzione di probabilit di [ , la distribuzione di questa statistica si ottiene pi facilmente attraverso la funzione generatrice di probabilit. Si noti infatti che dal Teorema 8.1.4 la funzione generatrice di
8 probabilit P[ @ di [ risulta 8 " 8 dato da #3" " ?@3 . "
volte il coefficiente di ordine 8" del polinomio in ?
Esempio 8.3.1. Per 8" # e 8# # si ha $ " ?@3 " @ @# @$ @% ?

% 3"
@$ @% #@& @' @( ?# @' @( @) @* ?$ @"! ?% da cui P[ @ " $ @ @% #@& @' @( . '
Dal momento che le probabilit :## A corrispondono ai coefficienti del polinomio P[ @, immediato ottenere la Tavola 8.3.1.
85
Tavola 8.3.1. Funzione di probabilit di [ per 8" # e 8# #.

A :## A $ "' % "' & #' ' "' ( "'
Se l'ipotesi di base vera, dall'Esempio 7.1.2 si ha E[ e Var[ " 8" 8# 8 " . "# " 8" 8 " , #
Inoltre, dall'Esempio 7.1.5 si ottiene che [ simmetrica rispetto a E[ . Infine, dal Corollario 2.4.6 si ha che la statistica [ distribution-free su _!J VJ e di conseguenza anche il test di Mann-Whitney-Wilcoxon distribution-free. Dal momento che la distribuzione della statistica [ sotto ipotesi di base specificata, le appropriate regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 8.1. Esempio 8.3.2. In un esperimento due gruppi di piccioni sono stati presi dai loro nidi nella campagna a Siena e sono stati portati in una localit vicino Roma. Il gruppo di controllo (composto da 8 piccioni) stato trasportato in un container non coperto, dove passava aria naturale durante il trasporto. Un secondo gruppo (composto da 10 piccioni) invece stato trasportato in un container coperto e riceveva solamente aria condizionata. I piccioni sono stati lasciati liberi dopo 172 km, in una localit vicino Roma (Siena rimane rispetto a questa localit in una direzione di 325). Le direzioni (in gradi, dove il nord 0) verso le quali i piccioni sono volati sono contenute nella Tavola 8.3.2. Tavola 8.3.2. Direzioni di fuga (in gradi).
piccione " # $ % & ' ( ) * "! guppo controllo B3 <3 #%( "' "&$ "! #!# "% #'% "( #% # ##) "& $$$ ") "*# "$ gruppo esperimento C3 <3 "!( % "!* & ")' "# "#" ) "(" "" % " ""! ' )# $ * "$" ""( (
Fonte: Batschelet (1981) Si vuole verificare se le condizioni di viaggio hanno alterato la capacit di orientamento dei piccioni, ovvero si vuole verificare il sistema di ipotesi L! J ! J V contro L" J ! J V. Dal momemto che per questi dati immediato verificare che A "!&, per 8" ) e 8# "! si ha Pr[ "!& !!!%$ e quindi la significativit osservata risulta 9== # !!!%$ !!!)'. Questa una significativit osservata molto bassa che porta a respingere l'ipotesi di base. Si deve concludere che le condizioni di trasporto hanno
86
alterato le capacit di orientamento dei piccioni, in quanto si pu respingere L! ad ogni livello di significativit !!!)'. Per quanto riguarda la distribuzione per grandi campioni della statistica [ [8 sotto ipotesi di base, dall'Esempio 7.2.2 si ha [8 8" 8 "# . R ! " . 8" 8# 8 ""# La convergenza della statistica di Mann-Whitney-Wilcoxon abbastanza veloce anche per campioni moderati, posto che entrambe le numerosit siano abbastanza elevate (8" "! e 8# "!). Le approssimazioni per grandi campioni delle regioni critiche del test per alternative bilaterali o direzionali si possono ottenere tenendo presente la discussione nella 8.2. 8.4. Il test della mediana. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _JJ . Il test della mediana basato sulla statistica
8"
P
3"
+V3 ,
descritta nell'Esempio 7.1.1, e mediante di esso si pu verificare un'ipotesi di base del tipo L! J ! J V. Ovviamente, la statistica P una statistica lineare dei ranghi per i parametri di posizione i cui punteggi sono definiti nell'Esempio 7.1.1. Come evidenziato nell'Esempio 7.1.1, la statistica P rappresenta il numero di \" \# \8" maggiori della mediana del campione misto. Il seguente teorema fornisce la funzione di probabilit della statistica P quando vera l'ipotesi di base. Teorema 8.4.1. Se \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 _!J , la funzione di probabilit di P data da PrP 6
8# 86" 8#6 8 8#
dove 6 max! 8# 8" 8 min8# 8" . Dimostrazione. Sotto ipotesi di base ogni scelta di ranghi ugualmente probabile. Quindi l'assegnazione di 6 degli 8 8# ranghi pi elevati ad \" \# \8" equivalente ad uno schema probabilistico ipergeometrico dove si estrae in blocco 8# elementi da una popolazione di numerosit 8" 8# 8 e gli elementi di interesse sono quelli provenienti dalla sottopopolazione di numerosit 8" . Se l'ipotesi di base vera, dall'Esempio 7.1.3 si ha EP e 8" 8# 8
87
VarP
8" 8# 8#8 8# . 8# 8 "
Inoltre, dall'Esempio 7.1.4 e dall'Esempio 7.1.6 si ha che P simmetrica rispetto a EP quando 8" 8# o quando 8 pari. Infine, dal Corollario 2.4.6 risulta che la statistica P distribution-free su _!J VJ e di conseguenza anche il test della mediana distributionfree. Dal momento che la distribuzione della statistica P sotto ipotesi di base specificata, le appropriate regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 8.1. Per quanto riguarda la distribuzione per grandi campioni della statistica P P8 sotto ipotesi di base, dall'Esempio 7.2.3 risulta P8 8" 8#8 . R ! " . 8" 8# 8#8 8#8# 8 " La convergenza della statistica della mediana abbastanza veloce anche per campioni moderati, posto che entrambe le numerosit siano abbastanza elevate (8" "! e 8# "!). Le approssimazioni per grandi campioni delle regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 8.2. Esempio 8.4.1. In un esperimento stata misurata la secrezione di tromboglobulina urinaria in 12 pazienti sani e in 12 pazienti diabetici, ottenendo in questa maniera i dati della Tavola 8.4.1. Si sospetta che i pazienti diabetici abbiano una secrezione di tromboglobulina pi elevata dei pazienti sani, ovvero si vuole verificare il sistema di ipotesi L! J ! J V contro L" J ! J V. Tavola 8.4.1. Secrezione di tromboglobulina.
paziente " # $ % & ' ( ) * "! "" "# sani B3 <3 %" " '$ # () $ )& % )* & "!% ' ""& ( "#! * "$) "" "(' "$ #%$ "' $(# "* diabetici C3 <3 ""' ) "#" "! "'" "# "() "% #%! "& #)) "( $$* ") %!( #! &"$ #" &'# ## '"( #$ '*# #%
Fonte: van Oost, Veldhayzen, Timmermans e Sixma (1983) Si noti che la mediana del campione misto compresa fra 16.1 e 17.6, per cui si ha 6 3. Dal momento che PrP $ F$ "# "##%"#% #%# #$ F #$*(* !!!)! ,
allora la significativit osservata risulta 9== !!!)!, un valore molto basso che porta a respingere l'ipotesi di base. Sulla base dell'evidenza empirica si deve concludere che i pazienti diabetici hanno una secrezione di tromboglobulina pi elevata dei pazienti sani, in
88
quanto si pu respingere L! ad ogni livello di significativit !!!)!. L'approssimazione normale ragionevole, in quanto il valore esatto risulta PrP $ !!"*'. 8.5. Le prestazioni del test di Mann-Whitney-Wilcoxon e del test della mediana. La potenza del test di Mann-Whitney-Wilcoxon, del test della mediana e del test di Student per due campioni sono state calcolate mediante simulazione per alcune distribuzioni e per numerosit 8" 8# & "! "&. Le alternative scelte sono state J !! 5 !$ 5 !' 5 !* 5 dove 5# rappresenta la varianza della distribuzione ipotizzata. Per la distribuzione di Chauchy 5 denota il valore per cui Pr\ 5 F". I test di Mann-Whitney-Wilcoxon e della mediana sono stati casualizzati al fine di ottenere un livello di significativit pari a !!& per tutti i test. I risultati della simulazione sono riportati nella Tavola 8.5.1. Tavola 8.5.1. Potenza del test di Mann-Whitney-Wilcoxon, del test della mediana e del test di Student per due campioni.
distribuzione 0.05 Y -"# " !!&!!&!!& R - " !!&!!&!!& P9- " !!&!!&!!& I.- " !!&!!&!!& G2- " !!&!!&!!$ IJ" " !!&!!&!!% Y -"# " !!&!!&!!& R - " !!&!!&!!& P9- " !!&!!&!!& I.- " !!&!!&!!& G2- " !!&!!&!!$ IJ" " !!&!!&!!% Y -"# " !!&!!&!!& R - " !!&!!&!!& P9- " !!&!!&!!& I.- " !!&!!&!!& G2- " !!&!!&!!$ IJ" " !!&!!&!!& 0.$5 0.'5 8" & 8# & !""!!*!"! !#!!"$!"* !""!"!!"" !#"!"'!## !"#!""!"" !#$!"(!## !"$!"#!"# !#(!##!#& !"#!""!!' !#"!"*!"$ !"(!""!"% !$$!##!#* 8" "! 8# "! !"&!"!!"' !$#!"(!$& !"&!"%!"' !$#!#&!$' !"&!"$!"' !$(!#(!$( !"*!")!"( !%%!%!!$) !"&!"'!!( !$#!$$!"% !#%!"'!"* !&$!$&!%" 8" "& 8# "& !"*!""!"* !%(!#'!%) !"*!"&!#! !%)!$'!%( !#!!"(!#! !%*!$*!&! !#*!#(!#" !&)!&%!&" !#"!##!!) !%%!%)!"& !$%!#!!#$ !("!%*!&$ 0.*5 !$$!"*!$$ !$'!#%!$& !$)!#(!$) !%$!$$!%# !$!!#*!#! !&!!$%!%' !&&!#*!'" !'!!%$!'# !'#!%(!'$ !(!!'!!'& !&$!&%!## !()!&)!'& !(#!%!!() !()!'!!(( !)"!'(!() !)&!()!() !'*!(%!#% !*#!(#!)!
Dalla Tavola 8.5.1 evidente che il test di Mann-Whitney-Wilcoxon dimostra ottime prestazioni rispetto agli altri due test per tutte le distribuzioni. Il test della mediana dimostra buone prestazioni solo per una distribuzione a code particolamente pesante quale la distribuzione di Chauchy. Il test di Student per due campioni dimostra prestazioni quasi sempre inferiori al test di Mann-Whitney-Wilcoxon. Inoltre per distribuzioni quali la Cauchy e l'esponenziale si noti che il test di Student per due campioni non mantiene neppure il livello di significativit. Per quanto riguarda le prestazioni asintotiche del test di Mann-WhitneyWilcoxon, dall'Esempio 8.2.1 si ha eff[ "#/ " / (

0 B# .B ,
per cui l'efficienza asintotica relativa del test di Mann-Whitney-Wilcoxon rispetto al test di Student per due campioni risulta
I test per i parametri di posizione: due campioni indipendenti EAR[ X "#5# (
89
0 B# .B# .
Si noti che si ottenuto la stessa efficienza asintotica del test di Wilcoxon rispetto al test di Student per un campione, per cui si pu considerare la Tavola 6.6.2 dove sono tabulati i valori di EAR[ X EAR[ X per alcune distribuzioni simmetriche. Dunque anche in questo caso dal punto di vista asintotico il test di Mann-Whitney-Wilcoxon dimostra ottime prestazioni. Si noti che per una distribuzione non simmetrica quale l'esponenziale si verifica inoltre che EAR[ X $. Per quanto riguarda l'efficacia del test della mediana, dall'Esempio 8.2.2 si ha effP %/ " / 0 B!& ,
per cui l'efficienza asintotica relativa del test della mediana rispetto al test di Student per due campioni risulta EARPX %5# 0 B!& # . Si noti che si ottenuto la stessa efficienza asintotica del test dei segni rispetto al test di Student per un campione, per cui si pu considerare la Tavola 6.2.2, dove sono tabulati i valori di EARPX EARFX per alcune distribuzioni simmetriche. Per una distribuzione non simmetrica quale l'esponeziale immediato verificare inoltre che EARPX ". Si noti infine che l'efficienza asintotica relativa del test di Mann-Whitney-Wilcoxon rispetto al test della mediana risulta EAR[ P
$ ( 0 B# .B# . 0 !#
Anche in questo caso si ovviamente ottenuto la stessa efficienza asintotica del test di Wilcoxon rispetto al test dei segni, per cui si pu considerare la Tavola 6.6.3, dove sono tabulati i valori di EAR[ P EAR[ F per alcune distribuzioni simmetriche. Per una distribuzione non simmetrica quale l'esponeziale immediato verificare inoltre che EAR[ P $.
Capitolo 9 I test per i parametri di scala: due campioni indipendenti

9.1. Le statistiche lineari dei ranghi per i parametri di scala. Si consideri due campioni casuali indipendenti \" \# \8" e ]" ]# ]8# e supponiamo che il campione misto \" \8" ]" ]8# abbia funzione di ripartizione congiunta J8 i(J , dove 8 8" 8# . Dalla definizione della classe i(J immediato verificare che il parametro ( rappresenta in effetti il rapporto fra i parametri di scala relativi alle variabili casuali da cui provengono i campioni. Inoltre, dalla definizione di i(J evidente che si suppone implicitamente che le due distribuzioni abbiano uguali parametri di posizione. Risulta dunque interessante verificare il sistema di ipotesi L! ( " J V contro un'alternativa bilaterale L" ( " J V o direzionale L" ( " (( ") J V. Una classe di statistiche test distribution-free opportuna in questo sistema di ipotesi definita di seguito. Definizione 9.1.1. Siano \" \# \8" e ]" ]# ]8# due campioni casuali indipendenti tali che il campione misto abbia funzione di ripartizione congiunta J8 i"J , dove 8 8" 8# . Siano V" V# V8" i ranghi assegnati a \" \# \8" e siano V8" " V8" # V8 i ranghi assegnati a ]" ]# ]8# rispettivamente nel campione misto. Se le costanti di regressione nella Definizione 7.2.1 sono date da -3 " ! 3 " # 8" 3 8" " 8
e i punteggi +3 (3 " # 8) sono tali che (tipo 1) ! +" +# +8 "# +8 "# +8 ! , o (tipo 2) +" +# +8 "# ! , ! +8 "# +8 , allora una statistica del tipo
8 8"
X
3"
-3+V3
3"
+V3
detta statistica lineari dei ranghi per i parametri di scala.
Si noti che per il Corollario 2.4.6 sotto ipotesi di base la statistica X distribution-free sulla classe i"J VJ . La statistica X sensibile a variazioni del parametro (, in quanto se non vera l'ipotesi di base X tende ad assumere valori piccoli o elevati. Esempio 9.1.1. Se i punteggi sono scelti come
I test per i parametri di scala: due campioni indipendenti
91
+3 3
" 8 "# , 3 " # 8 , #
allora soddisfano le condizioni della Definizione 9.1.1 (punteggi tipo 2). In questo caso si ottiene la cosiddetta statistica di Mood data da
8"
Q
3"
V3
" 8 "# . #
Anche i punteggi " " +3 8 " 3 8 " , 3 " # 8 , # # soddisfano le condizioni della Definizione 9.1.1 (punteggi tipo 1). In questo caso si ottiene la cosiddetta statistica di Ansari-Bradley, data da
8"
E
3"
" " 8 " V3 8 " . # #
Il seguente teorema fornisce la media e la varianza di una statistica lineare dei ranghi per i parametri di scala quando vera l'ipotesi di base. Teorema 9.1.2. Se il campione casuale misto \" \8" ]" ]8# possiede funzione di ripartizione congiunta J8 i"J , allora per una statistica lineare dei ranghi per i parametri di scala X si ha EX 8" + e VarX 8" 8# # = , 8" +
e =# sono definite nel Lemma 7.1.2. dove + + Dimostrazione. E' analoga a quella del Teorema 8.1.2.
Il seguente teorema fornisce le condizioni per cui una statistica lineare dei ranghi per i parametri di scala simmetrica quando vera l'ipotesi di base. Teorema 9.1.3. Se il campione casuale misto \" \8" ]" ]8# possiede funzione di ripartizione congiunta J8 i"J , allora una statistica lineare dei ranghi per i parametri di scala X simmetrica rispetto a EX se si ha 8" 8# , o + 3 + 8 " 3 5 , 3 " # 8 , dove 5 una costante. Dimostrazione. E' analoga a quella del Teorema 8.1.3.
92
I test per i parametri di scala:due campioni indipendenti
Esempio 9.1.2. Si consideri la statistica Q dell'Esempio 9.1.1. Tenendo presente il Teorema A.2.1, immediato verificare che " + 8 da cui EQ 8" + " 8" 8# " . "# " " < 8 "# # 8 <"
8 8
<#
<"
" 8 "# %
" " " 8 "#8 " 8 "# 8# " , ' % "#
Inoltre, sempre tenendo presente il Teorema A.2.1, =# + " 8

8
<
<" 8
" " 8 "# 8# "# # "#
" 8 " 8 8 "$ #8 da cui

8 8
<
<"
" " 8 "% 8# "# # "%% $8 "# < #8 <"

$ 8 8
#8 " < 8 <"

%
<#
<"
<
<"
" " " 8 "% 8# "# 8# "8# % , "' "%% ")!
VarQ Dal momento che
8" 8 # # " =+ 8" 8# 8 "8# % . 8" ")! " " 8 "# 8 " 3 8 "# # #
+3 +8 " 3 3
#3
" 8 "# , 3 " # 8 , #
allora dal Teorema 9.1.3 risulta che Q simmetrica solo se 8" 8# .
Esempio 9.1.3. Si consideri la statistica E dell'Esempio 8.1.1. Tenendo presente il Teorema A.2.1, immediato verificare che per 8 pari si ha " + 8 " " 8 " < 8 " # # <"
8
93
" # 8 " # 8
" " " 8 " < 8 " # # 8 <"
8#
8#
8 "
<"
# 8
8#
<
<"
" " " " 8 " 8 " 8 # 8 # # # % % nell'Esempio 9.1.2, si ha e inoltre, tenendo presente l'espressione di + =# + " 8
8
" 8
" " " 8 " < 8 " 8 ## # # % <" " " # " " # " 8 "# 8 8# " 8 8# % . # "' "# "' %)
<
<"
Dunque, per 8 pari si ha " 8" 8 # EE 8" + % e VarE Inoltre, per 8 dispari si ha " + 8 " " " # 8 " < 8 " 8 " # # # 8 <" " " 8 " # 8
8"# 8 8"# <"
8" 8# # 8" 8# 8# 4 =+ . 8" %)8 "
" 8 " < #
8 "
<"
# 8
8"#
<
<"
" 8# " 8# "# 8 "# 8 " # #8 %8 %8 nell'Esempio 9.1.2, si ha e inoltre, sempre tenendo presente l'espressione di + =# + " 8
8
" 8
" " 8 "# # 8 " < 8 " # # %8 <"
<
<"
" 8# "# " 8# " 8# "8# $ # 8 "# 8 " . # "68# "# "'8# %)8#
Dunque per 8 dispari si ha

# 8" 8 " EE 8" + %8
94 e
VarE Inoltre, dal momento che
8" 8 # # 8" 8# 8 "8# $ =+ . 8" %)8#
+3 +8 " 3 " " " " 8 " 3 8 " 8 " 8 " 3 8 " # # # # 8"# 3 " 8 " , 3 " # 8 , #
allora dal Teorema 9.1.3 si ottiene che E simmetrica solo se 8" 8# .
Il seguente teorema consente di ottenere la funzione generatrice di probabilit di una statistica lineare dei ranghi per i parametri di scala nel caso che i punteggi siano valori interi. Teorema 9.1.4. Se il campione casuale misto \" \8" ]" ]8# possiede funzioni di ripartizione congiunta J8 i"J , allora la funzione generatrice di probabilit di una statistica
8 lineare dei ranghi per i parametri di scala X data da 8 " "
volte il coefficiente di ordine
8" del polinomio in ?
$ " ?@+3 .
8 3"
Dimostrazione. E' identica a quella del Teorema 8.1.4.
Quando i punteggi non sono interi il precedente teorema pu essere ancora impiegato determinando una trasformata biunivoca che discretizza i punteggi originali. Dal momento che la distribuzione di una statistica lineare dei ranghi per i parametri di scala sotto l'ipotesi di base L! ( " J V si pu ottenere mediante il Teorema 9.1.4, allora si pu determinare le appropriate regioni critiche del test. Se l'alternativa bilaterale, ovvero L" ( " J V, allora il primo campione tende ad assumere i ranghi pi bassi o elevati e quindi si respingere l'ipotesi di base per determinazioni sia troppo elevate che troppo piccole di X . Fissato quindi un livello di significativit , allora la regione critica data dall'insieme g" > > >8" 8# # > >8" 8# "# , dove >8" 8# rappresenta il quantile di ordine della distribuzione di X per numerosit campionarie pari a 8" e 8# . Se l'alternativa direzionale del tipo L" ( " J V, il primo campione tende ad assumere i ranghi pi bassi se il test basato sui punteggi tipo 2 e quindi si respinge l'ipotesi di base per determinazioni troppo basse di X . Analogamente, il primo campione tende ad assumere i ranghi pi alti se il test basato sui punteggi tipo 1 e quindi si respinge l'ipotesi di base per determinazioni troppo alte di X . Fissato quindi un livello di significativit , per i punteggi tipo 2 si ha la regione critica g" > > >8" 8# ,
I test per i parametri di scala: due campioni indipendenti mentre per i punteggi tipo 1 si ha la regione critica g" > > >8" 8# " .
95
Al contrario, se l'alternativa direzionale del tipo L" ( " J V, allora il primo campione tende ad assumere i ranghi pi elevati se il test basato sui punteggi tipo 2 e quindi si respinge l'ipotesi di base per determinazioni troppo elevate di X . Analogamente, il primo campione tende ad assumere i ranghi pi bassi se il test basato sui punteggi tipo 1 e quindi si respinge l'ipotesi di base per determinazioni troppo basse di X . Fissato quindi un livello di significativit , per i punteggi tipo 2 si ha la regione critica g" > > >8" 8# " , mentre per i punteggi tipo 1 si ha la regione critica g" > > >8" 8# . Si noti infine che il test basato sulla X per i precedenti sistemi di ipotesi corretto al livello di significativit . Infatti, dal momento che si pu dimostrare che TX ( J Pr(J X g" una funzione monotona crescente per ( " e monotona decrescente per ( " per ogni J V, allora risulta TX ( J , ovvero il test corretto. Risulta ora interessante determinare la scelta dei punteggi che fornisce il test localmente pi potente per verificare il sistema di ipotesi L! ( " J J! contro L" ( " J J! . In questo caso si ha la seguente definizione di test localmente pi potente. Definizione 9.1.5. Se il campione casuale misto \" \8" ]" ]8# possiede funzione di ripartizione congiunta J8 i(J , dove 8 8" 8# , allora si consideri il sistema di ipotesi L! ( " J J! contro L" ( " J J! , dove J! V. Il test basato sulla statistica lineare dei ranghi per i parametri di scala X detto localmente pi potente se esiste un % ! tale che per ogni livello di significativit naturale si ha TX ( TX ( , " ( " % , per ogni statistica lineare dei ranghi per i parametri di scala X .
Il prossimo teorema fornisce la scelta ottima dei punteggi per la costruzione del test localmente pi potente. Al solito si noti che l'utilit di questo teorema consiste solamente nell'evidenziare la struttura ottima dei punteggi al variare della funzione di ripartizione, dal momento che questa non mai nota in pratica. Teorema 9.1.6. Si consideri il campione casuale misto \" \8" ]" ]8# con funzione di ripartizione congiunta J8 i(J , e sia 0 la funzione di densit corrispondente a J . Si assuma inoltre che 0 w esista, sia assolutamente continua e che
w ( 0 B .B .
Allora il test localmente pi potente per verificare il sistema di ipotesi L! ( " J J! contro L" ( " J J! basato sulla statistica lineare dei ranghi per i parametri di scala
8"
X
3"
+ V3 ,
96 dove
+ 3 E Z3
0 w Z3 , 3 " # 8 , 0 Z3
e Z" Z# Z8 la statistica ordinata relativa al campione casuale misto \" \8" ]" ]8# . Dimostrazione. Si veda Hettmansperger e McKean (1998). Analogamente a quanto visto per la scelta ottima dei punteggi nel caso di una statistica lineare dei ranghi con segno, anche in questo caso si pu dimostrare che la scelta ottima dei punteggi non dipende dal parametro di posizione e di scala della distribuzione. Esempio 9.1.4. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 i(J , dove J la funzione di ripartizione di una R ! " e 0 rappresenta la relativa funzione di densit. E' facile dimostrare che le condizioni del Teorema 9.1.6 sono soddisfatte. Inoltre dall'Esempio 5.2.1 si ha 0 w B0 B B, per cui la scelta ottimale dei punteggi data da
# + 3 EZ3 , 3 " # 8 ,
dove Z" Z# Z8 la statistica ordinata relativa ad un campione casuale proveniente da una R ! ". 9.2. La distribuzione per grandi campioni delle statistiche lineari dei ranghi per i parametri di scala. In questa sezione vengono considerate le propriet per grandi campioni delle statistiche lineari dei ranghi per i parametri di scala. Teorema 9.2.1. Se \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 i"J , allora per una statistica lineare dei ranghi per i parametri di scala
8"
X X8
3"
+8 V3 ,
i cui punteggi +8 3 (3 " # 8) soddisfano le condizioni del Teorema 7.2.2, risulta X8 EX8 . R ! " , VarX8 dove EX8 e VarX8 sono definite nel Teorema 9.1.2. Dimostrazione. Segue dall'Esempio 7.2.1 e dal Teorema 7.2.2.
Dunque, fissato un livello di significativit , per 8 la regione critica per verificare L! ( " J V contro l'alternativa L" ( " J V, pu essere approssimata dall'insieme > > EX8 D# VarX8 > EX8 D"# VarX8 .
Analogamente, per 8 la regione critica per verificare l'alternativa L" ( " J V, per i punteggi tipo 2 pu essere approssimata dall'insieme
I test per i parametri di scala: due campioni indipendenti > > EX8 D VarX8 , mentre per i punteggi tipo 1 pu essere approssimata dall'insieme > > EX8 D" VarX8 . > > EX8 D" VarX8 , > > EX8 D VarX8 .
97
Al contrario, la regione critica per verificare l'alternativa L" ( " J V, per i punteggi tipo 2 pu essere approssimata dall'insieme
mentre per i punteggi tipo 1 pu essere approssimata dall'insieme
Mediante il Teorema 3.1.8 si pu dimostrare inoltre che la successione di test basata su X8 coerente. Per quanto riguarda l'efficacia delle statistiche lineari dei ranghi per i parametri di scala si ha il seguente teorema. Teorema 9.2.2. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 i(J , e si consideri il sistema di ipotesi L! ( " J V contro L" ( (3 J V, dove (3 una successione di alternative tali che (3 " -83 con costante. Data una statistica lineare dei ranghi per i parametri di scala
8"
X X8
3"
+8 V3 ,
i cui punteggi +8 3 (3 " # 8) soddisfano le condizioni del Teorema 9.2.1, allora l'efficacia del test basato su X8 risulta effX / " / ( 9?90 ? .?( 9? 9# .? ,
" " ! !
dove / 8lim 8 8 (! / ") e " 90 ? " J " ? (1967). Dimostrazione. Vedi Hayek e idak 0 w J " ? . 0 J " ?
Esempio 9.2.1. Si consideri la statistica Q Q8 del test di Mood dell'Esempio 9.1.1. Analogamente all'Esempio 7.2.2 al fine di determinare la distribuzione asintotica di Q8 conveniente considerare la statistica X8 ,8 Q8 con ,8 8 "# . La funzione punteggio relativa alla statistica X8 , data da 9? ? "## I!" ?, tale che
" " " # # # ( 9? 9 .? ( ? "# ""# .? ")! ! !
e dunque le condizioni del Teorema 7.2.2 sono soddisfatte. Inoltre, risulta
98
I test per i parametri di scala:due campioni indipendenti ( 9?90 ?.? ( " J

" " ! !
"
0 w J " ? ? ? "## .? " 0 J ?
" " 0 w J " ? ( J " ? ? "## .? , " ? "# 0 J !
da cui, mediante la trasformazione di variabile B J " ? con ? J B e .? 0 B.B, e integrando successivamente per parti, si ha ( 9?90 ? .?
" ! " 0 w B ( B J B "## 0 B .B "# 0 B
" BJ B "## 0 B J B "## 0 B .B ( "#
#BJ B "#0 B# .B
" " # J B "#$ # ( BJ B "#0 B .B "# $
#(
BJ B "#0 B# .B .
Quindi l'efficacia del test di Mood risulta effQ / " /
#' BJ B "#0 B# .B "")!

(#!/ " / (
BJ B "#0 B# .B .
Esempio 9.2.2. Si consideri la statistica E E8 del test di Ansari-Bradley dell'Esempio 9.1.1. Analogamente all'Esempio 7.2.2 al fine di determinare la distribuzione asintotica di E8 conveniente considerare la statistica X8 ,8 E8 con ,8 8 ". La funzione punteggio relativa alla statistica X8 , data da 9? ? "# I!" ?, tale che
" " # # 9 ? 9 .? ( ( ? "# "% .? %) ! ! "
e dunque le condizioni del Teorema 7.2.2 sono soddisfatte. Inoltre, risulta

" ( 9?90 ?.? ( " J ? " " ! !
0 w J " ? ? "# .? 0 J " ?

" " 0 w J " ? " ( J ? ? "# .? , % 0 J " ? !
99
da cui, mediante la trasformazione di variabile B J " ? con ? J B e .? 0 B.B, se J B!& "#, e integrando successivamente per parti, si ha ( 9?90 ?.?
" ! " 0 w B ( B J B "# 0 B .B % 0 B
B!& " ( B"# J B0 w B .B ( BJ B "#0 w B .B % B!&
B!& B!& " !& "# J BB0 BB "# J B0 B .B B0 B# .B ( ( %
"#
J BB0 B B!&
B!&
J B "#0 B .B (
B!&
B0 B# .B
B!& " " # B!& "# J B ( B0 B# .B 4 # B!& " # # "# J B# B0 B .B B0 B .B B0 B# .B . ( ( ( B!& # B!& B!& B!& 'B B0 B# .B ' B0 B# .B
!&
Quindi l'efficacia del test di Ansari-Bradley risulta effE / " /
"%)
%)/ " / (
B!&
B0 B# .B (
B!&
B0 B# .B .
9.3. Il test di Mood. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 i(J . Il test di Mood basato sulla statistica
8"
Q
3"
V3
" 8 "# , #
descritta nell'Esempio 9.1.1. Mediante questo test si pu verificare un'ipotesi di base del tipo L! ( " J V. Ovviamente, la statistica Q una statistica lineare dei ranghi per i parametri di scala con i punteggi di tipo 2 scelti come +3 3 8 "## (3 " # 8). Al fine di calcolare la funzione di probabilit :8" 8# 7 di Q , conveniente considerare i punteggi +w 3 %+3 (3 " # 8) al posto dei punteggi originali. In questa maniera la statistica Q w basata sui nuovi punteggi prende valori solo sugli interi ed equivalente alla statistica originale essendo Q w %Q . Dunque, dal Teorema 9.1.4, la
100

"
8 funzione generatrice di probabilit PQ w @ di Q w data da 8 "
$ " ?@#38" .
8
#
3"
Esempio 9.3.1. Per 8" # e 8# # si ha $ " ?@#3&

%
#
3"
" #@ #@* ? @# %@"! @") ?# #@"" #@"* ?$ @#! ?% , da cui PQ w @ " # @ %@"! @") . '
Poich le probabilit :## 7w corrispondono ai coefficienti del polinomio PQ w @, immediato ottenere la Tavola 9.3.1. Tavola 9.3.1. Funzione di probabilit di Q w per 8" # e 8# #.
7w :## 7w # "' "! %' ") "'
Inoltre, tenendo presente la relazione fra Q e Q w dalla Tavola 9.3.1 immediato ottenere la Tavola 9.3.2. Tavola 9.3.2. Funzione di probabilit di Q per 8" # e 8# #.
7 :## 7 "# "' &# %' *# "'
Se l'ipotesi di base vera, dall'Esempio 9.1.2 si ha EQ e VarQ " 8" 8# 8 "8# % . ")! " 8" 8# " "#
Inoltre, dall'Esempio 9.1.2, risulta che la distribuzione di Q simmetrica solo se 8" 8# . Infine, dal Corollario 2.4.6 si ha che Q distribution-free su i"J VJ e di conseguenza anche il test di Mood distribution-free. Dal momento che la distribuzione della statistica Q sotto ipotesi di base specificata, le appropriate regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 9.1.
101
Esempio 9.3.2. Nella Tavola 9.3.3 sono riportati i tempi in anni dall'elezione alla morte per gli ultimi 8 presidenti degli Stati Uniti e degli ultimi 8 papi (dati aggiornati al 1991). Tavola 9.3.3. Tempi di sopravvivenza dall'elezione in anni.
" # $ % & ' ( ) presidente Harding Coolidge Hoover Roosvelt Truman Kennedy Eisenhower Johnson B3 # "! $' "# #) $ "' * <3 # ( "' * "& $ "" ' %+<3 "'* * ##& " "'* "#" #& #& papa Leone XIII Pio X Benedetto XV Pio XI Pio XII Giovanni XXIII Paolo VI Giovanni Paolo C3 #& "" ) "( "* & "& ! <3 %+<3 "% "#" ) " & %* "# %* "$ )" % )" "! * " ##&
Fonte: Lunn e McNeil (1991) Si vuole verificare se esiste una differente dispersione fra i due gruppi, ovvero si vuole verificare il sistema di ipotesi L! ( " J V contro L" ( " J V. Dal momento che per questi dati immediato verificare che 7 ")', per 8" ) e 8# ) si ha PrQ ")' !$&#& e quindi la significativit osservata risulta 9== # !.$&#& !.(!&!. Questo una significativit osservata piuttosto alta che porta ad accettare l'ipotesi di base. Per quanto riguarda la distribuzione per grandi campioni della statistica Q Q8 sotto ipotesi di base, dal Teorema 9.2.1, si ha Q8 8" 8# ""# . R ! " . # 8" 8# 8 "8 %")! La convergenza della statistica di Mood abbastanza veloce anche per campioni moderati, posto che entrambe le numerosit siano abbastanza elevate (8" "& e 8# "&). Le approssimazioni per grandi campioni delle regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 9.2. 9.4. Il test di Ansari-Bradley. Sia \" \8" ]" ]8# un campione casuale misto con funzione di ripartizione congiunta J8 i(J . Il test di Ansari-Bradley basato sulla statistica
8"
E
3"
" " 8 " V3 8 " # #
descritta nell'Esempio 9.1.1. Mediante questo test si pu verificare un'ipotesi di base del tipo L! ( " J V. Ovviamente, la statistica E una statistica lineare dei ranghi per i parametri di scala con i punteggi di tipo 1 scelti come +3 8 "# 3 8 "# (3 " # 8). Al fine di calcolare la funzione di probabilit :8" 8# + di E, si noti che conveniente considerare i punteggi +w 3 #+3 (3 " # 8) al posto dei punteggi originali. In questa maniera la statistica Ew basata sui nuovi punteggi prende valori solo sugli interi ed equivalente alla statistica originale essendo Ew #E. Dunque, dal Teorema 9.1.4,
8 la funzione generatrice di probabilit PEw @ di Ew data da 8 " "
102
I test per i parametri di scala:due campioni indipendenti $ " ?@8"#38" .

8 3"
Esempio 9.4.1. Per 8" # e 8# # si ha $ " ?@&#3&

% 3"
" #@# #@% ? @% %@' @) ?# #@) #@"! ?$ @"# ?% , da cui PEw @ " % @ %@' @) . '
Poich le probabilit :## +w corrispondono ai coefficienti del polinomio PEw @, immediato ottenere la Tavola 9.4.1. Tavola 9.4.1. Funzione di probabilit di Ew per 8" # e 8# #.
+w :## +w % "' ' %' ) "'
Inoltre, tenendo presente la relazione fra E e Ew dalla Tavola 9.4.1 immediato ottenere la Tavola 9.4.2. Tavola 9.4.2. Funzione di probabilit di E per 8" # e 8# #.
+ :## + # "' $ %' % "'
Se l'ipotesi di base vera, dall'Esempio 9.1.3 per 8 pari si ha EE e VarE mentre per 8 dispari si ha EE e VarE 8" 8# 8 "8# $ . %)8# 8" 8 "# %8 8" 8# 8# % , %)8 " " 8" 8 # %
Inoltre, dall'Esempio 9.1.3, risulta che la distribuzione di E simmetrica solo se 8" 8# . Infine, dal Corollario 2.4.6 si ha che la statistica E distribution-free su i"J VJ e di
103
conseguenza anche il test di Ansari-Bradley distribution-free. Dal momento che la distribuzione della statistica E sotto ipotesi di base specificata, le appropriate regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 9.1. Esempio 9.4.2. Sebbene i dati dell'Esempio 6.1.1 siano relativi ad un solo campione casuale di sfere di acciaio prodotte da un macchinario, sono tuttavia disponibili anche i dati relativi ad un secondo campione casuale proveniente da un altro macchianario che produce ancora sfere di acciaio del diametro di 1 micron. Si dispone quindi di due campioni casuali indipendenti e si hanno quindi i dati della Tavola 9.4.3. Tavola 9.4.3. Diametro delle sfere in micron.
sfera " # $ % & ' ( ) * "! macchianario 1 B3 <3 #+<3 "") ) "' "%# "# ") !'* " # !)) % ) "'# "& "# "!* ( "% "&$ "% "% "!# ' "# ""* * ") "$# "" #! macchinario 2 C3 <3 #+<3 "(# ") ' "'$ "' "! "'* "( ) !(* $ ' "(* "* % !(( # % "%% "$ "' "#* "! #! "*' #! # !** & "!
Fonte: Romano (1977) Si sospetta che il secondo macchinario produca sfere con minore precisione del primo, ovvero si vuole verificare il sistema di ipotesi L! ( 1 J V contro L" ( " J V. Dal momento che per questi dati immediato verificare che + '(, per 8" "! e 8# "! si ha PrE '( !.!%!$ e quindi la significativit osservata risulta 9== !.!%!$. Questa una significativit osservata bassa che porta a respingere l'ipotesi di base, ovvero sulla base dell'evidenza empirica si deve ritenere che il secondo macchinario sia meno preciso del primo. Per quanto riguarda la distribuzione per grandi campioni della statistica E E8 sotto ipotesi di base, dal Teorema 9.2.1, si ha E8 EE8 . R ! " . VarE8 La convergenza della statistica di Ansari-Bradley abbastanza veloce anche per campioni moderati, posto che entrambe le numerosit siano abbastanza elevate (8" "& e 8# "&). Le approssimazioni per grandi campioni delle regioni critiche del test per alternative bilaterali o direzionali si possono facilmente ottenere tenendo presente la discussione fatta nella 9.2. 9.5. Le prestazioni del test di Mood e del test di Ansari-Bradley. Per quanto riguarda le prestazioni asintotiche del test di Mood, dall'Esempio 9.2.1 si ha effQ (#!/ " / (
BJ B "#0 B# .B ,
104
per cui, utilizzando i risultati dell'Esempio 3.2.4, l'efficienza asintotica relativa del test di Mood rispetto al test di Snedecor risulta EARQ J
")!# # # # ( BJ B "#0 B .B . 5%
La Tavola 9.5.2 fornisce i valori dell'efficienza asintotica relativa EARQ J per alcune distribuzioni. E' evidente che anche dal punto di vista asintotico il test di Mood dimostra buone prestazioni. Tavola 9.5.2. EAR del test di Mood rispetto al test di Snedecor.
distribuzione EARQ J Y - $ " R . 5 # "&#1# !(&** P9- $ " I.. $ '#&&(' "!)&" G2- $ I- 5 ""&"%% !(*)'
Per quanto riguarda le prestazioni asintotiche del test di Ansari-Bradley, dall'Esempio 9.2.2 si ha effE %)/ " / (
B!&
B0 B# .B (
B!&
B0 B# .B ,
per cui utilizzando i risultati dell'Esempio 3.2.4, l'efficienza asintotica relativa del test di Ansari-Bradley rispetto al test di Snedecor risulta EAREJ
B!& "## # # % ( B0 B .B ( B0 B# .B# . 5 B!&
La Tavola 9.5.3 fornisce i valori dell'efficienza asintotica relativa EAREJ per alcune distribuzioni. E' evidente le prestazioni del test di Ansari-Bradley anche in questo caso sono relativamente scarse, eccetto che per una distribuzione a code pesanti quale la Chauchy. Tavola 9.5.3. EAR del test di Ansari-Bradley rispetto al test di Snedecor.
distribuzione EAREJ Y - $ $& !' R . 5 # '1# !'!(* P9- $ %% ln # "# "& !)$(* I.. $ "&"' !*$(& G2- $ I- 5 '*# ln # "# "' !'%$&
Si noti infine che l'efficienza asintotica relativa del test di Mood rispetto al test di AnsariBradley risulta EARQ E "& (

BJ B "#0 B# .B# (
B!&
B0 B# .B (
B!&
B0 B# .B# ,
La Tavola 9.5.4 fornisce i valori dell'efficienza asintotica relativa EARQ E per alcune distribuzioni. E' evidente che dal punto di vista asintotico il test di Mood risulta superiore al test di Ansari-Bradley.
105
Tavola 9.5.4. EAR del test di Mood rispetto al test di Ansari-Bradley.

distribuzione EARQ E Y - $ &$ "'''( R . 5 # &% "#& P9- $ "&%% ln # "# ""*$& I.. $ "#&"!) ""&(% G2- $ "&"' !*$(& I- 5 &#(# ln # "# "#%"!
Capitolo 10 I test per l'associazione

10.1. Verifica di ipotesi sull'associazione. Si consideri innanzitutto il modello statistico distribution-free
# VJ
J8 J8 B" B# B8 C" C# C8 $ J B3 C3 J V# ,
8 3"
dove V# rappresenta la classe delle funzioni di ripartizione di un vettore bivariato di variabili # casuali continue. Ovviamente, VJ rappresenta il modello statistico relativo ad un campione casuale proveniente da un vettore bivariato di variabili casuali continue. Una sottoclasse di # VJ data dal modello statistico distribution-free
# \J J8 J8 B" B# B8 C" C# C8 $ J" B3 J# C3 J" J# V . " J# 8 3" # Evidentemente, \J rappresenta il modello statistico relativo ad un campione casuale " J# proveniente da un vettore bivariato di variabili casuali continue a componenti indipendenti. # Un sistema di ipotesi interessante da verificare quindi L! J8 \J contro l'ipotesi " J# # # alternativa L" J8 VJ \J" J# , ovvero verificare l'indipendenza delle componenti del vettore bivariato di variabili casuali da cui proviene il campione casuale.
10.2. Il test di correlazione di Spearman. Se \" ]" \# ]# \8 ]8 un # campione casuale bivariato con funzione di ripartizione congiunta J8 VJ , si vuole verificare il sistema di ipotesi considerato nella 10.1. Una statistica test conveniente in questo caso il coefficiente di correlazione campionario di Spearman, che non altro che l'ordinario coefficiente di correlazione calcolato sul vettore dei ranghi relativo a \" \# \8 e sul vettore dei ranghi relativo a ]" ]# ]8 . Si indichi dunque con V" V# V8 il vettore dei ranghi relativo a \" \# \8 e con Y" Y# Y8 il vettore dei ranghi relativo a ]" ]# ]8 . Tenendo presente che " 8 e che " 8
8 3" 8
V3
3"
" 8
Y3
3"
" 8 " #
" " [V3 8 "]# # 8
[Y3
3"
" " 8 "]# 8# " , # "#
il coefficiente di correlazione campionario di Spearman dunque dato da
I test per l'associazione
107
VW
" 8
8 3" Y3 V3 8#
" % 8 "# "# ""# 88# "
Y3 V3
3"
$8 " . 8"
Il seguente teorema permette di ottenenre un'espressione pi semplice per il coefficiente di correlazione di Spearman. Teorema 10.2.1. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , per il coefficiente di correlazione di Spearman " J# si ha VW "# 88# "
8
Y3 V3
3"
$8 " . "# 8" 88# "
3V3
3"
$8 " . 8"
Dimostrazione. Dal momento che i vettori dei ranghi V" V# V8 e Y" Y# Y8 sono indipendenti in quanto trasformate di variabili casuali indipendenti, allora per ogni ?" ?# ?8 e8 si ha VW Y" ?" Y# ?# Y8 ?8 "# 88# "
8
Y3 V3
3"
$8 " . Y " ?" Y # ? # Y 8 ? 8 8"

8
"# 88# "
?3 V3
3"
$8 " . 8"
Se .3 la posizione del numero 3 (3 " # 8) nel vettore ?" ?# ?8 , allora ovviamente si ha "# 88# "
8
?3 V3
3"
$8 " "# 8" 88# "
4V.4
4"
$8 " . 8"
Tuttavia, dal momento che per il Teorema 2.4.3 V" V# V8 distribuito uniformente su e8 , essendo il vettore dei ranghi relativo ad un campione casuale, allora si ha . V" V# V8 V." V.# V.8 per qualsiasi permutazione ." .# .8 di " # 8. Dunque, risulta
. VW Y" ?" Y# ?# Y8 ?8
"# 88# "
4V.4
4"
$8 " . 8"
"# 88# "
3V3
3"
$8 " . 8"
Dal momento che questa equivalenza in distribuzione vale per ogni ?" ?# ?8 e8 , allora il teorema dimostrato. Dunque, in base al precedente teorema, il coefficiente di correlazione di Spearman pu essere calcolato semplicemente ordinando rispetto alle realizzazioni di ]" ]# ]8 e
108
successivamente assegnando il vettore dei ranghi alle realizzazioni di \" \# \8 . Si noti che se V3 3 (3 " # 8) allora esiste associazione positiva perfetta fra i ranghi ed infatti risulta VW "# 88# "
8
3#
3"
$8 " "# 88 "#8 " $8 " ". # 8" 88 " ' 8"
Al contrario, se V3 8 " 3 (3 " # 8) allora esiste associazione negativa perfetta fra i ranghi ed infatti risulta VW "# 88# "
8 8
38 " 3
3" 8
$8 " 8" $8 " 8"
"# 88 "
3
3"
"# 88# "
3#
3"
"# 88 " "# 88 "#8 " $8 " ". # 88 " # 88 " ' 8"
Indicando con W 8 3" 3V3 , si noti che VW una trasformata lineare di W . Dunque, evidente che VW e W forniscono test equivalenti. Tenendo presente la Definizione 7.1.1, immediato verificare che W una statistica lineare dei ranghi con le costanti di regressione pari a -3 3 (3 " # 8) e i punteggi pari a +3 3 (3 " # 8). Si noti che il supporto di W 88 "8 #' 88 "8 #' " 88 "#8 "'. Tenendo presente il Teorema 2.4.3 e denotando la funzione di probabilit di W con :8 = PrW =, allora si ha :8 = " -8 = , = 88 "8 #' 88 "#8 "' 8x
dove -8 = rappresenta il numero di permutazioni di " # 8 per cui W assume valore =. La funzione di probabilit di W (e di conseguenza quella di VW ) solitamente ottenuta mediante enumerazione, dal momento che non esistono metodi che ne facilitino il calcolo. Se l'ipotesi di base vera, dal momento che in questo caso si ha + - 8 "# e # # # =+ =- 8 ""#, dal Teorema 7.1.3 risulta EW e VarW da cui EVW e "# $8 " EW ! # 88 " 8" " # 8 8 "8 "# , "%% " 88 "# %
109
VarVW
8# 8#
"%% " VarW . # " 8"
Dal momento che +3 3 (3 " # 8), in modo analogo all'Esempio 7.1.5, si ottiene che W simmetrica rispetto a EW 88# "%. Di conseguenza, anche VW simmetrica rispetto a EVW !. Inoltre, dal Corollario 2.4.4, si ottiene che la statistica W # distribution-free su VJ" e dunque anche su \J , ovvero anche il test di Spearman " J# distribution-free. Se l'ipotesi di base non vera, W tende ad assumere valori bassi o elevati. Fissato quindi un livello di significativit , allora si sceglie come regione critica l'insieme g" = = =8# = =8"# , dove =8 rappresenta il quantile di ordine della distribuzione di W per una numerosit campionaria pari a 8. Esempio 10.2.1. I dati della Tavola 10.2.1 si riferiscono alla mortalit per cirrosi e al consumo di maiale nell'anno 1978 nelle 10 provincie del Canada. Tavola 10.2.1. Mortalit per cirrosi (per 100 000 abitanti) e consumo di maiale (in 51 per persona).
provincia Prince Edward Island Newfoundland Nova Scotia Saskatchewan New Brunswick Alberta Manitoba Ontario Quebec British Columbia C3 '& "!# "!' "$% "%& "'% "'' ")# "*! #(& B3 &) ') $' %$ %% &( '* (# "%* )% 3 " # $ % & ' ( ) * "! <3 & ' " # $ % ( ) "! *
Fonte: Nanji e French (1985) Si vuole verificare se esiste associazione fra la mortalit per cirrosi e il consumo di maiale. Dal momento che per questi dati immediato verificare che = $'!, allora per 8 "! si ha PrW $'! !!"&$ e quindi la significativit osservata risulta 9== # !!"&$ !!$!'. Dunque esiste associazione fra la mortalit per cirrosi e il consumo di maiale, in quanto si pu respingere L! ad ogni livello di significativit !!$!'. Si noti che esiste una associazione positiva, dato che risulta <W #$$$ !'*'*. Per quanto riguarda la distribuzione per grandi campioni della statistica W W8 sotto ipotesi di base, si noti che i relativi coefficienti di regressione verificano la condizione di Noether dal momento che lim 8
8 # - 8 ]# 3" [3 8 "#] lim 8 max [3 8 "#]# max [-8 3 - 8 ]#
"38
8 3" [-8 3
"38
88# ""# 88 " 8lim lim . 8 "# % 8 $8 "
110
In questo caso, notando che alla statistica W associata una funzione punteggio 9? ?I!" , tenendo presente l'Esempio 5.3.1, le condizioni del Teorema 7.2.2 sono soddifatte e quindi si ha W8 88 "# % . R ! " . 8# 8 "8 "# "%% Tenendo presente la discussione che segue il Teorema 7.2.2 si ha inoltre VW8 . VW8 8 " R ! " . "8 "
Fissato un livello di significativit , per 8 la regione critica pu essere dunque approssimata dall'insieme = = EW8 D# VarW8 = EW8 D"# VarW8 .
Esempio 10.2.2. I dati della Tavola 10.2.2 si riferiscono alle misure (in 7) fatte nel lancio del peso e del giavellotto dalle 25 atlete partecipanti alla gara di eptathlon femminile alle Olimpiadi del 1988. Tavola 10.2.2. Misure nel lancio del peso e del giavellotto (in 7).
atleta Joyner-Kersee - USA John - GDR Behmer - GDR Sablovskaite - URS Choubenkova - URS Schultz - GDR Fleming - AUS Greiner - USA Lajbnerova - CZE Bouraga - URS Wijnsma - HOL Dimitrova - BUL Schneider - SWI Braun - FRG Ruotsalainen - FIN Yuping - CHN Hagger - GB Brown - USA Mulliner - GB Hautenauve - BEL Kytola - FIN Geremias - BRA Hui-Ing - TAI Jeong-Me - KOR Launa - PNG C3 "&)! "'#$ "%#! "&#$ "%(' "$&! "#)) "%"$ "%#) "#'# "$!" "#)* ""&) "$"' "#$# "%#" "#(& "#'* "#') "")" ""'' "#*& "!!! "!)$ ""() B3 %&'' %#&' %%&% %#() %('% %#)# %!#) $)!! %##! $*!' $()' %!#( %(&! %%&) %&%% $)'! $&(' %%$% $((' $&') $*%) $*'% $*"% $*#' %'$) 3 #% #& "* #$ ## "( "# ") #" ) "& "$ $ "' ( #! "" "! * ' % "% " # & <3 ## "' "* "( #% "& "$ & "% ( % "# #& #! #" ' # ") $ " "! "" ) * #$
Fonte: Lunn e McNeil (1991) I dati sono ordinati in base alla posizione finale dell'atleta nella gara. Si interessati a conoscere se vi associazione fra il risultato ottenuto dalle atlete nella gara del lancio del peso e quello ottenuto dalle atlete nella gara del lancio del giavellotto. Dal momento che immediato verificare che per questi dati si ha = %%*$, allora risulta
I test per l'associazione PrW %%*$ " F%%*$ #& '('%'#& #% '('"%% " F"!!)! !"&'' ,
111
la significativit osservata risulta 9== # !"&'' !$"$#. Dunque non esiste associazione fra i risultati ottenuti nel lancio del peso e del giavellotto nella gara di epthatlon, dal momento che si pu accettare L! ad ogni livello di significativit !$"$#. Si noti che il coefficiente di correlazione di Spearman risulta <W '($#& !#!'", un valore relativamente basso che conferma la mancanza di associazione. 10.3. Il test di correlazione di Kendall. Se \" ]" \# ]# \8 ]8 un campione # casuale bivariato con funzione di ripartizione congiunta J8 VJ , si vuole verificare il sistema di ipotesi considerato nella 10.1. Una statistica test opportuna in questo sistema di ipotesi data dalla statistica di Kendall, data da # 7 88 "
8" 8
segn\4 \3 segn]4 ]3 ,
3" 43"
dove segnB #I! B ". Si noti che la statistica 7 pu essere scritta come 7 dove
8" 8
# G H , 88 "
G
3" 43"
I! segn\4 \3 segn]4 ]3
rappresenta il numero di coppie \3 ]3 e \4 ]4 concordanti, mentre

8" 8
H
3" 43"
rappresenta il numero di coppie \3 ]3 e \4 ]4 discordanti. Dal momento che immediato verificare che G H 88 "#, allora si ha anche 7 %G ". 88 "
Si noti che in caso di perfetta associazione positiva tutte le coppie sono concordanti, per cui risulta G 88 "# e di conseguenza 7 ". Al contrario, in caso di perfetta associazione negativa tutte le coppie sono discordanti, per cui risulta G ! e di conseguenza 7 ". Infine, se il numero delle coppie concordanti uguale al numero delle coppie discordanti, ovvero se non vi associazione, allora risulta G 88 "% per cui 7 !. Dunque, 7 a tutti gli effetti una valida misura di associazione. Si noti che 7 una trasformata lineare della statistica G . Dunque, evidente che 7 e G forniscono test equivalenti. Il seguente teorema fornisce una utile equivalenza in distribuzione per la statistica G .
112
Teorema 10.3.1. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , per la statistica G risulta " J#
8" 8 8" 8
G
3" 43"
3" 43"
I! V4 V3 ,
dove V" V# V8 il vettore dei ranghi relativo a \" \# \8 . Dimostrazione. Si noti che immediato dimostrare
. segn\4 \3 segnV4 V3 , 3 " # 8 " , 4 3 " 8 ,
e
. segn]4 ]3 segnY4 Y3 , 3 " # 8 " , 4 3 " 8 ,
dove Y" Y# Y8 il vettore dei ranghi relativo a ]" ]# ]8 . Dunque, risulta

8" 8
. I! segn\4 \3 segn]4 ]3
G
3" 43" 8" 8
3" 43"
I! segnV4 V3 segnY4 Y3 .
Dal momento che V" V# V8 e Y" Y# Y8 sono indipendenti in quanto trasformate di variabili casuali indipendenti, allora per ogni ?" ?# ?8 e8 si ha
. G Y" ?" Y# ?# Y8 ?8
8"
.
I! segnV4 V3 segnY4 Y3 Y" ?" Y# ?# Y8 ?8

3" 43" 8" 8
3" 43"
I! segnV4 V3 segn?4 ?3 .
Se .3 la posizione del numero 3 (3 " # 8) nel vettore ?" ?# ?8 , allora ovviamente si ha

8" 8
I! segnV4 V3 segn?4 ?3
3" 43" 8" 8 8" 8
6" 76"
I! segnV.7 V.6 segn7 6

6" 76"
I! segnV.7 V.6 .
Tuttavia, dal momento che per il Teorema 2.4.3 V" V# V8 distribuito uniformente su e8 , essendo il vettore dei ranghi relativo ad un campione casuale, allora si ha . V" V# V8 V." V.# V.8 per qualsiasi permutazione ." .# .8 di " # 8. Dunque, risulta
113
. G Y" ?" Y# ?# Y8 ?8
8"
.
8
. I! segnV.6 V.7
8"
I! segnV4 V3 .
3" 43"
6" 76"
Dal momento che questa equivalenza in distribuzione vale per ogni ?" ?# ?8 e8 , allora il teorema dimostrato. Nel prossimo teorema si ottiene una importante equivalenza in distribuzione per la statistica G. Teorema 10.3.2. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , allora " J#
8
G
3#
Z3 ,
dove Z3 (3 # $ 8) sono 8 " variabili casuali indipendenti con funzione di probabilit data da :3 @ " , @ ! " 3 " , 3 # $ 8 . 3
Dimostrazione. Dal Teorema 10.3.1, si ha

8" 8 8" 8"
G
3" 43" 8" 8"
I! V4 V3
3" 43"
I! V4 V3 I! V8 V3
8"
8# 8"
. I! V8 V3
3" 43"
I! V4 V3
3"
I! \4 \3 Z8 ,
3" 43"
dove Z8
8" 4" I! \8
\4 . Dalla Definizione 2.4.1 si ha dunque che

. Z8 V8 " ,
ovvero Z8 possiede funzione di probabilit :8 @ " , @ ! " 8 " . 8
8" Inoltre, si noti che 8# 3" 43" I! \4 \3 indipendente da Z8 in quanto eliminando l'ultima osservazione l'ordinamento rimane comunque invariato. Questa variabile casuale in effetti la statistica G calcolata sul campione casuale \" \# \8" . Iterando si ha dunque 8
. G
Z3 ,
3#
114
dove Z3 3" 4" I! V3 V4 (3 # $ 8) sono 8 " variabili casuali indipendenti con funzione di probabilit data da :3 @ " , @ ! " 3 " , 3 # $ 8 . 3
Si noti che il supporto di G dato da ! " 88 "#. Tenendo presente il Teorema 2.4.3 e denotando la funzione di probabilit di G con :8 - PrG -, allora se l'ipotesi di base vera, si ha :8 - " -8 - , - ! " 88 "# , 8x
dove -8 - rappresenta il numero di permutazioni di " # 8 per cui G assume valore - . Sebbene esistano delle relazioni ricorrenti per il calcolo diretto della funzione di probabilit di G , la distribuzione della statistica si ottiene pi facilmente con la funzione generatrice delle probabilit. Teorema 10.3.3. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , la funzione generatrice delle probabilit di G " J# risulta PG > $
8 3#
" >3 , > ". 3" >
Dimostrazione. Con la notazione del Teorema 10.3.2, la funzione generatrice delle probabilit di Z3 (3 " # 8) risulta PZ3 > " 3
3"
>4 , > " , 3 # $ 8 .

4!
Dall'indipendenza delle Z3 si ottiene dunque PG > $

8 3#
" 3
3" 4!
> $
8 3 3#
" >3 , > ". 3" >
Esempio 10.3.1. Per 8 % si ha PG > " " >" > ># " > ># >% #%
" " $> &># '>$ &>% $>& >' . #%
Poich le probabilit :% - corrispondono ai coefficienti del polinomio PG >, immediato ottenere la Tavola 10.3.1. Tavola 10.3.1. Funzione di probabilit di G per 8 %.
7 :% - ! " "#% " #$ $#% # "$ &#% $ ! '#% % "$ &#% & #$ $#% ' " "#%
115
Nei seguenti teoremi si ottiene la media e la varianza di G e la sua simmetria rispetto alla media. Teorema 10.3.4. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , allora " J# EG e VarG " 88 "#8 & . (# " 88 " %
Dimostrazione. Per le variabili casuali Z3 (3 # $ 8) definite nel Teorema 10.3.2, si ha

3"
EZ3
@!
@:3 @
" 3
3"
@
@!
" 3
3"
@
@"
" 3 " #
e
3"
VarZ3
@!
@# :3 @ EZ3 #
" 3
3"
@#
@!
" 3 "# %
" 3
3"
@#
@"
" " # 3 "# 3 " . % "#
Di conseguenza, tenendo presente il Teorema 10.3.2, si ha

8
EG
3#
" EZ3 #
8 3#
" 3 " #
8"
3
3"
" 88 " %
e
8
VarG
3#
VarZ3
" "#
3# "
3#
" "#
3# "
3"
88 "#8 & . (#
Dal precedente teorema si ha inoltre E7 e Var7 8# 8 "' ##8 & VarG . # " *88 " 4 EG " ! 88 "
Teorema 10.3.5. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , allora G simmetrica rispetto a " J# EG 88 "%.
116
Dimostrazione. Dal momento che immediato verificare che ogni Z3 definita nel Teorema 10.3.2 simmetrica rispetto a EZ3 3 "# (3 # $ 8), tenendo presente il Teorema 1.2.3, si ha
8
. G EG . [Z3 EZ3 ]
8
. [EZ3 Z3 ] EG G ,
3#
3#
per cui dal Teorema 1.2.2 si deve concludere che G simmetrica rispetto a EG.
Dal Teorema 10.3.5 immediato constatare che anche 7 simmetrica rispetto a E7 !. Dal Teorema 10.3.1, tenendo presente il Corollario 2.4.4, risulta che la statistica G # distribution-free su VJ" e dunque anche su \J , ovvero anche il test di Kendall " J# distribution-free. Se l'ipotesi di base non vera, G tende ad assumere valori bassi o elevati. Fissato quindi un livello di significativit , allora si sceglie come regione critica l'insieme g" - - -8# - -8"# , dove -8 rappresenta il quantile di ordine della distribuzione di G per una numerosit campionaria pari a 8. Esempio 10.3.2. I dati della Tavola 10.3.2 si riferiscono ai tempi fatti nei 1007 piani dai primi 10 atleti classificati nella gara di decathlon alle Olimpiadi del 1988. Tavola 10.3.2. Tempi nei 100m piani (in sec). 8 atleta C3 B3 <3 43" I! V4 V3
Schenk - GDR " Voss - GDR # Steen - CAN $ Thompson - GB % Blondel - FRA & Plaziat - FRA ' Bright - USA ( DeWit - HOL ) Johnson - USA * Tarnovetsky - URS "! ""#& "!)( """* "!'# ""!# "!)$ """) ""!& """& ""#$ "! $ ) " % # ( & ' * ! ' " ' % % " # " !
Fonte: Lunn e McNeil (1991) Si interessati a conoscere se vi associazione fra la posizione finale dell'atleta e il risultato fatto nella gara dei 1007. Dal momento che immediato ottenere che - #&, per 8 "! si ha PrG #& !$'% e quindi la significativit osservata risulta 9== # !$'% !("). Dunque, la sola gara dei 1007 non condiziona la posizione finale dell'atleta, dal momento che si pu accettare L! ad ogni livello di significativit !("). Si noti che in questo caso si ha 7 "* !"""", un valore basso del coefficiente di Kendall che conferma la mancanza di associazione. Per quanto riguarda la distribuzione per grandi campioni di G8 , si ha il seguente teorema. Teorema 10.3.6. Se \" ]" \# ]# \8 ]8 un campione casuale bivariato con # funzione di ripartizione congiunta J8 \J , allora per 8 " J#
117
G8 88 "% . R ! " . 88 "#8 &(# Dimostrazione. Dal momento che per il Teorema 10.3.2 G8 data da una somma di variabili casuali indipendenti, ma non ugualmente distribuite, opportuno applicare Teorema Fondamentale di Lindberg del Limite (Teorema A.3.7). Si noti che
8
5#
3#
VarZ3
" "#
3# " 8$ .
3#
Inoltre, dal momento che il supporto di Z3 risulta ! " 3 " (3 # $ 8), dalla disugualianza di Chebicheff si ha E[Z3 3 "#]# I3"#%53"#%5 Z3 " " 3# " 3 "# 3# " 3 "# Pr Z3 3 "# %5} 3 "# . % % "#%# 5# %)%# 5#
8
Dunque, si ha " 5# E[Z3 3 "#]# I3"#%53"#%5 Z3

3# 8
da cui " lim 8 5#

8
" %)%# 5%
3 "# 3# "
3#
8& " # , # ' % 8 % 8
E[Z3 3 "#]# I3"#%53"#%5 Z3 ! .

3#
Dal momento che la precedente relazione soddisfatta per ogni % !, allora le condizioni del Teorema Fondamentale di Lindberg del Limite sono soddisfatte e il teorema dimostrato. Dal Teorema 10.3.6, segue inoltre che 78 . R ! " . ##8 &[*88 "] Fissato un livello di significativit , per 8 la regione critica pu essere dunque approssimata dall'insieme - - EG8 D# VarG8 - EG8 D"# VarG8 .
Esempio 10.3.3. I dati della Tavola 10.3.3 si riferiscono alle misurazioni relative al contenuto totale di acqua corporea e alla stime della massa magra corporea fornite dallo spessore della pliche cutanea misurato mediante il plicometro in 23 bambini.
118
Tavola 10.3.3. Acqua (in l) e massa magra (in kg). 8 soggetto C3 B3 <3 43" I! V4 V3
" # $ % & ' ( ) * "! "" "# "$ "% "& "' "( ") "* #! #" ## #$ ($& (&' ('& *!$ **" "!"# "!## "!&# "!&* ""($ "")' "#$$ "#'# "$&# "%%$ "&)$ "&*( "(%* ")*' ##(& #(") #(#! $!#% ""! ""& "!( "#* "#$ "%% "%! "&" "(% ")! "&$ "'' "*( "*# #"' ##* #"( #&( $"% #*! %!! %$% %%$ # $ " & % ( ' ) "" "# * "! "% "$ "& "( "' ") #! "* #" ## #$ #" #! #! ") ") "' "' "& "# "" "# "" * * ) ' ' & $ $ # " !
Fonte: Brook (1971) Si vuole verificare se esiste associazione fra il contenuto di acqua corporea e la pliche cutanea, ovvero si vuole verificare che le stime della massa magra corporea ottenute mediante il plicometro sono credibili. Dal momento che immediato ottenere che - #%#, allora PrG #%# " F#%# #$ ##%#$ ## &"(# " F'"!!) !!!!& , quindi la significativit osservata risulta 9== # !!!!& !!!". In questo caso si pu respingere L! ad ogni livello di significativit !!!". Si noti che il coefficiente di Kendall risulta 7 #"#$ !*"$!, un valore elevato che conferma la presenza di una forte associazione. Il test classico per la verifica di ipotesi sull'indipendenza basato sulla statistica test J 8 # " V # V ,
dove V il coefficiente di correlazione campionario di Pearson. Tavola 10.3.4. EAR del test di Kendall rispetto al test di Pearson.

distribuzione EARGJ Y - $ " R . 5 # *1# !*""* I.. $ )"'% "#'''
119
La Tavola 10.3.4 fornisce i valori dell'efficienza asintotica relativa EARGJ per alcune distribuzioni. Si noti che il test di Kendall presenta buone prestazioni per grandi campioni anche sotto ipotesi di normalit.
Capitolo 11 L'analisi della varianza

11.1. Ulteriori risultati per le statistiche rango. Si consideri innanzitutto il modello statistico distribution-free _-" -# -5 J J8 J8 B"" B"# B"8" B#" B## B#8# B5" B5# B585 $$ J B43 -4 J V -" -# -5 ,
5 84 4" 3"
dove 8 5 4" 84 . Ovviamente, _-" -# -5 J rappresenta il modello statistico relativo a 5 campioni casuali indipendenti provenienti da 5 variabili casuali continue che sono equivalenti in distribuzione a meno di un parametro di posizione. Inoltre, evidente che risulta _!!!J VJ . In questa struttura conveniente ampliare la definizione di variabile casuale rango. Definizione 11.1.1. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti con funzione di ripartizione congiunta J8 VJ . In questo caso si definiscono statistiche rango le seguenti trasformate
84 5
V43
6" 2"
I! \43 \26 , 4 " # 5 , 3 " # 84 .
Inoltre, si dice somma dei ranghi del 4-esimo campione la trasformata

84
V4
3"
V43 , 4 " # 5 .
Si noti che la statistica V43 rappresenta la posizione di \43 all'interno del campione misto ordinato. Dunque, V43 (3 " # 84 4 " # 5 ) sono a tutti gli effetti statistiche rango anche se con una differente indicizzazione e quindi tutte le propriet discusse nella 2.4 sono valide anche in questo caso. Per quanto riguarda le statistiche somma dei ranghi si ha il seguente teorema. Teorema 11.1.1. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti con funzione di ripartizione congiunta J8 VJ . Allora si ha EV4 " 84 8 " , 4 " # 5 , #
L'analisi della varianza
121
VarV4 e
" 84 8 84 8 " , 4 " # 5 , "# " 84 82 8 " , 4 2 " # 5 . "#
CovV4 V2
Dimostrazione. Tenendo presente il Corollario 2.4.5, si ha

84 84
EV4
3"
EV43
3"
" " 8 " 84 8 " , 4 " # 5 , # #
e
84 84 84
VarV4
3" 84 84 84
VarV43
3" 63"
CovV43 V46
3"
" 8# " "#
3" 63"
" " " 8 " 84 8# " 84 84 "8 " "# "# "#
" 84 8 84 8 " , 4 " # 5 . "#
Inoltre, ancora dal Corollario 2.4.5 risulta

84 82
CovV4 V2
3" 6"
CovV43 V26
" 84 82 8 " , 4 2 " # 5 . "#
Il seguente Teorema un'estenione del Corollario 2.4.7 e sar utile nel seguito. Teorema 11.1.2. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti con funzione di ripartizione congiunta J8 VJ . Se V4" V4# V484 denota il vettore ordinato dei ranghi relativo a V4" V4# V484 (4 " # 5 ), allora PrV"" <"" V"8" <"8" V5" <5" V585 <585 8 8" 8 # 8 5
"
, " <4" <484 8 , 4 " # 5 .
Dimostrazione. Dal Corollario 2.4.7 si ha PrV"" <"" V"8" <"8" Dal momento che immediato verificare PrV#" <#" V#8# <#8# V"" <"" V"8" <"8" 8 8" 8#
"
8 8"
"
122 allora
PrV"" <"" V"8" <"8" V#" <#" V#8# <#8# 8 8" 8#

"
8 8"
"
8 8" 8 #
"
Procedendo iterativamente si ha la dimostrazione.
11.2. Il test di Kruskal-Wallis. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti con funzione di ripartizione congiunta J8 _-" -# -5 J . Il test di Kruskal-Wallis basato sulla statistica L "# 88 "
5
84 V4 84 8 "## .
4"
Ovviamente, la statistica L in effetti una misura della differenza fra le somme dei ranghi attesi e le somme dei ranghi osservati. Dunque, mediante il test di Kruskal-Wallis si pu verificare un'ipotesi di base del tipo L! -" -# -5 J V contro L" -4 -2 b4 2 " # 5 J V. Questa struttura di ipotesi caratterizza la cosiddetta analisi della varianza ad un criterio. La statistica L opportuna in questo sistema di ipotesi, in quanto se non vera l'ipotesi di base tende ad assumere valori elevati. Si noti che la statistica L pu essere espressa alternativamente come L "# 88 "
5 # # 84 V4 84 8 "V4 84 8 "# 4 4" 5 84 5 # V4 84 $8 " . 4"
"# 88 "
5 # V4 84 4"
"# 8
V43 $8 "
4" 3"
"# 88 "
Tenendo presente il Teorema 11.1.2, la funzione di probabilit della statistica L risulta :8" 8# 85 2 8 8" 8# 85
"
-8" 8# 85 2 ,
dove -8" 8# 85 2 il numero di 5 sottoinsiemi di 8" 8# 85 interi dell'insieme " # 8 per cui la statistica vale 2. Dal momento che molto laborioso tabulare la distribuzione esatta di L (questo lavoro dovrebbe essere fatto per ogni numerosit campionaria e per ogni 5 ), conveniente impiegare il seguente risultato per grandi campioni. Teorema 11.2.1. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti con funzione di ripartizione congiunta J8 VJ . Se /4 8lim 8 8 4 (! /4 ", 4 " # 5 ), allora per 8 si ha L8 ;# 5" . Dimostrazione. Si veda Hettmansperger (1984).
.
123
Un'approssimazione per grandi campioni della regione critica del test quindi data dall'insieme 2 2 ;# 5"" . Esempio 11.2.1. I dati della Tavola 11.2.1 forniscono i coefficienti di salinit per alcuni saggi di acque prelevati in tre zone nei pressi di Bimini Lagoon nelle Bahamas. Tavola 11.2.1. Coefficienti di salinit (numero di parti per mille).
saggio " # $ % & ' ( ) * "! "" "# sito 1 B"3 <"3 $(&% "! $(!# % $'(" " $(!% ' $($# ( $(!" $ $(!$ & $((! "" $($' ) $'(& # $(%& * $))& "( sito 2 B#3 <#3 %!"( #( %!)! $! $*(' #% $*(! #$ %!(* #* %!%% #) $*(& #& $*$) ## sito 3 B$3 <$3 $*!% "* $*#" #" $*!& #! $)#% "# $)&$ "$ $)(" "' $))* ") $)'' "& $)&" "% %!!) #'
Fonte: Till (1974) Si interessati a determinare se la salinit identica nelle tre zone considerate, ovvero si vuole verificare il sistema di ipotesi L! -" -# -$ J V contro L" -4 -2 b4 2 " # $ J V. Dal momento che <" )$, <# #!) e <$ "(%, da cui 2 #$#&$*, allora PrL #$#&$* Pr;# # #$#&$* !!!" , per cui la significativit osservata risulta 9== !!!". Dato che si pu respingere L! ad ogni livello di significativit !!!", l'evidenza empirica porta a concludere che vi una differente salinit nei tre siti considerati. Esempio 11.2.2. I dati della Tavola 11.2.2 forniscono i tempi di sopravvivenza di una serie di pazienti con cancro avanzato (allo stomaco, ai bronchi, al colon, alle ovarie e al seno) che sono stati trattati con ascorbato. Si interessati a determinare se i tempi di sopravvivenza sono differenti a secondo degli organi malati, ovvero si vuole verificare il sistema di ipotesi L! -" -# -$ -% -& J V contro l'alternativa L" -4 -2 b4 2 " # $ % & J V. Dal momento che <" $"&, <# $*(, <$ '"!, <% #%" e <& &"(, da cui 2 "%*"'*, allora si ha !!!" PrL "%*"'* Pr;# % "%*"'* !!!& , da cui la significativit osservata risulta !!!" 9== !!!&. Dunque, l'evidenza empirica porta a concludere che i tempi di sopravvivenza differiscono a secondo dell'organo colpito dal cancro, in quanto si pu respingere L! ad ogni livello di significativit !!!&.
124
L'analisi della varianza Tavola 11.2.2. Tempi di sopravvivenza (in giorni).

paziente " # $ % & ' ( ) * "! "" "# "$ "% "& "' "( stomaco B"3 <"3 "#% ") %# ( #& % %& ) %"# %" &" "! """# && %' * "!$ "( )(' &$ "%' #! $%! $% $*' $* bronchi B#3 <#3 )" "% %'" %& #" # %&! %# #%' $" "'( #& '$ "" '% "# "&& ## )&* &# "&" #" "'' #% $( & ##$ #* "$) "* (# "$ #%& $! colon B$3 <$3 #%) $# $(( $) ")* #( ")%$ '" ")! #' &$( %( &"* %' %&& %$ %!' %! $'& $' *%# &% ((' &! $(# $( "'$ #$ "!" "' #! " #)$ $$ ovarie B%3 <%3 "#$% &( )* "& #!" #) $&' $& #*(! '# %&' %% seno B&3 <&3 "#$& &) #% $ "&)" &* ""'' &' %! ' (#( %* $)!) '% (*" &" ")!% '! $%'! '$
Fonte: Cameron e Pauling (1974) Infine, per quanto riguarda le prestazioni per grandi campioni del test di Kruskal-Wallis, si pu dimostrare che l'efficienza asintotica relativa del test basato sulla statistica L rispetto al test basato sulla classica statistica J dell'analisi della varianza a un criterio risulta (Hajek e 1967) idak, EARLJ "#5# (
0 B# .B# .
Si noti che questa efficienza asintotica relativa ancora identica a quella ottenuta per il test [ di Wilcoxon rispetto al test X di Student per un campione e per il test [ di MannWhitney-Wilcoxon rispetto al test X di Student per due campioni, per cui si pu considerare ancora la Tavola 6.6.2, dove si hanno i valori di EARLJ EAR[ X per alcune distribuzioni. 11.3. Il test di Friedman. Questo test viene utilizzato per la verifica di ipotesi nell'analisi della varianza a due criteri nel cosiddetto disegno campionario con blocchi casualizzati con una osservazione per cella. Pi esattamente, in questo disegno si hanno 85 soggetti che vengono divisi in 8 blocchi, in maniera tale che in ogni blocco i soggetti sono assegnati casualmente ai 5 trattamenti. Il modello statistico distribution-free opportuno in questo caso quindi dato da _-" -# -5 J" J# J8 J8 J8 B"" B5" B"# B5# B"8 B58 $$ J3 B43 -4 J" J# J8 V -" -# -5 .
5 8 4" 3"
Ovviamente, _-" -# -5 J" J# J8 rappresenta il modello statistico relativo a 85 campioni casuali indipendenti di una osservazione provenienti da 85 variabili casuali continue che in ogni blocco sono equivalenti in distribuzione a meno di un parametro di posizione. Inoltre, evidente che _!!!J" J#J8 rappresenta il modello statistico relativo a 8 campioni casuali
125
indipendenti di 5 osservazioni provenienti da 8 variabili casuali continue. Siano dunque \43 (4 " # 5 , 3 " # 8) 85 variabili casuali da cui si dispone di una sola osservazione, con funzione di ripartizione congiunta J8 _-" -# -5 J" J# J8 . Si vuole verificare un'ipotesi di base del tipo L! -" -# -5 J" J# J8 V contro un'alternativa L" -4 -2 b4 2 " # 5 J" J# J8 V, ovvero si vuole verificare se i trattamenti hanno effetto differente. Si noti che se vera l'ipotesi di base allora \"3 \#3 \53 (3 " # 8) costituisce un campione casuale e sia V"3 V#3 V53 (3 " # 8) il relativo vettore dei ranghi. La statistica del test di Friedman quindi data da "# K 855 "
5
V4 85 "## ,
4"
dove in questo caso V4 8 3" V43 rappresenta la somma dei ranghi associati al 4-esimo trattamento in ogni blocco. Si noti che se vera l'ipotesi di base il rango associato ad un dato trattamento per un blocco uniformente distribuito (vedi Corollario 2.4.4), per cui in conseguenza del Corollario 2.4.5 si ha EV4 8 3" EV43 85 "#. Dunque, la statistica K, che una misura della differenza fra le somme attese dei ranghi e le somme osservate dei ranghi per un trattamento, una statistica opportuna per verificare l'ipotesi di base. Si noti che la statistica K pu essere espressa alternativamente come "# K 855 " "# 855 "
5 # V4 85 "V4 8# 5 "# 4 4" 5 # V4 4" 5 8
"# 5
5
V43 $85 "

4" 3"
"# 855 "
# V4 $85 " . 4"
Dal momento che molto laborioso tabulare la distribuzione esatta di K, conveniente adoperare il seguente risultato per grandi campioni. Teorema 11.3.1. Siano \43 (4 " # 5 , 3 " # 8) 85 variabili casuali da cui si ha a disposizione una sola osservazione, con funzione di ripartizione congiunta data da J8 _!!!J" J# J8 . Allora per 8 si ha K8 ;# 5" . Dimostrazione. Si veda Hettmansperger (1984).
.
Un'approssimazione per grandi campioni della regione critica del test quindi data dall'insieme 1 1 ;# 5"" . Esempio 11.3.1. In un esperimento si vuole verificare l'efficacia delle scorie degli altoforni come materiale fertilizzante in agricoltura su tre tipi di suolo, ovvero fertile sabbioso, fertile
126
argilloso e sabbia fertile. Vari tipi di fertilizzante per acro sono stati applicati e i dati della Tavola 11.3.1 si riferiscono al granturco prodotto. Tavola 11.3.1. Granturco prodotto (in staio per acro).
fertile sabbioso B4" <4" Nessuno """ " Scorie grezze "&$ # Scorie medie ##( $ Scorie per agricoltura #$) % Calcare per agricoltura #&' & Scorie per agricoltura+additivi $"# ( Calcare per agricoltura+additivi #&) ' Fertilizzante fertile argilloso B4# <4# $#' " %!) # &#" $ &#) % '$" ( &*& ' &&$ & sabbia fertile B4# <4# '$$ & '&! ' &)) # '"% % %"" " ()" ( '!# $
Fonte: Johnson e Graybill (1972) Ovviamente in questo caso i vari tipi di fertilizzanti rappresentano i trattamenti, mentre i tipi di suolo sono i blocchi. Si quindi interessati a verificare se i trattamenti sono equivalenti, ovvero l'ipotesi di base L! -" -# -( J" J# J$ V contro L" -4 -2 b4 2 " # ( J" J# J$ V. Dal momento che in questo caso <" (, <# "!, <$ ), <% "#, <& "$, <' #! e <( "%, da cui 1 )"%#), allora risulta !"! PrK )"%#) Pr;# ' )"%#) !#& , e quindi per la significativit osservata si ha !"! 9== !#&. L'evidenza empirica porta dunque a concludere che i fertilizzanti sono equivalenti, dal momento che si pu accettare L! ad ogni livello di significativit !"!. Esempio 11.3.2. In un esperimento si vuole verificare l'aumento di peso di alcuni topi sottoposti a 4 tipi di dieta. Ogni dieta caratterizzata da differenti apporti proteici (1 moderato apporto proteico animale, 2 - elevato apporto proteico animale, 3 - moderato apporto proteico vegetale, 4 - elevato apporto proteico vegetale). I dati della Tavola 11.3.2 forniscono gli aumenti di peso in 10 gruppi di 4 topi ciascuno che sono stati assegnati casualmente alle diete. Tavola 11.3.2. Aumenti di peso dei topi (in grammi).
4 " # $ % B4" *! ($ "!( *) <4" # " % $ B4# (' "!# *& (% <4# # % $ " B4$ *! "") *( &' <4$ # % $ " B4% '% "!% )! """ <4% " $ # % B4& )' )" *) *& <4& # " % $ B4' &" "!( (% )) <4' " % # $ B4( (# "!! (% )# <4( " % # $ B4) *! )( '( (( <4) % $ " # B4* *& ""( )* )' <4* $ % # " B4"! <4"! () # """ % &) " *# $
Fonte: Snedecor e Cochran (1967) Ovviamente, in questo caso i vari tipi di dieta rappresentano i trattamenti, mentre i gruppi di topi assegnati casualmete ai 4 trattamenti sono i blocchi. Si quindi interessati a verificare se le diete sono equivalenti, ovvero l'ipotesi di base L! -" -# -$ -% J" J# J"! V contro L" -4 -2 b4 2 " # $ % J" J# J"! V. Dal momento che <" #!, <# $#, <$ #% e <% #%, da cui 1 %&', allora si ha !"! PrK %&' Pr;# $ %&' !#& ,
127
quindi la significativit osservata risulta !"! 9== !#&. L'evidenza empirica porta dunque a concludere che le diete sono equivalenti, in quanto si pu accettare L! ad ogni livello di significativit !"!. Infine, per quanto riguarda l'efficacia del test di Friedman, si pu dimostrare che l'efficienza asintotica relativa del test basato sulla statistica K rispetto al test basato sulla classica e idak, 1967), statistica J dell'analisi della varianza a due criteri risulta (Hajek EARKJ
"#5# 5 ( 0 B# .B# . 5 "
Si noti che questa efficienza asintotica relativa uguale a quella ottenuta per il test L di Kruskal-Wallis rispetto al test per l'analisi della varianza a un criterio solo per 5 . In particolare, si noti che se vera l'assunzione di normalit, allora per 5 # si ottiene EARKJ #1, ovvero l'efficienza asintotica relativa del test dei segni rispetto al test X di Student per un campione. Questa perdita di efficienza ovviamente dovuta all'ordinamento all'interno dei blocchi, specie per un piccolo numero di trattamenti. Tenendo presente la relazione EARKJ 55 "EAR[ X , si pu ottenere i valori di EARKJ per alcune distribuzioni mediante la Tavola 6.6.2. 11.4. Il test di concordanza di Kendall. La statistica del test di Friedman pu essere adoperata anche nel problema dell'associazione quando si ha a disposizione campioni da variabili casuali 5 dimensionate. Ad esempio questo problema sorge quando si hanno 5 oggetti su cui viene misurato un certo attributo da 8 persone in maniera indipendente e si vuole avere una conferma della credibilit delle 8 misurazioni fatte (ovvero si vuole verificare l'associazione tra le misurazioni). Si noti che questa struttura dei dati analoga a quella relativa a 5 trattamenti fatti su 8 blocchi. Innanzitutto, si consideri il modello statistico distribution-free
5 VJ J8 J8 B"" B#" B5" B"# B## B5# B"8 B#8 B58
$ J B"3 B#3 B53 J V5 ,

8 3"
dove V5 rappresenta la classe delle funzioni di ripartizione di un vettore 5 -variato di variabili 5 casuali continue. Ovviamente, VJ rappresenta il modello statistico relativo ad un campione casuale proveniente da un vettore 5 -variato di variabili casuali continue. Una sottoclasse di 5 VJ data dal modello statistico distribution-free
5 \J J8 J8 B"" B#" B5" B"# B## B5# B"8 B#8 B58 " J# J5
$$ J4 B43 J" J# J5 V .
5 8 4" 3" 5 Evidentemente, \J rappresenta il modello statistico relativo ad un campione casuale " J# J5 proveniente da un vettore 5 -variato di variabili casuali continue a componenti indipendenti. Il 5 5 5 sistema di ipotesi d'interesse quindi L! J8 \J contro L" J8 VJ \J , " J# J5 " J# J5 ovvero verificare l'indipendenza delle componenti del vettore 5 -variato di variabili casuali da cui proviene il campione casuale. Si noti che se vera l'ipotesi di base allora
128
5 e quindi una statistica test opportuna data dalla statistica di _!!!J" J#J8 \J " J# J5 Kendall
K . 85 "
Questa statistica ovviamente equivalente alla statistica di Friedman ed stata standardizzata in modo che ! O ", ovvero in modo che possa essere interpretato come coefficiente di associazione. Infatti, se non esiste associazione allora V4 85 "# (4 " # 5 ) e quindi O !. In caso contrario si ha V4 84 (4 " # 5 ) e quindi O ". Ovviamente, sotto ipotesi di base per 8 si ha 85 "O ;# 5" . Dunque, un'approssimazione per grandi campioni della regione critica del test data dall'insieme 5 5 ;# 5"" .
.
Capitolo 12 I test funzionali

13.1. Il test Chi-quadrato per la bont di adattamento. Sia \" \# \8 un campione casuale da una variabile casuale discreta \ . Supponiamo inoltre che il supporto di \ sia finito e che la relativa funzione di probabilit sia data da :B3 Pr\ B3 13 , 3 " # < , Sia inoltre 03 la frequenza osservata di determinazioni del valore B3 nel campione < (3 " # <). Ovviamente, si ha 3" 03 8. Le quantit 0" 0# 0< sono dette frequenze osservate, mentre le quantit 81" 81# 81< sono dette frequenze attese. In questo caso un sistema di ipotesi interessante da verificare risulta L! 13 13! ) 3 " # < contro L" 13 13! ) b3 " # <, dove ) un vettore di parametri tale che ) K ; . Mediante questo sistema di ipotesi si vuole dunque verificare che la distribuzione di \ appartiene ad una certa famiglia di distribuzioni specificata (eventualmente) a meno di un vettore di parametri. Dal momento che le probabilit 13 (3 " # <) specificano completamente la funzione di ripartizione di \ , la precedente ipotesi a tutti gli effetti una ipotesi funzionale. Una statistica test conveniente in questo caso la statistica Chi-quadrato per la bont d'adattamento data da
<
U
3"
s]# [03 813! K , s 813! K
s uno stimatore di ) coerente, efficiente per grandi campioni e che converge in dove K distribuzione ad una normale. Si noti che la statistica U pu essere alternativamente espressa come U " 8
< 3"
03# s 13! K
8.
Ovviamente, se le frequenze osservate si discostano molto da quelle attese stimate, si ottengono determinazioni elevate di U che conseguentemente portano a respingere l'ipotesi di base. La distribuzione esatta di U proibitiva da calcolare e quindi conveniente impiegare il seguente risultato per grandi campioni. Teorema 12.1.1. Sia \" \# \8 un campione casuale da una variabile casuale discreta \ con funzione di probabilit data da :B3 13! ) (3 " # <) dove ) K ; , e siano 0" 0# 0< le relative frequenze osservate. Se 1) ammette derivate del primo e s uno stimatore di ) coerente, efficiente per secondo ordine rispetto ad ogni ) K e se K grandi campioni e che converge in distribuzione ad una normale, allora per 8
130
I test funzionali
<
U
3"
s]# . # [03 813! K ;<"; . s 813! K
Dimostrazione. Si veda Serfling (1980).
Un'approssimazione per grandi campioni della regione critica del test quindi data dall'insieme ; ; ;# <";" . Esempio 12.1.1. I dati della Tavola 12.1.1 si riferiscono al numero di maschi nei primi sette figli di 1334 pastori prostestanti svedesi. Tavola 12.1.1. Numero dei figli maschi.
Numero figli maschi Frequenze osservate ! ' " &( # #!' $ $'# % $'& & #&' ' '* ( "$
Fonte: Edwards e Fraccaro (1960) Si vuole verificare che questi dati provengono da una F3( ), ovvero si vuole verificare ( 3" l'ipotesi di base L! 13 3" ) " )(3" 3 " # ), contro l'ipotesi alternativa ( 3" L" 13 3" ) " )(3" b3 " # ), dove ) ! ". Il parametro ) pu essere stimato col metodo della massima verosimiglianza, che fornisce stimatori coerenti, efficienti per grandi campioni e che convergono in distribuzione ad una normale. La funzione di logverosimiglianza risulta
) )
ln P) -
3" )
03 ln 13 -
3"
03 ln)3" " )(3"
- ln )
3"
3 "03 ln" )
3"
( 3 "03 , ! ) " .
E' immediato verificare che la funzione di log-verosimiglianza massimizzata per " s ) (8

)
3 "03 ,
3"
ovvero s ) !&"%!. Dunque, 1" s ) !!!'%, 1# s ) !!%(%, 1$ s ) !"&!%, 1% s ) s s s s !#'&#, 1& ) !#)!%, 1' ) !"()!, 1( ) !!'#(, 1) ) !!!*&, da cui ; &*%#'. Di conseguenza, risulta !#& PrU &*%#' Pr;# ' &*%#' !&! ,
I test funzionali
131
quindi la significativit osservata risulta !#& 9== !&!. In questo caso si pu accettare L! , ovvero che il campione proviene da una F3( ), ad ogni livello di significativit !#&. Esempio 12.1.2 I dati della Tavola 12.1.2 danno la distribuzione della prima cifra dei numeri contenuti in un volume della rivista Reader's Digest scelto casualmente. Un modello teorico per questi dati la cosiddetta distribuzione anomala (vedi Feller, 1971). La funzione di probabilit di una variabile casuale anomala data da :B log"! B " log"! B , B " # * . Si vuole verificare che i dati provengono da una variabile casuale anomala, ovvero si vuole verificare l'ipotesi L! 13 log"! 3 " log"! 3 3 " # *, contro l'alternativa L" 13 log"! 3 " log"! 3 b3 " # *. Tavola 12.1.2. Prime cifre dei numeri contenuti in un volume.
Prima cifra " # $ % & ' ( ) * Frequenze osservate "!$ &( $) #$ ## #! "( "& "$
Benford, F. (1938) In questo caso non vi sono parametri da stimare, e dunque si ha ; $#((', da cui !*! PrU $#((' Pr;# ) $#((' !*& , e quindi la significativit osservata risulta !*! 9== !*&. In questo caso vi una forte evidenza empirica ad accettare L! , ovvero che il campione proviene da una distribuzione anomala, in quanto si potrebbe accettare questa ipotesi ad ogni livello di significativit !*!. Sia \" \# \8 un campione casuale proveniente da una variabile casuale \ discreta con supporto numerabile, con relativa funzione di probabilit :B3 Pr\ B3 13 (3 " # ). In questo caso, per rendere applicabile il test Chi-quadrato si deve considerare un raggruppamento di valori. Pi esattamente, si considera solo i primi < " valori B3 con relativi 13 Pr\ B3 (3 " # < ") e l'insieme di valori B< B<" con relativo 1< 3< Pr\ B3 . In questo caso, si deve tenere presente che 0< rappresenta la frequenza osservata dei valori B< B<" . Esempio 12.1.3. I dati della Tavola 12.1.3 si riferiscono al numero di taxi arrivati in intervalli di un minuto alla stazione di Euston a Londra fra le 9.00 e le 10.00 in una mattina del 1950. Se gli arrivi sono casuali allora noto dalla teoria dei processi stocastici puntuali che i dati provengono da una T 9). Raggruppando opportunamente i valori, si vuole dunque verificare l'ipotesi di base L! 13 exp ))3" 3 "x 3 " # & 1' " & 3" 3 "x, dove ) . 3" exp ) )
132
I test funzionali
Tavola 12.1.3. Numero dei taxi arrivati alla stazione in un ora.

numero di taxi per minuto ! " # $ % pi di & frequenza ") ") "% ( $ !
Fonte: Kendall (1951) Il parametro ) pu essere stimato col metodo della massima verosimiglianza, che fornisce stimatori coerenti, asintoticamente efficienti e asintoticamente normali. Tenendo presente che 0' !, la funzione di log-verosimiglianza risulta
'
ln P) -
3" &
03 ln 13
&
-
3"
03 lnexp ))3" 3 "x 0' ln"

3" & &
exp ))3" 3 "x
-
3"
03 ) 3 " ln ) - ln )
3"
3 "03 8) , ) ! .
E' immediato verificare che la funzione di log-verosimiglianza massimizzata per " s ) 8

&
3 "03 ,
3"
ovvero s ) "$"'(. Dunque, si ha 1" s ) !#')!, 1# s ) !$&#*, 1$ s ) !#$#$, s s s 1% ) !"!#!, 1& ) !!$$', 1' ) !!""#, da cui ; "*)%". Di conseguenza !&! PrU "*)%" Pr;# % "*)%" !*! , quindi la significativit osservata risulta !&! 9== !*!. In questo caso, si pu accettare L! , ovvero che il campione proviene da una variabile casuale di Poisson, ad ogni livello di significativit !&!. Esempio 12.1.4 I dati della Tavola 12.1.4 si riferiscono al numero di scintillazioni in intervalli di 72 secondi causate dal decadimento radioattivo del polonio. Se le scintillazioni avvengono casualmente, allora noto dalla teoria dei processi stocastici puntuali che i dati provengono da una T 9). Raggruppando opportunamente i valori, si vuole dunque verificare L! 13 exp ))3" 3 "x 3 " # "# "# 1"$ " 3" exp ))3" 3 "x, dove ) . Analogamente all'Esempio 12.1.3, il parametro ) pu essere stimato col metodo della massima verosimiglianza. Si noti tuttavia in questo caso 0"$ non nullo, per cui la funzione di log-verosimiglianza risulta
I test funzionali
133
"$
ln P) -
3" "#
03 ln 13
"#
-
3"
03 lnexp ))
3"
3 "x 0"$ ln"

3"
exp ))3" 3 "x
"#
"#
- ln )
3"
3 "03 8) 0"$ ln"

3"
exp ))3" 3 "x , ) ! ,
che pu essere massimizzata solo numericamente. Sostituendo i dati si deve dunque massimizzare numericamente la seguente funzione
""
1) "!!(! ln ) #'!) ) # ln" exp )

3!
)3 3x , ) ! .
Per via numerica si ottiene che il massimo della precedente funzione raggiunto per s ) $)'(). Sostituendo si ha dunque 1" s ) !!#!*, 1# s ) !!)!), 1$ s ) !"&'$, 1% s ) !#!"', 1& s ) !"*&!, 1' s ) !"&!), 1( s ) !!*(#, 1) s ) !!&$(, 1* s ) !!#'!, 1"! s ) !!""#, 1"" s ) !!!%$, 1"# s ) !!!"&, 1"$ s ) !!!!%, da cui ; "%'&)!. Di conseguenza, si ha !"! PrU "%'&)! Pr;# "" "%'&)! !#& , quindi la significativit osservata risulta !"! 9== !#&. In questo caso si pu accettare L! , ovvero che il campione proviene da una variabile casuale di Poisson, ad ogni livello di significativit !"!. Tavola 12.1.4. Numero di scintillazioni (in intervalli di 72sec) del polonio.
Numero scintillazioni Frequenze osservate ! &( " #!$ # $)$ $ &#& % &$# & %!) ' #($ ( "$* ) %& * #( "! "! "" % "# #
Fonte: Rutheford e Geiger (1910) Esempio 12.1.5. In un indagine sono state contate le bombe cadute in un area di 36km# nella parte sud di Londra durante la Seconda Guerra Mondiale. L'area stata suddivisa in sottoaree ognuna delle quali misurava 1/16 di km# , per un totale di 576 sottoaree in cui stato contato il numero di bombe cadute. I dati relativi sono forniti nella Tavola 12.1.5.
134 Tavola 12.1.5. Numero di bombe (in aree di 1/4 di km# ).

Numero bombe Frequenze osservate ! ##* " #"" # *$ $ $& % ( & "
I test funzionali
Fonte: Clarke (1946) Si vuole verificare se le bombe sono cadute casualmente o se sono state lanciate su precisi obiettivi. Se le bombe sono cadute casualmente, allora dalla teoria dei processi stocastici puntuali sul piano noto che i dati provengono da una T 9). Si vuole dunque verificare l'ipotesi di base L! 13 exp ))3" 3 "x 3 " # 5 1' " & 3" 3 "x, dove ) . Analogamente all'Esempio 13.1.4, lo stimatore di 3" exp ) ) massima verosimiglianza di ) viene ottenuto massimizzando numericamente la seguente funzione
%
1) &$! ln ) &(' ) ln" exp )

3!
)3 3x , ) ! ,
da cui si ha s ) !*#(&. Sostituendo si ha dunque 1" s ) !$*&&, 1# s ) !$''*, s s s s 1$ ) !"(!", 1% ) !!&#', 1& ) !!"##, 1' ) !!!#(, da cui ; "")(). Di conseguenza risulta !&! PrU "")() Pr;# % "")() !*! , quindi la significativit osservata risulta !&! 9== !*!. In questo caso si pu accettare L! , ovvero che il campione proviene da una variabile casuale di Poisson, ad ogni livello di significativit !&!. 13.2. Il test Chi-quadrato per la bont di adattamento con 5 campioni. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti, ognuno dei quali proviene rispettivamente da una variabile casuale discreta \4 (4 " # 5 ). Sia inoltre 8 5 4" 84 . Supponiamo che le \4 (4 " # 5 ) abbiano identico supporto finito e che la relativa funzione di probabilit sia data da :B3 Pr\4 B3 143 , 3 " # < , Sia inoltre 043 la frequenza osservata di determinazioni del valore B3 nel 4-esimo campione < (3 " # <, 4 " # 5 ). Ovviamente, 3" 043 84 (4 " # 5 ). Inoltre si 5 indica con 03 4" 043 (3 " # <). In questo caso un sistema di ipotesi interessante da verificare dato dall'ipotesi di base L! 1"3 1#3 153 13 3 " # < contro l'ipotesi alternativa L" 143 163 b4 6 " # 5 3 " # <. Mediante questo sistema di ipotesi si vuole dunque verificare l'omogeneit delle distribuzioni delle \4 (4 " # 5 ). Dal momento che le probabilit 143 (3 " # < 4 " # 5 ) specificano completamente le funzioni di ripartizione delle \4 la precedente ipotesi a tutti gli effetti una ipotesi funzionale. Una statistica test conveniente in questo caso la statistica Chi-quadrato per la bont d'adattamento con 5 campioni data da
I test funzionali
135
<
U
4" 3"
043 84 1 s 3 # , 84 1 s3
dove 1 s3 03 8 (3 " # <). Si noti che la statistica U pu essere alternativamente espressa come
5 <
U8
4" 3"
# 043 8. 84 03
Ovviamente, se le frequenze osservate si discostano molto dalle frequenze attese stimate si ottengono realizzazioni elevate di U, che conseguentemente portano a respingere l'ipotesi di base. La distribuzione esatta di U proibitiva da calcolare e quindi conveniente impiegare il seguente risultato per grandi campioni. Teorema 12.2.1. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti, ognuno dei quali proviene rispettivamente da una variabile casuale discreta \4 con funzione di probabilit :B3 13 , 3 " # < 4 " # 5 ). Allora, per 8
5 <
U
4" 3"
043 84 1 s 3 # . # ;<55<" , 84 1 s3
dove 1 s3 03 8 (3 " # <). Dimostrazione. Si veda Serfling (1980).
Un'approssimazione per grandi campioni della regione critica del test quindi data dall'insieme ; ; ;# <55<"" . Esempio 12.2.1. Quando i dati vengono raccolti spesso il rilevatore arrotonda l'ultima cifra del dato a certe cifre convenienti quali ad esempio lo 0 e il 5. Questo fenomeno di accatastamento di cifre stato verificato per la rilevazione dei dati pi disparati. Si considerino ad esempio i dati della Tavola 12.2.1 che si riferiscono alle frequenze della cifra finale delle misurazioni delle temperature massime e minime giornaliere ufficiali negli Stati Uniti negli anni 1922-1924. Tavola 12.2.1. Cifra finale delle temperature minime e massime.
Cifra ! " # $ % & ' ( ) * max "*% "%) "!) (# #* &" $# &% "!# #"! min "(( "%* ""$ (! $& &! #( ') *) #"$
Fonte: Preece (1981)
136
I test funzionali
Si vuole determinare se i dati provengono dalla stessa distribuzione, ovvero si vuole verificare L! 13 1"3 1#3 (3 " # "!). Si ha dunque ; $'#(', da cui !*! Pr; $'#(' Pr;# * $'#(' !*& , quindi la significativit osservata risulta !*! 9== !*&. Quindi, si deve accettare che i dati provengono dalla stessa distribuzione, in quanto si pu accettare L! ad ogni livello di significativit !*!. Esempio 12.2.2. Nel 1861 il periodico New Orleans Crescent pubblic 10 lettere a firma Quinto Curzio Snodgrass. Sebbene gli eventi discussi in queste lettere sembrano essere accaduti realmente, non esiste alcuna traccia di uno scrittore con questo nome. E' stato supposto che il vero autore delle lettere sia Mark Twain. Un modo per verificare statisticamente la paternit degli scritti quella di comparare le distribuzioni delle lunghezze delle parole. I dati della Tavola 12.2.2 si riferiscono alle distribuzioni del numero di lettere delle parole di due brani scelti casualmente dagli scritti di Mark Twain e Quinto Curzio Snodgrass. Tavola 12.2.2. Lunghezza delle parole di due brani.
Lunghezza " # $ % & ' ( ) * "! "" "# "$ Twain $"# ""%' "$*% ""(( ''" %%# $'( #$" ")" "!* &! #% "# Q.C.S. %#% #')& #(&# #$!# "%$" **# )*' '$) %'& #(' "&# "!" '"
Fonte: Brinegar (1963) Si vuole determinare se i due brani sono stati scritti dalla medesima persona, ovvero si vuole verificare L! 13 1"3 1#3 (3 " # "$). Si ha dunque ; "!"%*$), da cui PrU "!"%*$) Pr;# "# "!"%*$) !!!" , e quindi la significativit osservata risulta 9== !!!". Dunque, si deve respingere l'ipotesi che Twain e Snodgrass siano la stessa persona, in quanto si pu respingere L! ad ogni livello di significativit !!!". Quando i 13 (3 " # <) sono noti il test si basa sulla statistica
5 <
U
4" 3"
043 84 13 # . 84 1 3
La distribuzione esatta di U proibitiva da calcolare e quindi conveniente impiegare il seguente risultato per grandi campioni.
I test funzionali
137
Teorema 12.2.2. Siano \4" \4# \484 (4 " # 5 ) 5 campioni casuali indipendenti, ognuno dei quali proviene rispettivamente da una variabile casuale discreta \4 con funzione di probabilit :B3 13 , (3 " # <, 4 " # 5 ). Allora, per 8
5 <
U
4" 3"
043 84 13 # . # ;<55 . 84 1 3
Dimostrazione. Si veda Serfling (1980).
Un'approssimazione per grandi campioni della regione critica del test quindi data dall'insieme ; ; ;# <55" . Esempio 12.2.3. Mediante un elaborazione con un sistema di calcolo simbolico sono state determinate le prime 10000 cifre nell'espansione decimale dei numeri trascendenti 1 ed e. Per ognuno di queste numeri stata contata la frequenza di ogni cifra ! " * e si sono ottenuti i dati di Tavola 12.2.3. Tavola 12.2.3. Cifre dei numeri trascendenti 1 ed e.
Cifra ! " # $ % & ' ( ) * 1 *') "!#' "!#" *(% "!"# "!%' "!#" *(! *%) "!"% e *(% *)* "!!% "!!) *)# **# "!(* "!!) **' *')
Dalla teoria dei numeri noto che 1 ed e sono normali con probabilit " (un numero detto normale se ogni cifra si presenta con la medesima frequenza nella sua espansione decimale). Si vuole ottenere una conferma statistica dell'uniformit della distribuzione delle cifre di 1 ed e, ovvero si vuole verificare L! 13 ""! (3 " # "!). Si ha ; "(*#), da cui !#& PrU "(*#) Pr;# ") "(*#) !&! , quindi la significativit osservata risulta !#& 9== !&!. Si pu dunque accettare l'ipotesi di uniformit della distribuzione delle cifre dell'espansione decimale di 1 e di e ad ogni livello di significativit !#&. 12.3. La statistica di Kolmogorov. In questo paragrafo viene considerata la principale statistica per costruire test per la verifica di ipotesi funzionali quando la variabile casuale d'interesse continua. Definizione 12.3.1. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora si definisce come funzione di ripartizione empirica
138
I test funzionali
s B " J 8
IB \3 , B .
3"
Se \" \# \8 la statistica ordinata relativa a \" \# \8 , allora immediato verificare che una rappresentazione alternativa della funzione di ripartizione empirica data da s B " J 8
8
3 I\3 \3" B ,
3"
dove con abuso di notazione si assunto che \! e \8" . Definizione 12.3.2. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora la statistica di Kolmogorov data da s B J B . H sup J
B
Si noti che la statistica di Kolmogorov una misura della discrepanza fra la funzione di ripartizione e la funzione di ripartizione empirica. Questa statistica distribution-free, nel senso che non dipende dalla struttura funzionale di J , come viene dimostrato nel seguente teorema. Teorema 12.3.3. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , allora la statistica H di Kolmogorov distribution-free su VJ . Dimostrazione. Si noti che s B " J 8
8 3"
" IB \3 8
I!J B J \3 ] , B ,
3"
essendo J una funzione monotona crescente. Inoltre, tenendo presente la trasformata . dell'Integrale di Probabilit si ha J \3 ]3 , dove ]3 una Y ! " (3 " # 8). Se s LC CI!" C I" C rappresenta la funzione di ripartizione di una Y ! " e se LC rappresenta la funzione di ripartizione empirica relativa al campione casuale trasformato ]" ]# ]8 , allora tenendo presente il Teorema 1.1.2, si ha s B J B sup H sup J
B B
" 8
8
. I!J B J \3 ] J B
3"
. sup
!C"
" 8
s I!C ]3 C sup LC LC ,
3"
C
ovvero H distribuito come una variabile casuale che non dipende da J .

:
Si noti che il Teorema di Glivenko-Cantelli (vedi Serfling, 1980) implica H ! per 8 . Per quanto riguarda la distribuzione di H si ha il seguente teorema. Teorema 12.3.4. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , la funzione di ripartizione della statistica H di Kolmogorov data da
I test funzionali K. 8x( ( (
139
"8. #8.
8"8.
IE .B" .B# .B8 I"#8" . I" . ,

".
"8.
dove IE IE B" B# B8 e E B" B# B8 ! B" B# B8 ". Dimostrazione. In conseguenza del Teorema 12.3.3 si pu assumere senza perdita di s B la funzione generalit che J la funzione di ripartizione di una Y ! " e che dunque J di ripartizione empirica relativa a un campione casuale proveniente da una Y ! ". In questo s B J B ! per B ! ", per cui sup J s B J B deve essere caso, si ha J
B
ottenuto per qualche B ! ", ovvero la statistica di Kolmogorov pu essere espressa come s B B . H sup J
!B"
E' evidente che il supporto di H risulta ! ", ovvero si deve determinare PrH . solo per ! . ". Tenendo presente le precedenti considerazioni si ha s B B . K. PrH . Pr sup J
!B"
s B B . aB ! " , ! . " . Pr J s B in termini della statistica ordinata, dall'espressione Considerando la rappresentazione di J precedente si ha K. Pr 38 B . aB [\3 \3" a3 ! " 8 Pr38 . B 38 . aB [\3 \3" a3 ! " 8 Pr, I3 , ! . " ,
8 3!
dove con abuso di notazione si definisce \! ! e \8" " ed inoltre I3 38 . B 38 . aB [\3 \3" , ! . " . Si noti che l'insieme di valori di B comune agli eventi I3 e I3" (3 ! " 8 ") dato da 38 . B 38 . 3 "8 . B 3 "8 . 3 "8 . B 38 . , 3 ! " 8 " , "#8 . " , dove il vincolo . "#8 deriva dalla condizione 38 . 3 "8 . . Inoltre si noti che la \3" comune solo agli eventi I3 e I3" , per cui I3 I3" 3 "8 . \3" 38 . , 3 ! " 8 " , "#8 . " . Di conseguenza, si ha
140
I test funzionali
3!
, I3 , I3 I3" , 3 "8 . \3" 38 . , "#8 . " ,

8 8" 3! 8" 3!
ovvero, K. Pr , [3 "8 . \3" 38 . ]

8" 3!
8x (
"8.
"8. #8.
8"8.
IE .B" .B# .B8 , "#8 . " .

".
Si noti inoltre che per . "#8 si ha PrH . !, dal momento che in questo caso +8 3! I3 g. Inoltre immediato verificare che per . " si ha PrH . ". Esempio 12.3.1. Dal Teorema 12.3.4, per 8 # si ha K. #(
.
"#. ".
"#.
IE .B" .B# I"%" . I" . ,
dove E B" B# ! B" B# 1. Per quanto riguarda il precedente integrale si deve distinguere due casi. Per "% . "# si ha #(
.
"#. ".
"#.
IE .B" .B# # ( #( (
"#. ".
"#.
.B" .B# ). # %.
" , #
mentre per "# . " si ha

. "#.
IE .B" .B#
. ". # ( .B" .B# #. %. " . " B"
"#. ".
#( Dunque, si ha
".
" ".
.B" .B# # (
K. ). # %. "#I"%"# . #. # 4. "I"#" . I" ..
Per quanto riguarda la distribuzione per grandi campioni di H H8 si ha il seguente teorema. Teorema 12.3.5. Se \" \# \8 un campione casuale con funzione di ripartizione congiunta J8 VJ , per 8 si ha lim Pr8H . " # 8
"3" exp #3# . # , . ! .

3"
Dimostrazione. Si veda Billingsley (1968).
I test funzionali
141
Esempio 12.3.2. Nella Tavola 12.3.1 sono riportati i quantili di ordine !*& della distribuzione di H e le relative approssimazioni ottenute mediante il Teorema 12.3.5 per alcuni valori di 8. Tavola 12.3.1. Quantili .8!*& di H e relative approssimazioni.
8 # & "! #! $! %! &! .!*& !)%"* !&'$$ !%!)( !#*$* !#%"( !#"!" !"))% approssimazione !*'"# !'')& !%)'% !$&#% !#)*) !#&#" !##'!
Si noti che H converge abbastanza lentamente alla relativa distribuzione per grandi campioni. 12.4. Il test di Kolmogorov. Sia \" \# \8 un campione casuale da una variabile casuale continua \ con funzione di ripartizione congiunta J8 VJ . Un sistema di ipotesi interessante da verificare risulta L! J B J! B aB , contro L" J B J! B bB , dove J! B una funzione di ripartizione completamente specificata. Il test si basa sulla statistica s B J! B , H sup J
B
ovvero sulla statistica di Kolmogorov. Si noti che la statistica H pu essere convenientemente espressa come H max max[ 38 J! \3 3 "8 J! \3 ] .
"38
Se la funzione di ripartizione empirica si discosta molto da quella ipotizzata, allora si hanno valori elevati di H che conseguentemente portano a respingere l'ipotesi di base in favore dell'ipotesi alternativa. Se dunque .8 rappresenta il quantile di ordine della distribuzione di H, la regione critica del test risulta dunque g" . . .8" . Esempio 12.4.1. Su un campione di dieci ragnatele stato misurato l'angolo fra l'asse della ragnatela e la perpendicolare alla superficie terrestre, e si sono ottenuti i dati della Tavola 12.4.1. Tavola 12.4.1. Angoli fra ragnatele e asse terrestre (in radianti).
3 " # $ % & ' ( ) * "! B3 !"(%& !#!*% !##'* !#'") !#(*$ !#*'( !%")* !%$'$ !%&$) !&%"" KB3 !##*( !$!&( !$%'% !%$!( !%($& !&"&* !((!# !(*') !)#!* !*!## 3"! KB3 !"#*( !"!&( !!%'% !!$!( !!#'& !!)%" !!(!# !!!$# !!(*" !!*() 3 ""! KB3 !##*( !#!&( !"%'% !"$!( !!($& !!"&* !"(!# !!*') !!#!* !!!##
Fonte: Gadsen e Kanji (1981)
142
I test funzionali
Si vuole verificare se i dati provengono da una distribuzione di tipo von Mises, una distribuzione circolare adatta a modellare questi dati. La funzione di densit di una variabile casuale di vonMises data da 1B . , " exp, cosB . I!#1 B , ! . #1 , , ! , #1M! ,
dove M! , rappresenta la funzione di Bessel del primo tipo e ordine !, per cui la relativa funzione di ripartizione data da I!#1 B B KB . , ( exp, cos> . .> I#1 B . #1M! , ! Dal momento che si sospetta che le ragnatele siano state costruite da ragni della specie Araneus rufipalpus noto da molte osservazioni precedenti che i parametri della distribuzione di von Mises sono in questo caso . !#( per quanto riguarda la direzione media e , $(*% per quanto riguarda il parametro di concentrazione. Si vuole dunque verificare l'ipotesi di base L! J B KB !#( $(*% aB , contro l'ipotesi alternativa L" J B KB !#( $(*% bB . Dalla Tavola 12.4.1 si ricava che . !##*(, per cui PrH !##*( !.#! e quindi la significativit osservata risulta 9== !#!. L'evidenza empirica porta dunque ad accettare che i dati provengono da una distribuzione di tipo von Mises, dal momento che si pu accettare L! ad ogni livello di significativit !#!. Esempio 12.4.2. E' stato fatto un esperimento al fine di verificare la resistenza alla rottura di alcune fibre di poliestere. Pi esattamente sono stati determinati i carichi da applicare a un campione di queste fibre al fine di provocarne il cedimento. Si sospetta che la distribuzione dei carichi segua una distribuzione log-normale. I dati della Tavola 12.4.2 sono stati ottenuti trasformando quelli originali mediante la trasformazione dell'integrale di probabilit, ovvero se l'ipotesi di log-normalit valida allora il campione trasformato dovrebbe provenire da una Y ! 1. Dal momento che in questo caso J! B BI!" B I" B , allora si vuole dunque verificare l'ipotesi di base L! J B J! B aB , contro l'ipotesi alternativa L" J B J! B bB . Dalla Tavola 12.4.2 si ricava . !#$), per cui !!& PrH !.#$) !"! e quindi la significativit osservata risulta !!& 9== !"!. In questo caso vi qualche dubbio ad accettare L! , ovvero che il campione trasformato proviene da una Y ! 1 e che quindi il campione originale proviene da una variabile casuale log-normale, in quanto si potrebbe respingere questa ipotesi ad ogni livello di significativit !"!.
I test funzionali Tavola 12.4.2. Carichi di rottura delle fibre di poliestere.

fibra " # $ % & ' ( ) * "! "" "# "$ "% "& "' "( ") "* #! #" ## #$ #% #& #' #( #) #* $! B3 !#$ !$# !&% !'* !)" !*% "!& "#( "%) "'* ")) #"' #&& #(( $"" $'" $(' $*& %$# %'$ %)" &"* &#* &'( '%# '(% (&# )$# ))( *#' J! B3 !#$ !$# !&% !'* !)" !*% "!& "#( "%) "'* ")) #"' #&& #(( $"" $'" $(' $*& %$# %'$ %)" &"* &#* &'( '%# '(% (&# )$# ))( *#' 3$! J! B3 !"! !$& !%' !'% !)' "!' "#) "%! "&# "'% "() ")% "() "*! ")* "(# "*" #!& #!" #!% #"* #"% #$) #$$ "*" "*$ "%) ""! !)! !(% 3 "$! J! B3 !#$ !!" !"$ !$" !&# !($ !*& "!' ""* "$" "%& "&" "%& "&' "&' "$* "(! "(# "') "(! ")' ")" #!% #!! "&) "&* ""& !(( !%' !%"
143
Fonte: Quesenberry e Hales (1980) 12.5. La statistica di Kolmogorov-Smirnov. In questo paragrafo viene considerata una modifica della statistica di Kolmogorov che permette di costruire test per la verifica di ipotesi funzionali quando la variabile casuale d'interesse continua e si dispone di due campioni. Definizione 12.5.1. Siano \" \# \8" e ]" ]# ]8# due campioni casuali indipendenti, tali che il campione misto abbia funzione di ripartizione congiunta J8 VJ , s " B e J s # B le funzione di ripartizione empiriche relative dove 8 8" 8# . Siano inoltre J a ciascuno dei due campioni. La statistica di Kolmogorov-Smirnov data da s " B J s # B . H sup J
B
Evidentemente la statistica di Kolmogorov-Smirnov una misura della discrepanza fra le due funzione di ripartizione empiriche. Si pu dimostrare in modo del tutto analogo a quanto fatto nel Teorema 12.3.3 per la statistica di Kolmogorov, che anche la statistica di KolmogorovSmirnov distribution-free su VJ . Se Z" Z# Z8 la statistica ordinata relativa al campione misto \" \# \8" ]" ]# ]8# , allora si noti che la statistica H pu essere espressa come H max
"38
s " Z3 J s # Z3 . J
144
I test funzionali
:
Anche in questo caso il Teorema di Glivenko-Cantelli (vedi Serfling, 1980) implica H ! per 8" 8# . La distribuzione di H pu essere determinata in modo semplice per 8" 8# 8 mediante alcune propriet delle passeggiate aleatorie. Teorema 12.5.2. Siano \" \# \8 e ]" ]# ]8 due campioni casuali indipendenti, tali che il campione misto abbia funzione di ripartizione congiunta J#8 VJ . La distribuzione della statistica H di Kolmogorov-Smirnov risulta #8 K. " # 8
" < 3"
"3
#8 8 38. "
dove . ! "8 #8 " e < 88. ". Dimostrazione. Sia Z" Z# Z#8 la statistica ordinata relativa al campione misto \" \# \8 ]" ]# ]8 . Sia inoltre X3 una variabile casuale tale che vale "8 se Z3 appartiene al primo campione e vale "8 se Z3 appartiene al secondo campione (3 " # #8). Si consideri inoltre l'ulteriore variabile casuale W3 X" X# X3 (3 " # #8). Evidentemente, l'insieme delle variabili casuali W3 3 " # #8 costituisce una passeggiata aleatoria in #8 passi i cui percorsi 3 W3 (3 " # #8) sono di questi percorsi, tali che iniziano in ! ! e finiscono in #8 !. Si noti che vi sono #8 8 ognuno dei quali corrisponde ad una possibile sequenza di \3 e di ]3 nel campione misto ordinato. Inoltre, dal momento che i due campioni provengono dalla stessa distribuzione ogni percorso ugualmente probabile. E' fondamentale notare che dalla definizione di H si ha H max max W3
" 3 #8 " 3 #8
min W3 ,
per cui il problema di determinare K. equivalente al problema di determinare il numero di percorsi compresi fra la retta P , data da = . "8, e la retta P , data da = . "8. Si determini innanzitutto il numero di percorsi che intersecano la retta P . Si noti che esiste un punto E in cui il percorso interseca per la prima volta la retta P . Per la parte di percorso che va da E a #8 ! esiste un percorso simmetrico rispetto alla retta P che va da E a #8 #. #8. Quindi il numero di percorsi da ! ! che intersecano la retta P in E e finiscono in #8 ! uguale al numero di percorsi da ! ! che intersecano la retta P in E e procedono specularmente rispetto ai percorsi originari fino a #8 #. #8. #8 , ovvero il numero in cui 8 8. " salti positivi e Questo numero dato da 88." 8 8. " salti negativi possono essere permutati. Si denoti con T! l'insieme di percorsi che intersecano P e con T! l'insieme dei percorsi che intersecano P . Sia inoltre #I il numero di percorsi in un insieme I di percorsi. Si ha dunque
#T! T! #T! #T! #T! T! .
Per quanto affermato in precedenza si ha

#T! #T!
#8 8 8. "
Si noti che T! T! T" T" , dove T" l'insieme di tutti i percorsi che contengono almeno una parte di percorso che va da P a P e in maniera simile T" l'insieme di tutti i percorsi che contengono almeno una parte di percorso che va da P a P . Dunque si ha #T! T! #T" #T" #T" T" .
I test funzionali dove, in maniera analoga a quanto visto in precedenza, si ha

#T" #T"
145
#8 8 #8. "
Definendo quindi con T3 l'insieme di tutti i percorsi che contengono almeno 3 parti di percorso che vanno da P a P e con T3 l'insieme di tutti i percorsi che contengono 3 parti di percorso che vanno da P a P e procedendo in maniera iterativa si ha dunque
#T3" T3" #T3 #T3 #T3 T3 , 3 ! " < " ,
e #T3 #T3 #8 8 3 "8. " , 3 ! " < " ,
dove < 88. ". Ovviamente, si ha #T<" T<" !. Dunque, si ottiene <" <
#T!
T!
3!
"
#T3
#T3
#
3"
"3"
#8 8 38. "
per cui il numero di percorsi che non intersecano mai le rette P e P dato da #8 8
#T! T!
#8 8
<
#
3"
"3"
#8 8 38. "
Tenendo presente questo risultato si ha dunque #8 K. 8

"
#8 8 #8 8
<
#
3" " < 3"
"3"
#8 8 38. "
"#
"3
#8 8 38. "
che quanto si voleva dimostrare. Esempio 12.5.1. Dal Teorema 12.5.2, per 8 4 si ha K! " " $&
% 3" # 3" " 3"
"3 "3
) %3 ) % #3 ) % $3
!,
" K"% " $& " $&
) , $& #( , $&
K#% "
"3
146 "3 "3
I test funzionali
K$% "
" $&
" 3" ! 3"
) % %3
$% , $&
" K" " $&
) % &3
".
Per quanto riguarda infine la distribuzione per grandi campioni di H H8" 8# si ha il seguente risultato. Teorema 12.5.3. Per 8 8# si ha lim Pr8" 8# 8" 8# H . " # 8" 8 #
"3" exp #3# . # , . ! .

3"
Dimostrazione. Si veda Billingsley (1968).
12.6. Il test di Kolmogorov-Smirnov. Siano \" \# \8" e ]" ]# ]8# due campioni casuali indipendenti, tali che il campione misto abbia funzione di ripartizione congiunta J8 VJ , dove 8 8" 8# . Un sistema di ipotesi interessante da verificare risulta L! J" B J# B J B aB , contro L" J" B J# B bB . Il test si basa sulla statistica s " B J s # B , H sup J
B
ovvero sulla statistica di Kolmogorov-Smirnov. Si noti che se le due funzione di ripartizione empiriche si discostano molto fra di loro, allora si hanno realizzazioni elevate di H che conseguentemente portano a respingere l'ipotesi di base in favore dell'ipotesi alternativa. Se dunque .8" 8# rappresenta il quantile di ordine della distribuzione di H, la regione critica del test risulta dunque g" . . .8" 8# " . Esempio 12.6.1. In un esperimento per la verifica delle capacit percettive sono stati bendati 24 soggetti. I soggetti hanno poi percorso un tracciato irregolare di forma approssimativamente circolare. Ad un certo punto del tracciato ad ognuno dei soggetti stato chiesto di stimare l'angolo formato dalla loro attuale posizione rispetto alla posizione di partenza. Dodici di questi soggetti hanno percorso il tracciato in senso orario, mentre gli altri lo hanno percorso in senso anti-orario. I dati della Tavola 12.6.1 riportano gli errori commessi (in gradi) nelle stime degli angoli dai due gruppi. Si vuole verificare se i dati provengono dalla stessa distribuzione. Il procedimento per il calcolo della realizzazione campionaria di H per questi dati riportato nella Tavola 12.6.2. Si ha dunque . %"#, per cui PrH %"# !#! e quindi la significativit osservata risulta 9== !#!. Si quindi portati ad accettare che le due distribuzioni sono identiche, in quanto si pu accettare L! ad ogni livello di significativit !#!.
I test funzionali Tavola 12.6.1. Errori nelle stime degli angoli (in gradi).
soggetto " # $ % & ' ( ) * "! "" "# gruppo percorso senso orario &! ## "' "! ) "% ") # $ "" "# $" gruppo percorso senso anti-orario #$ ! * ( % #% "( "$ $# #$ %( &$
147
Fonte: Lederman, Klatsky e Barber (1985) Tavola 12.6.2.

soggetto " # $ % & ' ( ) * "! "" "# "$ "% "& "' "( ") "* #! #" ## #$ #% D3 &$ %( $# $" #$ ") "( "$ "# "" % $ # ! ( ) * "! "% "' ## #$ #% &! s " D3 J ! ! ! ""# ""# #"# #"# #"# $"# %"# %"# &"# '"# '"# '"# ("# ("# )"# *"# "!"# """# """# """# " s # D3 J ""# #"# $"# $"# %"# %"# &"# '"# '"# '"# ("# ("# ("# )"# *"# *"# "!"# "!"# "!"# "!"# "!"# """# "#"# " s " D3 J s # D3 J ""# #"# $"# #"# $"# #"# $"# %"# $"# #"# $"# #"# ""# #"# $"# #"# $"# #"# ""# ! ""# ! ""# !
Appendice
A.1. Alcune distribuzioni e relative caratteristiche. In questa sezione vengono considerate alcune variabili casuali di frequente uso insieme con alcune loro caratteristiche. Una generica variabile casuale ^ considerata nella sua forma standard e si indica con J ed 0 le relative funzioni di ripartizione e densit. Se si considera la variabile casuale non standard \ $ ^ -, dove - un parametro di posizione e $ un parametro di scala, allora si tenga presente che la relativa funzione di ripartizione data da KB J B -$ , mentre la relativa funzione di densit risulta 1B 0 B -$ $ . Ovviamente, si ha che E\ . $ E^ - e Var\ 5# $ # Var^. In particolare, se E^ ! e Var^ ", allora - . e $ 5. A.1.1. Distribuzione uniforme. Una variabile casulae uniforme ^ ha la seguente funzione di densit 0 D I!" D . Per questa distribuzione risulta E^ " , # " , "#
Var^
$ ! , % La mediana data D!.& "#. Inoltre, risulta 0 ! " ,

# ( 0 D .D " , " ! # ( D [J D "#]0 D .D " !
* . &
" , "# " . %
" "#
D0 D# .D (
"# !
D0 D# .D
Una variabile casuale uniforme non standard viene indicata con la notazione Y - $ .
Appendice
149
A.1.2. Distribuzione normale. Una variabile casuale normale ^ ha la seguente funzione di densit 0 D #1"# exp D # # . La funzione di ripartizione di questa variabile casuale viene indicata con FD. Inoltre il quantile di ordine viene indicato con D . Per questa distribuzione risulta E^ ! , Var^ " , $ ! , % $ . La mediana data D!.& !. Inoltre, risulta 0 ! ( ( (
!
" , #1 " , #1 " , %1$ " . #1
0 D# .D
D [FD "#]0 D# .D D0 D# .D (
!
D0 D# .D
Una variabile casuale normale non standard viene indicata con la notazione R . 5# . A.1.3. Distribuzione logistica. Una variabile casuale logistica ^ ha la seguente funzione di densit 0 D Per questa distribuzione risulta E^ ! , Var^ 1# , $ exp D . [" exp D]#
$ ! ,
150
Appendice
% La mediana data D!.& !. Inoltre, risulta
#" . & " , % " , ' " , #%
0 ! ( ( (
!
0 D# .D
D [J D "#]0 D# .D
D0 D# .D (
D0 D# .D
%ln# " . "#
Una variabile casuale logistica non standard viene indicata con P9. $ . A.1.4. Distribuzione esponenziale. Una variabile casuale esponenziale ^ ha la seguente funzione di densit 0 D exp DI! D . Per questa distribuzione risulta E^ " , Var^ " , $ # , % * . La mediana data D!.& ln#. Inoltre, risulta 0 ln# ( ( (
ln#
" , # " , # " . (#
0 D# .D
D [J D "#]0 D# .D
ln#
D0 D# .D (
D0 D# .D
#ln# " . )
Una variabile casuale esponenziale non standard viene indicata con la notazione I- 5.
Appendice
151
A.1.5. Distribuzione esponenziale doppia. Una variabile casuale esponenziale doppia ^ ha la seguente funzione di densit 0 D Per questa distribuzione risulta E^ ! , Var^ # , $ ! , % ' . La mediana data D!.& !. Inoltre, risulta 0 ! ( ( (

" exp D . #
" , # " , % & , "%% " . )
0 D# .D
D [J D "#]0 D# .D
!
D0 D# .D (
D0 D# .D
Una variabile casuale esponenziale doppia non standard denotata con I.. $ . A.1.6. Distribuzione di Cauchy. Una variabile casuale di Cauchy ^ ha la seguente funzione di densit 0 D " . 1" D #
Questa distribuzione non possiede momenti e la mediana data D!.& !. Inoltre, risulta 0 ! ( (

" , 1 " , #1 " , 41#
0 D# .D
D [J D "#]0 D# .D
152 ( D0 D .D (
#
Appendice
D0 D# .D
" . 1#
Una variabile casuale di Cauchy non standard denotata con G- $ . A.2. Alcuni risultati matematici. Il seguente teorema consente di determinare la somma di alcune potenze dei primi 8 interi. Teorema A.2.1. Si ha
8
3
3" 8
" 88 " , #
3#
3" 8
" 88 "#8 " , ' " # 8 8 "# , %
3$
3" 8
3%
3"
" 88 "#8 "$8# $8 " . $!
Dimostrazione. Si veda Randles e Wolfe (1979).
A.3. Alcuni risultati di teoria delle probabilit. In questo paragrafo vengono richiamati alcuni risultati sulla convergenza di successioni di variabili casuali. Una completa trattazione di questo argomento dato in Serfling (1980). Teorema A.3.1. (Legge Debole dei Grandi Numeri di Khintchine) Si consideri una successione \8 di variabili casuali indipendenti ed ugualmente distribuite con E\" . . Allora se \ 8 "8 8 3" \3 (8 ") si ha : \8 . . Dimostrazione. Vedi Serfling (1980).
Esempio A.3.1. Sia \8 una successione di variabili casuali indipendenti ed ugualmente distribuite con E\" . e Var\" 5# . Si consideri dunque la successione di variabili casuali ^8 , dove ^8 \8 .# , 8 ". Si noti che ^8 ancora una successione di variabili casuali indipendenti ed ugualmente distribuite con E^" 5# . Di conseguenza dalla Legge Debole dei Grandi Numeri di Khintchine (Teorema A.3.1) si ha " ^8 8
8 3"
\3 .# 5# .
Teorema A.3.2. (Legge Debole dei Grandi Numeri di Markov) Per ogni 8 sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\38 .38
Appendice
153
(3 " # 8). Si supponga inoltre che esista un $ (! $ ") per cui si ha E \38 .38 "$ e
8
lim
" 8"$
E \38 .38 "$ ! .

3"
Allora se \ 8 "8
8 3" \38
(8 ") si ha : \ 8 E\ 8 ! .
Dimostrazione. Vedi Serfling (1980).
Esempio A.3.2. Sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\38 -8 e Var\38 5# , dove - costante (3 " # 8). Dal momento che per $ " si ha E \38 .38 # 5# e lim 8 " 8#
8
5# 8lim
3"
5# !, 8
allora dalla Legge Debole dei Grandi Numeri di Markov (Teorema A.3.2) si ottiene : \ 8 -8 ! .
Teorema A.3.3. (Legge Forte dei Grandi Numeri di Khintchine) Per ogni 8 sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\"8 . (3 " # 8). Allora se \ 8 "8 8 3" \38 (8 " si ha ;\8 . . Dimostrazione. Vedi Serfling (1980).
Esempio A.3.3. Sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\38 -8 e Var\38 5# , dove - costante (3 " # 8). Si consideri dunque il vettore trasformato ^"8 ^#8 ^88 , dove ^38 \38 -8# (3 " # 8), che risulta ancora un vettore di variabili casuali indipendenti con E^38 5# . Di conseguenza, dalla Legge Forte dei Grandi Numeri di Khintchine (Teorema A.3.3) si ha " ^8 8 che implica " ^8 8
8 3" 8 3"
\38 -8# 5# ,
;-
\38 -8# 5# .
:
Teorema A.3.4. (Teorema di Sverdrup) Se \8 una successione di variabili casuali e 1 una funzione continua, allora \8 ) 1\8 1) ,
: :
154
;;-
Appendice
\8 ) 1\8 1) , \8 \ 1\8 1\ . Dimostrazione. Vedi Serfling (1980).

. .
Esempio A.3.4. Sia \8 una successione di variabili casuali indipendenti ed ugualmente distribuite con E\" . e Var\" 5# . Sia inoltre
# W8
" 8"
8 3"
\3 \ 8 # ,
dove \ 8 "8 espresso come

# W8
8 3" \3 . 8
# Con la notazione dell'Esempio A.3.1, si noti che W8 pu essere
8 " 8" 8
\3 .# \ 8 .#
3"
8 ^ 8 \ 8 .# . 8"
: Inoltre dalla Legge Debole dei Grandi Numeri di Khintchine (Teorema A.3.1) si ha \ 8 ., : mentre dall'Esempio A.3.1 si ha ^ 8 5# . Si noti inoltre che 1B D D B .# una funzione continua. Tenendo dunque presente che lim8 88 " ", per la generalizzazione al caso multivariato del Teorema di Sverdrup (Teorema A.3.4) si ha # : W8 5# . Esempio A.3.5. Sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\38 -8 e Var\38 5# , dove - costante (3 " # 8). Sia inoltre
# W8
" 8"
8 3"
\38 \ 8 # ,
dove \ 8 "8 espresso come

# W8
8 3" \38 . 8
# Con la notazione dell'Esempio A.3.3, si noti che W8 pu essere
: Inoltre dall'Esempio A.3.2 si ha \ 8 -8 !, mentre dall'Esempio A.3.3 si ha : ^ 8 5# . Tenendo presente che 1B D D B# una funzione continua e che lim8 88 " ", per la generalizzazione al caso multivariato del Teorema A.3.4 si ha # : infine W8 5# .
8 " 8" 8
3"
\38 -8# \ 8 -8#
8 ^ 8 \ 8 -8# . 8"
Teorema A.3.5. (Teorema di Slutsky) Se \8 e ]8 sono due successioni di variabili : . casuali tali che \8 \ e ]8 ) con ) costante, allora \ 8 ]8 \ ) , ]8 \ 8 ) \ ,
. .
Appendice
155
\8 ]8 \) , ) ! . Dimostrazione. Vedi Serfling (1980).
Teorema A.3.6. (Teorema Fondamentale Classico del Limite) Sia \8 una successione di variabili casuali indipendenti ed ugualmente distribuite con E\" . e Var\" 5# . Allora se \ 8 "8 8 3" \3 (8 ") si ha 8 . \ 8 . R ! " . 5
Dimostrazione. Vedi Serfling (1980). Esempio A.3.6. Sia \8 una successione di variabili casuali indipendenti ed ugualmente % distribuite con E\" . e Var\" 5# . Si assuma inoltre che E\" e % # % # E\" . .% , da cui Var\" . .% 5 # . Tenendo presente la notazione e i risultati dell'Esempio A.3.4 si ha 8 #
# W8 5#
8 #
" 8"
\3 .#
3"
8 85 # 5# \ 8 .# 8" 8" 8"
8 8 8 " ^ 8 5# [ 8\ 8 .# 5# 8] . 8" # 8" # Dal momento che E[\ 8 .# ] 5# 8, allora lim 8E[\ 8 .# ] 5# 8 8lim #5 # 8 ! , 8 ovvero [8\ 8 .# 5# 8] converge in media a !, che implica
: # # 8\ 8 . 5 8 ! .
Inoltre dal Teorema Fondamentale Classico del Limite (Teorema A.3.6) si ha 8 . ^ 8 5# R ! " . # 8 #
Quindi per il Teorema di Slutsky (Teorema A.3.5) si pu concludere che

# W8 5# R ! " .
.
Teorema A.3.7. (Teorema Fondamentale di Lindberg del Limite) Per ogni 8 sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\38 .38 e 8 # # # Var\38 538 (3 " # 8) e sia inoltre .8 8 3" .38 e 58 3" 538 . Se per ogni % ! si ha lim 8 " # 58
8
E[\38 .38 # I.38 %58 .38 %58 \38 ] ! ,

3" 8 3" \38
allora se \ 8 "8
156
Appendice
" . 8\ 8 .8 R ! " . 58 Dimostrazione. Vedi Serfling (1980).
Corollario A.3.8. Per ogni 8 sia \"8 \#8 \88 un vettore di variabili casuali # indipendenti con E\38 .8 e Var\38 58 (3 " # 8). Allora se 8 \ 8 "8 3" \38 8 . \ 8 .8 R ! " . 58
Teorema A.3.9. (Teorema Fondamentale di Lyapunov del Limite) Per ogni 8 sia \"8 \#8 \88 un vettore di variabili casuali indipendenti con E\38 .38 e 8 # # # Var\38 538 (3 " # 8) e sia inoltre .8 8 3" .38 e 58 3" 538 . Se esiste un $ ! tale che lim 8 allora se \ 8 "8
8 3" \38
"
#$ 58 3"
E \38 .38 #$ ! ,
" . 8\ 8 .8 R ! " . 58 Dimostrazione. Vedi Serfling (1980).
Teorema A.3.10. (Metodo Delta) Se \8 una variabili casuali tale che . 8\8 .5 R ! " e se 1 una funzione continua tale che 1w . esiste e 1w . !, allora
. 8 1\8 1. R ! " . w 5 1 .
Analogamente se X8 un vettore di variabili casuali tale che8X8 . R5 ! D e se g 5 6 un vettore di funzioni continue tale che D `g`xx esiste e D !. Allora
. . 8 gX8 g. R6 ! DT DD .
x.
Esempio A.3.7. Sia \8 una successione di variabili casuali indipendenti ed ugualmente distribuite per cui si ha E\" ., Var\" 5# e E\" .% .% . Nell'Esempio . # A.3.3 stato provato che 8"# W8 5# # R ! ". Se si considera la trasformata # # si ha 1w 5 # #5 # " , per cui applicando il Metodo Delta si ha W8 1W8 W8
. 8 W8 5 R ! " . # #5"
Appendice
157
Teorema A.3.11. (Teorema di Cochran) Sia X8 una successione di vettori casuali 5 . dimensionati tali che 8X8 . R5 ! D. Sia inoltre C una matrice quadrata simmetrica di ordine 5 . In questo caso 8X8 .T CX8 . ;# ; se e solo se DCDCD DCD, dove trCD ; . Dimostrazione. Vedi Serfling (1980).
.
Teorema A.3.12. Sia J8 una successione di funzioni di ripartizione di variabili casuali continue che converge uniformemente alla funzione di ripartizione K. Se -8 una successione in , allora lim J - 8 8 8 se e solo se lim 8 8 dove B tale che KB . Dimostrazione. Vedi Serfling (1980). B , ,!",
Bibliografia
Bibliografia di base
Billingsley, P. (1968) Convergence of probability measures, Wiley, New York. Conover, W.J. (1980) Practical nonparametric statistics, Wiley, New York. Daniel, W.W. (1978) Applied nonparametric statistics, Houghton Mifflin Company, Boston. Feller W. (1971) An introduction to probability theory and its applications, vol. I-II, Wiley, New York. Fraser, D.A.S. (1957) Nonparametric methods in statistics, Wiley, New York. Gibbons, J.D. (1985) Nonparametric methods for quantitative analysis, American Sciences Press, Syracuse, New York. Gibbons, J.D. e Chakraborti, S. (1992) Nonparametric statistical inference, Dekker, New York. Hettmansperger, T.P. (1991) Statistical inference based on ranks, Krieger Publishing Company, Malabar, Florida. Hettmansperger, T.P. e McKean, J.W. (1998) Robust nonparametric statistical methods, Arnold, London. Hollander, M. e Wolfe, D.A. (1973) Nonparametric statistical methods, Wiley, New York. Hajek, J. (1969) Nonparametric statistics, Holden Day, San Francisco. Z. (1967) Theory of rank tests, Academic Press, New York. Hajek, J. e idak, Kendall, M.G. (1962) Rank correlation methods, Hafner, New York. Kendall, M.G. e Gibbons J.D. (1976) Rank correlation methods, Edward Arnold, London. Lehmann, E.L. (1975) Nonparametrics: statistical methods based on ranks, Holden-Day, San Francisco. Maritz, J.S. (1981) Distribution-free statisitical methods, Chapman and Hall, London. Noether, G.E. (1967) Elements of nonparametric statistics, Wiley, New York. Puri, M.L. e Sen, P.K. (1971) Nonparametric methods in multivariate analysis, Wiley, New York. Randles, R.H. e Wolfe, D.A. (1979) Introduction to the theory of nonparametric statistics, Wiley, New York. Siegel, S. (1956) Nonparametric statistics for behavioral sciences, McGraw Hill, New York. Siegel, S. e Castellan, N.J. (1988) Nonparametric statistics for behavioral sciences, McGraw Hill, New York. Serfling, R.J. (1980) Approximation theorems of mathematical statistics, Wiley, New York.
Riferimenti bibliografici
Batschelet, E. (1981) Circular Statistics in biology, Academic Press, London. Benford, F. (1938) The law of anomalous numbers, Proceedings of the American Philosophical Society 78, 551-572.
182
Bibliografia
Bhatia, M.L., Manchanda, S.C. e Roy, S.B. (1969) Coronary Haemodinamic studies in chronic severe anaemia, British Heart Journal 31, 365-374. Brinegar, C.S. (1963) Mark Twain and the Q.C.S. letters - a statistical test of authorship, Journal of the Royal Statistical Association 58, 85-96. Brook, C.G.D. (1971) Determination of body composition of children from skinfold measuraments, Archivia Disease Childhood 46, 182-184. Bryson, M.C. e Siddiqui, M.M. (1969) Survival time: some criteria for aging, Journal of the American Statistical Association 64, 1472-1483. Cameron, E. e Pauling, L. (1974) Supplemental ascorbate in the supportive treatment of cancer: re-evaluation of prolongation of survival times in terminal human cancer, Proceedings of the National Academy of Science USA 75, 4538-4542. Clarke, R.D. (1946) An application of the Poisson distribution, Journal of the Institute of the Actuaries 72, 48. Darwin, C. (1876) The effects of cross- and self-fertilization in the vegetable kingdom, John Murray, London. Dubois, C. (1970) Lowie's selected papers in antrophology, University of California Press, California. Edwards A.W. e Fraccaro M. (1960) Distribution and sequences of sexes in a selected sample of Swedish families, Annals Human Genetics 24, 245-252. Gadsen, R.J. e Kanji, G.K. (1981) Sequential analysis for angular data, The Statistician 30, 119-129. Johnson, T.E. e Graybill, F.A. (1972) An analysis of two-way model with interaction and no replication, Journal of the American Statistical Association 67, 862-868. Kendall, D.G. (1951) Some problems in the theory of queues, Journal of the Royal Statistical Society B13, 151-185. Lederman, S.J., Klatsky, R.L. e Barber, B.P.O. (1985) Spatial and movement-based heuristics for encoding pattern information through touch, Journal of Experimental Psycology: General 114, 33-49. Lunn, A.D. e McNeil, D.R. (1991) Computer-interactive data analysis, Wiley, New York. Nanji, A.A. e French, S.W. (1985) Relationship between pork consumption and cirrhosis, The Lancet 1, 681-683. Preece, D.A. (1981) Distributions of final digits in the data, The Statistician 30, 31-60. Quesenberry, C.P. e Hales, C. (1980) Concentration bands for uniformity plots, Journal of Statistical Computation and Simulation 11, 41-53. Romano, A. (1977) Applied Statistics for Science and Industry, Allyn and Bacon, Boston. Rutheford, E. e Geiger, M. (1910) The probability of variations in the distributions of alphaparticles, Philosophical Magazine 20, 698-704. Selvin, S. (1991) Statistical analysis of epidemiological data, Oxford University Press, New York. Snedecor, G.W. e Cochran, G.C. (1967) Statistical methods, Iowa State University Press, Ames. Till, R. (1974) Statistical methods for the earth scientist, McMillan, London. Van Oost, B.A., Veldhayzen, B., Timmermans, A.P.M. e Sixma, J.J. (1983) Increased urinary " -thromboglobulin excretion in diabets assayed with a modified RIA kit-technique, Thrombosis and Haemostasis 9, 18-20.
Tavole
Tavola 1. Gli elementi della tavola danno le probabilit di coda sinistra di una variabile casuale R ! ".
D 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2
.00 .5000 .5398 .5793 .6179 .6554 .6915 .7257 .7580 .7881 .8159 .8413 .8643 .8849 .9032 .9192 .9332 .9452 .9554 .9641 .9713 .9772 .9821 .9861 .9893 .9918 .9938 .9953 .9965 .9974 .9981 .9987 .9990 .9993
.01 .5040 .5438 .5832 .6217 .6591 .6950 .7291 .7611 .7910 .8186 .8438 .8665 .8869 .9049 .9207 .9345 .9463 .9564 .9649 .9719 .9778 .9826 .9864 .9896 .9920 .9940 .9955 .9966 .9975 .9982 .9987 .9991 .9993
.02 .5080 .5478 .5871 .6255 .6628 .6985 .7324 .7642 .7939 .8212 .8461 .8686 .8888 .9066 .9222 .9357 .9474 .9573 .9656 .9726 .9783 .9830 .9868 .9898 .9922 .9941 .9956 .9967 .9976 .9982 .9987 .9991 .9994
.03 .5120 .5517 .5910 .6293 .6664 .7019 .7357 .7673 .7967 .8238 .8485 .8708 .8907 .9082 .9236 .9370 .9484 .9582 .9664 .9732 .9788 .9834 .9871 .9901 .9925 .9943 .9957 .9968 .9977 .9983 .9988 .9991 .9994
.04 .5160 .5557 .5948 .6331 .6700 .7054 .7389 .7704 .7995 .8264 .8508 .8729 .8925 .9099 .9251 .9382 .9495 .9591 .9671 .9738 .9793 .9838 .9875 .9904 .9927 .9945 .9959 .9969 .9977 .9984 .9988 .9992 .9994
.05 .5199 .5596 .5987 .6368 .6736 .7088 .7422 .7734 .8023 .8289 .8531 .8749 .8944 .9115 .9265 .9394 .9505 .9599 .9678 .9744 .9798 .9842 .9878 .9906 .9929 .9946 .9960 .9970 .9978 .9984 .9989 .9992 .9994
.06 .5239 .5636 .6026 .6406 .6772 .7123 .7454 .7764 .8051 .8315 .8554 .8770 .8962 .9131 .9279 .9406 .9515 .9608 .9686 .9750 .9803 .9846 .9881 .9909 .9931 .9948 .9961 .9971 .9979 .9985 .9989 .9992 .9994
.07 .5279 .5675 .6064 .6443 .6808 .7157 .7486 .7794 .8078 .8340 .8577 .8790 .8980 .9147 .9292 .9418 .9525 .9616 .9693 .9756 .9808 .9850 .9884 .9911 .9932 .9949 .9962 .9972 .9979 .9985 .9989 .9992 .9995
.08 .5319 .5714 .6103 .6480 .6844 .7190 .7517 .7823 .8106 .8365 .8599 .8810 .8997 .9162 .9306 .9429 .9535 .9625 .9699 .9761 .9812 .9854 .9887 .9913 .9934 .9951 .9963 .9973 .9980 .9986 .9990 .9993 .9995
.09 .5359 .5753 .6141 .6517 .6879 .7224 .7549 .7852 .8133 .8389 .8621 .8830 .9015 .9177 .9319 .9441 .9545 .9633 .9706 .9767 .9817 .9857 .9890 .9916 .9936 .9952 .9964 .9974 .9981 .9986 .9990 .9993 .9995
Tavole
159
Tavola 2. Gli elementi della tavola danno i quantili di una variabile casuale ;# 8 per alcune probabilit di coda sinistra T e gradi di libert 8 " # $!.
8\T 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0.05 0.004 0.10 0.35 0.71 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 11.59 12.34 13.09 13.85 14.61 15.38 16.15 16.93 17.71 18.49
0.10 0.016 0.21 0.58 1.06 1.61 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.09 10.86 11.65 12.44 13.24 14.04 14.85 15.66 16.47 17.29 18.11 18.94 19.77 20.60
0.50 0.45 1.39 2.37 3.36 4.35 5.35 6.35 7.34 8.34 9.34 10.34 11.34 12.34 13.34 14.34 15.34 16.34 17.34 18.34 19.34 20.34 21.34 22.34 23.34 24.34 25.34 26.34 27.34 28.34 29.34
0.75 1.32 2.77 4.11 5.39 6.63 7.84 9.04 10.22 11.39 12.55 13.70 14.85 15.98 17.12 18.25 19.37 20.49 21.60 22.72 23.83 24.93 26.04 27.14 28.24 29.34 30.43 31.53 32.62 33.71 34.80
0.90 2.71 4.61 6.25 7.78 9.24 10.64 12.02 12.36 14.68 15.99 17.28 18.55 19.81 21.06 22.31 23.54 24.77 25.99 27.20 28.41 29.62 30.81 32.01 33.20 34.38 35.56 36.74 37.92 39.09 40.26
0.95 3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 26.30 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.42 37.65 38.89 40.11 41.34 42.56 43.77
0.975 5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.54 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.84 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98
0.99 6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.72 26.22 27.69 29.14 30.58 32.00 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89
.995 7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.96 23.59 25.19 26.76 28.30 29.82 31.32 32.80 34.27 35.72 37.16 38.58 40.00 41.40 42.80 44.18 45.56 46.93 48.29 49.64 50.99 52.34 53.67
.999 10.83 13.82 16.27 18.47 20.52 22.46 24.32 26.12 27.88 29.59 31.26 32.91 34.53 36.12 37.70 39.25 40.79 43.31 43.82 45.32 46.80 48.27 49.73 51.18 52.62 54.05 55.48 56.89 58.30 59.70
#8 " Per 8 $! le probabilit di coda sinistra possono essere ottenute tenendo presente che ^ #;# 8 converge in probabilit ad una variabile casuale R ! ".
160
Tavole
Tavola 3. Gli elementi della tavola danno le probabilit T di coda sinistra o destra della statistica F del test dei segni (a secondo che nella tavola , sia a sinistra o a destra di T ), 8 # $ #!.
8 2
T .2500 .7500 .1250 .5000 .0625 .3125 .6875 .0313 .1875 .5000 .0156 .1094 .3438 .6563 .0078 .0625 .2266 .5000 .0039 .0352 .1445 .3633 .6367 .0020 .0195 .0898 .2539 .5000 .0010 .0107
, 2 1 3 2 4 3 2 5 4 3 6 5 4 3 7 6 5 4 8 7 6 5 4 9 8 7 6 5 10 9
8 , 10 2 3 4 5 11 0 1 2 3 4 5 12 0 1 2 3 4 5 6 13 0 1 2 3 4 5 6 14 0 1 2 3 4 5
T .0547 .1719 .3770 .6230 .0005 .0059 .0327 .1133 .2744 .5000 .0002 .0032 .0193 .0730 .1938 .3872 .6128 .0001 .0017 .0112 .0461 .1334 .2905 .5000 .0001 .0009 .0065 .0287 .0898 .2120
, 8 7 6 5 11 10 9 8 7 6 12 11 10 9 8 7 6 13 12 11 10 9 8 7 14 13 12 11 10 9
8 , 14 6 7 15 0 1 2 3 4 5 6 7 16 0 1 2 3 4 5 6 7 8 17 0 1 2 3 4 5 6 7 8 18 0 1
T .3953 .6047 .0000 .0005 .0037 .0176 .0592 .1509 .3036 .5000 .0000 .0003 .0021 .0106 .0384 .1051 .2272 .4018 .5982 .0000 .0001 .0012 .0064 .0245 .0717 .1662 .3145 .5000 .0000 .0001
8 ,
T .0007 .0038 .0154 .0481 .1189 .2403 .4073 .5927 .0000 .0000 .0004 .0022 .0096 .0318 .0835 .1796 .3238 .5000 .0000 .0000 .0002 .0013 .0059 .0207 .0577 .1316 .2517 .4119 .5881
, 16 15 14 13 12 11 10 9 19 18 17 16 15 14 13 12 11 10 20 19 18 17 16 15 14 13 12 11 10
0 1 3 0 1 4 0 1 2 5 0 1 2 6 0 1 2 3 7 0 1 2 3 8 0 1 2 3 4 9 0 1 2 3 4 10 0 1
8 18 2 7 3 15 4 14 5 13 6 12 7 11 8 10 9 9 19 0 8 1 16 2 15 3 14 4 13 5 12 6 11 7 10 8 9 9 8 20 0 17 1 16 2 15 3 14 4 13 5 12 6 11 7 10 8 9 9 18 10 17
Tavole
161
Tavola 4. Gli elementi della tavola danno le probabilit T di coda sinistra o destra della statistica [ di Wilcoxon (a secondo che nella tavola A sia a sinistra o a destra di T ), 8 # $ "&. A 0 1 0 1 2 3 0 1 2 3 4 5 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 A 8 A 3 7 4 2 5 6 6 5 7 4 8 3 9 10 10 9 11 8 12 7 13 6 14 5 8 0 15 1 14 2 13 3 12 4 11 5 10 6 9 7 8 8 21 9 20 10 19 11 18 12 17 13 16 14 15 15 14 16 13 17 12 18 11 9 0 28 1 27 2 26 3 25 4 A 8 A 24 9 5 23 6 22 7 21 8 20 9 19 10 18 11 17 12 16 13 15 14 14 15 36 16 35 17 34 18 33 19 32 20 31 21 30 22 29 10 0 28 1 27 2 26 3 25 4 24 5 23 6 22 7 21 8 20 9 19 10 18 11 45 12 44 13 43 14 42 15 41 16 A 8 A A 8 A T A .2324 .2598 .2886 .3188 .3501 .3823 .4155 .4492 .4829 .5171 .0002 .0005 .0007 .0012 .0017 .0024 .0034 .0046 .0061 .0081 .0105 .0134 .0171 .0212 .0261 .0320 .0386 .0461 .0549 .0647 .0757 .0881 .1018 .1167 .1331 42 41 40 39 38 37 36 35 34 33 78 77 76 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54
8 2 3
.2500 .5000 .1250 .2500 .3750 .6250 .0625 .1250 .1875 .3125 .4375 .5625 .0313 .0625 .0938 .1563 .2188 .3125 .4063 .5000 .0156 .0313 .0469 .0781 .1094 .1563 .2188 .2813 .3438 .4219 .5000 .0078 .0156 .0234 .0391
.0547 .0781 .1094 .1484 .1875 .2344 .2891 .3438 .4063 .4688 .5313 .0039 .0078 .0117 .0195 .0273 .0391 .0547 .0742 .0977 .1250 .1563 .1914 .2305 .2734 .3203 .3711 .4219 .4727 .5273 .0020 .0039 .0059 .0098 .0137
.0195 .0273 .0371 .0488 .0645 .0820 .1016 .1250 .1504 .1797 .2129 .2480 .2852 .3262 .3672 .4102 .4551 .5000 .0010 .0020 .0029 .0049 .0068 .0098 .0137 .0186 .0244 .0322 .0420 .0527 .0654 .0801 .0967 .1162 .1377
40 10 17 .1611 38 11 24 39 18 .1875 37 25 38 19 .2158 36 26 37 20 .2461 35 27 36 21 .2783 34 28 35 22 .3125 33 29 34 23 .3477 32 30 33 24 .3848 31 31 32 25 .4229 30 32 31 26 .4609 29 33 30 27 .5000 28 12 0 29 11 0 .0005 66 1 28 1 .0010 65 2 27 2 .0015 64 3 26 3 .0024 63 4 25 4 .0034 62 5 24 5 .0049 61 6 23 6 .0068 60 7 55 7 .0093 59 8 54 8 .0122 58 9 53 9 .0161 57 10 52 10 .0210 56 11 51 11 .0269 55 12 50 12 .0337 54 13 49 13 .0415 53 14 48 14 .0508 52 15 47 15 .0615 51 16 46 16 .0737 50 17 45 17 .0874 49 18 44 18 .1030 48 19 43 19 .1201 47 20 42 20 .1392 46 21 41 21 .1602 45 22 40 22 .1826 44 23 39 23 .2065 43 24
162
Tavola 4. (continuazione)
Tavole
8 12
A 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
A 8 A
A 8 A
A 8 A
A 8 A
T A .0277 .0319 .0365 .0416 .0473 .0535 .0603 .0677 .0757 .0844 .0938 .1039 .1147 .1262 .1384 .1514 .1651 .1796 .1947 .2106 .2271 .2444 .2622 .2807 .2997 .3193 .3394 .3599 .3808 .4020 .4235 .4452 .4670 .4890 .5110 94 93 92 91 90 89 88 87 86 85 84 83 82 81 80 79 78 77 76 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60
13
.1506 .1697 .1902 .2119 .2349 .2593 .2847 .3110 .3386 .3667 .3955 .4250 .4548 .4849 .5151 .0001 .0002 .0004 .0006 .0009 .0012 .0017 .0023 .0031 .0040 .0052 .0067 .0085 .0107 .0133 .0164 .0199 .0239 .0287 .0341
53 13 20 .0402 71 14 9 52 21 .0471 70 10 51 22 .0549 69 11 50 23 .0636 68 12 49 24 .0732 67 13 48 25 .0839 66 14 47 26 .0955 65 15 46 27 .1082 64 16 45 28 .1219 63 17 44 29 .1367 62 18 43 30 .1527 61 19 42 31 .1698 60 20 41 32 .1879 59 21 40 33 .2072 58 22 39 34 .2274 57 23 91 35 .2487 56 24 90 36 .2709 55 25 89 37 .2939 54 26 88 38 .3177 53 27 87 39 .3424 52 28 86 40 .3677 51 29 85 41 .3934 50 30 84 42 .4197 49 31 83 43 .4463 48 32 82 44 .4730 47 33 81 45 .5000 46 34 80 14 0 .0001 105 35 79 1 .0001 104 36 78 2 .0002 103 37 77 3 .0003 102 38 76 4 .0004 101 39 75 5 .0006 100 40 74 6 .0009 99 41 73 7 .0012 98 42 72 8 .0015 97 43
.0020 .0026 .0034 .0043 .0054 .0067 .0083 .0101 .0123 .0148 .0176 .0209 .0247 .0290 .0338 .0392 .0453 .0520 .0594 .0676 .0765 .0863 .0969 .1083 .1206 .1338 .1479 .1629 .1788 .1955 .2131 .2316 .2508 .2708 .2915
96 14 44 .3129 61 15 26 95 45 .3349 60 27 94 46 .3574 59 28 93 47 .3804 58 29 92 48 .4039 57 30 91 49 .4276 56 31 90 50 .4516 55 32 89 51 .4758 54 33 88 52 .5000 53 34 87 15 0 .0000 120 35 86 1 .0001 119 36 85 2 .0001 118 37 84 3 .0002 117 38 83 4 .0002 116 39 82 5 .0003 115 40 81 6 .0004 114 41 80 7 .0006 113 42 79 8 .0008 112 43 78 9 .0010 111 44 77 10 .0013 110 45 76 11 .0017 109 46 75 12 .0021 108 47 74 13 .0027 107 48 73 14 .0034 106 49 72 15 .0042 105 50 71 16 .0051 104 51 70 17 .0062 103 52 69 18 .0075 102 53 68 19 .0090 101 54 67 20 .0108 100 55 66 21 .0128 99 56 65 22 .0151 98 57 64 23 .0177 97 58 63 24 .0206 96 59 62 25 .0240 95 60
Tavole
163
Tavola 5. Gli elementi della tavola danno le probabilit T di coda sinistra o destra della statistica [ di MannWhitney-Wilcoxon (a secondo che nella tavola A sia a sinistra o a destra di T ), 8" 8# " # "!.
8" 1 1 1 1
8# A
T A 2 3 2 4 3 5 4 3 6 5 4 7 6 5 4 8 7 6 5 9 8 7 6 5 10 9 8 7 6 11
8" 8# A 1 10 2 3 4 5 6 2 2 3 4 5 2 3 3 4 5 6 2 4 3 4 5 6 7 2 5 3 4 5 6 7 8 2 6 3 4 5 6 7 8 9
T A .1818 .2727 .3636 .4545 .5455 .1667 .3333 .6667 .1000 .2000 .4000 .6000 .0667 .1333 .2667 .4000 .6000 .0476 .0952 .1905 .2857 .4286 .5714 .0357 .0714 .1429 .2143 .3214 .4286 .5714 10 9 8 7 6 7 6 5 9 8 7 6 11 10 9 8 7 13 12 11 10 9 8 15 14 13 12 11 10 9
8" 8# A
T A 17 16 15 14 13 12 11 10 19 18 17 16 15 14 13 12 11 21 20 19 18 17 16 15 14 13 12 23 22 21
8" 8# A
T A
8" 8# A
T A
1 1 .5000 2 1 .3333 2 .6667 3 1 .2500 2 .5000 4 1 .2000 2 .4000 3 .6000 5 1 .1667 2 .3333 3 .5000 6 1 .1429 2 .2857 3 .4286 4 .5714 7 1 .1250 2 .2500 3 .3750 4 .5000 8 1 .1111 2 .2222 3 .3333 4 .4444 5 .5556 9 1 .1000 2 .2000 3 .3000 4 .4000 5 .5000 10 1 .0909
2 7 3 .0278 4 .0556 5 .1111 6 .1667 7 .2500 8 .3333 9 .4444 10 .5556 2 8 3 .0222 4 .0444 5 .0889 6 .1333 7 .2000 8 .2667 9 .3556 10 .4444 11 .5556 2 9 3 .0182 4 .0364 5 .0727 6 .1091 7 .1636 8 .2182 9 .2909 10 .3636 11 .4545 12 .5455 2 10 3 .0152 4 .0303 5 .0606
2 10 6 .0909 7 .1364 8 .1818 9 .2424 10 .3030 11 .3788 12 .4545 13 .5455 3 3 6 .0500 7 .1000 8 .2000 9 .3500 10 .5000 3 4 6 .0286 7 .0571 8 .1143 9 .2000 10 .3143 11 .4286 12 .5714 3 5 6 .0179 7 .0357 8 .0714 9 .1250 10 .1964 11 .2857 12 .3929 13 .5000 3 6 6 .0119 7 .0238
20 3 6 8 .0476 22 19 9 .0833 21 18 10 .1310 20 17 11 .1905 19 16 12 .2738 18 15 13 .3571 17 14 14 .4524 16 13 15 .5476 15 15 3 7 6 .0083 27 14 7 .0167 26 13 8 .0333 25 12 9 .0583 24 11 10 .0917 23 18 11 .1333 22 17 12 .1917 21 16 13 .2583 20 15 14 .3333 19 14 15 .4167 18 13 16 .5000 17 12 3 8 6 .0061 30 21 7 .0121 29 20 8 .0242 28 19 9 .0424 27 18 10 .0667 26 17 11 .0970 25 16 12 .1394 24 15 13 .1879 23 14 14 .2485 22 24 15 .3152 21 23 16 .3879 20
164
Tavole
8" 3 3
8# A
T A 19 18 33 32 31 30 29 28 27 26 25 24 23 22 21 20 36 35 34 33 32 31 30 29 28 27 26 25 24 23
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8 17 .4606 18 .5394 9 6 .0045 7 .0091 8 .0182 9 .0318 10 .0500 11 .0727 12 .1045 13 .1409 14 .1864 15 .2409 16 .3000 17 .3636 18 .4318 19 .5000 10 6 .0035 7 .0070 8 .0140 9 .0245 10 .0385 11 .0559 12 .0804 13 .1084 14 .1434 15 .1853 16 .2343 17 .2867 18 .3462 19 .4056
3 10 20 .4685 21 .5315 4 4 10 .0143 11 .0286 12 .0571 13 .1000 14 .1714 15 .2429 16 .3429 17 .4429 18 .5571 4 5 10 .0079 11 .0159 12 .0317 13 .0556 14 .0952 15 .1429 16 .2063 17 .2778 18 .3651 19 .4524 20 .5476 4 6 10 .0048 11 .0095 12 .0190 13 .0333 14 .0571 15 .0857 16 .1286 17 .1762
22 4 6 18 .2381 26 4 8 20 .1838 32 4 10 14 .0120 46 21 19 .3048 25 21 .2303 31 15 .0180 45 26 20 .3810 24 22 .2848 30 16 .0270 44 25 21 .4571 23 23 .3414 29 17 .0380 43 24 22 .5429 22 24 .4040 28 18 .0529 42 23 4 7 10 .0030 38 25 .4667 27 19 .0709 41 22 11 .0061 37 26 .5333 26 20 .0939 40 21 12 .0121 36 4 9 10 .0014 46 21 .1199 39 20 13 .0212 35 11 .0028 45 22 .1518 38 19 14 .0364 34 12 .0056 44 23 .1868 37 18 15 .0545 33 13 .0098 43 24 .2268 36 30 16 .0818 32 14 .0168 42 25 .2697 35 29 17 .1152 31 15 .0252 41 26 .3177 34 28 18 .1576 30 16 .0378 40 27 .3666 33 27 19 .2061 29 17 .0531 39 28 .4196 32 26 20 .2636 28 18 .0741 38 29 .4725 31 25 21 .3242 27 19 .0993 37 30 .5275 30 24 22 .3939 26 20 .1301 36 5 5 15 .0040 40 23 23 .4636 25 21 .1650 35 16 .0079 39 22 24 .5364 24 22 .2070 34 17 .0159 38 21 4 8 10 .0020 42 23 .2517 33 18 .0278 37 20 11 .0040 41 24 .3021 32 19 .0476 36 34 12 .0081 40 25 .3552 31 20 .0754 35 33 13 .0141 39 26 .4126 30 21 .1111 34 32 14 .0242 38 27 .4699 29 22 .1548 33 31 15 .0364 37 28 .5301 28 23 .2103 32 30 16 .0545 36 4 10 10 .0010 50 24 .2738 31 29 17 .0768 35 11 .0020 49 25 .3452 30 28 18 .1071 34 12 .0040 48 26 .4206 29 27 19 .1414 33 13 .0070 47 27 .5000 28
Tavole
165
8" 5
8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
6 15 .0022 16 .0043 17 .0087 18 .0152 19 .0260 20 .0411 21 .0628 22 .0887 23 .1234 24 .1645 25 .2143 26 .2684 27 .3312 28 .3961 29 .4654 30 .5346 7 15 .0013 16 .0025 17 .0051 18 .0088 19 .0152 20 .0240 21 .0366 22 .0530 23 .0745 24 .1010 25 .1338 26 .1717 27 .2159 28 .2652
45 5 7 29 .3194 36 5 9 20 .0095 55 5 10 27 .0646 53 6 6 37 .4091 41 44 30 .3775 35 21 .0145 54 28 .0823 52 38 .4686 40 43 31 .4381 34 22 .0210 53 29 .1032 51 39 .5314 39 42 32 .5000 33 23 .0300 52 30 .1272 50 6 7 21 .0006 63 41 5 8 15 .0008 55 24 .0415 51 31 .1548 49 22 .0012 62 40 16 .0016 54 25 .0559 50 32 .1855 48 23 .0023 61 39 17 .0031 53 26 .0734 49 33 .2198 47 24 .0041 60 38 18 .0054 52 27 .0949 48 34 .2567 46 25 .0070 59 37 19 .0093 51 28 .1199 47 35 .2970 45 26 .0111 58 36 20 .0148 50 29 .1489 46 36 .3393 44 27 .0175 57 35 21 .0225 49 30 .1818 45 37 .3839 43 28 .0256 56 34 22 .0326 48 31 .2188 44 38 .4296 42 29 .0367 55 33 23 .0466 47 32 .2592 43 39 .4765 41 30 .0507 54 32 24 .0637 46 33 .3032 42 40 .5235 40 31 .0688 53 31 25 .0855 45 34 .3497 41 6 6 21 .0011 57 32 .0903 52 30 26 .1111 44 35 .3986 40 22 .0022 56 33 .1171 51 50 27 .1422 43 36 .4491 39 23 .0043 55 34 .1474 50 49 28 .1772 42 37 .5000 38 24 .0076 54 35 .1830 49 48 29 .2176 41 5 10 15 .0003 65 25 .0130 53 36 .2226 48 47 30 .2618 40 16 .0007 64 26 .0206 52 37 .2669 47 46 31 .3108 39 17 .0013 63 27 .0325 51 38 .3141 46 45 32 .3621 38 18 .0023 62 28 .0465 50 39 .3654 45 44 33 .4165 37 19 .0040 61 29 .0660 49 40 .4178 44 43 34 .4716 36 20 .0063 60 30 .0898 48 41 .4726 43 42 35 .5284 35 21 .0097 59 31 .1201 47 42 .5274 42 41 5 9 15 .0005 60 22 .0140 58 32 .1548 46 6 8 21 .0003 69 40 16 .0010 59 23 .0200 57 33 .1970 45 22 .0007 68 39 17 .0020 58 24 .0276 56 34 .2424 44 23 .0013 67 38 18 .0035 57 25 .0376 55 35 .2944 43 24 .0023 66 37 19 .0060 56 26 .0496 54 36 .3496 42 25 .0040 65
166
Tavole
8" 6
8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8 26 .0063 27 .0100 28 .0147 29 .0213 30 .0296 31 .0406 32 .0539 33 .0709 34 .0906 35 .1142 36 .1412 37 .1725 38 .2068 39 .2454 40 .2864 41 .3310 42 .3773 43 .4259 44 .4749 45 .5251 9 21 .0002 22 .0004 23 .0008 24 .0014 25 .0024 26 .0038 27 .0060 28 .0088 29 .0128 30 .0180
64 6 9 31 .0248 65 6 10 33 .0280 69 7 7 39 .0487 66 7 8 44 .0946 68 63 32 .0332 64 34 .0363 68 40 .0641 65 45 .1159 67 62 33 .0440 63 35 .0467 67 41 .0825 64 46 .1405 66 61 34 .0567 62 36 .0589 66 42 .1043 63 47 .1678 65 60 35 .0723 61 37 .0736 65 43 .1297 62 48 .1984 64 59 36 .0905 60 38 .0903 64 44 .1588 61 49 .2317 63 58 37 .1119 59 39 .1099 63 45 .1914 60 50 .2679 62 57 38 .1361 58 40 .1317 62 46 .2279 59 51 .3063 61 56 39 .1638 57 41 .1566 61 47 .2675 58 52 .3472 60 55 40 .1942 56 42 .1838 60 48 .3100 57 53 .3894 59 54 41 .2280 55 43 .2139 59 49 .3552 56 54 .4333 58 53 42 .2643 54 44 .2461 58 50 .4024 55 55 .4775 57 52 43 .3035 53 45 .2811 57 51 .4508 54 56 .5225 56 51 44 .3445 52 46 .3177 56 52 .5000 53 7 9 28 .0001 91 50 45 .3878 51 47 .3564 55 7 8 28 .0002 84 29 .0002 90 49 46 .4320 50 48 .3962 54 29 .0003 83 30 .0003 89 48 47 .4773 49 49 .4374 53 30 .0006 82 31 .0006 88 47 48 .5227 48 50 .4789 52 31 .0011 81 32 .0010 87 46 6 10 21 .0001 81 51 .5211 51 32 .0019 80 33 .0017 86 45 22 .0002 80 7 7 28 .0003 77 33 .0030 79 34 .0026 85 75 23 .0005 79 29 .0006 76 34 .0047 78 35 .0039 84 74 24 .0009 78 30 .0012 75 35 .0070 77 36 .0058 83 73 25 .0015 77 31 .0020 74 36 .0103 76 37 .0082 82 72 26 .0024 76 32 .0035 73 37 .0145 75 38 .0115 81 71 27 .0037 75 33 .0055 72 38 .0200 74 39 .0156 80 70 28 .0055 74 34 .0087 71 39 .0270 73 40 .0209 79 69 29 .0080 73 35 .0131 70 40 .0361 72 41 .0274 78 68 30 .0112 72 36 .0189 69 41 .0469 71 42 .0356 77 67 31 .0156 71 37 .0265 68 42 .0603 70 43 .0454 76 66 32 .0210 70 38 .0364 67 43 .0760 69 44 .0571 75
Tavole
167
8" 7
8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
9 45 .0708 46 .0869 47 .1052 48 .1261 49 .1496 50 .1755 51 .2039 52 .2349 53 .2680 54 .3032 55 .3403 56 .3788 57 .4185 58 .4591 59 .5000 10 28 .0001 29 .0001 30 .0002 31 .0004 32 .0006 33 .0010 34 .0015 35 .0023 36 .0034 37 .0048 38 .0068 39 .0093 40 .0125 41 .0165 42 .0215
74 7 10 43 .0277 83 8 8 45 .0074 91 8 9 42 .0012 102 8 9 72 .5187 72 73 44 .0351 82 46 .0103 90 43 .0019 101 8 10 36 .0000 116 72 45 .0439 81 47 .0141 89 44 .0028 100 37 .0000 115 71 46 .0544 80 48 .0190 88 45 .0039 99 38 .0001 114 70 47 .0665 79 49 .0249 87 46 .0056 98 39 .0002 113 69 48 .0806 78 50 .0325 86 47 .0076 97 40 .0003 112 68 49 .0966 77 51 .0415 85 48 .0103 96 41 .0004 111 67 50 .1148 76 52 .0524 84 49 .0137 95 42 .0007 110 66 51 .1349 75 53 .0652 83 50 .0180 94 43 .0010 109 65 52 .1574 74 54 .0803 82 51 .0232 93 44 .0015 108 64 53 .1819 73 55 .0974 81 52 .0296 92 45 .0022 107 63 54 .2087 72 56 .1172 80 53 .0372 91 46 .0031 106 62 55 .2374 71 57 .1393 79 54 .0464 90 47 .0043 105 61 56 .2681 70 58 .1641 78 55 .0570 89 48 .0058 104 60 57 .3004 69 59 .1911 77 56 .0694 88 49 .0078 103 98 58 .3345 68 60 .2209 76 57 .0836 87 50 .0103 102 97 59 .3698 67 61 .2527 75 58 .0998 86 51 .0133 101 96 60 .4063 66 62 .2869 74 59 .1179 85 52 .0171 100 95 61 .4434 65 63 .3227 73 60 .1383 84 53 .0217 99 94 62 .4811 64 64 .3605 72 61 .1606 83 54 .0273 98 93 63 .5189 63 65 .3992 71 62 .1852 82 55 .0338 97 92 8 8 36 .0001 100 66 .4392 70 63 .2117 81 56 .0416 96 91 37 .0002 99 67 .4796 69 64 .2404 80 57 .0506 95 90 38 .0003 98 68 .5204 68 65 .2707 79 58 .0610 94 89 39 .0005 97 8 9 36 .0000 108 66 .3029 78 59 .0729 93 88 40 .0009 96 37 .0001 107 67 .3365 77 60 .0864 92 87 41 .0015 95 38 .0002 106 68 .3715 76 61 .1015 91 86 42 .0023 94 39 .0003 105 69 .4074 75 62 .1185 90 85 43 .0035 93 40 .0005 104 70 .4442 74 63 .1371 89 84 44 .0052 92 41 .0008 103 71 .4813 73 64 .1577 88
168
Tavole
8" 8
8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
8" 8# A
T A
10 65 .1800 66 .2041 67 .2299 68 .2574 69 .2863 70 .3167 71 .3482 72 .3809 73 .4143 74 .4484 75 .4827 76 .5173 9 45 .0000 46 .0000 47 .0001 48 .0001 49 .0002 50 .0004 51 .0006 52 .0009 53 .0014 54 .0020 55 .0028 56 .0039 57 .0053 58 .0071 59 .0094 60 .0122 61 .0157 62 .0200
87 9 9 63 .0252 108 9 10 52 .0005 128 9 10 82 .2745 86 64 .0313 107 53 .0007 127 83 .3019 85 65 .0385 106 54 .0011 126 84 .3304 84 66 .0470 105 55 .0015 125 85 .3598 83 67 .0567 104 56 .0021 124 86 .3901 82 68 .0680 103 57 .0028 123 87 .4211 81 69 .0807 102 58 .0038 122 88 .4524 80 70 .0951 101 59 .0051 121 89 .4841 79 71 .1112 100 60 .0066 120 90 .5159 78 72 .1290 99 61 .0086 119 10 10 55 .0000 77 73 .1487 98 62 .0110 118 56 .0000 76 74 .1701 97 63 .0140 117 57 .0000 126 75 .1933 96 64 .0175 116 58 .0000 125 76 .2181 95 65 .0217 115 59 .0001 124 77 .2447 94 66 .0267 114 60 .0001 123 78 .2729 93 67 .0326 113 61 .0002 122 79 .3024 92 68 .0394 112 62 .0002 121 80 .3332 91 69 .0474 111 63 .0004 120 81 .3652 90 70 .0564 110 64 .0005 119 82 .3981 89 71 .0667 109 65 .0008 118 83 .4317 88 72 .0782 108 66 .0010 117 84 .4657 87 73 .0912 107 67 .0014 116 85 .5000 86 74 .1055 106 68 .0019 115 9 10 45 .0000 135 75 .1214 105 69 .0026 114 46 .0000 134 76 .1388 104 70 .0034 113 47 .0000 133 77 .1577 103 71 .0045 112 48 .0001 132 78 .1781 102 72 .0057 111 49 .0001 131 79 .2001 101 73 .0073 110 50 .0002 130 80 .2235 100 74 .0093 109 51 .0003 129 81 .2483 99 75 .0116
98 10 10 76 .0144 134 97 77 .0177 133 96 78 .0216 132 95 79 .0262 131 94 80 .0315 130 93 81 .0376 129 92 82 .0446 128 91 83 .0526 127 90 84 .0615 126 155 85 .0716 125 154 86 .0827 124 153 87 .0952 123 152 88 .1088 122 151 89 .1237 121 150 90 .1399 120 149 91 .1575 119 148 92 .1763 118 147 93 .1965 117 146 94 .2179 116 145 95 .2406 115 144 96 .2644 114 143 97 .2894 113 142 98 .3153 112 141 99 .3421 111 140 100 .3697 110 139 101 .3980 109 138 102 .4267 108 137 103 .4559 107 136 104 .4853 106 135 105 .5147 105
Tavole
169
Tavola 6. Gli elementi della tavola danno le probabilit T di coda destra della statistica E di Ansari-Bradley, 8" 8# # $ "!.
8" 2
8# + 2 2 3 4 3 2 3 4 5 4 2 3 4 5 6 5 2 3 4 5 6 7 6 2 3 4 5 6 7 8 7 2 3 4 5 6
T 1.0000 .8333 .1667 1.0000 .9000 .5000 .2000 1.0000 .9333 .6667 .3333 .0667 1.0000 .9524 .7619 .5238 .2381 .0952 1.0000 .9643 .8214 .6429 .3571 .1786 .0357 1.0000 .9722 .8611 .7222 .5000
8" 8# +
8" 8# + 2 10 10 11 12 3 3 4 5 6 7 8 3 4 4 5 6 7 8 9 10 3 5 4 5 6 7 8 9 10 11 3 6 4 5 6 7 8 9 10
T .1515 .0758 .0152 1.0000 .9000 .7000 .3000 .1000 1.0000 .9429 .8286 .5714 .3429 .1429 .0286 1.0000 .9643 .8929 .7143 .5000 .2857 .1071 .0357 1.0000 .9762 .9286 .8095 .6548 .4643 .2857
8" 8# + 3 6 11 12 13 3 7 4 5 6 7 8 9 10 11 12 13 14 3 8 4 5 6 7 8 9 10 11 12 13 14 15 16 3 9 4 5 6
T .1429 .0595 .0119 1.0000 .9833 .9500 .8667 .7500 .5833 .4167 .2500 .1333 .0500 .0167 1.0000 .9879 .9636 .9030 .8182 .6909 .5455 .3939 .2606 .1455 .0727 .0303 .0061 1.0000 .9909 .9727
8" 8# +
2 7 7 .3056 8 .1389 9 .0556 2 8 2 1.0000 3 .9778 4 .8889 5 .7778 6 .6000 7 .4000 8 .2222 9 .1111 10 .0222 2 9 2 1.0000 3 .9818 4 .9091 5 .8182 6 .6727 7 .5091 8 .3273 9 .2000 10 .0909 11 .0364 2 10 2 1.0000 3 .9848 4 .9242 5 .8485 6 .7273 7 .5909 8 .4091 9 .2727
3 9 7 .9273 8 .8636 9 .7636 10 .6364 11 .5000 12 .3636 13 .2364 14 .1364 15 .0727 16 .0273 17 .0091 3 10 4 1.0000 5 .9930 6 .9790 7 .9441 8 .8951 9 .8182 10 .7168 11 .5979 12 .4755 13 .3497 14 .2413 15 .1503 16 .0839 17 .0420 18 .0175 19 .0035 4 4 6 1.0000 7 .9857 8 .9286
170
Tavole
8" 4
8# +
8" 8# +
8" 8# +
8" 8# +
8" 8# +
4 9 .8000 10 .6286 11 .3714 12 .2000 13 .0714 14 .0143 5 6 1.0000 7 .9921 8 .9603 9 .8889 10 .7778 11 .6032 12 .4286 13 .2619 14 .1349 15 .0476 16 .0159 6 6 1.0000 7 .9952 8 .9762 9 .9333 10 .8571 11 .7333 12 .5810 13 .4190 14 .2667 15 .1429 16 .0667 17 .0238 18 .0048
4 7 6 1.0000 7 .9970 8 .9848 9 .9576 10 .9091 11 .8242 12 .7152 13 .5818 14 .4424 15 .3030 16 .1939 17 .1061 18 .0515 19 .0182 20 .0061 4 8 6 1.0000 7 .9980 8 .9899 9 .9717 10 .9394 11 .8788 12 .7980 13 .6889 14 .5677 15 .4323 16 .3111 17 .2020 18 .1212 19 .0606 20 .0283
4 8 21 .0101 22 .0020 4 9 6 1.0000 7 .9986 8 .9930 9 .9804 10 .9580 11 .9161 12 .8573 13 .7762 14 .6783 15 .5650 16 .4503 17 .3357 18 .2378 19 .1538 20 .0923 21 .0490 22 .0238 23 .0084 24 .0028 4 10 6 1.0000 7 .9990 8 .9950 9 .9860 10 .9700 11 .9401 12 .8961 13 .8342 14 .7542
4 10 15 .6593 16 .5554 17 .4446 18 .3407 19 .2458 20 .1658 21 .1039 22 .0599 23 .0300 24 .0140 25 .0050 26 .0010 5 5 9 1.0000 10 .9921 11 .9762 12 .9286 13 .8492 14 .7302 15 .5873 16 .4127 17 .2698 18 .1508 19 .0714 20 .0238 21 .0079 5 6 9 1.0000 10 .9957 11 .9870 12 .9610 13 .9156
5 6 14 .8420 15 .7446 16 .6147 17 .4805 18 .3463 19 .2294 20 .1342 21 .0693 22 .0303 23 .0108 24 .0022 5 7 9 1.0000 10 .9975 11 .9924 12 .9773 13 .9495 14 .9015 15 .8333 16 .7374 17 .6237 18 .5000 19 .3763 20 .2626 21 .1667 22 .0985 23 .0505 24 .0227 25 .0076 26 .0025
Tavole
171
8" 5
8# +
8" 8# +
8" 8# +
8" 8# +
8" 8# +
8 9 1.0000 10 .9984 11 .9953 12 .9860 13 .9689 14 .9386 15 .8936 16 .8275 17 .7451 18 .6457 19 .5385 20 .4266 21 .3209 22 .2269 23 .1507 24 .0917 25 .0513 26 .0249 27 .0109 28 .0039 29 .0008 9 9 1.0000 10 .9990 11 .9970 12 .9910 13 .9800 14 .9600 15 .9291 16 .8821
5 9 17 .8212 18 .7423 19 .6523 20 .5514 21 .4486 22 .3477 23 .2577 24 .1788 25 .1179 26 .0709 27 .0400 28 .0200 29 .0090 30 .0030 31 .0010 5 10 9 1.0000 10 .9993 11 .9980 12 .9940 13 .9867 14 .9734 15 .9524 16 .9197 17 .8761 18 .8182 19 .7483 20 .6663 21 .5771 22 .4832 23 .3916
5 10 24 .3044 25 .2268 26 .1608 27 .1086 28 .0686 29 .0406 30 .0220 31 .0107 32 .0047 33 .0017 34 .0003 6 6 12 1.0000 13 .9989 14 .9946 15 .9848 16 .9632 17 .9264 18 .8658 19 .7846 20 .6807 21 .5649 22 .4351 23 .3193 24 .2154 25 .1342 26 .0736 27 .0368 28 .0152 29 .0054 30 .0011
6 7 12 1.0000 13 .9994 14 .9971 15 .9918 16 .9802 17 .9592 18 .9242 19 .8735 20 .8048 21 .7203 22 .6189 23 .5122 24 .4038 25 .3030 26 .2133 27 .1410 28 .0851 29 .0484 30 .0239 31 .0105 32 .0035 33 .0012 6 8 12 1.0000 13 .9997 14 .9983 15 .9953 16 .9887 17 .9760 18 .9547 19 .9217
6 8 20 .8751 21 .8139 22 .7366 23 .6474 24 .5501 25 .4499 26 .3526 27 .2634 28 .1861 29 .1249 30 .0783 31 .0453 32 .0240 33 .0113 34 .0047 35 .0017 36 .0003 6 9 12 1.0000 13 .9998 14 .9990 15 .9972 16 .9932 17 .9856 18 .9724 19 .9518 20 .9215 21 .8803 22 .8260 23 .7600 24 .6829
172
Tavole
8" 6
8# +
8" 8# +
8" 8# +
8" 8# + 7 8 36 37 38 39 40 41 42 43 44 7 9 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
T .1005 .0648 .0393 .0221 .0115 .0053 .0022 .0008 .0002 1.0000 .9998 .9995 .9984 .9963 .9921 .9851 .9734 .9559 .9306 .8965 .8523 .7981 .7336 .6608 .5820 .5000 .4180 .3392 .2664 .2019
8" 8# +
9 25 .5984 26 .5085 27 .4190 28 .3323 29 .2543 30 .1860 31 .1303 32 .0859 33 .0539 34 .0312 35 .0170 36 .0082 37 .0036 38 .0012 39 .0004 10 12 1.0000 13 .9999 14 .9994 15 .9983 16 .9958 17 .9910 18 .9825 19 .9692 20 .9487 21 .9202 22 .8812 23 .8322 24 .7717 25 .7025 26 .6246
6 10 27 .5425 28 .4575 29 .3754 30 .2975 31 .2283 32 .1678 33 .1188 34 .0798 35 .0513 36 .0308 37 .0175 38 .0090 39 .0042 40 .0017 41 .0006 7 7 16 1.0000 17 .9994 18 .9983 19 .9948 20 .9878 21 .9744 22 .9534 23 .9196 24 .8730 25 .8106 26 .7348 27 .6463 28 .5507 29 .4493 30 .3537
7 7 31 .2652 32 .1894 33 .1770 34 .0804 35 .0466 36 .0256 37 .0122 38 .0052 39 .0017 40 .0006 7 8 16 1.0000 17 .9997 18 .9991 19 .9972 20 .9935 21 .9862 22 .9744 23 .9549 24 .9270 25 .8878 26 .8375 27 .7748 28 .7021 29 .6194 30 .5324 31 .4435 32 .3577 33 .2777 34 .2075 35 .1478
7 9 37 .1477 38 .1035 39 .0694 40 .0441 41 .0266 42 .0149 43 .0079 44 .0037 45 .0016 46 .0005 47 .0002 7 10 16 1.0000 17 .9999 18 .9997 19 .9991 20 .9978 21 .9954 22 .9912 23 .9841 24 .9734 25 .9574 26 .9354 27 .9059 28 .8685 29 .8221 30 .7676 31 .7052 32 .6368 33 .5637 34 .4888
Tavole
173
8" 7
8# +
8" 8# +
8" 8# +
8" 8# + 8 10 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
T .9997 .9992 .9983 .9965 .9935 .9887 .9813 .9704 .9551 .9344 .9075 .8738 .8328 .7847 .7296 .6686 .6031 .5347 .4653 .3969 .3314 .2704 .2153 .1672 .1262 .0925 .0656 .0449 .0296 .0187
8" 8# + 8 10 53 54 55 56 57 58 59 60 9 9 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
T .0113 .0065 .0035 .0017 .0008 .0003 .0001 .0000 1.0000 1.0000 .9999 .9996 .9991 .9981 .9963 .9932 .9882 .9805 .9695 .9540 .9332 .9062 .8724 .8313 .7833 .7283 .6677 .6025 .5346 .4654
10 35 .4139 36 .3421 37 .2753 38 .2154 39 .1633 40 .1199 41 .0847 42 .0576 43 .0375 44 .0233 45 .0136 46 .0075 47 .0038 48 .0017 49 .0007 50 .0003 51 .0001 8 20 1.0000 21 .9999 22 .9996 23 .9989 24 .9974 25 .9941 26 .9885 27 .9789 28 .9643 29 .9428 30 .9133 31 .8737 32 .8246
8 8 33 .7650 34 .6970 35 .6212 36 .5413 37 .4587 38 .3788 39 .3030 40 .2350 41 .1754 42 .1263 43 .0867 44 .0572 45 .0357 46 .0211 47 .0115 48 .0059 49 .0026 50 .0011 51 .0004 52 .0001 8 9 20 1.0000 21 1.0000 22 .9998 23 .9994 24 .9986 25 .9969 26 .9938 27 .9886 28 .9804 29 .9680
8 9 30 .9504 31 .9262 32 .8947 33 .8549 34 .8069 35 .7508 36 .6877 37 .6184 38 .5457 39 .4714 40 .3983 41 .3281 42 .2636 43 .2055 44 .1557 45 .1139 46 .0807 47 .0548 48 .0358 49 .0221 50 .0131 51 .0072 52 .0037 53 .0017 54 .0007 55 .0002 56 .0001 8 10 20 1.0000 21 1.0000 22 .9999
174
Tavole
8" 9
8# + 9 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 10 25 26 27 28 29 30 31 32 33 34 35
T .3975 .3323 .2717 .2167 .1687 .1276 .0938 .0668 .0460 .0305 .0195 .0118 .0068 .0037 .0019 .0009 .0004 .0001 .0000 1.0000 1.0000 .9999 .9998 .9995 .9990 .9980 .9964 .9937 .9894 .9831
8" 8# + 9 10 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65
T .9741 .9618 .9453 .9240 .8972 .8646 .8259 .7813 .7310 .6759 .6166 .5548 .4916 .4287 .3673 .3092 .2552 .2064 .1632 .1262 .0952 .0700 .0500 .0347 .0232 .0150 .0093 .0056 .0031 .0017
8" 8# +
8" 8# + 10 10 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
T .5296 .4704 .4119 .3551 .3014 .2514 .2060 .1656 .1306 .1007 .0761 .0560 .0403 .0282 .0192 .0126 .0080 .0049 .0029 .0016 .0008 .0004 .0002 .0001 .0000 .0000
8" 8# +
9 10 66 .0008 67 .0004 68 .0002 69 .0001 70 .0000 10 10 30 1.0000 31 1.0000 32 1.0000 33 .9999 34 .9998 35 .9996 36 .9992 37 .9984 38 .9971 39 .9951 40 .9920 41 .9874 42 .9808 43 .9718 44 .9597 45 .9440 46 .9239 47 .8993 48 .8694 49 .8344 50 .7940 51 .7486 52 .6986 53 .6449 54 .5881
Tavole
175
Tavola 7. Gli elementi della tavola danno le probabilit T di coda sinistra o destra della statistica W di Spearman (a secondo che nella tavola = sia a sinistra o a destra di T ), 8 $ % "!.
8 = 3 10 11 4 20 21 22 23 24 25 5 35 36 37 38 39 40 41 42 43 44 45 6 56 57 58 59 60 61 62 63 64 65 66 67 68
T .167 .500 .042 .167 .208 .375 .458 .542 .008 .042 .067 .117 .175 .225 .258 .342 .392 .475 .525 .001 .008 .017 .029 .051 .068 .088 .121 .149 .178 .210 .249 .282
= 14 13 30 29 28 27 26 25 55 54 53 52 51 50 49 48 47 46 45 91 90 89 88 87 86 85 84 83 82 81 80 79
8 = 6 69 70 71 72 73 7 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110
T .329 .357 .401 .460 .500 .000 .001 .003 .006 .012 .017 .024 .033 .044 .055 .069 .083 .100 .118 .133 .151 .177 .198 .222 .249 .278 .297 .331 .357 .391 .420 .453
= 78 77 76 75 74 140 139 138 137 136 135 134 133 132 131 130 129 128 127 126 125 124 123 122 121 120 119 118 117 116 115 114
8 = 7 111 112 8 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149
T .482 .518 .000 .000 .001 .001 .002 .004 .005 .008 .011 .014 .018 .023 .029 .035 .042 .048 .057 .066 .076 .085 .098 .108 .122 .134 .150 .163 .180 .195 .214 .231
= 113 112 204 203 202 201 200 199 198 197 196 195 194 193 192 191 190 189 188 187 186 185 184 183 182 181 180 179 178 177 176 175
8 = 8 150 151 152 153 154 155 156 157 158 159 160 161 162 9 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183
T .250 .268 .291 .310 .332 .352 .376 .397 .420 .441 .467 .488 .512 .000 .000 .000 .000 .000 .001 .001 .002 .002 .003 .004 .005 .007 .009 .011 .013 .016 .018 .022
= 174 173 172 171 170 169 168 167 166 165 164 163 162 285 284 283 282 281 280 279 278 277 276 275 274 273 272 271 270 269 268 267
176
Tavole
8 = 9 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215
T .025 .029 .033 .038 .043 .048 .054 .060 .066 .074 .081 .089 .097 .106 .115 .125 .135 .146 .156 .168 .179 .193 .205 .218 .231 .247 .260 .276 .290 .307 .322 .339
8 =
8 =
8 =
= 331 330 329 328 327 326 325 324 323 322 321 320 319 318 317 316 315 314 313 312 311 310 309 308 307 306 305 304 303
266 9 216 .354 265 217 .372 264 218 .388 263 219 .405 262 220 .422 261 221 .440 260 222 .456 259 223 .474 258 224 .491 257 225 .509 256 10 220 .000 255 221 .000 254 222 .000 253 223 .000 252 224 .000 251 225 .000 250 226 .000 249 227 .000 248 228 .000 247 229 .001 246 230 .001 245 231 .001 244 232 .001 243 233 .002 242 234 .002 241 235 .003 240 236 .004 239 237 .004 238 238 .005 237 239 .007 236 240 .008 235 241 .009
234 10 242 .010 233 243 .012 232 244 .013 231 245 .015 230 246 .017 229 247 .019 228 248 .022 227 249 .025 226 250 .027 225 251 .030 385 252 .033 384 253 .037 383 254 .040 382 255 .044 381 256 .048 380 257 .052 379 258 .057 378 259 .062 377 260 .067 376 261 .072 375 262 .077 374 263 .083 373 264 .089 372 265 .096 371 266 .102 370 267 .109 369 268 .116 368 269 .124 367 270 .132 366 271 .139 365 272 .148 364 273 .156
363 10 274 .165 362 275 .174 361 276 .184 360 277 .193 359 278 .203 358 279 .214 357 280 .224 356 281 .235 355 282 .246 354 283 .257 353 284 .268 352 285 .280 351 286 .292 350 287 .304 349 288 .316 348 289 .328 347 290 .341 346 291 .354 345 292 .367 344 293 .379 343 294 .393 342 295 .406 341 296 .419 340 297 .433 339 298 .446 338 399 .459 337 300 .473 336 301 .486 335 302 .500 334 333 332
Tavole
177
Tavola 8. Gli elementi della tavola danno le probabilit T di coda sinistra o destra della statistica G di Kendall (a secondo che nella tavola - sia a sinistra o a destra di T ), 8 $ % "&. 8 3 0 1 4 0 1 2 3 5 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 7 0 1 2 3 4 5 6 7 8 9 10 8 0 1 2 3 4 T .167 .500 .042 .167 .375 .625 .008 .042 .117 .242 .408 .592 .001 .008 .028 .068 .136 .235 .360 .500 .000 .001 .005 .015 .035 .068 .119 .191 .281 .386 .500 .000 .000 .001 .002 .007 3 2 6 5 4 3 10 9 8 7 6 5 15 14 13 12 11 10 9 8 21 20 19 18 17 16 15 14 13 12 11 28 27 26 25 24 8 8 5 6 7 8 9 10 11 12 13 14 9 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 10 0 1 2 3 4 5 6 T .016 .031 .054 .089 .138 .199 .274 .360 .452 .548 .000 .000 .000 .000 .001 .003 .006 .012 .022 .038 .060 .090 .130 .179 .238 .306 .381 .460 .540 .000 .000 .000 .000 .000 .000 .001 23 22 21 20 19 18 17 16 15 14 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 45 44 43 42 41 40 39 8 10 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 11 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 T .002 .005 .008 .014 .023 .036 .054 .078 .108 .146 .190 .242 .300 .364 .431 .500 .000 .000 .000 .000 .000 .000 .000 .000 .001 .002 .003 .005 .008 .013 .020 .030 .043 .060 .082 .109 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 8 11 20 21 22 23 24 25 26 27 12 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 T .141 .179 .232 .271 .324 .381 .440 .500 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .001 .002 .003 .004 .007 .010 .016 .022 .031 .043 .058 .076 .098 .125 .155 .190 .230 35 34 33 32 31 30 29 28 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39
178
Tavole
8 12 28 29 30 31 32 33 13 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
T .273 .319 .369 .420 .473 .527 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .001 .001 .002 .003 .005 .007 .011 .015 .021 .029 .038 .050 .064 .082 .102 .126
38 37 36 35 34 33 78 77 76 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49
8 13 30 31 32 33 34 35 36 37 38 39 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
T .153 .184 .218 .255 .295 .338 .383 .429 .476 .524 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .001 .001 .002 .002 .003 .005 .007 .010 .013
48 47 46 45 44 43 42 41 40 39 91 90 89 88 87 86 85 84 83 82 81 80 79 78 77 76 75 74 73 72 71 70 69 68 67 66
8 14 26 27 28 29 30 31 32 33 34 35 36 37 58 39 40 41 42 43 44 45 15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
T .018 .024 .031 .040 .050 .063 .079 .096 .117 .140 .165 .194 .225 .259 .295 .334 .374 .415 .457 .500 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000
8 -
89 88 87 86 85 84 83 82 81 80 79 78 77 76 75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 60 59 58 57 56 55 54 53
65 15 16 .000 64 17 .000 63 18 .000 62 19 .000 61 20 .000 60 21 .001 59 22 .001 58 23 .001 57 24 .002 56 25 .003 55 26 .004 54 27 .006 53 28 .008 52 29 .010 51 30 .014 50 31 .018 49 32 .023 48 33 .029 47 34 .037 46 35 .046 105 36 .057 104 37 .070 103 38 .084 102 39 .101 101 40 .120 100 41 .141 99 42 .164 98 43 .190 97 44 .218 96 45 .248 95 46 .279 94 47 .313 93 48 .349 92 49 .385 91 50 .423 90 51 .461 52 .500
Tavole
179
Tavola 9. Gli elementi della tavola danno i quantili della statistica di Kolmogorov per alcune probabilit di coda sinistra T e 8 " # %!.
8\T 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.80 0.90 0.95 0.98 0.99 .900 .684 .565 .493 .447 .410 .381 .358 .339 .323 .308 .296 .285 .275 .266 .258 .250 .244 .237 .232 .950 .776 .636 .565 .509 .468 .436 .410 .387 .369 .352 .338 .325 .314 .304 .295 .286 .279 .271 .265 .975 .842 .780 .624 .563 .519 .483 .454 .430 .409 .391 .375 .361 .349 .338 .327 .318 .309 .301 .294 .990 .900 .785 .689 .627 .577 .538 .507 .480 .457 .437 .419 .404 .390 .377 .366 .355 .346 .337 .329 .995 .929 .829 .734 .669 .617 .576 .542 .513 .489 .468 .449 .432 .418 .404 .392 .381 .371 .361 .352
8\T 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
0.80 0.90 0.95 0.98 0.99 .226 .221 .216 .212 .208 .204 .200 .197 .193 .190 .187 .184 .182 .179 .177 .174 .172 .170 .168 .165 .259 .253 .247 .242 .238 .233 .229 .225 .221 .218 .214 .211 .208 .205 .202 .199 .196 .194 .191 .189 .287 .281 .275 .269 .264 .259 .254 .250 .246 .242 .238 .234 .231 .227 .224 .221 .218 .215 .213 .210 .321 .314 .307 .301 .295 .290 .284 .279 .275 .270 .266 .262 .258 .254 .251 .247 .244 .241 .238 .235 .344 .337 .330 .323 .317 .311 .305 .300 .295 .290 .285 .281 .277 .273 .269 .265 .262 .258 .255 .252
180
Tavole
Tavola 10. Gli elementi della tavola danno i quantili della statistica di Kolmogorov-Smirnov per uguali campioni di numerosit 8 per alcune probabilit di coda sinistra T e 8 " # %!.
8 \ T 0.80 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.90
0.95
0.98
0.99
8 \ T 0.80 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 6/21 7/22 7/23 7/24 7/25 7/26 7/27 8/28 8/29 8/30 8/31 8/32 8/33 8/34 8/35 9/36 9/37 9/38 9/39 9/40
0.90 7/21 8/22 8/23 8/24 8/25 8/26 8/27 9/28 9/29 9/30 9/31 9/32 9/33 10/34 10/35 10/36 10/37 10/38 10/39 10/40
0.95 8/21 8/22 9/23 9/24 9/25 9/26 9/27 10/28 10/29 10/30 10/31 10/32 11/33 11/34 11/35 11/36 11/37 11/38 11/39 12/40
0.98 9/21 10/22 10/23 10/24 10/25 10/26 11/27 11/28 11/29 11/30 11/31 12/32 12/33 12/34 12/35 12/36 13/37 13/38 13/39 13/40
0.99 10/21 10/22 10/23 11/24 11/25 11/26 11/27 12/28 12/29 12/30 12/31 12/32 13/33 13/34 13/35 13/36 13/37 14/38 14/39 14/40
2/3 3/4 3/5 3/6 4/7 4/8 4/9 4/10 5/11 5/12 5/13 5/14 5/15 6/16 6/17 6/18 6/19 6/20
2/3 3/4 3/5 4/6 4/7 4/8 5/9 5/10 5/11 5/12 6/13 6/14 6/15 6/16 7/17 7/18 7/19 7/20
3/4 4/5 4/6 5/7 5/8 5/9 6/10 6/11 6/12 6/13 7/14 7/15 7/16 7/17 8/18 8/19 8/20
4/5 5/6 5/7 5/8 6/9 6/10 7/11 7/12 7/13 7/14 8/15 8/16 8/17 9/18 9/19 9/20
4/5 5/6 5/7 6/8 6/9 7/10 7/11 7/12 8/13 8/14 8/15 9/16 9/17 9/18 9/19 10/20

Barabesi - Statistica Non Parametrica

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Barabesi - Statistica Non Parametrica

Caricato da

Copyright:

Formati disponibili

Elementi di statistica non parametrica

Capitolo 1 L'equivalenza in distribuzione

mentre la funzione di ripartizione di ^ risulta

Dunque, per il Teorema 1.2.2 la trasformata \" \# simmetrica rispetto a !.

6 ovvero E\ - - E\ , da cui infine risulta E\ -.

Pr-" \" B" \# -# B# \8 -8 B8 ,

Inoltre, se si considera la trasformata Y B" B# B8 8" ha " 8 ovvero . \- -\ ,

dal Teorema 1.1.2 si

Capitolo 2 Le statistiche distribution-free

E' immediato dunque concludere che la statistica segno ^3 F3" "#.

Il vettore di statistiche V" V# V8 detto vettore dei ranghi.

<" <# <8 e8

PrV" " V# # V8 8 8x PrV" " V# # V8 8 .

Le statistiche distribution-free Infine, essendo PrV" <" V# <# V8 <8 " ,

" " , <" <# " # 8 . 8x 88 "

5 " # 8 , <" <# <5 " # 8 .

" 8 " , 3 " # 8 . #

" 8 "#8 " , 3 " # 8 , '

per cui CovV3 V4 EV3 V4 EV3 EV4

" " " 8 "$8 # 8 "# 8 " , 3 4 " # 8 . "# % "#

8 " , 5 " # 8 , " <" <# <5 8 . 5

" , <" <# <8 e8 . 8x

Pr! \ B J B J ! . Pr\ ! " J !

Analogamente, per un dato B ! si ha Pr] B ^ ! Pr] B ^ ! Pr \ B \ ! Pr^ ! Pr\ !

8 " 8 #8 #8 , 5 ! " 8 , " <" <# <5 8 . 5 5

5 ! " 8 , " <" <# <5 8 .

Capitolo 3 Il test statistico distribution-free

Il test statistico distribution-free

Il test statistico distribution-free

8 J -, [" J -]8, , - ! . , "

Il test statistico distribution-free

lim T < 8 X8 per ogni < R R! .

ovvero dalla Definizione 3.1.7 si ha che la successione di test basata su X8 coerente.

Il test statistico distribution-free

Il test statistico distribution-free

Il test statistico distribution-free

5X83 )3 5Y73 )3 lim "; 5X83 )! 3 5Y73 )!

iv le derivate ` .X ) .wX8 ) `) 8 e ` .Y ) .wY7 ) `) 7 sono continue in intorno di ) )! e .wX8 )! !, .wY7 )! !; v si ha

Il test statistico distribution-free

.wY7 )! OY 7lim !; 75Y7 )! allora EARX Y

Analogamente, per .Y73 ) si ha

Si noti ora che dalle assunzioni fatte risulta

lim TX83 )! J lim Pr)! J X83 -83

X83 .X83 )! - 8 3 . X 83 ) ! . 5X83 )! 5X83 )!

.X83 )! .X83 )3 . 3 5X83 )!

lim TX83 )3 J lim Pr)3 J X83 -83 " ,

Il test statistico distribution-free

-83 .X83 )3 @"" . 3 5X83 )3 lim Analogamente, si ha

lim TY73 )! J lim Pr)! J Y73 .73 ,

lim TY73 )3 J lim Pr)3 J Y73 .73 " ,

5Y73 )! ", )3 )! .wY7 )3

.wX8 )3 73 5Y7 )! 83 3 3 lim ". w 3 73 83 5X )! . Y7 )3 83

Tenendo presente la condizione iv, v vi si ha dunque

da cui si ottiene infine EARX Y lim

Definizione 3.2.5. Se sono soddisfatte le condizioni del Teorema 3.2.4, la quantit

Il test statistico distribution-free

Il test statistico distribution-free

Le condizioni del Teorema 3.2.4 sono dunque soddisfatte e quindi si ha effX

Il test statistico distribution-free

Le condizioni del Teorema 3.2.4 sono dunque soddisfatte e quindi si ha

Il test statistico distribution-free

" # # 8" "WB 8# "WC , 8#

# # 8#3 "WC 8"3 "WB : /5# " / 5# 5# , 83 # 83 #

Il test statistico distribution-free