Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
2. Rappresentazioni grafiche » 31
1. Generalità » 31
2. Grafico a barre » 31
3. Grafico a settori circolari (torta) » 42
4. Istogramma » 50
5. Diagramma cartesiano » 61
6. Diagramma di dispersione (scatter-plot) » 70
7. Altre rappresentazioni » 75
7.1. Diagramma logaritmico » 75
7.2. Diagramma di Pareto » 80
7.3. Diagramma a scatola e baffi (box-plot) » 93
7.4. Diagramma polare (radar) » 103
5
4. Misure di variabilità pag. 121
1. Generalità » 121
2. Campo di variazione (range) » 122
3. Varianza » 123
4. Scarto quadratico medio (deviazione standard) » 124
6
4.4. Verifiche di ipotesi sulle differenze tra valori medi pag. 233
4.4.1. Verifica di ipotesi sulla differenza tra valori medi (va-
rianze note) » 233
4.4.2. Verifica di ipotesi sulla differenza tra valori medi (va-
rianze ignote e uguali) » 240
4.4.3. Verifica di ipotesi sulla differenza tra valori medi (va-
rianze ignote e diverse) » 246
4.4.4. Verifica di ipotesi sulla differenza tra valori medi per
campioni appaiati » 251
4.5. Verifiche di ipotesi sulla varianza » 259
4.5.1. Verifica di ipotesi sul rapporto tra varianze » 261
4.6. Verifiche di ipotesi sulla frequenza » 267
7
1. Introduzione a Microsoft Excel
1. Generalità
9
Per muoversi fra le celle è possibile utilizzare il mouse, i pulsanti di dire-
zione o il tabulatore.
Le informazioni che è possibile inserire nelle celle del foglio elettronico
possono essere di due tipi: numeriche e alfanumeriche. Con le prime è possibi-
le realizzare operazioni aritmetiche, le seconde hanno uno scopo esclusivamen-
te descrittivo.
I dati alfanumerici vengono definiti etichette o testo e sono rappresentati da
stringhe che cominciano con una lettera o un carattere di punteggiatura (tran-
ne caratteri speciali quali /, +, -, $, o il punto).
I dati numerici vengono chiamati numeri o valori e consistono in una com-
binazione di cifre non precedute da un prefisso di testo.
Nel foglio elettronico è possibile visualizzare i numeri con formati diversi a
seconda delle necessità (valuta, percentuale, scientifico, ecc.).
La principale funzione di un foglio elettronico è quella di svolgere opera-
zioni con i dati contenuti nelle celle attraverso l’utilizzo di formule che vengo-
no inserite nelle celle stesse. Tali formule consistono in una combinazione di
dati e operatori che generano un nuovo dato in output.
In generale le formule sono equazioni che eseguono calcoli sui valori con-
tenuti nel foglio di lavoro.
Una formula può contenere anche: funzioni, riferimenti, operatori e costan-
ti (fig. 1.2):
n o p q p r
= pi * A2 ^ 2
dove:
10
Una funzione generalmente contiene il nome della funzione e gli argomenti
(fig. 1.3):
n o p
= ARROTONDA ( A2 , 2 )
dove:
- database;
- data e ora;
- esterne;
- ingegneristiche;
- finanziarie;
- informative;
- logiche;
- ricerca e riferimento;
- matematiche e trigonometriche;
- statistiche;
- testo e dati;
Con Microsoft Excel viene fornito un insieme di strumenti di analisi dei da-
ti, denominati Strumenti di analisi, che consente di ridurre i passaggi necessa-
ri allo sviluppo di complesse analisi statistiche o ingegneristiche. Una volta
forniti i dati e i parametri per ciascuna analisi, lo strumento utilizzerà le fun-
zioni macro statistiche o ingegneristiche appropriate, visualizzando i risultati in
una tabella di output. Alcuni strumenti generano anche dei grafici; tali stru-
menti sono:
11
- Correlazione: consente di misurare la relazione fra due insiemi di dati;
- Covarianza: consente di determinare la relazione tra due intervalli di da-
ti;
- Statistica descrittiva: genera un rapporto di statistica univariata per i da-
ti dell'intervallo di input, fornendo informazioni sulla tendenza centrale e
la variabilità dei dati;
- Smorzamento esponenziale: consente di prevedere un valore sulla base
della previsione per il periodo precedente con la correzione dell'errore
della previsione precedente;
- Test F a due campioni per varianze: consente di eseguire un test F a due
campioni per confrontare le varianze di due popolazioni;
- Analisi di Fourier: consente di risolvere i problemi dei sistemi lineari e
di analizzare i dati periodici utilizzando il metodo Fast Fourier Tran-
sform (FFT) per la trasformazione dei dati. Questo strumento supporta
anche le trasformazioni inverse, in cui l'inversa dei dati trasformati resti-
tuisce i dati originali;
- Istogramma: consente di calcolare le frequenze individuali e cumulative
per un intervallo di celle e di classi di dati. Questo strumento genera dati
per il numero di occorrenze di un valore in un insieme di dati;
- Media mobile: consente di proiettare valori nel periodo di previsione sul-
la base del valore medio della variabile calcolata su un numero specifico
di periodi precedenti. Una media mobile fornisce le informazioni sulla
tendenza che una semplice media di tutti i dati cronologici non sarebbe in
grado di fornire;
- Generazione di un numero casuale: consente di riempire un intervallo
con numeri casuali indipendenti derivati da uno dei numerosi tipi di di-
stribuzione. È possibile caratterizzare i soggetti di una popolazione con
una distribuzione probabilistica;
- Rango e percentile: consente di generare una tabella contenente il rango
ordinale e percentuale di ciascun valore di un insieme di dati. È possibile
analizzare la posizione relativa dei valori in un insieme di dati;
- Regressione: consente di eseguire un’analisi lineare della regressione uti-
lizzando il metodo dei minimi quadrati per adattare una retta a un insie-
me di osservazioni. È possibile analizzare l'effetto di una o più variabili
indipendenti su una singola variabile dipendente;
- Campionamento: consente di creare un campione da una popolazione
trattando l'intervallo di input come una popolazione. Qualora una popola-
zione sia troppo vasta per elaborarla o tracciarla in un grafico, è possibile
utilizzarne un campione rappresentativo. È anche possibile creare un
campione contenente solo i valori di una determinata parte di un ciclo, se
si ritiene che i dati di input siano periodici;
- Test t: consente l'analisi della media di tipi di popolazioni differenti;
12
- Test z: consente di eseguire un test z a due campioni per medie con va-
rianze note.
- Barra standard: che contiene gli strumenti comuni per lavorare con ogni
tipo di documento (Salva, Stampa, Taglia, Copia, Incolla, Elimina, ecc.) e
quelli più utilizzati per lavorare con un foglio elettronico (Somma, Incolla
funzione, Ordinamento, ecc.) (fig. 1.6);
13
Fig. 1.6 – Barra standard
3. Spostamento e selezione
- una cella: cliccare sulla cella; apparirà con un contorno nero (fig. 1.9):
14
- più celle: cliccare sulla prima e trascinare fino all’ultima. Le celle appari-
ranno contornate di nero. In più la prima cella resterà a fondo bianco (per indi-
care che è quella iniziale) e le altre avranno fondo scuro (fig. 1.10):
- una riga o una colonna: cliccare sulla rispettiva intestazione. Tutte le cel-
le appariranno su fondo scuro (fig. 1.11, 1.12):
- più righe o colonne: cliccare sulla intestazione della prima e trascinare fi-
no all’ultima. Anche qui tutte le celle selezionate appariranno su fondo
scuro (fig. 1.13, 1.14):
15
Fig. 1.14 – Selezione di più colonne
- elementi non consecutivi: cliccare sul primo e poi sui successivi tenendo
premuto tasto CTRL; in questo caso l’ultima cella selezionata è in fondo
chiaro (per indicare che è quella finale) (fig. 1.15):
4. Immissione dati
16
Per cancellare l’intero contenuto di una cella (o di più celle) selezionare
l’area interessata e premere il tasto Canc.
Va notato che Excel pretende che ogni dato immesso vada convalidato, per
questo motivo occorre premere Invio dopo l’immissione del dato.
In fase di immissione, il testo viene allineato a sinistra nella cella e si e-
stende anche sulle celle adiacenti, se la sua lunghezza va oltre la cella attiva, fin
quando nelle celle adiacenti non verrà inserito del testo a sua volta. In questo
caso il contenuto delle celle verrà troncato, anche se è sempre possibile aumen-
tare la larghezza delle celle per visualizzarlo per intero.
Per modificare le dimensioni delle celle, senza utilizzare i comandi, è pos-
sibile posizionare il puntatore del mouse tra l’etichetta di colonna (o di riga)
della colonna che si vuole modificare e la successiva (o precedente); il puntato-
re diventa una doppia freccia; a questo punto basta cliccare e trascinare. Oppure
effettuare un doppio clic quando il puntatore diventa una doppia freccia: in
questo modo si adatta la dimensione della cella al suo contenuto.
Se si vuole andare a capo all’interno della stessa cella si deve premere i ta-
sti Alt + Invio.
I numeri immessi nella cella vengono allineati a destra, se sono più lunghi
di questa al loro posto verranno visualizzati dei simboli di cancelletto (###) al-
largando la colonna verrà restituito il valore digitato per intero.
Le date vengono allineate a destra e per essere riconosciute come tali de-
vono essere separate dal carattere barra (/) dal trattino (-) o da uno spazio. Al-
cuni valori riconosciuti come date vengono automaticamente visualizzati in
modo differente da come sono stati scritti. Se una cella che contiene una data
viene formattata come Numero: al posto della data compare un numero, che
corrisponde al numero progressivo del giorno considerando che il giorno 1° è il
1° gennaio del 1900.
L’orario viene allineato anch’esso a destra e deve essere separato dai due
punti (:) o da un punto singolo (.), ma nella visualizzazione verrà utilizzato il
punto come divisore.
Excel, inoltre, consente di creare una serie di elementi predefiniti (giorni
della settimana, mesi, … ) semplicemente digitandone il primo. Significa che è
possibile scrivere “Lunedì” e poi far scrivere a Excel il resto; oppure scrivere
“1 ott.” e poi lasciar fare al programma. Per far ciò basta attivare la cella conte-
nente il primo dato (generatore della serie), quindi posizionarsi sull’angolo in-
feriore destro (si noterà un quadratino nero: si chiama maniglia di trascina-
mento) e, quando il puntatore assume la forma di una croce nera, cliccare e tra-
scinare il riquadro che si formerà fino alla cella in cui si desidera completare la
serie. Se si trascina a sinistra o in alto dalla casella di origine si ottiene il risul-
tato di immettere i valori antecedenti il primo, se ci porta a destra o in basso,
invece, si ottengono dei valori successivi nella serie.
17
5. Inserimento di celle, righe, colonne e fogli
Se, invece, si vuole inserire una riga, basta posizionare il cursore in quella
immediatamente sotto al punto di inserimento ed attivare il comando Inserisci
Righe (fig. 1.17):
18
Infine, per inserire solo una cella, ci si posizioni nel punto in cui inserirla
ed attivare il comando Inserisci Celle, (fig. 1.18):
19
Fig. 1.20 – Inserisci Foglio di lavoro
6. Formattazione
20
Fig. 1.21 – Formato celle
21
La scheda Allineamento permette di scegliere il tipo di allineamento,
l’orientamento ed effettuare alcuni controlli sul testo (fig. 1.22):
22
- Giustifica: nel caso del ritorno a capo o quando gli elementi sono orienta-
ti verticalmente, consente sempre di occupare pienamente lo spazio della
cella allargando la distanza fra le righe o le parole.
- Tipo di carattere;
- Stile;
- Dimensioni;
- Sottolineatura;
- Colore;
- Effetti.
23
Fig. 1.24 – Formato celle: Bordo
24
Fig. 1.26 – Formato celle: Protezione
25
Fig. 1.28 – Formato Colonna
presenta un sottomenù:
presenta un sottomenù:
26
8. Formule
8.1. Generalità
Il vero punto di forza del programma Excel è dato dalla gestione delle for-
mule.
È possibile immettere nelle celle formule di ogni tipo, dove i parametri so-
no i dati contenuti in altre celle (dello stesso foglio, della stessa cartella o anche
di altre cartelle) e lasciare fare a Excel i conti e visualizzare il risultato.
Quando si utilizza una formula semplice o costituita da una funzione, nella
casella che la ospita non vedremo i suoi parametri, bensì il risultato
dell’operazione effettuata.
Per visualizzarne gli elementi costituenti bisogna selezionare la cella che li
contiene e guardare la barra della formula, oppure fare doppio clic sulla stessa.
Il primo carattere di una formula deve essere sempre l’uguale ( = ) a cui
devono seguire gli elementi che la completano.
È possibile inserire una formula direttamente in una cella o sulla barra della
formula utilizzando l’apposito pulsante Modifica formula (rappresentato da un
uguale), nel qual caso comparirà una finestra che visualizzerà il risultato man
mano che vengono inseriti i parametri.
I parametri delle formule sono costituiti da indirizzi di cella, operatori e
valori.
Per indicare che la formula è terminata è necessario premere sempre il pul-
sante di Invio.
Per immettere gli indirizzi di cella non è necessario digitarli: è possibile
semplicemente cliccare sulla cella contenente il dato che interessa, inserire gli
operatori e cliccare sulle altre celle fino ad ottenere la formula desiderata.
27
glio. Per ottenere questo risultato è necessario far precedere i riferimenti asso-
luti di cella dai riferimenti assoluti del foglio. Ciò si ottiene facendo seguire al
nome del foglio un punto esclamativo (!).
Inoltre è possibile avere anche dei riferimenti misti, vale a dire assoluto per
una colonna e relativo per una riga o viceversa, semplicemente anteponendo il
simbolo $ alla sola etichetta che si desidera assoluta.
Infine c’è da ricordare che attraverso la maniglia di trascinamento Excel
copia le formule adattandole relativamente. In altre parole se al termine della
prima colonna di una tabella si esegue un totale, trascinando per la maniglia
questa cella nella cella a fianco comparirà il totale della seconda colonna. Excel
esegue il totale dei soli dati formattati come numeri, saltando automaticamente
i dati in formato testo.
Gli elementi delle funzioni possono essere costituiti da singole celle o da in-
tervalli, da numeri e testo; esse iniziano sempre col segno uguale ( = ) al quale
segue il nome della funzione e delle parentesi tonde entro le quali inserire i pa-
rametri che vengono separati fra loro da un punto e virgola (;). È possibile inse-
28
rire più funzioni in una stessa formula, ma il segno di uguale andrà soltanto da-
vanti alla prima.
Diversi possono essere i metodi di inserimento di una formula:
cliccando sulla freccia a destra si apre la lista di quelle più usate di recen-
te; la voce Altre funzioni attiva invece la finestra Inserisci funzione;
- attivare la finestra Inserisci funzione mediante il pulsante della barra
della formula (fig. 1.31):
29
per avere l’elenco completo, in ordine alfabetico, delle funzioni disponibi-
li.
Per ogni funzione viene spiegato in basso il suo funzionamento, vale a di-
re la sua sintassi.
È possibile digitare direttamente gli argomenti o cliccare sul pulsante a
destra degli appositi spazi e selezionarli con il mouse; la finestra scompa-
rirà e rimarrà un riquadro nel quale si potrà visualizzare gli indirizzi o in-
tervalli selezionati. Per tornare alla funzione si deve cliccare nuovamente
sul pulsante alla sua destra; quando è completata la fase di digitazione, si
deve preme il pulsante OK.
Infine, nel caso in cui si commettano degli errori, Excel visualizza, in alcu-
ni casi dei messaggi, per informarvi che le parentesi aperte non corrispondono
a quelle chiuse o che vi è un riferimento circolare (si utilizzando cioè la cella
che contiene il risultato anche come dato per ottenere il risultato stesso); in altri
casi Excel visualizza dei codici di errore:
30
2. Rappresentazioni grafiche
1. Generalità
2. Grafico a barre
31
Per rappresentare una tabella si disegna, per ciascuna modalità del fenome-
no, un rettangolo di lunghezza proporzionale alla frequenza o all’intensità della
modalità e di larghezza arbitraria.
I rettangoli possono essere sia orizzontali (grafico a barre orizzontali) (fig.
2.7), sia verticali (grafico a barre verticali) (fig. 2.13).
Se si vogliono rappresentare graficamente i dati di tabelle a doppia entrata,
si possono utilizzare grafici a barre suddivise o a colonne suddivise (fig. 2.20).
In questo caso i rettangoli vengono suddivisi in tratti proporzionali alle fre-
quenze o intensità congiunte.
I grafici a barre possono inoltre riportare sia valori positivi sia valori nega-
tivi, nel caso in cui i valori siano negativi rispetto ad un valore di riferimento
(fig. 2.13).
Come si può facilmente intuire, l’utilizzo dei grafici a barre è molto vasto;
la diffusione di queste rappresentazioni è dovuta sia all’immediatezza di lettura
dell’andamento dei fenomeni rappresentati, sia dalla semplicità di costruzione
dei grafici stessi.
Esempio 2.1
Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei
suoi 5 negozi che si trovano in località diverse nella stessa provincia (tab. 2.1):
Partendo dalla cella A1, introdurre i dati della tab. 2.1, ottenendo il seguente
risultato (fig. 2.1):
Fig. 2.1 – Inserimento nel foglio elettronico dei dati di tab. 2.1
32
Selezionare le celle A1:B6, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.2):
Successivamente, cliccare tra i Tipi standard, il tipo Barre e tra le Scelte di-
sponibili mantenere il valore di default (fig. 2.3):
33
Fig. 2.4 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafico
Procedere ancora premendo il pulsante Avanti e nel Titolo del grafico digita-
re: Reddito mensile di alcuni negozi (in euro) (fig. 2.5):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.6):
34
Fig. 2.6 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
Negozio 5
Negozio 4
Negozio 3
Negozio 2
Negozio 1
Fig. 2.7 – Grafico a barre per il reddito mensile di alcuni negozi (in euro)
Esempio 2.2
La tab. 2.2 rappresenta gli arrivi (espressi sotto forma di variazioni percentuali
rispetto allo stesso periodo dell’anno precedente) negli esercizi alberghieri per
ripartizione geografica, durante il periodo di ferragosto 2001:
Tab. 2.2 – Arrivi negli esercizi alberghieri per ripartizione geografica ferragosto
2001 (fonte: ISTAT)
Zona geografica Italiani Stranieri
Nord – ovest 1,1 -7,6
Nord - est -1,0 -1,6
Centro -2,9 5,9
Sue e isole 6,5 -16,1
35
Partendo dalla cella A1, introdurre i dati della tab. 2.2, ottenendo il seguente
risultato (fig. 2.8):
Fig. 2.8 – Inserimento nel foglio elettronico dei dati di tab. 2.2
Selezionare le celle A1:C5, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.9):
36
Fig. 2.10 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Procedere ancora premendo il pulsante Avanti e nel Titolo del grafico digita-
re: Arrivi negli esercizi alberghieri per ripartizione geografica ferragosto 2001
(fonte: ISTAT) (fig. 2.11):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.12):
37
Fig. 2.12 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
15
10
Italiani
Stranieri
-10
Fig. 2.13 – Arrivi negli esercizi alberghieri per ripartizione geografica ferragosto
2001 (fonte: ISTAT)
Esempio 2.3
38
Tab. 2.3 – Esportazioni e importazioni per attività economica anno 2001 (fonte:
ISTAT)
Classi di attività economica Esportazioni Importazioni
Autoveicoli 11.681.377 24.736.864
Parti e accessori per autoveicoli 8.494.249 4.862.863
Calzature 8.394.356 3.062.063
Medicinali e preparati farmaceutici 6.988.249 6.483.934
Altre macchine per impieghi speciali 6.895.006 2.495.881
Elettrodomestici 6.011.183 1.119.915
Macchine utensili compresi parti e accessori 5.680.330 2.631.355
Altri indumenti esterni 5.669.565 2.612.787
Gioielli e articoli di oreficeria 5.382.526 941.905
Altre macchine di impiego generale 5.134.691 1.431.210
Partendo dalla cella A1, introdurre i dati della tab. 1.3, ottenendo il seguente
risultato (fig. 2.14):
Fig. 2.14 – Inserimento nel foglio elettronico dei dati di tab. 2.3
Selezionare le celle A1:C11, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.15):
39
Fig. 2.15 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
Successivamente, cliccare tra i Tipi standard, il tipo Barre e tra le Scelte di-
sponibili selezionare Barre in pila (fig. 2.16):
40
Fig. 2.17 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Procedere ancora premendo il pulsante Avanti e nel Titolo del grafico digita-
re: Esportazioni e importazioni per attività economica anno 2001 (fonte: I-
STAT) (fig. 2.18):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.19):
41
Fig. 2.19 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
Elettrodomestici
Medicinali e preparati
farmaceutici
Calzature
Autoveicoli
- 5.000.000
10.000.000 15.000.000 20.000.000 25.000.000 30.000.000 35.000.000 40.000.000
Fig. 2.20 – Esportazioni e importazioni per attività economica anno 2001 (fonte:
ISTAT)
42
L’angolo al centro di ogni settore è proporzionale alla frequenza o intensità
della modalità che rappresenta.
Le ampiezze α i degli angoli dei settori vengono calcolate con la seguente
proporzione:
α i : 360 = fi : ftot
dove:
Esempio 2.4
Tab. 2.4 – Depositi bancari per aree geografiche al 31 dicembre 2003 (fonte: Ban-
ca d’Italia)
Italia Nord-Occidentale 214.476
Italia Nord-Orientale 129.678
Italia Centrale 141.728
Italia Meridionale 85.614
Italia Insulare 40.817
Partendo dalla cella A1, introdurre i dati della tab. 2.4, in modo da ottenere il
seguente risultato (fig. 2.21):
43
Selezionare le celle A1:B5, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.22):
Successivamente, cliccare tra i Tipi standard, il tipo Torta e tra le Scelte di-
sponibili mantenere l’impostazione di default (fig. 2.23):
44
Fig. 2.24 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Procedere ancora premendo il pulsante Avanti e nel Titolo del grafico digita-
re: Depositi bancari per aree geografiche al 31 dicembre 2003 (fonte: Banca
d’Italia) (fig. 2.25):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.26):
45
Fig. 2.26 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
6,67%
13,98%
35,03%
Italia Nord-Occidentale
Italia Nord-Orientale
Italia Centrale
Italia Meridionale
23,15% Italia Insulare
21,18%
Fig. 2.27 – Depositi bancari per aree geografiche al 31 dicembre 2003 (fonte: Ban-
ca d’Italia)
Esempio 2.5
La tab. 2.5 rappresenta le vendite effettuate da un negozio di una merce (in Kg)
rilevate in due settimane consecutive:
Tab. 2.5 – Quantità (in Kg) di merce venduta da un negozio in due settimane
Giorni Vendite I° settimana Vendite II° settimana
lunedì 250 180
martedì 420 320
mercoledì 175 230
giovedì 280 300
venerdì 350 235
sabato 250 200
46
Partendo dalla cella A1, introdurre i dati della tab. 2.4, in modo da ottenere il
seguente risultato (fig. 2.28):
Fig. 2.28 – Inserimento nel foglio elettronico dei dati di tab. 2.5
Selezionare le celle A1:C7, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.29):
Successivamente, cliccare tra i Tipi standard, il tipo Anello e tra le Scelte di-
sponibili mantenere l’impostazione di default (fig. 2.30):
47
Fig. 2.30 – Selezione del tipo di grafico
Fig. 2.31 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
48
Procedere ancora premendo il pulsante Avanti e nel Titolo del grafico digita-
re: Quantità (in Kg) di merce venduta da un negozio in due settimane (fig.
2.32):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.33):
V e n d it e II° V e n d it e II°
s e ttim a n a ; 1 3 ,6 5 % s e ttim a n a ; 1 2 ,2 9 %
V e n d it e I° s e t t im a n a ;
V e n d ite I° s e ttim a n a ; 1 4 ,4 9 %
1 4 ,4 9 %
V e n d it e II° V e n d it e II°
s e ttim a n a ; 1 6 ,0 4 % s e ttim a n a ; 2 1 ,8 4 %
V e n d ite I° s e ttim a n a ;
V e n d it e I° s e t t im a n a ; lu n e d ì
2 0 ,2 9 %
2 4 ,3 5 % m a rte d ì
m e r c o le d ì
g io v e d ì
V e n d it e I° s e t t im a n a ; ve n e rd ì
1 6 ,2 3 % V e n d ite I° s e ttim a n a ; s a b a to
1 0 ,1 4 %
V e n d it e II°
V e n d it e II°
s e ttim a n a ; 2 0 ,4 8 %
s e ttim a n a ; 1 5 ,7 0 %
Fig. 2.34 – Quantità (in Kg) di merce venduta da un negozio in due settimane
49
4. Istogramma
50
Operativamente, invece di calcolare manualmente ampiezza e densità di
frequenza, è possibile utilizzare gli Strumenti di analisi, che consentono di ri-
durre i passaggi necessari allo sviluppo di complesse analisi statistiche o inge-
gneristiche. Una volta forniti i dati e i parametri per ciascuna analisi, lo stru-
mento utilizzerà le funzioni macro statistiche o ingegneristiche appropriate, vi-
sualizzando i risultati in una tabella di output generando anche dei grafici.
Per accedere a questi strumenti, dal menu Strumenti selezionare la voce
Analisi Dati (fig. 2.35). Se il comando Analisi Dati non è disponibile, è neces-
sario caricare il programma di aggiuntivo Strumenti di analisi.
dove:
51
tomaticamente conteggiato il numero di dati tra il numero della classe cor-
rente e la classe più elevata adiacente, se esiste. Un numero viene conteg-
giato in una particolare classe se è uguale o minore al numero di classe.
Vengono conteggiati insieme tutti i valori inferiori al primo valore della
classe e tutti i valori superiori all'ultimo valore della classe. Se non si spe-
cifica l'intervallo di classe, viene automaticamente creato un insieme di
classi distribuite uniformemente tra il valore minimo e il valore massimo
dei dati;
- Etichette: selezionare questa opzione se la prima riga o colonna dell'in-
tervallo di input contiene etichette. In caso contrario deselezionarla, in
quanto le etichette di dati appropriate per la tabella di output vengono cre-
ate automaticamente;
- Intervallo di output: immettere il riferimento della cella superiore sini-
stra della tabella di output. Le dimensioni dell'area di output vengono de-
terminate automaticamente e viene visualizzato un messaggio qualora la
tabella di output sostituisca i dati esistenti;
- Nuovo foglio di lavoro: selezionare tale opzione per inserire un nuovo
foglio di lavoro nella cartella di lavoro corrente e incollare i risultati a par-
tire dalla cella A1 del nuovo foglio di lavoro. Per assegnare un nome al
nuovo foglio di lavoro, digitarlo nella casella di testo;
- Nuova cartella di lavoro: selezionare tale opzione per creare una nuova
cartella di lavoro e incollare i risultati in un nuovo foglio della nuova car-
tella di lavoro;
- Pareto (istogramma ordinato): selezionare questa casella di controllo per
presentare i dati nella tabella di output in ordine di frequenza decrescente.
Se la casella è deselezionata, i dati vengono presentati in ordine crescente
e vengono omesse le tre colonne all'estremità destra contenenti i dati ordi-
nati;
- Percentuale cumulativa: selezionare questa opzione per generare nella
tabella di output una colonna per le percentuali cumulative e per includere
nel grafico di istogramma una riga per la percentuale cumulativa. Desele-
zionare l'opzione per omettere le percentuali cumulative;
- Grafico in output: selezionare questa opzione per generare automatica-
mente un istogramma incorporato nella tabella di output.
Esempio 2.6
La tab. 2.6 riporta 150 misure sperimentali (in volt) rilevate in un punto di un
circuito elettronico con un voltmetro digitale:
52
Tab. 2.6 – Valori di tensione (in volt) misurati da un voltmetro digitale in un punto
di un circuito elettronico (dati grezzi)
5,145 5,120 5,146 5,114 5,134 5,148 5,146 5,143 5,145 5,156
5,132 5,138 5,139 5,140 5,139 5,132 5,128 5,142 5,132 5,138
5,143 5,159 5,123 5,148 5,131 5,143 5,146 5,129 5,141 5,135
5,145 5,139 5,136 5,161 5,118 5,141 5,138 5,152 5,146 5,138
5,131 5,160 5,169 5,142 5,129 5,131 5,128 5,140 5,150 5,130
5,124 5,150 5,140 5,136 5,150 5,158 5,144 5,132 5,145 5,142
5,133 5,137 5,131 5,137 5,154 5,155 5,126 5,126 5,133 5,149
5,128 5,125 5,133 5,134 5,144 5,133 5,157 5,134 5,138 5,142
5,143 5,133 5,154 5,134 5,124 5,129 5,155 5,153 5,146 5,154
5,158 5,148 5,140 5,133 5,134 5,133 5,152 5,155 5,132 5,135
5,136 5,148 5,153 5,150 5,147 5,162 5,129 5,148 5,151 5,157
5,151 5,137 5,128 5,140 5,143 5,140 5,130 5,153 5,142 5,151
5,146 5,148 5,137 5,157 5,158 5,157 5,153 5,131 5,164 5,159
5,134 5,148 5,144 5,143 5,156 5,147 5,145 5,123 5,140 5,162
5,139 5,152 5,132 5,154 5,128 5,140 5,151 5,138 5,139 5,142
Partendo dalla cella A1, introdurre i dati della tab. 2.6, ottenendo il seguente
risultato (fig. 2.37):
Fig. 2.37 – Inserimento nel foglio elettronico dei dati di tab. 2.5
53
Fig. 2.38 – Strumenti di analisi di Microsoft Excel
e dopo aver premuto il pulsante OK, si ottiene il seguente risultato (fig. 2.41):
54
90
80
70
60
50
40
30
20
10
0
14 33 67 ro
5,1 33 66 Alt
2 33 066
3 5
5,1 5,1
Fig. 2.41 – Istogramma della distribuzione dei valori di tensione (in volt) misurati
da un voltmetro digitale in un punto di un circuito elettronico
55
30
25
20
15
10
0
5,115 5,120 5,125 5,130 5,135 5,140 5,145 5,150 5,155 5,160 5,165 5,170
Fig. 2.43 – Istogramma della distribuzione dei valori di tensione (in volt) misurati
da un voltmetro digitale in un punto di un circuito elettronico effettuata con la de-
terminazione manuale delle classi
Fig. 2.44 – Raggruppamento in classi dei valori di tensione (in volt) misurati da un
voltmetro digitale
56
Esempio 2.7
Partendo dalla cella A1, inserire i dati della tab. 2.7, ottenendo il seguente risul-
tato (fig. 2.45):
57
Fig. 2.45 – Inserimento nel foglio elettronico dei dati di tab. 2.7
58
Selezionato la voce Istogramma e premere il pulsante OK (fig. 2.47):
Nella cella Intervallo di input digitare A1:E24, nella cella Intervallo della
classe digitare H2:H13 e selezionare la voce Grafico in output (fig. 2.48):
dopo aver premuto il pulsante OK, si ottiene il seguente risultato (fig. 2.49,
2.50):
59
30
25
20
15
10
0
0,726 0,728 0,730 0,732 0,734 0,736 0,738 0,740 0,742 0,744 0,746 0,748
Fig. 2.49 – Istogramma della distribuzione delle misure di assorbimento con spet-
trofotometro
60
5. Diagramma cartesiano
Esempio 2.8
61
12 103,2 101,0 97,6 100,1 100,8
13 99,5 100,1 101,2 100,2 99,6
14 100,2 94,9 99,4 103,7 103,0
15 97,3 101,8 99,2 101,0 100,7
16 100,9 99,6 102,9 100,8 99,4
17 99,8 97,9 100,7 100,3 99,3
18 99,9 99,3 100,6 101,1 103,3
19 96,1 101,1 104,1 97,4 102,1
20 98,3 99,2 100,7 98,2 100,9
21 98,4 104,7 100,0 98,2 99,2
22 101,9 97,8 98,1 103,4 99,0
23 101,7 96,8 100,9 100,8 101,8
24 101,8 102,9 102,9 98,8 101,5
25 102,3 100,9 100,1 99,4 101,1
26 100,8 102,3 98,5 100,8 102,4
27 100,3 101,9 102,3 100,4 99,5
28 100,2 103,4 102,1 100,8 104,0
29 103,7 105,4 101,5 103,2 103,4
30 102,8 101,9 104,5 103,4 104,7
Partendo dalla cella A1, inserire i dati della tab. 2.8, ottenendo il seguente risul-
tato (fig. 2.51):
Fig. 2.51 – Inserimento nel foglio elettronico dei dati di tab. 2.8
62
Selezionare le celle A1:F30, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.52):
Successivamente, cliccare tra i Tipi standard, il tipo Linee e tra le Scelte di-
sponibili mantenere il valore di default (fig. 2.53):
63
Fig. 2.54 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Selezionare la linguetta Serie e nella casella Etichette asse categoria (X) digi-
tare: A3:A32 per inserire le etichette identificative sull’asse delle ascisse (fig.
2.55):
64
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Peso di 30 lotti di 5 vaschette di gelato, nell’Asse delle categorie (X): n° lotto
e nell’Asse dei valori (Y): grammi (fig. 2.56):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.57):
65
Peso di 30 lotti di 5 vaschette di gelato
108,0
106,0
104,0
102,0
100,0
grammi
98,0
96,0
1a vaschetta
2a vaschetta
94,0
3a vaschetta
92,0 4a vaschetta
5a vaschetta
90,0
88,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
n° lotto
Esempio 2.9
La tab. 2.9 riporta la quantità venduta da un’azienda di due merci (A, B) negli
anni 1997 – 2003:
Tab. 2.9 – Quantità venduta delle merci A e B negli anni 1997 - 2003
Anno Merce A Merce B
1997 6000 2000
1998 6500 2400
1999 7000 3500
2000 8000 4200
2001 8350 4550
2002 8500 4600
2003 8900 4890
Partendo dalla cella A1, dopo aver inserito i dati della tab. 2.9, si ottiene (fig.
2.59):
66
Fig. 2.59 – Inserimento nel foglio elettronico dei dati di tab. 2.9
Selezionare le celle A1:C8, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.60):
Successivamente, cliccare tra i Tipi standard, il tipo Area e tra le Scelte di-
sponibili mantenere il valore di default (fig. 2.61):
67
Fig. 2.61 – Selezione del tipo di grafico
Fig. 2.62 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
68
Selezionare la linguetta Serie e nella casella Etichette asse categoria (X) digi-
tare: A3:A8 per inserire le etichette identificative sull’asse delle ascisse (fig.
2.63):
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Andamento vendite, nell’Asse delle categorie (X): anni e nell’Asse dei valori
(Y): Q.tà (fig. 2.64):
69
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.65):
9000
8000
7000
6000
Q.tà
5000 Merce A
Merce B
4000
3000
2000
1000
0
1997 1998 1999 2000 2001 2002 2003
anni
70
Questa rappresentazione grafica viene utilizzata per vedere la dispersione
tra le unità statistiche ossia la loro vicinanza o distanza indicanti rispettivamen-
te la loro somiglianza o dissomiglianza rispetto ai due caratteri contemporane-
amente considerati. Inoltre, è importante considerare la forma assunta dalla nu-
vola dei punti perché può fornire indicazioni sul tipo di relazione esistente tra
le variabili.
Esempio 2.10
71
Inserire i dati della tab. 2.10, partendo dalla cella A1, utilizzando solamente le
colonne A e B (fig. 2.67):
Fig. 2.67 – Inserimento nel foglio elettronico dei dati di tab. 2.9
Selezionare le celle A1:B52, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.68):
72
Fig. 2.68 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
73
Fig. 2.70 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.72):
74
Fig. 2.72 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
800
700
600
mM/L
500
400
300
200
100
0
0 50 100 150 200 250 300 350 400 450 500
tempo (sec)
7. Altre rappresentazioni
75
variazioni percentuali in quanto la differenza tra due ordinate relative ai due
tempi t e t + h è pari al logaritmo del rapporto dei valori del fenomeno in detti
tempi:
⎛y ⎞
log ( yt + h ) − log ( yt ) = log ⎜⎜ t + h ⎟⎟
⎝ yt ⎠
e tale rapporto è indicativo della variazione percentuale in quanto:
yt + h y − yt
⋅ 100 = 100 + t + h ⋅ 100
yt yt
Esempio 2.11
Tab. 2.11 – Dinamica del traffico passeggeri negli aeroporti italiani (fonte: ISTAT)
Passeggeri
Anni
(migliaia)
1948 212
1953 324
1958 922
1963 2855
1968 5612
1973 10171
1978 12842
1983 14864
Partendo dalla cella A1, dopo aver inserito i dati della tab. 2.11, si ottiene (fig.
2.74):
Fig. 2.74 – Inserimento nel foglio elettronico dei dati di tab. 2.11
76
Selezionare le celle A1:B10, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.75):
77
Fig. 2.77 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Selezionare la linguetta Serie e nella casella Etichette asse categoria (X) digi-
tare: A3:A10 per inserire le etichette identificative sull’asse delle ascisse (fig.
2.78):
78
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Dinamica del traffico passeggeri negli aeroporti italiani (fonte: ISTAT) (fig.
2.79):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.80):
79
Dinamica del traffico passeggeri negli areoporti italiani (fonte: ISTAT)
100000
10000
1000
100
10
1
1948
1953
1958
1963
1968
1973
1978
1983
Fig. 2.81 – Dinamica del traffico passeggeri negli aeroporti italiani (fonte: ISTAT)
80
possibile valutare quanto siano pesanti i primi due o tre difetti rispetto la globa-
lità dei difetti che si sono presentati (fig. 2.94).
Operativamente, per la costruzione del diagramma di Pareto, è necessario:
Esempio 2.12
La tab. 2.12 riporta la distribuzione, per tipologia di difetto, di 200 pezzi mec-
canici:
Partendo dalla cella A1, dopo aver inserito i dati della tab. 2.12, si ottiene (fig.
2.82):
81
Fig. 2.82 – Inserimento nel foglio elettronico dei dati di tab. 2.12
Dopo aver premuto il pulsante OK, il risultato che si ottiene è (fig. 2.84):
82
Fig. 2.84 – Ordinamento dei dati in senso decrescente per numero di difetti
Per il calcolo dei valori totali cumulati, posizionarsi nella cella C3 e digitare:
= B3 , nella cella C4: = B 4 + C 3 , trascinare tale formula verticalmente fino alla
cella C9 (fig. 2.86):
83
Per il calcolo delle percentuali cumulate, posizionarsi nella cella D3 e digitare:
= C 3 / $C $9 (il carattere $ è stato ottenuto premendo il tasto funzione F4 dopo
la digitazione del riferimento di cella), trascinare tale formula verticalmente fi-
no alla cella D9 (fig. 2.87):
84
Fig. 2.89 – Selezione del tipo di grafico
Fig. 2.90 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
85
Selezionare la linguetta Serie e nella casella Etichette asse categorie (X) digi-
tare: A3:A10 per inserire le etichette identificative sull’asse delle ascisse (fig.
2.91):
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Diagramma di Pareto per i 200 pezzi meccanici (fig. 2.92):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.93):
86
Fig. 2.93 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
90%
100
80%
70%
80
60%
60 50%
40%
40
30%
20%
20
10%
0 0%
deformazione foro graffio giuoco rottura macchia altri
Esempio 2.13
87
345 Sedili 25.000
450 Impianti frenante 5.000
451 Pastiglie freni 2.000
Partendo dalla cella A1, dopo aver inserito i dati della tab. 2.13, si ottiene (fig.
2.95):
Fig. 2.95 – Inserimento nel foglio elettronico dei dati di tab. 1.13
Dopo aver premuto il pulsante OK, il risultato che si ottiene è (fig. 2.97):
88
Fig. 2.97 – Ordinamento dei dati in senso decrescente per valore del prodotto
Per il calcolo dei valori totali cumulati, posizionarsi nella cella D2 e digitare:
= C 3 , nella cella D3: = C 3 + D 2 , trascinare tale formula verticalmente fino
alla cella D10 (fig. 2.99):
89
Per il calcolo delle percentuali cumulate, posizionarsi nella cella E2 e digitare:
= D3 / $ D$10 (il carattere $ è stato ottenuto premendo il tasto funzione F4 do-
po la digitazione del riferimento di cella), trascinare tale formula verticalmente
fino alla cella E10 (fig. 2.100):
90
Fig. 2.102 – Selezione del tipo di grafico
Fig. 2.103 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
91
Selezionare la linguetta Serie e nella casella Etichette asse categorie (X) digi-
tare: B2:B10 per inserire le etichette identificative sull’asse delle ascisse (fig.
2.104):
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Diagramma di Pareto giacenza di magazzino (fig. 2.105):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.106):
92
Fig. 2.106 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
160000 100%
90%
140000
80%
120000
70%
100000
60%
80000 50%
40%
60000
30%
40000
20%
20000
10%
0 0%
Gruppo ottici
Pastiglie freni
Scatole del
Trasmissioni
Motori a gasolio
Motori a benzina
Differenziali
Sedili
Impianti frenante
cambio
93
Fig. 2.108 – Diagramma a scatola e baffi (box-plot)
94
Fig. 2.109 – Diagramma a scatola e baffi nel caso di distribuzione normale
Esempio 2.14
La tab. 2.14 riporta il diametro (cm) di 25 tubi prodotti da tre macchinari diver-
si:
95
74,010 73,989 73,990
74,015 74,008 73,993
73,982 73,984 73,995
Partendo dalla cella A1, dopo aver inserito i dati della tab. 2.14, si ottiene (fig.
2.110):
Fig. 2.110 – Inserimento nel foglio elettronico dei dati di tab. 1.14
96
Fig. 2.111 – Predisposizione tabella per il calcolo delle statistiche di base
Fig. 2.112 – Rappresentazione delle formule per il calcolo delle statistiche di base
97
Fig. 2.113 – Valori numerici delle statistiche di base calcolate a partire dai dati del-
la tab. 2.14
Tra i Tipi standard selezionare il tipo di grafico Linee e tra le Scelte disponi-
bili l’opzione Linee con indicatori assieme ai valori (fig. 2.115):
98
Fig. 2.115 – Selezione del tipo di grafico
Fig. 2.116 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
99
Fig. 2.117 – Modifica disposizione dati
Procedere ancora premendo il pulsante Avanti e nel Titolo del grafico digita-
re: Box – Plot per il diametro di tubi prodotti da tre macchine diverse (fig.
2.118):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 2.119):
100
Fig. 2.119 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
74,02
74,01
74,00
73,99
73,98
73,97 I° quartile
valore minimo
73,96
media
73,95 mediana
valore massimo
73,94
III° quartile
73,93
Macchina A Macchina B Macchina C
Fig. 2.120 – Box-Plot (diagramma non definitivo)
101
Fig. 2.121 – Formato serie dati
102
Fig. 2.123 – Inserimento scatole nel digramma
74,03
74,02
74,01
74,00
73,99
73,98 I° quartile
valore minimo
media
73,97 mediana
valore massimo
III° quartile
73,96
Macchina A Macchina B Macchina C
103
Nei diagrammi in coordinati polari si considera una asse polare costituito
da una retta avente per origine un punto fisso, O, detto polo (fig. 2.125).
y P
θ
O x
104
Infine, si congiungono gli estremi dei raggi vettori al fine dare maggior ri-
lievo all’andamento del fenomeno.
Esempio 2.15
La tab. 2.15 riporta la distribuzione dei veicoli (in migliaia) transitati sulla rete
autostradale nei giorni dell’ultima settimana di luglio, negli anni 1996 e 1996
(fonte: IRI-ITALSTAT):
Tab. 2.15 – Distribuzione dei veicoli (in migliaia) transitati sulla rete autostradale
nei giorni dell’ultima settimana di luglio, negli anni 1996 e 1997 (fonte: IRI-
ITALSTAT)
Giorni 1996 1997
lunedì 960.000 950.000
martedì 1.100.000 1.259.000
mercoledì 1.020.000 1.110.000
giovedì 1.050.000 1.150.000
venerdì 1.052.000 1.210.000
sabato 1.080.000 1.168.000
domenica 1.000.000 1.130.000
Partendo dalla cella A1, dopo aver inserito i dati della tab. 2.15, si ottiene (fig.
2.126):
Fig. 2.126 – Inserimento nel foglio elettronico dei dati di tab. 1.15
Selezionare le celle A1:C8, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 2.127):
105
Fig. 2.127 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
Tra i Tipi standard selezionare il tipo di grafico Radar e tra le Scelte dispo-
nibili l’opzione di default (fig. 2.128):
106
Fig. 2.129 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
107
Premere due volte consecutive il pulsante Avanti e selezionare la voce Crea
nuovo foglio (fig. 2.131):
sabato mercoledì
venerdì giovedì
Fig. 2.132 – Diagramma polare per la distribuzione dei veicoli transitati sulla rete
autostradale nei giorni dell’ultima settimana di luglio negli anni 1996 e 1997 (fon-
te: IRI-ITALSTAT)
108
3. Misure di tendenza centrale
1. Generalità
Abbiamo visto che i dati osservati, sia per la loro numerosità che per il fatto
di non essere ordinati, non consentono di percepire agevolmente le caratteristi-
che che seno presenti nel fenomeno indagato nel collettivo dei casi.
Le tabelle statistiche, ottenute dalla classificazione delle osservazioni, con-
tengono dati ordinati (in quanto scaturenti da una classificazione), e più sinteti-
ci (i casi caratterizzati dalla stessa modalità vengono messi assieme).
Spesso però è opportuno effettuare una sintesi più spinta dei dati, sì da ot-
tenere indici che misurino gli aspetti più rilevanti della serie di dati ottenuti dal-
la rilevazione o della relativa tabella.
Tra gli indici più importanti occorre considerare quelli di posizione, quelli
di variabilità e quelli di forma. Il primo tipo verrà esaminato in questo capitolo
gli altri due tipi verranno considerati nei capitoli seguenti.
Il concetto di media scaturisce dalla esigenza di esprimere, attraverso un
valore sintetico, l’entità del carattere unica che meglio può rappresentare una
serie di osservazioni diverse. La sintesi si rende opportuna specie quando si
vuole condurre agevolmente dei confronti tra collettivi diversi per i quali si è
osservato lo stesso carattere.
Atteso che in relazione alle caratteristiche peculiari della serie di osserva-
zioni (o della variabile statistica) ed alle esigenze interpretative che si vogliono
raggiungere, la sintesi può essere effettuata in maniera diversa, è possibile co-
struire vari tipi di medie.
Le medie possono essere analitiche o lasche.
Le medie analitiche dette anche di calcolo utilizzano tutti i valori della se-
rie indipendentemente dal loro ordine.
Le medie lasche o di posizione utilizzano solo alcune osservazioni ordinate.
Le principali medie analitiche sono: la media aritmetica, la media geome-
trica, la media armonica e la media armonica.
Le principali medie lasche sono: il valore centrale, la mediana, i valori
quantilici e la moda.
109
2. Media aritmetica
Esempio 3.1
Nella tab. 3.1 sono riportati i valori (in μg/m3) di biossido di azoto (NO2), mo-
nossido di carbonio (CO), biossido di zolfo (SO2), particelle totali sospese
(PST), ozono (O3) rilevate in 10 centraline in un giorno:
110
Tab. 3.1 – Valori di NO2, CO, SO2, PTS, O3, rilevati in 10 centraline in un giorno
centralina NO2 CO SO2 PTS O3
1 190 1430 70 70 120
2 208 2024 115 170 172
3 380 1800 180 95 145
4 150 1320 95 44 230
5 308 2560 255 145 215
6 407 3100 130 82 158
7 187 1200 310 80 167
8 241 1040 195 56 285
9 220 1900 90 115 135
10 420 2230 108 198 189
Partendo dalla cella A1, introdurre i dati della tab. 3.1, ottenendo il seguente
risultato (fig. 3.1):
Fig. 3.1 – Inserimento nel foglio elettronico dei dati di tab. 3.1
Posizionare il cursore nella cella A13 e digitare: valori medi; nella cella B13
digitare: =SOMMA(B2:B11), trascinare tale formula orizzontalmente fino alla
cella F13 ottenendo il seguente risultato (fig. 3.2):
111
Esempio 3.2
Partendo dalla cella A1, introdurre i dati della tab. 3.2 (fig. 3.3):
Fig. 3.3 – Inserimento nel foglio elettronico dei dati di tab. 3.2
Posizionare il cursore nella cella A5 e digitare: valore medio; nella cella B5 di-
gitare: =SOMMA(A1:F3) (fig. 3.4):
3. Media geometrica
112
È anche possibile utilizzare un'unica matrice o un riferimento a una matrice
anziché argomenti separati dal punto e virgola.
Da osservare che gli argomenti devono essere numeri oppure nomi, matrici
o riferimenti che contengono numeri.
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati.
Le celle contenenti il valore zero verranno invece incluse nel calcolo.
Se uno qualsiasi dei dati è minore od uguale a 0 , la funzione restituirà il
valore di errore #NUM!.
Esempio 3.3
Partendo dalla cella A1, introdurre i dati ottenendo il seguente risultato (fig.
3.5):
113
Quindi, per ogni litro di olio minerale sottoposto al processo di raffinazione la
quantità media ricavata risulta essere del 90,27% e conseguentemente la perdita
media: 100% – 90,27% = 9,73%.
4. Media armonica
Esempio 3.4
Partendo dalla cella A1, introdurre i dati ottenendo il seguente risultato (fig.
3.7):
114
Posizionarsi nella cella A3 e digitare: media armonica; nella cella C3 digitare:
=MEDIA.ARMONICA(A1:E1), ottenendo (fig. 3.8):
5. Mediana
115
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati.
Le celle contenenti il valore zero verranno invece incluse nel calcolo.
Qualora l'insieme sia costituito da un numero pari di valori, la funzione cal-
colerà la media dei due numeri che occupano la posizione centrale.
Esempio 3.5
La tab. 3.3 mostra l’andamento del dollaro dalle ore 9 alle ore 20 del 26 giugno
1998 (fonte: IL SOLE 24 ORE):
Tab. 3.3 – Andamento del dollaro il 26 giugno 1998 (fonte: IL SOLE 24 ORE)
ore £/$
9 1170
10 1170
11 1772
12 1773
13 1773
14 1773
15 1774
16 1779
17 1784
18 1787
19 1786
20 1784
Partendo dalla cella A1, introdurre i dati ottenendo il seguente risultato (fig.
3.9):
116
Posizionarsi nella cella A15 e digitare: mediana; nella cella B15 digitare:
=MEDIANA(B2:B13), ottenendo (fig. 3.10):
6. Quartili e percentili
Abbiamo visto che la mediana è quel valore al di sotto del quale vi è la me-
tà delle osservazioni. Talvolta vengono utilizzati anche altri valori di posizione
che dividono le distribuzioni in determinate percentuali, come ad esempio i
quartili ed i percentili.
I quartili, come dice il termine stesso, dividono la distribuzione in quarti ed
esattamente:
- il I quartile ( Q1 ) è il valore che lascia alla sua sinistra il 25% degli ele-
menti della distribuzione;
- il II quartile ( Q2 ) coincide con la mediana;
- il III quartile ( Q3 ) è il valore che lascia il 75% degli elementi a sinistra ed
il 25% a destra.
- 0 valore minimo;
- 1 I quartile;
- 2 II quartile (mediana);
- 3 III quartile;
- 4 valore massimo.
117
Per quanto concerne il calcolo dei percentili, la funzione in Excel risulta es-
sere:
PERCENTILE(matrice;k)
dove matrice è la matrice o l'intervallo di dati che definisce la condizione
relativa e k è il valore percentile nell'intervallo 0, 1 compresi.
Se matrice contiene più di 8.191 dati o nessun dato, la funzione restituirà il
valore di errore #NUM!.
Se k non è un valore numerico, la funzione restituirà il valore di errore
#VALORE!.
Se k è minore di 0 o maggiore di 1, la funzione restituirà il valore di errore
#NUM!.
Se k non è un multiplo di 1 / (n − 1) , la funzione effettuerà un’interpolazione
per determinare il valore al k-esimo percentile.
Esempio 3.6
Posizionandosi nella cella B5 digitare: valore minimo, nella cella B6, I quartile,
nella cella B7, II quartile, nella cella B8 III quartile e nella cella B9 valore
massimo. Spostarsi nella cella C5 e digitare: =QUARTILE(A1:F3;0), nella cel-
la C6: =QUARTILE(A1:F3;1), nella cella C7: =QUARTILE(A1:F3;2), nella
cella B8: =QUARTILE(A1:F3;3) e nella cella B9: =QUARTILE(A1:F3;4) (fig.
3.11):
7. Moda
118
La moda può non esistere quando tutti i valori hanno la stessa frequenza e
se esiste può non essere unica. Se esiste ed è unica si parla di distribuzione u-
nimodale, se invece non è unica la distribuzione è detta plurimodale.
La corrispondente funzione in Excel risulta essere:
MODA(num1;num2;...)
dove num1; num2;...; sono da 1 a 30 argomenti di cui si desidera calcolare
la moda.
È anche possibile utilizzare un’unica matrice o un riferimento a una matrice
anziché argomenti separati dal punto e virgola.
Gli argomenti devono essere numeri, nomi, matrici o riferimenti che con-
tengono numeri.
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati.
Le celle contenenti il valore zero verranno invece incluse nel calcolo.
Se l'insieme dei dati non contiene valori duplici, la funzione restituirà il va-
lore di errore #N/D.
Esempio 3.7
Partendo dalla cella A1, introdurre i dati della tab. 3.4, ottenendo il seguente
risultato (fig. 3.12):
119
Fig. 3.12 – Inserimento nel foglio elettronico dei dati di tab. 3.4
Posizionare il cursore nella cella A12 e digitare: moda, nella cella B12:
=MODA(A1:B10) (fig. 3.13):
120
4. Misure di variabilità
1. Generalità
d1
d2 d n −1 dn
d3 di
x1 x2 x3 xi xn −1 xn
valore medio
(centro della distribuzione)
121
Per analizzare una distribuzione, dopo aver calcolato uno o più valori medi,
è necessario studiare la dispersione dei dati, dispersione che caratterizza la va-
riabilità del fenomeno oggetto di studio.
È importante, quindi, conoscere sia di quanto i dati differiscono da un valo-
re medio, sia di quanto differiscono fra di loro. Tra i vari indici che misurano la
variabilità di un fenomeno si considereranno: il campo di variazione (range),
varianza e scarto quadratico medio (deviazione standard) e per concludere
l’errore standard.
122
Esempio 4.1
La tab. 4.1 riporta i valori delle temperature delle cinghie rilevate in un giorno
di lavoro da una macchina industriale:
Partendo dalla cella A1, introdurre i dati della tab. 4.1, ottenendo il seguente
risultato (fig. 4.2):
Fig. 4.2 – Inserimento nel foglio elettronico dei dati di tab. 4.1
Posizionarsi con il cursore nella cella A4 e digitare: range, nella cella B4:
=MAX(A1:E2)-MIN(A1:E2) (fig. 4.3):
3. Varianza
∑( x − x)
i =1
i
2
sc2 =
n −1
L’analoga funzione in Excel, ha sintassi:
VAR(num1;num2;...)
dove num1;num2;...; sono da 1 a 30 argomenti numerici corrispondenti a
un campione della popolazione.
La funzione presuppone che gli argomenti siano un campione della popola-
zione. Se i dati rappresentano l’intera popolazione, la varianza dovrà essere cal-
colata utilizzando la funzione VAR.POP.
I valori logici come vero e falso e il testo vengono ignorati.
123
Se non si desidera che i valori logici e il testo vengano ignorati, è necessa-
rio utilizzare la funzione MEDIA.VALORI.
Per il calcolo della varianza Excel utilizza la seguente formula:
2
n
⎛ n ⎞
n ∑
i =1
xi2 ∑
− ⎜⎜ xi ⎟⎟
⎝ i =1 ⎠
sc2 =
n (n − 1)
Esempio 4.2
Partendo dalla cella A1, introdurre i dati ottenendo il seguente risultato (fig.
4.4):
Fig. 4.4 – Inserimento nel foglio elettronico dei dati dell’esempio 4.2
Posizionarsi con il cursore nella cella A3 e digitare: varianza, nella cella B3:
=VAR(A1:J1) (fig. 4.5):
Per risolvere l’inconveniente legato al calcolo della varianza, cioè che tale
indice è espresso nel quadrato dell’unità di misura delle osservazioni, è preferi-
bile calcolare la radice quadrata della varianza stessa, cioè lo scarto quadratico
medio (deviazione standard):
n
∑( x − x)
i =1
i
2
sc =
n −1
L’analoga funzione in Excel, assume la seguente sintassi:
DEV.ST(num1;num2;...)
dove num1;num2;...; sono da 1 a 30 argomenti numerici corrispondenti a
un campione della popolazione.
124
Invece che argomenti separati da punti e virgole, è possibile utilizzare una
singola matrice o un riferimento a una matrice.
DEV.ST presuppone che gli argomenti siano un campione della popolazio-
ne. Se i dati rappresentano l’intera popolazione, la deviazione standard deve
essere calcolata utilizzando la funzione DEV.ST.POP.
I valori logici come vero e falso e il testo vengono ignorati.
Se non si desidera che i valori logici e il testo vengano ignorati, utilizzare la
funzione DEV.ST.VALORI.
In Excel, la deviazione standard viene calcolata utilizzando la seguente
formula:
2
n
⎛ n ⎞
n ∑
i =1
xi2 ∑
− ⎜⎜ xi ⎟⎟
⎝ i =1 ⎠
sc =
n (n − 1)
Esempio 4.3
Partendo dalla cella A1, introdurre i dati ottenendo il seguente risultato (fig.
4.6):
Fig. 4.6 – Inserimento nel foglio elettronico dei dati dell’esempio 4.3
Posizionarsi con il cursore nella cella A3 e digitare: dev.st, nella cella B3:
=DEV.ST(A1:J1) (fig. 4.7):
Fig. 4.7 – Deviazione standard per tempi di collegamento via modem ad un ISP
125
5. Misure di forma
1. Generalità
2. Asimmetria
- simmetria se risulta x = M e = M o ;
- asimmetria positiva se M o < M e < x , la distribuzione presenta il ramo de-
stro più allungato di quello sinistro, in altre parole presenta una coda ver-
so destra;
126
- asimmetria negativa se x < M e < M o , la distribuzione presenta il ramo si-
nistro più allungato di quello destro, quindi presenta una coda verso sini-
stra.
Diversi indici di asimmetria si basano sulle relazioni tra media, moda e me-
diana, alcuni sono espressi nella stessa unità di misura del fenomeno investiga-
to, altri sono numeri puri. Tra i secondi, Fisher ha proposto un indice di asim-
metria relativo nella formula:
3
n n
⎛ xi − x ⎞
αF = ∑ ⎜
(n − 1)(n − 2) i =1 ⎜⎝ sc ⎟⎠
⎟
Se risulta:
Esempio 5.1
127
Partendo dalla cella A1, introdurre i dati della tab. 5.1, ottenendo il seguente
risultato (fig. 5.1):
Fig. 5.1 – Inserimento nel foglio elettronico dei dati di tab. 5.1
Fig. 5.2 – Indice di asimmetria per la quota dei particolari meccanici di tab. 5.1
3. Curtosi
128
È anche possibile utilizzare un'unica matrice o un riferimento a una matrice
anziché argomenti separati dal punto e virgola.
Gli argomenti devono essere numeri oppure nomi, matrici o riferimenti che
contengono numeri.
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati. Le celle contenenti il valore zero verranno invece
incluse nel calcolo.
Se sono presenti meno di quattro dati o se la deviazione standard del cam-
pione è uguale a zero, la funzione restituirà il valore di errore #DIV/0!.
Esempio 5.2
Partendo dalla cella A1, si introduca i dati della tab. 1.2, ottenendo il seguente
risultato (fig. 5.3):
Fig. 5.3 – Inserimento nel foglio elettronico dei dati di tab. 5.2
Posizionarsi con il cursore nella cella A7 e digitare: curtosi, nella cella B7:
=CURTOSI(A1:J5) (fig. 5.4):
129
6. Strumenti di analisi: statistica descrittiva
1. Generalità
Molti indici sintetici trattati nei capitoli precedenti vengono generati auto-
maticamente da Excel utilizzando la procedura Statistica descrittiva del menu
Analisi dati.
In particolare, le statistiche di sintesi utilizzate sono:
- media aritmetica;
- errore standard;
- mediana;
- moda;
- deviazione standard;
- varianza campionaria;
- curtosi;
- asimmetria;
- intervallo;
- minimo;
- massimo;
- somma;
- conteggio;
- più grande ( k );
- più piccolo ( k );
- confidenza.
130
L'errore standard è un numero che è direttamente correlato alla variabilità
della misura ottenuta: tanto più piccolo è l'errore standard, tanto minore è la
variabilità della misura e quindi tanto più attendibile è la statistica.
In Excel, la formula utilizzata per il calcolo dell’errore standard è:
m n
∑∑ y
s =1 i =1
2
is
S .E . =
n y (n y − 1)
dove:
131
Fig. 6.1 – Analisi dati: Statistica descrittiva
dove:
132
quanto le etichette di dati appropriate per la tabella di output verranno ge-
nerate automaticamente;
- Intervallo di output: immettere il riferimento della cella superiore sini-
stra della tabella di output. Questo strumento genera due colonne di in-
formazioni per ciascun insieme di dati. La colonna di sinistra contiene le
etichette di statistica, mentre quella di destra contiene le statistiche. Viene
scritta una tabella di statistiche a due colonne per ogni colonna o riga del-
l'intervallo di input, a seconda dell'opzione Raggruppato per seleziona-
ta;
- Nuovo foglio di lavoro: per inserire un nuovo foglio di lavoro nella car-
tella di lavoro corrente e incollare i risultati a partire dalla cella A1 del
nuovo foglio di lavoro. Per assegnare un nome al nuovo foglio di lavoro,
digitarlo nella casella di testo;
- Nuova cartella di lavoro: cliccare per creare una nuova cartella di lavoro
e incollare i risultati in un nuovo foglio della nuova cartella di lavoro;
- Riepilogo statistiche: selezionare se si desidera che venga generato nella
tabella di output un campo per ognuna delle seguenti statistiche: Media,
Errore standard (della media), Mediana, Modalità, Deviazione standard,
Varianza, Curtosi, Asimmetria, Intervallo, Minimo, Massimo, Somma,
Conteggio, Più grande (#), Più piccolo (#) e Livello di confidenza;
- Livello di confidenza per media: selezionare questa opzione se si deside-
ra includere nella tabella di output una riga per il livello di confidenza del-
la media (varianza ignota). Immettere quindi nella casella il livello di
confidenza che si desidera utilizzare;
- k -esimo più grande: selezionare questa opzione se si desidera includere
nella tabella di output una riga per il valore k -esimo più grande di cia-
scun intervallo di dati:
GRANDE(matrice;k)
dove matrice è una matrice o un intervallo di dati numerici di cui si desi-
dera determinare il k -esimo valore più grande e k è la posizione nella
matrice o nell'intervallo di celle dei dati da restituire (partendo dal più
grande). Immettere quindi nella casella il numero da utilizzare per k . Se
il numero assegnato è uguale a 1, questa riga conterrà il valore massimo
dell'insieme di dati;
- k -esimo più piccolo: selezionare questa opzione se si desidera includere
nella tabella di output una riga per il valore k -esimo più piccolo di cia-
scun intervallo di dati:
PICCOLO(matrice;k)
dove matrice è una matrice o un intervallo di dati numerici di cui si desi-
dera determinare il k -esimo valore più piccolo e k è la posizione nella
matrice o nell'intervallo di celle dei dati da restituire (partendo dal più
piccolo). Immettere quindi nella casella il numero da utilizzare per k . Se
133
il numero assegnato è uguale a 1, questa riga conterrà il valore minimo
dell'insieme di dati.
Esempio 6.1
La tab. 6.1 riporta il peso (in gr) di un campione di 100 tavolette di cioccolata:
Partendo dalla cella A1, utilizzando una sola colonna, introdurre i dati della
tab. 6.1, ottenendo il seguente risultato (fig. 6.3):
Fig. 6.3 – Inserimento nel foglio elettronico dei dati di tab. 6.1
134
Aprire il menu Strumenti, selezionare la voce Analisi dati, Statistica descrit-
tiva e premere il pulsante OK (fig. 6.4):
135
Fig. 6.6 – Statistica descrittiva per il peso (in gr) di 100 barrette di cioccolato
Esempio 6.2
Partendo dalla cella A1, utilizzando una sola colonna, introdurre i dati della
tab. 6.2, ottenendo il seguente risultato (fig. 6.7):
Fig. 6.7 – Inserimento nel foglio elettronico dei dati di tab. 6.2
136
Aprire il menu Strumenti, selezionare la voce Analisi dati, Statistica descrit-
tiva e premere il pulsante OK (fig. 6.8):
137
Fig. 6.10 – Statistica descrittiva per lo spessore di 50 lastre di metallo
Esempio 6.3
Tab. 6.3 – Quantità (in q.li) di semilavorati stoccati in un magazzino negli ultimi 9
anni
1995 1996 1997 1998 1999 2000 2001 2002 2003
Gen 22 20 19 19 19 20 19 20 20
Feb 25 22 13 16 7 25 27 22 15
Mar 25 19 22 21 26 17 20 19 27
Apr 24 19 15 19 19 11 16 16 25
Mag 21 16 22 15 24 18 18 22 17
Giu 22 22 20 14 22 23 25 19 19
Lug 28 31 20 32 26 25 26 25 28
Ago 23 22 22 23 23 24 24 22 24
Set 19 17 21 20 14 17 17 18 20
Ott 25 25 19 24 18 21 25 20 19
Nov 23 14 21 21 19 16 15 16 20
Dic 15 21 16 15 18 17 17 17 20
Partendo dalla cella A1, introdurre i dati della tab. 1.3, ottenendo il seguente
risultato (fig. 6.11):
138
Fig. 6.11 – Inserimento nel foglio elettronico dei dati di tab. 6.3
139
Fig. 6.13 – Opzioni della Statistica descrittiva
Fig. 6.14 – Statistica descrittiva per la quantità (in q.li) di semilavorati stoccati in
un magazzino negli ultimi 9 anni
140
7. Distribuzioni di probabilità
1. Generalità
141
∞
- ∑ p(x ) = 1 .
i =1
i
Ρ( X = x )
p2
p1
pi
x
x1 x2 xi
- f (x0 ) = 0 ;
+∞
- ∫ f (x ) dx = 1 .
−∞
142
f (x )
x
Fig. 7.2 – Rappresentazione grafica di una distribuzione continua
143
che, nel caso di una distribuzione discreta, assume la forma:
n
σ 2 = Var ( X ) = ∑ (xi − μ )2 ⋅ pi
i =1
mentre, invece, nel caso di distribuzione continua:
+∞
σ 2 = Var ( X ) = ∫ (x − μ ) ⋅ f (x ) dx
2
−∞
2. Distribuzione binomiale
144
⎛ n⎞
dove ⎜⎜ ⎟⎟ (coefficiente binomiale) rappresenta tutte le possibili sequenze di
⎝ x⎠
prove in cui si sono verificati x successi.
Il grafico rappresentativo della distribuzione binomiale presenta un anda-
mento diverso a seconda del valore assunto dai parametri n e p .
In particolare, per n costante, se:
145
Fig. 7.5 – Andamento della distribuzione binomiale: p = q , n costante
146
Fig. 7.7 – Andamento della distribuzione binomiale: n = 50 , p costante
147
- num_successi è il numero di successi in prove ( x );
- prove è il numero di prove indipendenti ( n );
- probabilità_s è la probabilità di successo per ciascuna prova ( p );
- cumulativo è un valore logico che determina la forma assunta dalla fun-
zione. Se il valore cumulativo è vero, la formula restituirà la funzione di-
stribuzione cumulativa, ovvero la probabilità che venga restituito un nu-
mero massimo di successi pari al valore di num_successi:
n
⎛n⎞
∑ ⎜⎜⎝ x ⎟⎟⎠ p
x =0
x
qn − x
Esempio 7.1
Fig. 7.9 – Inserimento nel foglio elettronico dei dati dell’esempio 7.1
148
Successivamente posizionarsi nella cella A5 e digitare: X , nella B5: Ρ( X ) ;
nelle celle A6, A7, A8, A9, A10, A11 rispettivamente: 0, 1, 2, 3, 4, 5 (fig.
7.10):
Fig. 7.10 – Predisposizione foglio elettronico per il calcolo della densità di proba-
bilità binomiale utilizzando i dati dell’esempio 1.1
Fig. 7.11 – Impostazione della formula per il calcolo della densità di probabilità
binomiale per i dati dell’esempio 7.1
A questo punto copiare la formula nelle celle B7:B11 ottenendo il seguente ri-
sultato (fig. 7.12):
149
Fig. 7.12 – Densità di probabilità binomiale per i dati dell’esempio 7.1
Cliccare tra i Tipi standard, il tipo Istogramma, tra le Scelte disponibili man-
tenere il valore di default e premere il pulsante Avanti (fig. 7.14):
150
Fig. 7.14 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
Selezionare la linguetta Serie e nella casella Etichette asse categoria (X) digi-
tare: A6:A11 per inserire le etichette identificative sull’asse delle ascisse (fig.
7.15):
151
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Densità di probabilità per il numero di macchine guaste (fig. 7.16):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 7.17):
0 ,4
0 ,3 5
0 ,3
0 ,2 5
0 ,2
0 ,1 5
0 ,1
0 ,0 5
0
0 1 2 3 4 5
152
Esempio 7.2
Fig. 7.19 – Inserimento nel foglio elettronico dei dati dell’esempio 7.2
153
Fig. 7.20 – Impostazione della formula per il calcolo della probabilità che non vi
sia un sovraccarico nella rete elettrica
Fig. 7.21 – Probabilità che non vi sia un sovraccarico nella rete elettrica
Esempio 7.3
La distribuzione binomiale viene spesso utilizzata nel campo industriale per de-
terminare l’accettazione o il rifiuto di un lotto di pezzo lavorati. In genere, per
contenere i costi, non si analizzano tutti i pezzi che formano il lotto, ma sola-
mente un campione e si decide se respingere tutti i pezzi che formano, il lotto
in base alla percentuale di pezzi difettosi del campione. In questo contesto p
rappresenta la probabilità che un pezzo risulti difettoso ed n la numerosità del
campione.
Determinare la distribuzione di probabilità del numero X di pezzi difettosi se
si sono provati 20 pezzi di un lotto dove normalmente quelli difettosi sono il
10%.
Rappresentare graficamente la distribuzione ottenuta. Determinare, inoltre:
a) il numero medio di pezzi difettosi;
b) la deviazione standard;
c) la probabilità di trovare un numero di pezzi difettosi minore o uguale a
μ + 3σ .
Fig. 7.22 – Inserimento nel foglio elettronico dei dati dell’esempio 7.3
Fig. 7.23 – Predisposizione foglio elettronico per il calcolo della densità di proba-
bilità per i dati dell’esempio 7.3
155
Fig. 7.24 – Impostazione della formula per il calcolo della densità di probabilità
binomiale per i dati dell’esempio 7.3
A questo punto copiare la formula nelle celle B7:B26 ottenendo il seguente ri-
sultato (fig. 7.25):
156
Fig. 7.26 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
Cliccare tra i Tipi standard, il tipo Istogramma, tra le Scelte disponibili man-
tenere il valore di default e premere il pulsante Avanti (fig. 7.27):
Fig. 7.27 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del grafi-
co
157
Selezionare la linguetta Serie e nella casella Etichette asse categoria (X) digi-
tare: A6:A26 per inserire le etichette identificative sull’asse delle ascisse (fig.
7.28):
Procedere ancora premendo il pulsante Avanti, nel Titolo del grafico digitare:
Densità di probabilità per il numero di pezzi difettosi (fig. 7.29):
Premendo ancora una volta sul pulsante Avanti e selezionando la voce Crea
nuovo foglio (fig. 7.30):
158
Fig. 7.30 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione grafico
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Posizionarsi, adesso, nella cella D2 e digitare media, nella cella D3: dev.st, E2:
=$B$1*$B$2 ed infine in E3: =RADQ($B$1*$B$2*$B$3), ottenendo (fig.
7.32):
159
Si può facilmente notare che per il calcolo della deviazione standard si è utiliz-
zata la funzione RADQ(num) che restituisce la radice quadrata del numero
positivo inserito tra le parentesi.
La probabilità di ottenere un numero di pezzi difettosi minore o uguale a
μ + 3 σ = 2 + 3 ⋅ 1,34 ≈ 6 , risulta:
x 20 − x
6
⎛ 20 ⎞ ⎛ 1 ⎞ ⎛ 9 ⎞
∑
Ρ( X ≤ 6) = ⎜⎜ ⎟⎟ ⎜ ⎟ ⎜ ⎟
x = 0 ⎝ x ⎠ ⎝ 10 ⎠ ⎝ 10 ⎠
Ci si posizioni nella cella D5 e si digiti: Ρ( X ≤ 6) , nella cella E5:
=DISTRIB.BINOM(6;$B$1;$B$2;vero) (fig. 7.33):
Fig. 7.33 – Calcolo della probabilità di ottenere un numero di pezzi difettosi mino-
re o uguale a 6
3. Distribuzione ipergeometrica
160
- successi_camp è il numero di successi nel campione ( x );
- num_campione è la dimensione del campione ( n );
- successi_pop è il numero di successi nella popolazione ( k );
- num_popolazione è la dimensione della popolazione ( N ).
Esempio 7.4
Fig. 7.34 – Inserimento nel foglio elettronico dei dati dell’esempio 7.4
161
Fig. 7.35 – Calcolo della probabilità di accettazione del lotto
4. Distribuzione di Poisson
- valore medio μ = E ( X ) = λ ;
162
- varianza σ 2 = Var ( X ) = λ ;
164
Esempio 7.5
Fig. 7.39 – Inserimento nel foglio elettronico dei dati dell’esempio 7.5
Quindi, vi è una probabilità di circa il 27% che presa a caso una scatola di 50
lampadine ve ne siano due difettose.
Esempio 7.6
Una ditta deve provvedere ad assumere operai specializzati per il servizio ma-
nutenzione tenendo conto del numero di interventi che devono essere effettuati.
Se in un periodo di 45 giorni lavorativi (di 8 ore giornaliere) si sono contati 180
interventi, calcolare ogni quante ore ci si aspetta di dover effettuare, in un pe-
riodo di un’ora:
a) almeno un intervento;
b) almeno 3 interventi.
Fig. 7.41 – Inserimento nel foglio elettronico dei dati dell’esempio 7.6
5. Distribuzione normale
166
Questa distribuzione fu individuata per la prima volta da De Moivre nel
1733 come mezzo per da una valutazione approssimata della densità di proba-
bilità binomiale.
In seguito fu riscoperta da Gauss nel 1809 nell’ambito della teoria degli er-
rori e per tale motivo è spesso indicata come distribuzione di Gauss o distribu-
zione degli errori accidentali.
Il termine distribuzione normale deriva dalla convinzione, peraltro non del
tutto corretta, che i fenomeni sperimentali fisici e biologici abbiano una distri-
buzione di frequenza che si adatta bene a questa distribuzione teorica.
Il termine distribuzione degli errori accidentali deriva dal fatto che risulta
plausibile l’ipotesi che gli errori accidentali o casuali, commessi effettuando
misure ripetute, si distribuiscono secondo tale modello.
In ogni caso, questa distribuzione, è particolarmente importante sia perché
risulta utile in numerose applicazioni pratiche, sia perché può sovente essere
utilizzata come distribuzione limite in quanto è una distribuzione alla quale
tendono, sotto condizioni abbastanza generali, altre distribuzioni.
La funzione di probabilità della distribuzione normale risulta essere:
2
1 ⎛ x−μ ⎞
1 − ⎜ ⎟
f (x ) = e 2⎝ σ ⎠
σ 2π
mentre il grafico (fig. 7.43):
1
σ 2π
1
σ 2π e
μ −σ μ +σ
Fig. 7.43 – Funzione di probabilità della distribuzione normale
167
- la curva è simmetrica rispetto alla retta x = μ ;
⎛ 1 ⎞
- ha un massimo nel punto ⎜⎜ μ , ⎟;
⎟
⎝ σ 2π ⎠
- quanto più x si allontana da μ tanto più la curva decresce e tende asinto-
ticamente a zero;
⎛ 1 ⎞ ⎛ 1 ⎞
- ha due flessi nei punti ⎜ μ − σ , ⎟ e ⎜μ +σ, ⎟.
⎜ σ 2 π e ⎟ ⎜ σ 2 π e ⎟
⎝ ⎠ ⎝ ⎠
μ1 < μ2 < μ3
μ2 μ3
Fig. 7.44 – Modificazioni della curva normale al variare di μ, σ costante
σ1
σ2
σ3
μ
Fig. 7.45 – Modificazioni della curva normale al variare di σ, μ costante
168
La funzione predisposta in Excel per il calcolo della funzione di probabilità
normale è:
DISTRIB.NORM(x;media;dev_standard;cumulativo)
dove:
Ρ( X ≤ x )
x
Fig. 7.46 – Funzione di distribuzione cumulativa normale
σ 2π
graficamente (fig. 7.47):
169
Ρ( X = x0 )
x0
Fig. 7.47 – Funzione massa di probabilità normale
Ρ ( X ≤ x0 ) = α
x0
Fig. 7.48 – Inversa della distribuzione normale cumulativa
170
In Excel, la funzione ha sintassi:
INV.NORM(probabilità;media;dev_standard)
dove:
Esempio 7.7
Una macchina produce tondini metallici il cui diametro è una variabile nor-
malmente distribuita con media 6 cm e deviazione standard 0,2 cm. Si vuole
determinare la probabilità che il diametro di un tondino differisca dal valore
medio (in più o in meno) almeno 0,5 cm.
5,5 6 6,5
Fig. 7.49 – Ρ( X ≤ 5,5 ; X > 6,5)
171
Utilizzando le proprietà della funzione di Excel, ciò equivale a calcolare:
Ρ( X ≤ 5,5 ; X > 6,5) = Ρ( X ≤ 5,5) + Ρ( X > 6,5) = Ρ( X ≤ 5,5) + [1 − Ρ( X ≤ 6,5)]
Posizionandosi nella cella A1 digitare: μ = , A2: σ = , B1: 6, B2: 0,2 (fig.
7.50):
Fig. 7.50 – Inserimento nel foglio elettronico dei dati dell’esempio 7.7
Quindi, vi è circa 1,24% di probabilità che un tondino differisca dal valore me-
dio (in più o in meno) almeno di 0,5 cm.
Esempio 7.8
Una macchina produce un tipo di catene per bicicletta con lunghezza normal-
mente distribuita, con media pari a 150 cm e deviazione standard pari a 3 cm.
Per un certo tipo di biciclette si richiede che le catene abbiano lunghezza com-
presa tra 154 ± 2 cm, in caso contrario la catena, prima di poter essere utilizza-
ta, deve essere modificata.
Qual è la percentuale di catene prodotte dalla macchina che vengono utilizzate
senza essere modificate?
Se la macchina viene regolata in modo che la lunghezza delle catene abbia me-
dia pari a 154 cm (la deviazione standard rimane costante), qual è la percentua-
le di catene utilizzate senza modifiche? È conveniente la nuova regolazione?
172
Dal problema si conosce: μ = 150 , σ = 3 .
Si deve determinare Ρ(152 ≤ X ≤ 156) , cioè:
Ρ(152 ≤ X ≤ 156) = Ρ( X ≤ 156 ) − Ρ( X ≤ 152 )
Posizionandosi nella cella A1 digitare: μ = , A2: σ = , B1: 150, B2: 3 (fig.
7.52):
Fig. 7.52 – Inserimento nel foglio elettronico dei dati dell’esempio 7.8
173
Fig. 7.55 – Calcolo della probabilità Ρ(152 ≤ X ≤ 156) con la nuova regolazione
Poiché il calcolo della probabilità risulta del 49,50%, la nuova regolazione ri-
sulta senz’altro conveniente.
Esempio 7.9
174
LIT p0 LST p0
z LIT zLST
LIT LST
Fig. 7.56 – Inversa della distribuzione normale cumulativa per i dati dell’esempio
7.9
Fig. 7.57 – Inserimento nel foglio elettronico dei dati dell’esempio 7.9
Nelle celle A5, B5, C5, D5, F5 e G5 rispettivamente: LIT p0 , z LIT , LST p0 ,
z LST , μ e σ (fig. 7.58):
Fig. 7.58 – Predisposizione del foglio elettronico per il la stima dei parametri di
processo
175
Fig. 7.59 – Predisposizione del foglio elettronico per il calcolo degli scarti stan-
dardizzati
Infine, per il calcolo delle stime dei parametri di processo, posizionarsi nella
cella F6 e digitare: =(($E$1*D6)-($E$3*B6))/(D6-B6), mentre nella cella G6:
=($E$3-$E$1)/(D6-B6), quindi copiare le formule fino alle celle F17 e G17
(fig. 7.60):
Fig. 7.60 – Predisposizione del foglio elettronico per il calcolo delle stime dei pa-
rametri di processo per i dati dell’esercizio 7.9
176
Come si può facilmente osservare, al variare dei parametri LIT p0 e LST p0 , la
stima della media ( μ̂ ) rimane costante, mentre invece la stima della deviazione
standard ( σ̂ ) aumenta all’aumentare delle percentuali di pezzi difettosi ammes-
si a sinistra e a destra delle tolleranze.
6. Altre distribuzioni
6.1. Distribuzione χ 2
- l’asimmetria;
- la dipendenza da un parametro intero ν ;
- la non negatività della funzione in quanto somma di quadrati.
177
ν =2
ν =3
ν =6
178
Se probabilità è minore di 0 o maggiore di 1, la funzione restituirà il valo-
re di errore #NUM!.
Se gradi_libertà non è un numero intero, la parte decimale verrà troncata.
Se gradi_libertà è minore di 1 o maggiore o uguale a 1010 , la funzione re-
stituirà il valore di errore #NUM!.
INV.CHI utilizza una tecnica iterativa per il calcolo della funzione. Dato
un valore di probabilità, la funzione applica il metodo delle iterazioni fino a
quando la precisione del risultato non rientra nel valore ± 3 ⋅ 10−7 . Se il risultato
di INV.CHI non converge dopo 100 iterazioni, la funzione restituirà il valore
di errore #N/D.
179
ν = 12
ν =5
ν =1
180
Se un qualsiasi argomento non è numerico, la funzione restituirà il valore di
errore #VALORE!.
Se probabilità è minore di 0 o maggiore di 1, INV.T restituirà il valore di
errore #NUM!.
Se gradi_libertà non è un numero intero, la parte decimale verrà troncata.
Se gradi_libertà è minore di 1, la funzione restituirà il valore di errore
#NUM!.
La funzione viene calcolata come INV.T = Ρ( X > t ) , dove X è una varia-
bile che segue la distribuzione t .
È possibile restituire un valore t a una coda sostituendo probabilità con
2*probabilità.
INV.T utilizza una tecnica iterativa per il calcolo della funzione. Dato un
valore di probabilità, la funzione applica il metodo delle iterazioni fino a quan-
do la precisione del risultato non rientra nel valore ± 3 ⋅ 10−7 . Se il risultato di
INV.T non converge dopo 100 iterazioni, la funzione restituirà il valore di er-
rore #N/D.
181
Se un qualsiasi argomento non è un valore numerico, la funzione restituirà
il valore di errore #VALORE!.
Se x è un valore negativo, DISTRIB.F restituirà il valore di errore
#NUM!.
Se gradi_libertà1/gradi_libertà2 non è un numero intero, la parte decima-
le verrà troncata.
Se gradi_libertà1/gradi_libertà2 è minore di 1 o maggiore o uguale a
10
10 , la funzione restituirà il valore di errore #NUM!.
La funzione è calcolata come DISTRIB.F = Ρ( X > F) , dove F è una varia-
bile associata a una distribuzione F .
Infine, la funzione:
INV.F(probabilità;gradi_libertà1;gradi_libertà2)
restituisce l'inversa della distribuzione di probabilità F .
Se p = DISTRIB.F(x;...), si avrà INV.F(p;...) = x.
Se un qualsiasi argomento non è un valore numerico, la funzione restituirà
il valore di errore #VALORE!.
Se probabilità è minore di 0 o maggiore di 1, INV.F restituirà il valore di
errore #NUM!.
Se gradi_libertà1/gradi_libertà2 non è un numero intero, la parte decima-
le verrà troncata.
Se gradi_libertà1/gradi_libertà2 è minore di 1 o maggiore o uguale a
10
10 , la funzione restituirà il valore di errore #NUM!.
La funzione INV.F può essere utilizzata per restituire i valori critici della
distribuzione F ; ciò risulta particolarmente importante nel calcoli dell’analisi
della varianza.
INV.F utilizza una tecnica iterativa per il calcolo della funzione. Dato un
valore di probabilità, la funzione applica il metodo delle iterazioni fino a quan-
do la precisione del risultato non rientra nel valore ± 3 ⋅ 10−7 . Se il risultato di
INV.F non converge dopo 100 iterazioni, la funzione restituirà il valore di er-
rore #N/D.
182
8. Inferenza statistica parametrica
1. Generalità
183
rametri che caratterizzano la distribuzione del carattere nella popolazione o a
vagliare delle congetture a priori sul valore di tali parametri.
I problemi di tipo c) si dicono problemi inferenziali non parametrici in
quanto attengono ad aspetti della distribuzione del carattere nella popolazione
non suscettibili di essere espressi dai parametri che compaiono nella forma fun-
zionale di tale distribuzione.
Della stima dei parametri si suole distinguere:
184
n
(xi − x )2
sc2 = ∑n −1
i =1
Sostituendo nella formula dell’errore standard il valore della varianza
campionaria corretta al posto di σ 2 , si ottiene:
^ sc
SE x =
n −1
Per rendere minore l’errore medio di campionamento e avere quindi una
stima più precisa, occorre aumentare il numero di elementi del campione ( n );
poiché sc è inversamente proporzionale alla n , per dimezzare l’errore stan-
dard occorre quadruplicare la dimensione del campione.
Esempio 8.1
Fig. 8.1 – Inserimento nel foglio elettronico dei dati dell’esempio 8.1
185
Si nota immediatamente che con un campione di 100 lampadine il possibile er-
rore medio di campionamento è meno di un terzo di quello chi si ha conside-
rando un campione di 10 elementi.
186
μ1 − μ 2
si utilizzano le medie campionarie:
x1 − x2
associato ad un errore standard dato da:
σ 12 σ 22
SEμ1 − μ 2 = +
n1 n2
Nel caso in cui σ 12 e σ 22 siano ignoti, indicando con:
n1
(x1i − x1 )2
s12c = ∑
i =1 n1 − 1
n2
(x2i − x2 )2
s22c = ∑
n2 − 1
i =1
le varianze campionarie corrette del primo e del secondo campione rispet-
tivamente, la stima dell’errore standard risulta essere:
^ s12c s2
SE x1 − x2 = + 2c
n1 − 1 n2 − 1
Esempio 8.2
Fig. 8.3 – Inserimento nel foglio elettronico dei dati dell’esempio 8.2
187
Successivamente posizionarsi nella cella A6 e digitare: errore standard della
differenza tra le medie e nella cella F6: =RADQ(($B$4)^2/($B$2-
1)+($E$4^2)/($E$2-1)), ottenendo il seguente risultato (fig. 8.4):
Pertanto, si può affermare che si stima la differenza tra i diametri dei due lotti
di 2 mm, con un errore standard di 0,20 mm.
Esempio 8.3
Nella produzione di 800 oggetti con una macchina (A) si sono riscontrati 60
pezzi difettosi; con un’altra macchina (B) i pezzi difettosi, fra i 1000 prodotti,
sono stati 70. Stimare l’errore standard per la differenza fra le frazioni di pezzi
difettosi delle due macchine.
Fig. 8.5 – Inserimento nel foglio elettronico dei dati dell’esempio 8.3
188
3. Intervalli di confidenza
3.1. Generalità
189
3.2.1. Popolazione normalmente distribuita con varianza nota
1−α
α α
2 2
− zc 0 zc
Fig. 8.7 – Intervallo di confidenza per la media di una popolazione normale stan-
dardizzata
190
⎛ ⎞
⎜ ⎟
x − μ
Ρ ⎜ − zc ≤ ≤ zc ⎟ = 1 − α
⎜ σ ⎟
⎜ ⎟
⎝ n ⎠
e risolvendo la doppia disuguaglianza in termini di μ :
⎛ σ σ ⎞
Ρ⎜⎜ x − zc ≤ μ ≤ x + zc ⎟⎟ = 1 − α
⎝ n n⎠
σ
la quale esprime che l’intervallo di confidenza x ± z c , con probabilità
n
1 − α potrà comprendere il vero ed ignoto valore medio della popolazione μ
(fig. 8.8).
1−α
α α
2 2
σ μ σ
μ − zc μ + zc
n n
Fig. 8.8 – Intervallo di confidenza per la media di una popolazione normale
191
In Excel, la funzione che permette di calcolare l’intervallo di confidenza
per una popolazione normalmente distribuita con varianza nota è data da:
CONFIDENZA(alfa;dev_standard;dimens)
dove:
Esempio 8.4
192
Nella cella A6 digitare: intervallo di confidenza per la media, A7: estremo in-
feriore, C7: estremo superiore, A8: =$B$2-confidenza($B$4;$B$3;$B$1), C8:
=$B$2+confidenza($B$4;$B$3;$B$1) (fig. 8.10):
Fig. 8.10 – Intervallo di confidenza per la media del peso delle pastiglie di un far-
maco
Pertanto, con una probabilità del 95%, la vera ed ignota media del peso delle
pastiglie del farmaco sarà compresa tra 3,6 e 3,8 grammi.
Esempio 8.5
Una azienda produce una bibita frizzante. La caratteristica di qualità che risulta
importante per i processo produttivo è il contenuto di anidride carbonica. Sa-
pendo che la deviazione standard ideale è di 0,3 gr/litro, si vuole calcolare
l’intervallo di confidenza per il contenuto medio di anidride carbonica al livello
del 97% sapendo che dal processo produttivo si sono ottenuti i seguenti risultati
(tab. 8.1):
Partendo dalla cella A1, introdurre i dati della tab. 8.1, ottenendo il seguente
risultato (fig. 8.11):
193
Posizionarsi nella cella A7 e digitare: n = , nella cella A8: media=, A9: dev.st=,
A10: alfa=, B7: =conta.numeri($A$1:$J$5), B8: =media($A$1:$J$5), B9: 0,3,
B10: =1-0,97 (fig. 8.12):
Nella cella A12 digitare: intervallo di confidenza per la media, A13: estremo
inferiore, C13: estremo superiore, A14: =$B$8-confidenza
($B$10;$B$9;$B$7), C14: =$B$8+confidenza($B$10;$B$9;$B$7) (fig. 8.13):
Pertanto, con una probabilità del 97%, il vero ed ignoto contenuto medio di a-
nidride carbonica presente nella bibita frizzante è compreso tra 5,85 e 6,04
gr/litro.
corretta.
Si può dimostrate che tale variabile si distribuisce come una t di Student
con n − 1 gradi di libertà.
194
Procedendo in maniera analoga a quanto visto precedentemente, si può a-
gevolmente dimostrare che:
⎛ s s ⎞
Ρ⎜⎜ x − t c c ≤ μ ≤ x + t c c ⎟⎟ = 1 − α
⎝ n n⎠
esprime l’intervallo di confidenza per la media di una popolazione normale
con varianza ignota.
In Excel è possibile calcolare questo intervallo utilizzando una opzione di-
sponibile all’interno della procedura Statistica descrittiva del menu Analisi
dati.
Per attivare la procedura aprire il menu Strumenti e selezionare la voce
Analisi dati (fig. 8.14):
La distribuzione del tempo di vita di un certo modello di batterie per uso foto-
grafico è approssimativamente normale; un campione casuale di 50 batterie e-
stratte da un lotto di 2000, sottoposte ad una prova di usura accelerata, hanno
fornito i seguenti risultati (tab. 8.2):
Partendo dalla cella A1, introdurre i dati della tab. 8.2, ottenendo il seguente
risultato (fig. 8.16):
196
Fig. 8.17 – Impostazioni per il calcolo dell’intervallo di confidenza per i dati
dell’esempio 8.6
Infine, nella cella C13 digitare: intervallo di confidenza per la media, C15: e-
stremo inferiore, C17: estremo superiore, D15: =$D$8-(($D$3
*$D$10)/RADQ($D$6)), D17: =$D$8+(($D$3*$D$10)/RADQ($D$6)) (fig.
8.20):
197
Fig. 8.20 – Intervallo di confidenza per la durata media di batterie per uso fotogra-
fico
Quindi, con una probabilità del 95%, la durata media delle batterie per uso fo-
tografico sarà compresa fra le 19,19 e le 20,17 ore.
Esempio 8.7
Si vuole stimare la precisione di una macchina che produce mine per matite;
misurando 10 mine si sono ottenuti i seguenti valori (tab. 8.3):
Partendo dalla cella A1, introdurre i dati della tab. 8.3, ottenendo il seguente
risultato (fig. 8.21):
198
Fig. 8.22 – Impostazioni per il calcolo dell’intervallo di confidenza per i dati
dell’esempio 8.7
Infine, nella cella C13 digitare: intervallo di confidenza per la media, C15: e-
stremo inferiore, C17: estremo superiore, D15: =$D$8-(($D$3*
$D$10)/RADQ($D$6)), D17: =$D$8+(($D$3*$D$10)/RADQ($D$6)) (fig.
8.25):
199
Fig. 8.25 – Intervallo di confidenza per la lunghezza delle mine per matite
Quindi, con una probabilità del 95%, la macchina produrrà mine di lunghezza
media compresa tra 12,90 e 12,97 cm.
200
le varianze campionarie corrette del primo e del secondo campione rispet-
tivamente, la stima della varianza delle due popolazioni si ottiene applicando la
formula:
(n − 1) s12c + (n2 − 1) s22c
S2 = 1
n1 + n2 − 2
Quindi, la probabilità:
⎧⎪ 1 1 1 1 ⎫⎪
Ρ ⎨(x1 − x2 ) − tc S + ≤ (μ1 − μ 2 ) ≤ (x1 − x2 ) + tc S + ⎬ = 1−α
⎪⎩ n1 n2 n1 n2 ⎪⎭
sta ad indicare che nel 100 ⋅ (1 − α ) % dell’universo dei campioni, la diffe-
renza tra le medie delle due popolazioni considerando le varianze ignote è
compresa fra gli estremi (intervallo di confidenza):
⎪⎧ 1 1 1 1 ⎫⎪
⎨(x1 − x2 ) − tc S + ; (x1 − x2 ) + tc S + ⎬
⎪⎩ n1 n2 n1 n2 ⎪⎭
con t c = t α .
; n1 + n2 − 2
2
Esempio 8.8
La tab. 8.4 contiene i risultati del funzionamento efficiente (in giorni) di 100
pneumatici per auto prodotti da due fabbriche A e B. Si vuole costruire un in-
tervallo di confidenza al 99% per la differenza delle medie, supposto che la va-
rianza sia la stessa per le due popolazioni e sia pari a 29.
Tab. 8.4 – Durata (in ore) di 100 pneumatici per auto prodotte da due fabbriche
fabbrica A
167 142 181 208 206 220 118 169 203 147
157 131 127 150 155 120 160 164 179 165
166 165 210 173 170 162 226 198 237 158
218 133 189 198 225 173 161 193 165 195
137 153 135 166 174 176 167 232 130 156
108 213 142 158 195 187 198 190 139 146
193 183 151 169 178 190 179 151 224 188
177 197 197 158 151 204 144 134 193 192
232 213 209 178 175 187 174 148 129 197
187 191 181 148 207 167 153 154 164 163
201
fabbrica B
182 156 161 149 161 107 162 130 169 178
199 149 146 169 159 160 206 166 161 213
149 198 165 163 207 174 176 159 183 163
146 136 170 139 215 162 124 156 190 155
148 129 173 161 180 148 156 172 156 171
101 163 171 220 125 124 105 195 227 155
139 179 182 143 186 182 160 125 191 185
156 147 187 174 179 219 172 136 177 133
180 161 173 174 168 158 130 220 207 192
127 136 179 167 165 169 116 158 141 139
Partendo dalla cella A1, introdurre i dati della tab. 8.4, ottenendo il seguente
risultato (fig. 8.26):
202
Fig. 8.27 – Calcolo di x A , xB , zc per i dati dell’esempio 8.8
Infine, nella cella D8: intervallo di confidenza per la differenza tra medie, E10:
limite inferiore, G10: limite superiore, E11: =($E$3-$G$3)-$G$7*RADQ
(($E$5/$E$1)+($G$5/$G$1)), G11: =($E$3-$G$3)+$G$7*RADQ(($E$5
/$E$1)+($G$5/$G$1)) (fig. 8.28):
Fig. 8.28 – Intervallo di confidenza per la differenza tra durate medie di pneumatici
per auto prodotti da due fabbriche
Esempio 8.9
La tab. 8.5 contiene i risultati sul funzionamento (in ore) di 10 componenti elet-
tronici non sottoposti a stress (A) e di 15 sottoposti ad una prova accelerata (B);
determinare un intervallo di confidenza per la differenza di durata tra i compo-
nenti sottoposti ai due diversi trattamenti, utilizzando un livello del 97%.
Partendo dalla cella A1, introdurre i dati della tab. 8.5, ottenendo il seguente
risultato (fig. 8.29):
203
Fig. 8.29 – Inserimento dati dell’esempio 8.9
Infine, nella cella D12: intervallo di confidenza per la differenza tra medie,
E13: limite inferiore, G13: limite superiore, E14: =($E$3-$G$3)-$G$10*
$F$8*RADQ((1/$E$1)+(1/$G$1)), G14: =($E$3-$G$3)+$G$10*$F$8*RADQ
((1/$E$1)+(1/$G$1)) (fig. 8.31):
204
Fig. 8.31 – Intervallo di confidenza per la differenza tra durate medie di compo-
nenti elettronici sottoposti a due diversi trattamenti
Per fornire una stima di una varianza di una popolazione con distribuzione
normale, nel caso in cui sia nota la media del carattere nella popolazione, si
considera la statistica:
n ⋅ s2
σ2
che ha distribuzione χ 2 con n gradi di libertà.
Fissato un livello di confidenza 1 − α , si può scrivere che:
⎧⎪ n ⋅ s2 ⎫⎪
Ρ⎨χ 2 α ≤ 2 ≤ χ 2 α ⎬ = 1 − α
⎪⎩ n ; 2 σ n ; 1− ⎪
2⎭
graficamente (fig. 8.32):
1−α
α α
2 2
χ2 α χ2 α
n; n ; 1−
2 2
Fig. 8.32 – Intervallo di confidenza per la varianza di una popolazione normale
205
⎧ ⎫
⎪ n ⋅ s2 n ⋅ s2 ⎪
Ρ⎨ 2 ≤ σ ≤ 2 ⎬ =1−α
2
χ
⎪ n ; 1− α χ α⎪
n;
⎩ 2 2 ⎭
la quale esprime che l’intervallo di confidenza:
⎧ n n
⎫
⎪ ∑
⎪ i =1
( x i − μ )2
∑ (xi − μ )2 ⎪
⎪
⎨ ; i =1 2 ⎬
⎪ χ n ; 1− α χ α
2
n;
⎪
⎪⎩ 2 2 ⎪⎭
con probabilità 1 − α , potrebbe essere uno di quelli che comprendono la ve-
ra ed ignota varianza della popolazione σ 2 .
Se, invece, la media del carattere nella popolazione μ non è nota la stati-
stica da considerare è:
(n − 1) ⋅ sc2
σ2
che ha distribuzione χ 2 con n − 1 gradi di libertà.
In questo caso si perviene alla:
⎧ ⎫
⎪ (n − 1) ⋅ sc2 (n − 1) ⋅ sc2 ⎪
Ρ⎨ 2 ≤σ ≤2
⎬ =1−α
⎪ χ n −1 ; 1− α χ2 α ⎪
n −1 ;
⎩ 2 2 ⎭
la quale esprime l’intervallo di confidenza:
⎧ n n
⎫
∑
⎪ (xi − x )
⎪ i =1
2
∑ (xi − x )2 ⎪
⎪
⎨ 2 ; i =1 2 ⎬
⎪ χ n −1; 1− α χ α ⎪
n −1 ;
⎪⎩ 2 2 ⎪⎭
Esempio 8.10
206
Tab. 8.6 – Peso (in grammi) di 50 sigarette
5,27 4,55 5,38 5,47 5,30 5,04 4,35 5,20 4,50 5,21
4,37 5,53 5,21 5,02 4,70 5,12 5,16 4,81 4,38 5,00
4,83 4,79 5,31 5,20 4,40 4,88 4,83 4,89 4,62 5,00
4,93 5,28 4,80 4,85 5,17 4,96 5,14 4,75 4,36 5,22
4,96 5,10 5,24 5,05 5,54 5,04 4,52 4,97 5,44 5,20
Partendo dalla cella A1, si introducano i dati della tab. 8.6, ottenendo il seguen-
te risultato (fig. 8.33):
207
Fig. 8.34 – Predisposizione foglio dati per il calcolo dell’intervallo di confidenza
per la varianza
n
Per il calcolo della devianza ∑ (x − μ )
i =1
i
2
posizionarsi nella cella B1 e digitare
(xi – media), nella cella C1: (xi – media)2, B2: =A2-$G$3, C2: =B2^2, infine
copiare tali formule nelle celle B3:B51 e C3:C51 rispettivamente, ottenendo
(fig. 8.36):
208
Sistemarsi nella cella G5 ed inserire =SOMMA($C$2:$C$51) ottenendo così il
valore della devianza cercato (fig. 8.37):
Infine, collocarsi nella cella G13 e digitare intervallo di confidenza per la va-
rianza, F14: limite inferiore, H14: limite superiore, F15: =$G$5/$G$11, H15:
=$G$5/$G$9, G17: intervallo di confidenza per la deviazione standard, F18:
limite inferiore, H18: limite superiore, F19: =RADQ($F$15), H19:
=RADQ($H$15) (fig. 8.39):
Fig. 8.39 – Intervallo di confidenza per la varianza dei pesi di tutte le sigarette
prodotte da una determinata macchina
Esempio 8.11
209
Tab. 8.7 – Quantità di zucchero contenuta in un campione di 20 tazze di caffè
11,97 11,89 12,02 12,11 12,10 12,15 11,81 11,98 12,10 11,91
11,94 11,85 11,84 11,92 11,93 11,82 11,95 11,96 12,01 11,97
Partendo dalla cella A1, si introducano i dati della tab. 8.7, ottenendo (fig.
8.40):
210
Fig. 8.42 – Calcolo dei valori ne x
n
Per il calcolo della devianza ∑ (x − μ )
i =1
i
2
posizionarsi nella cella B1 e digitare
(xi – media), nella cella C1: (xi – media)2, B2: =A2-$G$3, C2: =B2^2, infine
copiare tali formule nelle celle B3:B51 e C3:C51 rispettivamente, ottenendo
(fig. 8.43):
211
Fig. 8.45 – Calcolo dei valori critici χ α2 / 2 ; n −1 e χ12−α / 2 ; n −1
Infine, collocarsi nella cella G13 e digitare intervallo di confidenza per la va-
rianza, F14: limite inferiore, H14: limite superiore, F15: =$G$5/$G$11, H15:
=$G$5/$G$9, G17: intervallo di confidenza per la deviazione standard, F18:
limite inferiore, H18: limite superiore, F19: =RADQ($F$15), H19:
=RADQ($H$15) (fig. 8.46):
Fig. 8.46 – Intervallo di confidenza per la varianza dei pesi di tutte le sigarette
prodotte da una determinata macchina
Quindi, con una probabilità del 97%, il distributore di caffè erogherà una quan-
tità di zucchero con una deviazione standard compresa tra 0,07 e 0,15 grammi.
212
deve essere verificata la disuguaglianza:
s
zc c ≤ ε
n
dalla quale, risolvendo rispetto ad n , si ottiene:
2
⎛ s ⎞
n ≥ ⎜ zc c ⎟
⎝ ε ⎠
Tale formula viene generalmente utilizzata quando la numerosità della po-
polazione ( N ) è molto elevata (infinita); in campo aziendale/industriale, inve-
ce, la numerosità del campione deve essere determinata tenendo conto anche
della dimensione della popolazione, in questo caso, considerando la relazione:
s n
zc c 1 −
n N
e risolvendo rispetto ad n , si ottiene:
2
⎛ sc ⎞
⎜ zc ⎟
ε ⎠
n≥ ⎝ 2
1⎛ s ⎞
1 + ⎜ zc c ⎟
N⎝ ε ⎠
dove: zc = zα / 2 .
Esempio 8.12
213
Fig. 8.47 – Predisposizione del foglio per il calcolo della numerosità del campione
Fig. 8.48 – Calcolo della numerosità del campione per i dati dell’esempio 8.12
Esempio 8.13
Fig. 8.49 – Predisposizione del foglio per il calcolo della numerosità del campione
214
Nella cella E2: =ASS(INV.NORM.ST((1-$B$2)/2)) e nella cella B5:
=($E$2*($A$2/$D$2))^2/1+(1/$C$2)*($E$2*($A$2/$D$2))^2 (fig. 8.50):
Fig. 8.50 – Calcolo della numerosità del campione per i dati dell’esempio 8.13
4. Verifiche di ipotesi
4.1. Generalità
215
Tab. 8.8 – Specificazioni di diverse tipologie di ipotesi nulla H 0 e alternativa H1
H0 θ = θ0 θ = θ0 θ ≥ θ0 θ ≤ θ0
H1 θ = θ1 θ ≠ θ0 θ < θ0 θ > θ0
Nel dettaglio, la problematica dei test implica una suddivisione dello spazio
campionario in due regioni esclusive:
- una regione di accettazione che indica l’insieme dei valori campionari che
implicano l’accettazione dell’ipotesi nulla, ossia è tale che se il test per
quell’osservazione campionaria ricade in essa si accetta l’ipotesi nulla;
- una regione critica (o di rifiuto) che indica l’insieme dei valori campiona-
ri che implicano il rifiuto dell’ipotesi nulla, ossia è tale che se il test sud-
detto ricade in essa si rigetta l’ipotesi nulla.
216
Essendo fondata su un risultato campionario, la regola di decisione deve
presupporre la possibilità di commettere degli errori ed, essendo H 0 ed H1
due alternative che si escludono tra loro logicamente, si distinguono due tipo-
logie di errori:
Regione critica
− zc
Fig. 8.51 – Regione critica nel caso di ipotesi alternativa del tipo: H1: μ < μ0
218
Pertanto, si accetterà l’ipotesi nulla se:
x − μ0
Z= < zc
σ
n
graficamente (fig. 8.52):
Regione di accettazione
Regione critica
zc
Fig. 8.52 – Regione critica nel caso di ipotesi alternativa del tipo: H1: μ > μ0
219
Regione di accettazione
− zc zc
Fig. 8.53 – Regione critica nel caso di ipotesi alternativa del tipo: H1: μ ≠ μ0
Esempio 8.14
220
Partendo dalla cella B5 inserire i dati della tab. 8.9 ottenendo il seguente risul-
tato (fig. 8.55):
221
Fig. 8.56 – Predisposizione formule per l’esempio 8.14
Pertanto, dai dati osservati (tab. 8.9), le variazioni del contenuto nelle lattine
non sono così significative per affermare che il contenuto in media del campio-
ne non sia minore di quanto dichiarato in etichetta.
Esempio 8.15
222
Fig. 8.57 – Impostazione del sistema di ipotesi per l’esempio 8.15
Partendo dalla cella B5 inserire i dati della tab. 8.10 ottenendo il seguente risul-
tato (fig. 8.58):
223
Fig. 8.59 – Predisposizione formule per l’esempio 8.15
Esempio 8.16
Un’azienda produce anelli per i pistoni delle automobili. È noto che il diametro
di tali anelli segue approssimativamente una distribuzione normale con devia-
zione standard σ = 0,001 mm. La tab. 8.11 riporta la dimensione del diametro
di un campione di 20 anelli; si vuole testare l’ipotesi che la media del diametro
degli anelli sia pari a 74,035 mm ad un livello di significatività del 3%.
224
Fig. 8.60 – Impostazione del sistema di ipotesi per l’esempio 8.16
Partendo dalla cella B5 inserire i dati della tab. 8.11 ottenendo il seguente risul-
tato (fig. 8.61):
225
Fig. 8.62 – Predisposizione formule per l’esempio 8.16
Poiché, il valore della funzione-test (2,907) cade al di fuori della regione di ac-
cettazione (-2,170 ; 2,170), allora non è possibile accettare l’ipotesi nulla al li-
vello di significatività del 3%.
226
T > −tc
Con una ipotesi alternativa del tipo:
H1: μ > μ0
la regione critica è:
sc
RC : x ≥ μ0 + tc
n
dove: t c = tα ; n −1 .
Si accetterà l’ipotesi nulla se:
T < tc
Infine, con una ipotesi del tipo:
H1: μ ≠ μ0
la regione critica risulta essere:
⎧ sc
⎪ x ≤ μ 0 − tc n
⎪
RC : ⎨
⎪ x ≥ μ + t sc
⎪⎩ 0 c
n
dove: t c = t α .
; n −1
2
Quindi, si accetterà l’ipotesi nulla se:
− t c < T < tc
Esempio 8.17
227
Dai dati del problema il sistema di ipotesi risulta essere:
⎧ H 0 : μ = 1,3
⎨
⎩ H 1 : μ ≠ 1,3
α = 0,05
Posizionandosi con il cursore nella cella B1 digitare: μ 0 = , B2: μ1 ≠ , B3:
α = , C1: 1,3, C2: 1,3, C3: 0,05 (fig. 8.63):
Partendo dalla cella B4 inserire i dati della tab. 8.12 ottenendo il seguente risul-
tato (fig. 8.64):
Nella cella A16: n = , A17: x medio =, A18: dev.st =, A20: tc = (valore criti-
co), A22: T = (funzione-test), A24: risultato:.
Nella cella B16: =CONTA.VALORI($B$5:$I$14), B17: =MEDIA($B$5:$I$14),
B18: =DEV.ST($B$5:$I$14), B20: =-INV.T($C$3/2;$B$16-1), C20:
=INV.T($C$3/2;$B$16-1), B22: =($B$17-$C$1)/($B$18/RADQ($B$16)), B24:
=SE($B$22<$B$20;"si rifiuta l'ipotesi nulla";SE($B$22>$C$20;"si rifiuta l'i-
potesi nulla";"si accetta l'ipotesi nulla")) fig. (8.65):
228
Fig. 8.65 – Predisposizione formule per l’esempio 8.17
Quindi, poiché il valore della statistica test (-3,693) cade all’esterno della re-
gione di accettazione (-2,285 ; 2,285), non è possibile affermare, ad un livello
di significatività del 5%, che la resistenza media sia pari ad 1,3 Ohm.
Esempio 8.18
La tab. 8.13 riporta la durata (in migliaia di km) di 15 convertitori catalitici per
automobili. Si vuole verificare, ad un livello di significatività del 5%, che la
durata media non sia superiore a 100.
Tab. 8.13 – Durata (in migliaia di km) di 15 convertitori catalitici per automobili
115,4 85,2 89,1 118,3 88,4 109,3 104,3 69,3 105,5 106,8
103,1 101,6 102,9 89,6 109,3
229
Fig. 8.66 – Impostazione del sistema di ipotesi per l’esempio 8.18
Partendo dalla cella B4 inserire i dati della tab. 8.13 ottenendo il seguente risul-
tato (fig. 8.67):
Nella cella A16: n = , A17: x medio =, A18: dev.st =, A20: tc = (valore criti-
co), A22: T = (funzione-test), A24: risultato: .
Nella cella B16: =CONTA.VALORI($B$5:$C$14), B17:
=MEDIA($B$5:$C$14), B18: =DEV.ST($B$5:$C$14), B20: =-INV.T(2*
$C$3;$B$16-1), B22: =($B$17-$C$1)/($B$18/RADQ($B$16)), B24: =SE
($B$22>$B$20;"si accetta l'ipotesi nulla";"si rifiuta l'ipotesi nulla") fig.
(8.68):
230
Fig. 8.68 – Predisposizione formule per l’esempio 8.18
Pertanto, al livello di significatività del 5%, si può affermare che la durata me-
dia dei catalizzatori esaminati non è superiore a 100.
Esempio 8.19
231
Fig. 8.69 – Impostazione del sistema di ipotesi per l’esempio 8.19
Partendo dalla cella B4 inserire i dati della tab. 8.14 ottenendo il seguente risul-
tato (fig. 8.70):
Nella cella A16: n = , A17: x medio =, A18: dev.st =, A20: tc = (valore criti-
co), A22: T = (funzione-test), A24: risultato: .
Nella cella B16: =CONTA.VALORI($B$5:$B$14), B17:
=MEDIA($B$5:$B$14), B18: =DEV.ST($B$5:$B$14), B20: =INV.T(2*
$C$3;$B$16-1), B22: =($B$17-$C$1)/$B$18/RADQ($B$16), B24: =SE($B$22
<$B$20;"si accetta l'ipotesi nulla";"si rifiuta l'ipotesi nulla") fig. (8.71):
232
Fig. 8.71 – Predisposizione formule per l’esempio 8.19
- H 1 : μ1 < μ 2 ;
- H 1 : μ1 > μ 2 ;
- H 1 : μ1 ≠ μ 2 .
233
dove:
Fig. 8.72 – Strumento Analisi dati Test z: due campioni per medie
234
Fig. 8.73 – Test z: due campioni per medie (input)
dove:
235
nuovo foglio di lavoro. Per assegnare un nome al nuovo foglio di lavoro,
digitarlo nella casella di testo;
- Nuova cartella di lavoro: creazione di una nuova cartella di lavoro e co-
pia dei risultati in un nuovo foglio della nuova cartella di lavoro.
abbiamo:
236
- se la differenza ipotizzata per le medie ≠ 0, si accetta l’ipotesi nulla se il
valore della statistica-test - z critico una coda < Z < - z critico una coda;
oppure se P(Z<=z) due code > α .
Esempio 8.20
Tab. 8.15 – Pesi (in mg) delle pastiglie prodotte da due macchine
peso pastiglie macchina A peso pastiglie macchina B
327 321 331 338 338 336 320 314 314 314
342 314 328 337 322 320 321 308 317 320
325 318 317 323 324 315 320 322 334 307
315 326 327 330 327 319 332 322 321 314
327 327 339 329 328 315 321 329 323 331
326 343 336 346 325 314 319 322 324 314
341 318 333 336 343 327 331 320 329 315
329 326 334 327 335 322 322 315 320 320
319 324 319 327 329 314 325 315 325 319
330 327 345 317 324 319 319 324 331 322
237
Fig. 8.75 – Inserimento valori della tab. 8.15
Per attivare la procedura Strumenti di analisi: Test z: due campioni per me-
die, aprire il menu Strumenti e selezionare la voce Analisi dati (fig. 8.76):
238
Fig. 8.77 – Test z: due campioni per medie
Fig. 8.78 – Inserimento valori Test z: due campioni per medie per l’esempio 8.20
239
Fig. 8.79 – Test z: due campioni per medie per i dati dell’esempio 8.20
∑
i =1
( x1i − x1 ) 2 + ∑(x
i =1
2i − x2 ) 2
sc =
n1 + n2 − 2
la quale, se è vera l’ipotesi nulla, segue una distribuzione t di Student con
n1 + n2 − 2 gradi di libertà.
Per quanto riguarda la regola di decisione, si avrà che, se:
240
In Excel all’interno del menu Strumenti Analisi dati troviamo Test t: due
campioni assumendo uguale varianza che consente di eseguire un test t di
Student a due campioni. Questa forma del test t, definito test t omoschedastico,
presuppone che le medie dei due insiemi di dati siano uguali. È possibile utiliz-
zare i test t per determinare se le medie di due campioni sono uguali (fig. 8.80).
Fig. 8.80 – Strumento Analisi dati Test t: due campioni assumendo uguale varian-
za
dove:
241
narla. Vengono generate delle etichette dati appropriate per la tabella di
output;
- Alfa: livello di confidenza per il test che deve essere un valore compreso
nell'intervallo 0÷1. Il livello alfa è un livello di significatività correlato al-
la probabilità di riscontrare un errore di tipo I, ossia il rifiuto di un'ipotesi
vera;
- Intervallo di output: riferimento della cella superiore sinistra della tabel-
la di output. Le dimensioni dell'area di output vengono determinate auto-
maticamente e viene visualizzato un messaggio qualora la tabella di
output sostituisca i dati esistenti;
- Nuovo foglio di lavoro: inserimento di un nuovo foglio di lavoro nella
cartella di lavoro corrente e copia dei risultati a partire dalla cella A1 del
nuovo foglio di lavoro. Per assegnare un nome al nuovo foglio di lavoro,
digitarlo nella casella di testo;
- Nuova cartella di lavoro: creazione di una nuova cartella di lavoro e co-
pia dei risultati in un nuovo foglio della nuova cartella di lavoro.
abbiamo:
242
- la differenza ipotizzata per la media nella cella C7;
- nella cella C8 il calcolo dei gradi di libertà (gdl);
- Stat T, il valore della statistica-test, nella cella C9;
- t critico una coda, t critico due code rispettivamente nelle celle C11 e
C13;
- P(T<=t) una coda e P(T<=t) due code rispettivamente nelle celle C10 e
C12.
Esempio 8.21
243
⎧ H 0 : μ1 = μ 2
⎨
⎩ H 1 : μ1 ≠ μ 2
cioè:
⎧ H 0 : μ1 − μ 2 = 0
⎨
⎩ H1 : μ1 − μ2 ≠ 0
α = 0,05
Partendo dalla cella A1 inserire i valori utilizzando una sola colonna ottenendo
il seguente risultato (fig. 8.83):
244
Fig. 8.84 – Analisi dati: Test t: due campioni assumendo uguale varianza
Fig. 8.86 – Inserimento valori Test t: due campioni assumendo uguale varianza
per l’esempio 8.21
245
Infine, premendo il pulsante OK si ottiene (fig. 8.87):
Fig. 8.87 – Test t: due campioni assumendo uguale varianza per i dati
dell’esempio 8.21
∑(x 1i − x1 ) 2
s12 = i =1
n1 + −1
n2
∑(x 2i − x2 ) 2
s22 = i =1
n2 − 1
In questo caso la statistica-test risulta essere:
x −x
T= 1 2
s12 s22
+
n1 n2
246
la quale, se è vera l’ipotesi nulla, segue una distribuzione t di Student con i
seguenti gradi di libertà (Welch):
2
⎡ s12 s22 ⎤
⎢ + ⎥
n n
ν = ⎣ 12 2 ⎦ 2
⎡ s12 ⎤ ⎡ s22 ⎤
⎢ ⎥ ⎢ ⎥
⎣ n1 ⎦ + ⎣ n2 ⎦
n1 − 1 n2 − 1
Per quanto concerne le regole di decisione valgono le stesse considerazioni
fatte al paragrafo precedente.
In Excel all’interno del menu Strumenti Analisi dati troviamo Test t: due
campioni assumendo varianze diverse consente di eseguire un test t di Stu-
dent a due campioni. Questa forma del test, definito test t eteroschedastico,
presuppone che le varianze dei due intervalli di dati siano diverse. È possibile
utilizzare un test t per determinare se le medie di due campioni sono uguali
(fig. 8.88).
Fig. 8.88 – Strumento Analisi dati Test t: due campioni assumendo varianze di-
verse
247
dove:
abbiamo:
248
- le medie aritmetiche della Variabile 1 nella cella C3 e Variabile 2 nella
cella D3;
- le varianze campionarie nelle celle C4 e D4 rispettivamente della Varia-
bile 1 e Variabile 2;
- il numero di osservazioni della Variabile 1 e Variabile 2 nelle celle C5 e
D5 rispettivamente;
- la differenza ipotizzata per la media nella cella C6;
- nella cella C7 il calcolo dei gradi di libertà (gdl);
- Stat T, il valore della statistica-test, nella cella C8;
- t critico una coda, t critico due code rispettivamente nelle celle C10 e
C12;
- P(T<=t) una coda e P(T<=t) due code rispettivamente nelle celle C9 e
C11.
Il risultato della fig. 8.90 si interpreta come già trattato nel paragrafo prece-
dente.
Esempio 8.22
249
Fig. 8.91 – Inserimento valori della tab. 8.17
Fig. 8.92 – Analisi dati: Test t: due campioni assumendo varianze diverse
250
Fig. 8.94 – Inserimento valori Test t: due campioni assumendo varianze diverse
per l’esempio 8.22
Fig. 8.95 – Test t: due campioni assumendo varianze diverse per i dati
dell’esempio 8.22
4.4.4. Verifica di ipotesi sulla differenza tra valori medi per campio-
ni appaiati
251
inoltre, che X 1 si distribuisca secondo una legge normale con media μ1 e va-
rianza σ 12 e X 2 come una normale con media μ 2 e varianza σ 22 .
Scelto un campione casuale di n unità (coppie) del tipo:
(x11, x21 ), (x12 , x22 ), (x13 , x23 ), …, (x1n , x2 n )
si consideri la differenza tra ogni coppia di osservazioni:
di = ( x2i − x1i ) i = 1,…, n
Sia μ D = μ 2 − μ1 la differenza tra le medie della variabile nella popolazio-
ne, l’ipotesi nulla prevede che il trattamento sia inefficace e l’ipotesi alternativa
che il trattamento sia efficace, cioè:
- H 0 : μ 2 − μ1 = 0 ;
- H1 : μ 2 − μ1 < 0 ;
- H1 : μ 2 − μ1 > 0 ;
- H1 : μ 2 − μ1 ≠ 0 .
sd = ∑
i =1
i
n −1
In questo caso, la statistica-test risulta essere:
d
T=
sd
n
252
che sotto l’ipotesi nulla segue una legge t di Student con n − 1 gradi di li-
bertà.
Le regole di decisione hanno la struttura analoga a quelle già viste prece-
dentemente.
In Excel all’interno del menu Strumenti Analisi dati troviamo Test t: due
campioni accoppiati per medie che consente di eseguire un test t di Student a
due campioni accoppiati per determinare se le medie di un campione sono di-
stinte. Questa forma del test t non presuppone che le varianze delle due popola-
zioni siano uguali. È possibile utilizzare un test accoppiato quando vi è un natu-
rale appaiamento tra le osservazioni dei campioni, come nel caso di una duplice
verifica di un gruppo campione, prima e dopo un esperimento (fig. 8.96).
Fig. 8.96 – Strumento Analisi dati Test t: due campioni accoppiati per medie
dove:
253
- Differenza ipotizzata per le medie: numero desiderato per la variazione
delle medie campione. Il valore 0 indica che si ipotizzano le stesse medie
campione;
- Etichette: selezionare questa casella di controllo se la prima riga o colon-
na dell'intervallo di input contiene etichette, in caso contrario deselezio-
narla. Vengono generate delle etichette dati appropriate per la tabella di
output;
- Alfa: livello di confidenza per il test che deve essere un valore compreso
nell'intervallo 0÷1. Il livello alfa è un livello di significatività correlato al-
la probabilità di riscontrare un errore di tipo I, ossia il rifiuto di un'ipotesi
vera;
- Intervallo di output: riferimento della cella superiore sinistra della tabel-
la di output. Le dimensioni dell'area di output vengono determinate auto-
maticamente e viene visualizzato un messaggio qualora la tabella di
output sostituisca i dati esistenti;
- Nuovo foglio di lavoro: inserimento di un nuovo foglio di lavoro nella
cartella di lavoro corrente e copia dei risultati a partire dalla cella A1 del
nuovo foglio di lavoro. Per assegnare un nome al nuovo foglio di lavoro,
digitarlo nella casella di testo;
- Nuova cartella di lavoro: creazione di una nuova cartella di lavoro e co-
pia dei risultati in un nuovo foglio della nuova cartella di lavoro.
abbiamo:
254
- il numero di osservazioni della Variabile 1 e Variabile 2 nelle celle C5 e
D5 rispettivamente;
- nella cella C6 l’indice di correlazione di Pearson, indice adimensionale
compreso tra -1 e 1 inclusi che riflette l'estensione di una relazione linea-
re tra due insiemi di dati calcolato sulla base della seguente formula:
⎛ n ⎞ ⎛ n ⎞⎛ n ⎞
∑ ∑ ∑
n ⎜⎜ x1i x2i ⎟⎟ − ⎜⎜ x1i ⎟⎟ ⎜⎜ x2i ⎟⎟
⎝ i =1 ⎠ ⎝ i =1 ⎠ ⎝ i =1 ⎠
r=
⎡ n ⎞ ⎤ ⎡⎡ n 2 ⎛ n ⎞ ⎤⎤
2 2
⎛ n
⎢n∑
⎢ i =1
∑
x1i − ⎜⎜ x1i ⎟⎟ ⎥ ⎢n
2
⎥
⎢
⎢ ⎢
∑
⎝ i =1 ⎠ ⎦ ⎣ ⎣ i =1
∑
x2i − ⎜⎜ x2i ⎟⎟ ⎥ ⎥
⎝ i =1 ⎠ ⎥⎦ ⎥⎦
⎣
- la differenza ipotizzata per la media nella cella C7;
- nella cella C8 il calcolo dei gradi di libertà (gdl);
- Stat T, il valore della statistica-test, nella cella C9;
- t critico una coda, t critico due code rispettivamente nelle celle C11 e
C13;
- P(T<=t) una coda e P(T<=t) due code rispettivamente nelle celle C10 e
C12.
Il risultato della fig. 8.98 si interpreta come già trattato nei paragrafi prece-
denti.
Esempio 8.23
255
9 7 22
10 2 6
11 8 12
12 9 13
13 11 12
14 6 8
15 5 9
16 10 12
17 11 14
18 19 23
19 12 16
20 11 15
21 8 10
22 9 12
23 17 25
24 14 15
256
Fig. 8.99 – Inserimento valori della tab. 8.18
Fig. 8.100 – Analisi dati: Test t: due campioni accoppiati per medie
257
Fig. 8.101 – Test t: due campioni accoppiati per medie
Fig. 8.102 – Inserimento valori Test t: due campioni accoppiati per medie per
l’esempio 8.23
258
Fig. 8.103 – Test t: due campioni accoppiati per medie per i dati dell’esempio 8.23
Per verificare l’ipotesi nulla che una popolazione normale abbia varianza
σ :
2
0
H 0 : σ 2 = σ 02
la statistica-test da utilizzare è:
2
⎛s ⎞
Χ = (n − 1) ⎜⎜ c ⎟⎟
2
⎝σ0 ⎠
la quale, se è vera l’ipotesi nulla, si distribuisce secondo una distribuzione
χ con n − 1 gradi di libertà.
2
259
Esempio 8.24
Partendo dalla cella B5 inserire i dati della tab. 8.24 ottenendo il seguente risul-
tato (fig. 8.105):
260
A questo punto posizionarsi nella cella A16 e digitare: n = , A17: s = , A19:
χ c2 = (valore critico), A21: Χ 2 = (funzione-test), A23: risultato:. Nella cella
B16: =CONTA.VALORI($B$5:$B$14), B17: =DEV.ST($B$5:$B$14), B19:
=INV.CHI(1-($C$3/2);$B$16-1), C19: =INV.CHI($C$3/2;$B$16-1), B21:
=((B17^2)/$C$1)*($B$16-1), B23: =SE($B$21<$B$19;"si rifiuta l'ipotesi nul-
la";SE($B$21>$C$19;"si rifiuta l'ipotesi nulla";"si accetta l'ipotesi nulla"))
fig. (8.106):
261
Se le medie delle due popolazioni ( μ1 , μ 2 ) sono note la statistica-test da
utilizzare è:
2
⎛s ⎞
F = ⎜⎜ 1 ⎟⎟
⎝ s2 ⎠
dove:
n1
(x1i − μ1 )2
- s12 = ∑
i =1 n1
;
n2
(x2i − μ2 )2 ;
- s22 = ∑
i =1 n2
n1
(x1i − x1 )2 ;
- sˆ12 = ∑
i =1 n1 − 1
n2
(x2i − x2 )2
- sˆ22 = ∑
i =1 n2 − 1
;
- H1 : σ 12 < σ 12 , si accetta l’ipotesi nulla se risulta F 2 > Fα2; (n1 −1, n2 −1) ;
- H1 : σ 12 > σ 22 , si accetta l’ipotesi nulla se risulta F 2 < Fα2; (n1 −1, n2 −1) ;
- H1 : σ 12 ≠ σ 22 , si accetta l’ipotesi nulla se risulta
F 2α < F 2 < Fα2 .
1− ; ( n1 −1, n2 −1) ; ( n1 −1, n2 −1)
2 2
dove:
263
- Nuovo foglio di lavoro: inserimento di un nuovo foglio di lavoro nella
cartella di lavoro corrente e copia dei risultati a partire dalla cella A1 del
nuovo foglio di lavoro. Per assegnare un nome al nuovo foglio di lavoro,
digitarlo nella casella di testo;
- Nuova cartella di lavoro: creazione di una nuova cartella di lavoro e co-
pia dei risultati in un nuovo foglio della nuova cartella di lavoro.
abbiamo:
Il risultato della fig. 8.109 si interpreta come già trattato nei paragrafi pre-
cedenti fatto salvo che la procedura considera solamente ipotesi alternative u-
nidirezionali cioè H1 : σ 12 > σ 22 .
Esempio 8.25
La tab. 8.20 riporta la dimensione esterna (in mm) di due campioni di 10 dischi
metallici prodotti con due tipi diversi di procedimenti (A, B). Si vuole verifica-
re ad un livello di significatività dell’1% se la variabilità dei diametri esterni
dei dischi è maggiore con il procedimento A rispetto al procedimento B.
264
Tab. 8.20 – Dimensione esterna (in mm) di due campioni di 10 dischi metallici
diametro dischi procedimento A diametro dischi procedimento B
48,832 52,478
45,029 43,919
50,950 53,075
54,965 53,332
54,661 54,528
56,741 57,230
41,505 45,476
49,089 51,130
54,259 52,837
45,772 49,538
Per attivare la procedura Strumenti di analisi: Test F a due campioni per va-
rianze, aprire il menu Strumenti e selezionare la voce Analisi dati (fig.
8.111):
265
Fig. 8.111 – Analisi dati: Test F a due campioni per varianze
Fig. 8.113 – Inserimento valori Test F a due campioni per varianze per l’esempio
8.25
266
Fig. 8.114 – Test F a due campioni per varianze per i dati dell’esempio 8.25
Si consideri una popolazione le cui unità posseggono o meno una certa ca-
ratteristica, ovvero le unità statistiche possono essere classificate secondo un
carattere qualitativo dicotomico.
Si estragga un campione di ampiezza n e si indichi con f = x / n , (dove x
è il numero di successi nel campione) la proporzione (frequenza) dei soggetti
che posseggono la caratteristica in esame, stima della vera ed ignota frequenza
p nella popolazione; supponendo che l’ipotesi nulla oggetto di confronto sia:
H 0 : p = p0
per n sufficientemente grande la statistica-test:
f − p0
Z=
p0 (1− p0 )
n
se è vera l’ipotesi nulla, distribuisce seguendo una distribuzione normale
standardizzata.
Per quanto concerne le regole di decisione si può fare riferimento a quanto
già visto per i test sul valor medio.
Esempio 8.26
Un’azienda che assembla computers rileva difetti di assemblaggio nel 20% dei
casi; si decide pertanto di utilizzare un nuovo procedimento. Da un campione
di 100 computer assemblati, estratti casualmente da un lotto di 1.000, si rileva
267
che 18 presentano difetti. Si vuole verificare, ad un livello di significatività del
5%, se è significativo il decremento nella proporzione dei difetti.
268
Esempio 8.27
269
9. Inferenza statistica non parametrica
1. Generalità
270
Si consideri una variabile X con distribuzione di probabilità da verificare
(ad esempio binomiale, Poisson, normale, ecc.); se si effettuano n misure della
variabile e si raggruppano i valori, si ottiene una distribuzione empirica di fre-
quenze. Tale distribuzione viene successivamente confrontata con una distribu-
zione teorica ipotetica valutando in questo modo il grado di adattamento tra le
due distribuzioni.
Si indichi genericamente con:
ai fi fri = f i / n pi n ⋅ pi
ak fk frk = f k / n pk n ⋅ pk
totale n 1 1 n
271
k
( f i − n ⋅ pi )2
Χ= ∑ i =1 n ⋅ pi
che, se è vera l’ipotesi nulla, si distribuisce secondo una distribuzione χ 2
con:
La regione critica del test è definita dalla coda di destra della distribuzione,
in quanto in tale regione vi sono i valori più grandi di χ 2 , che indicano diffe-
renze significativamente elevate tra frequenze teoriche e frequenze empiriche.
La regione di accettazione dell’ipotesi nulla è invece quella in cui si hanno
bassi valori di χ 2 che indicano accordo tra le frequenze.
Fissato il livello di significatività α per un determinato ν , si determina
dalla tabella della distribuzione χ 2 , il valore critico χ c2 che stabilisce la soglia
della regione critica (fig. 9.1):
χ c2
Fig. 9.1 – Regione critica e di accettazione per il test χ2
(
P χ 2 ≥ χ c2 = α )
272
Le regole di decisione sono:
Χ =
(k − n p )2 + [(n − k ) − n q ] 2 = (k − n p )2
np nq n pq
che, se è vera l’ipotesi nulla, si distribuisce secondo un χ 2 con
ν = k − 1 = 2 − 1 = 1 gradi di libertà.
Esempio 9.1
Un produttore afferma che solo l’1% dei pezzi prodotti sono difettosi. Ad un
controllo, su 500 pezzi ne risultano difettosi 9. Si vuole verificare
l’affermazione del produttore ad un livello di significatività del 5%.
273
ν = 1.
Posizionarsi con il cursore nella cella B1 e digitare p = , B2: p ≠ , B3: n = ,
B4: α = , B5: ν = , B6: k = , C1: =0,01, C2: 0,01, C3: 500, C4: 0,05, C5: 1,
C6: 9 (fig. 9.2):
Esempio 9.2
274
Tab. 8.2 – Distribuzione di pezzi difettosi in 100 lotti
Pezzi difettosi 0 1 2 3 4 5 6
Lotti 11 32 26 14 12 4 1
Partendo dalla cella A1, introdurre i dati della tab. 8.2, nella cella A10: n = e
in B10: =SOMMA($B$2:$B$8) (fig. 9.4):
275
Fig. 9.5 – Calcolo di μ e p per i dati dell’esempio 9.2
Fig. 9.6 – Calcolo delle probabilità teoriche per e dati dell’esempio 9.2
276
Le frequenze teoriche sono ottenute moltiplicando le varie probabilità teoriche
per n ; nella cella E1 digitare frequenze teoriche, nella cella E2: =D2*$B$10,
quindi copiare tale formula nelle celle E3:E8, ottenendo il seguente risultato
(fig. 9.7):
Fig. 9.7 – Calcolo delle frequenze teoriche per i dati dell’esempio 9.2
277
Fig. 9.8 – Calcolo della funzione test per i dati dell’esempio 9.2
Fig. 9.9 – Impostazione delle regole di decisione per il test di adattamento ad una
distribuzione binomiale per i dati dell’esempio 9.2
278
2.2. Adattamento di una distribuzione di Poisson
Χ ==
(k − λ )2
λ
che se è vera l’ipotesi nulla, si distribuisce secondo una legge χ 2 con 1
grado di libertà.
Esempio 9.3
Partendo dalla cella A1 inserire i dati della tab. 8.3; nella A8: n = e nella cella
B8: =SOMMA($B$2:$B$6) (fig. 9.10):
279
Fig. 9.10 – Inserimento dati dell’esempio 9.3
Nella cella C1 digitare k ⋅ f e , C2: =A2*B2, copiare tale formula nelle celle
C3:C6.
Nella C8: =SOMMA($C$2:$C$6), B10: μ = λ = , C10: =$C$8/$B$8, (fig.
9.11):
280
Fig. 9.12 – Calcolo delle probabilità teoriche per i dati dell’esempio 9.3
Nella cella E1: frequenze teoriche, E2: =D2*$B$8, copiare tale formula nelle
celle E:E6 (fig. 9.13):
Fig. 9.13 – Calcolo delle frequenze teoriche per i dati dell’esempio 9.3
281
Fig. 9.14 – Calcolo della funzione test per i dati dell’esempio 9.3
Infine, nella cella E12: α = , E14: ν = , E16: χ c = , E18: risultato, F12: 0,05,
F14: =CONTA.VALORI($A$2:$A$6)-1-1, E16: =INV.CHI($F$10;$F$12),
E18: =SE($F$8<$F$14;"si accetta l'ipotesi nulla";"si rifiuta l'ipotesi nulla")
(fig. 9.15):
Fig. 9.15 – Impostazione delle regole di decisione per il test di adattamento ad una
distribuzione di Poisson per i dati dell’esempio 9.3
282
2.3. Adattamento di una distribuzione normale
Esempio 9.4
Nella tab. 9.4 sono riportati i tempi di vita, in ore di funzionamento, di un cam-
pione di 60 componenti elettronici. Si vuole verificare, al livello di significati-
vità del 5%, se la distribuzione empirica risulta ben approssimata da una legge
normale.
283
Fig. 9.16 – Inserimento dati esempio 9.4
284
Fig. 9.18 – Strumenti di analisi
dopo aver premuto il pulsante OK, si ottiene il seguente risultato (fig. 9.21):
285
Fig. 9.21 – Raggruppamento in classi della durata in ore del tempo di vita per 60
componenti elettronici
286
Fig. 9.22 – Calcolo del valor medio per i dati dell’esempio 9.4
Per quanto concerne il calcolo della varianza e della deviazione standard, de-
vono essere innanzitutto calcolati gli scarti al quadrato, come differenza tra il
centro classe e la media e successivamente moltiplicati per la frequenza empiri-
ca.
Posizionarsi con il cursore nella cella F1 e digitare scarto2 · f, nella cella F2:
=(D2-$E$15)^2*C2, copiare tale formula nelle celle F3:F11, quindi nella cella
F13 calcolare la somma dei valori così ottenuti (=SOMMA($F$2:$F$11)).
Infine, nella cella E17: varianza =, E19: dev.st =, F17: =$F$13/$C$13, F19:
=RADQ($F$17) (fig. 9.23):
287
Fig. 9.23 – Calcolo della varianza e della deviazione standard per i dati
dell’esempio 9.4
A questo punto è possibile trasformare gli intervalli delle classi della variabile
X in intervalli della variabile normale standardizzata Z .
Nella cella G1 digitare zinf , G2: =(A2-$E$15)/$F$19 e copiare tale formula
nelle celle G3:G11.
Infine nella H1: zsup , H2: =(B2-$E$15)/$F$19, quindi copiare la formula nelle
celle H3:H11 (fig. 9.24):
288
Fig. 9.24 – Calcolo di zinf e z sup per i dati dell’esempio 9.4
Fig. 9.25 – Calcolo delle probabilità teoriche per i dati dell’esempio 9.4
289
Moltiplicando le probabilità teoriche così ottenute per n si ottengono le fre-
quenze teoriche (fig. 9.26):
Fig. 9.26 – Calcolo delle frequenze teoriche per i dati dell’esempio 9.4
Fig. 9.27 – Calcolo della funzione test per i dati dell’esempio 9.4
Infine, nella cella L15: α = , L17: ν = , L19: χ c = , L21: risultato, M15: 0,05,
M17: =CONTA.VALORI($B$2:$B$11)-1-2, M19: =INV.CHI($M$15;$M$17),
M21: =SE($M$13<$M$19;"si accetta l'ipotesi nulla";"si rifiuta l'ipotesi nul-
la") (fig. 9.28):
290
Fig. 9.28 – Impostazione delle regole di decisione per il test di adattamento ad una
distribuzione normale per i dati dell’esempio 9.4
Quindi, ad un livello di significatività del 5%, non è possibile adattare una di-
stribuzione normale alla distribuzione empirica della durata in ore del tempo di
vita di 60 componenti elettronici.
Esempio 9.5
291
0,735 0,739 0,740 0,728 0,736
0,736 0,733 0,736 0,728 0,735
0,734 0,737 0,742 0,737 0,745
0,733 0,738 0,732 0,747 0,736
0,736 0,736 0,730 0,735 0,740
Per la definizione delle classi, si può operare in questo modo: considerando che
il valore più piccolo è xmin = 0,724 e il valore più grande è xmax = 0,747 e che
il range è pari a ϖ = xmax − xmin = 0,747 − 0,724 = 0,0023 ≈ 0,002 , partendo dal
valore 0,724 ed aggiungendo 0,002 , si ottiene (fig. 9.30):
292
Fig. 9.30 – Inserimento delle classi per i dati dell’esempio 9.5
293
Fig. 9.32 – Strumenti di analisi: Istogramma
dopo aver premuto il pulsante OK, si ottiene il seguente risultato (fig. 9.34):
294
Fig. 9.34 – Raggruppamento in classi delle misure con spettrofotometro
295
Fig. 9.35 – Calcolo del valor medio per i dati dell’esempio 9.5
Posizionarsi con il cursore nella cella F1 e digitare scarto2 · f, nella cella F2:
=(D2-$E$17)^2*C2, copiare tale formula nelle celle F3:F13, quindi nella cella
F13 calcolare la somma dei valori così ottenuti (=SOMMA($F$2:$F$13)). In-
fine, nella cella E19: varianza =, E21: dev.st =, F19: =$F$15/$C$15, F21:
=RADQ($F$19) (fig. 9.36):
Fig. 9.36 – Calcolo della varianza e della deviazione standard per i dati
dell’esempio 9.5
296
Nella cella G1 e H1 digitare zinf , z sup e nelle celle G2 e H2 =(A2-$E$17)
/$F$21, =(B2-$E$17)/$F$21. Quindi copiare tali formule nelle celle G3:G13 e
H3:H13 rispettivamente (fig. 9.37):
Fig. 9.38 – Calcolo delle probabilità teoriche per i dati dell’esempio 9.5
297
Moltiplicando le probabilità teoriche così ottenute per n si ottengono le fre-
quenze teoriche (fig. 9.39):
Fig. 9.39 – Calcolo delle frequenze teoriche per i dati dell’esempio 9.5
Fig. 9.40 – Calcolo della funzione test per i dati dell’esempio 9.5
Infine, nella cella L17: α = , L19: ν = , L21: χ c = , L23: risultato, M17: 0,03,
M19: =CONTA.VALORI($B$2:$B$11)-1-2, M21: =INV.CHI($M$17;$M$19),
298
M21: =SE($M$15<$M$21;"si accetta l'ipotesi nulla";"si rifiuta l'ipotesi nul-
la") (fig. 9.41):
Fig. 9.41 – Impostazione delle regole di decisione per il test di adattamento ad una
distribuzione normale per i dati dell’esempio 9.5
299
10. Analisi della varianza (ANOVA)
1. Generalità
Si è visto nel capitolo 8 come sia possibile effettuare il confronto tra valori
medi di due campioni.
Sovente, però, risulta necessario effettuare il confronto tra due o più cam-
pioni; ad esempio ci si può chiedere:
300
effettuate nelle stesse condizioni, ovvero misure di elementi sottoposti allo
stesso trattamento.
Nel linguaggio proprio dell’ANOVA, il termine trattamento sostituisce il
termine classe; in base a questa definizione, esaminare i dati relativi ad m trat-
tamenti significa esaminare m campioni ciascuno dei quali, costituito da n os-
servazioni, è stato estratto da una specifica sottopopolazione.
I risultati di un esperimento ad un fattore vengono generalmente presentati
come in tabella seguente (tab. 10.1):
2 x21 x22 … x2 j … x2 n
… … … … … … …
i xi1 xi 2 … xij … xin
… … … … … … …
m xm1 xm 2 … xmj … xmn
301
m n
1
x=
mn
∑∑ x
i =1 j =1
ij
Grande media x
Tale quantità può essere scomposta in due parti; infatti, sapendo che:
(
xij − x = xij − xi⋅ + (xi⋅ − x ))
risulta:
m n m n
ν = ∑∑ ( xij − x j ⋅ ) 2 + ∑∑ ( x j ⋅ − x ) 2
i =1 j =1 i =1 j =1
dove:
m n
ν w = ∑∑ ( xij − x j ⋅ ) 2
i =1 j =1
302
indica la variazione tra i trattamenti ed è la somma dei quadrati delle diffe-
renze tra le medie di trattamento e la grande media.
Il modello più utilizzato per l’analisi della varianza è il modello lineare; in
questo modello si presuppone che la popolazione sia omogenea rispetto al fat-
tore secondo cui vengono determinati i trattamenti (classi).
Questo significa ipotizzare che i diversi trattamenti abbiano le stesse carat-
teristiche, in quanto campioni casuali rappresentativi di una stessa popolazione.
Ogni riga della tab. 10.1 rappresenta un campione casuale di grandezza n
estratto dalla sottopopolazione soggetta a quel particolare trattamento; i valori
xij del campione sono valori osservati delle variabili X ij .
Se si ammette che le variabili X ij siano indipendenti, con la stessa distri-
buzione di probabilità e varianza della popolazione, ciascuna variabile X ij può
essere espressa come:
X ij = μ 2j + Δ ij = μ + α j + Δ ij
dove μ è il valor medio della popolazione; Δ ij rappresentano le compo-
nenti casuali e α j sono variabili indipendenti con valor medio nullo e varianza
σ2.
Se i diversi trattamenti sono equivalenti, quindi influenzano i dati del cam-
pione nello stesso modo, le diverse medie di trattamento sono uguali tra loro;
allora l’ipotesi nulla sarà del tipo:
H 0 : μ1 = μ 2 = … = μ m
contro l’ipotesi alternativa che vi sia almeno una μ i di versa da μ .
Per poter sottoporre a test l’ipotesi di omogeneità dei trattamenti si deve
assumere che:
303
totale dato dal fattore secondo cui è stata suddivisa la popolazione, mentre la
seconda rappresenta la variazione casuale intrinseca nella misure.
Se la variazione tra i trattamenti è significativamente maggiore di quella in-
terna ai trattamenti (o classi) si può concludere che il fattore di classificazione
influenza i valori della variabile e la popolazione non può essere ritenuta omo-
genea secondo il fattore analizzato.
Sarà pertanto necessario conoscere le distribuzioni campionarie della varia-
zione entro i trattamenti Vw , la variazione tra i trattamenti Vb e la variazione
totale V .
Sapendo che:
Vw V
Sˆw2 = Sˆb2 = b
m ⋅ (n − 1) m −1
rappresentano, rispettivamente, le migliori stime campionarie della varia-
zione entro i trattamenti e della variazione tra i trattamenti della popolazione,
la funzione test, risulterà essere:
Sˆ 2
F = b2
Sˆw
che, se è vera l’ipotesi nulla, è una variabile F con ν 1 = (m − 1) e
ν 2 = m ⋅ (n − 1) gradi di libertà.
Le regole di decisione sono:
Entro i trattamenti
νw
m ⋅ (n − 1) Sˆ w2 =
m n
ν w = ∑∑ ( xij − x j ⋅ ) 2
m ⋅ (n − 1)
i =1 j =1
304
Totale
m ⋅ n −1
ν = ν b +ν w
In Excel all’interno del menu Strumenti Analisi dati troviamo Analisi va-
rianza: ad un fattore che consente di eseguire una semplice analisi della va-
rianza per verificare l'ipotesi secondo cui i valori medi di due o più campioni,
estratti da popolazioni con gli stessi valori medi, sono uguali.
Questo strumento esegue una semplice analisi di varianza su dati relativi a
due o più campioni.
L'analisi verifica l'ipotesi secondo cui ogni campione viene estratto dalla
stessa distribuzione probabilistica sottostante in confronto all'ipotesi alternativa
secondo cui le distribuzioni probabilistiche sottostanti non sono uguali per tutti
i campioni.
Se si desidera analizzare due soli campioni, è possibile utilizzare anche la
funzione TEST.T.
Se si desidera analizzare più di due campioni, la generalizzazione del
TEST.T non risulta utile ed è invece consigliabile utilizzare il modello Analisi
varianza ad un fattore (fig. 10.2).
305
dove:
306
Fig. 10.4 – Analisi varianza: ad un fattore (output)
abbiamo:
307
Esempio 10.1
Nella tab. 10.3 è riportata la durata (in ore) di funzionamento ininterrotto (fino
al guasto) di un macchinario sottoposto a 5 diverse prove di durata, per ciascu-
no dei quali sono state effettuate 4 osservazioni. Ad un livello si significatività
del 5% si vuole valutare se vi sono differenze significative nelle prove di dura-
ta.
308
Fig. 10.7 – Analisi varianza: ad un fattore (input)
309
Poiché il valore della funzione test ( 1,870 ) è inferiore al valore critico ( 3,055 ),
al livello di significatività del 5%, si può affermare che non vi sono differenze
significativamente rilevanti nelle 5 prove di durata del macchinario.
Esempio 10.2
Tab. 10.4 – Differenze di lunghezza (in decimi di millimetro) rispetto a quella no-
minale di alcuni pezzi prodotti da 4 macchinari
Macchine Osservazioni
A 77 71 79 72 74 69
B 51 54 59 64 74 49
C 54 67 71 56 60 65
D 55 60 44 54 49 49
310
Fig. 10.11 – Strumento Analisi dati Analisi varianza: ad un fattore
311
Fig. 10.14 – Analisi varianza: ad un fattore per i dati dell’esempio 10.2
Esempio 10.3
Tab. 10.5 – Quantitativo di ozono (in parti per milione) misurati in quattro luoghi
diversi
Luoghi Osservazioni
A 0,08 0,10 0,09 0,07 0,09 0,06
B 0,15 0,09 0,11 0,10 0,08 0,13
C 0,13 0,10 0,15 0,09 0,09 0,17
D 0,05 0,11 0,07 0,09 0,11 0,08
312
Fig. 10.15 – Inserimento dati esempio 10.3
313
Fig. 10.18 – Impostazioni per il calcolo dell’Analisi varianza: ad un fattore
Poiché il valore della funzione test (3,498) è inferiore al valore critico (4,938),
al livello di significatività dell’1%, si può affermare che i livelli di ozono
nell’aria delle quattro zone non sono significativamente diversi.
314
na n classi (blocchi), i dati possono essere rappresentati in una tabella con m
righe ed n colonne di valori (tab. 10.6):
Tab. 10.6 – Tabella dati per l’ANOVA a due fattori senza replica
Blocchi
Trattamenti 1 2 … j … n
2 x21 x22 … x2 j … x2 n
… … … … … … …
i xi1 xi 2 … xij … xin
… … … … … … …
m xm1 xm 2 … xmj … xmn
dove il dato xij indica il valore rilevato per l’i-esimo trattamento e per il j-
esimo blocco supponendo inoltre che per ciascun trattamento di ciascun blocco
venga rilevato un solo dato.
Le medie marginali di riga sono le medie di trattamento:
1 m n
xi ⋅ = ∑∑
n i =1 j =1
xij
Fig. 10.20 – Medie di trattamento, di blocco e grande media per l’ANOVA a due fat-
tori senza replica
Blocchi Medie di
Trattamenti 1 2 … j … n trattamento
315
2 x21 x22 … x2 j … x2 n x2⋅
… … … … … … … …
i xi1 xi 2 … xij … xin xi ⋅
… … … … … … … …
m xm1 xm 2 … xmj … xmn x m⋅
Grande
Medie di blocco x⋅1 x⋅2 … x⋅ j … x⋅n media
x
Quindi, sapendo che la variazione totale può essere scomposta nei termini:
316
ν = ∑∑ [(xij − xi⋅ − x⋅ j + x ) + (xi⋅ − x ) + (x⋅ j − x )]
m n
i =1 j =1
si ottiene:
ν = ν e +ν r +ν c
In base al modello lineare, le variabili X ij che nel campione assumono i
valori xij , possono essere espresse come una combinazione lineare di termini:
X ij = μ + α i + β j + Δ ij
dove:
317
ha una distribuzione F con ν 1 = (m − 1) e ν 2 = (m − 1) ⋅ (n − 1) gradi di li-
bertà.
Se è vera l’ipotesi H 0( 2) , il rapporto:
Sˆ 2
F ( c ) = c2
Sˆe
segue una distribuzione F con ν 1 = (n − 1) e ν 2 = (m − 1) ⋅ (n − 1) gradi di
libertà.
L’ipotesi nulla di omogeneità complessiva deve essere rifiutata quando an-
che uno dei due valori campionari delle funzioni test risulta essere significati-
vo, cioè appartenente alla regione critica della distribuzione F al prefissato
livello di significatività.
La tab. 10.7 riassume i dati necessari per l’analisi della varianza a due fatto-
ri senza replica.
Tab. 10.7 – Tabella calcoli per l’ANOVA a due fattori senza replica
Variazione Gradi di libertà Media dei quadrati F
Tra i trattamenti ν Sˆr2
m −1 Sˆ r2 = r F (r ) =
νr m −1 Sˆ 2
e
Tra i blocchi νc Sˆ 2
n −1 Sˆc2 = F (c ) = c2
νc (n − 1) Sˆ e
Residua νe
νe
(m − 1)⋅ (n − 1) Sˆe2 =
(m − 1) ( n − 1)
Totale
m ⋅ n −1
ν
In Excel all’interno del menu Strumenti Analisi dati troviamo Analisi va-
rianza: a due fattori senza replica (fig. 10.21).
Fig. 10.21 – Strumento Analisi dati Analisi varianza: a due fattori senza replica
318
Fig. 10.22 – Analisi varianza: a due fattori senza replica (input)
dove:
319
Fig. 10.23 – Analisi varianza: a due fattori senza replica (output)
abbiamo:
320
- valore di significatività colonne: livello di significatività osservato (p-
value) per l’ipotesi H 0( 2) ; rappresenta il livello di significatività più basso
a cui H 0( 2) può essere rifiutata per un dato insieme di dati;
- F crit righe: valore critico della funzione test per l’ipotesi H 0(1)
( Fα(1; )[( m −1),( m −1)( n −1) ] );
- F crit colonne: valore critico della funzione test per l’ipotesi H 0( 2)
( Fα( ;2[)( n −1),( m −1)( n −1) ] ).
Esempio 10.4
321
Aprire il menu Strumenti, selezionare Analisi dati, Analisi varianza: a due
fattori senza replica e premere il pulsante OK (fig. 10.25):
Fig. 10.25 – Strumento Analisi dati Analisi varianza: a due fattori senza replica
Fig. 10.27 – Impostazioni per il calcolo dell’Analisi varianza: a due fattori senza
replica
322
Fig. 10.28 – Analisi varianza: a due fattori senza replica per i dati dell’esempio
10.4
Poiché entrambi i valori delle funzioni test sono inferiori dei corrispondenti va-
lori critici, si può accettare, ad un livello di significatività del 5%, l’ipotesi di
omogeneità dei prodotti.
Esempio 10.5
La tab. 10.9 registra la resa (in grammi) di un certo prodotto chimico al variare
del livello di concentrazione di solvente e della temperatura.
Tab. 10.9 – Resa (in gr) di un prodotto chimico al variare del livello di concentra-
zione di solvente e della temperatura
Concentrazione di solvente
Temperature
30% 40% 50%
60° C 46,2 46,7 45,9
70° C 45,8 46,8 45,7
323
Fig. 10.29 – Inserimento dati esempio 10.5
Fig. 10.30 – Strumento Analisi dati Analisi varianza: a due fattori senza replica
324
Fig. 10.32 – Impostazioni per il calcolo dell’Analisi varianza: a due fattori senza
replica
Fig. 10.33 – Analisi varianza: a due fattori senza replica per i dati dell’esempio
10.5
Poiché entrambi i valori delle funzioni test sono inferiori dei corrispondenti va-
lori critici, ad un livello di significatività del 5%, non risultano esservi differen-
ze significative nella resa sia per il variare del livello di concentrazione di sol-
vente sia per la temperatura.
325
- i indica il trattamento;
- j indica il blocco;
- k indica la ripetizione (replicazione).
L’analisi di tutti i valori può essere impostata in modo del tutto analogo a
quanto visto in precedenza, introducendo un ulteriore termine nella scomposi-
zione della variazione: quello relativo alle ripetizioni.
Il modello lineare di analisi considera la variabile X ijk come combinazione
dei termini:
X ijk = μ + α i + β j + γ k + Δ ijk
dove γ k indica l’effetto interazione (tra trattamenti e blocchi) e gli altri
simboli hanno il significato descritto nei paragrafi precedenti.
Per mezzo del test F si possono verificare le ipotesi che:
Fig. 10.34 – Strumento Analisi dati Analisi varianza: a due fattori con replica
326
Fig. 10.35 – Analisi varianza: a due fattori con replica (input)
dove:
327
Fig. 10.36 – Analisi varianza: a due fattori con replica (output)
Esempio 10.6
328
Fig. 10.37 – Inserimento dati esempio 10.6
Fig. 10.38 – Strumento Analisi dati Analisi varianza: a due fattori con replica
329
Fig. 10.40 – Impostazioni per il calcolo dell’Analisi varianza: a due fattori con re-
plica
Fig. 10.41 – Analisi varianza: a due fattori con replica per i dati dell’esempio 10.6
Dall’analisi della fig. 10.41 risulta che l’effetto della variabile temperatura e
dell’interazione tra temperatura e tempo di reazione sono significativi (si rifiu-
tano cioè le ipotesi nulle); l’effetto del tempo di reazione è invece non signifi-
cativo (si accetta in questo caso l’ipotesi nulla).
330
Esempio 10.7
La direzione di uno stabilimento vuole effettuare uno studio per accertare gli
effetti che il turno di lavoro e la linea di produzione possono avere sul tempo di
assemblaggio di un certo prodotto. Per l’analisi è stato scelto, per ogni combi-
nazione del turno di lavoro con la linea di produzione, un campione di 5 osser-
vazioni i cui risultati, espressi in numero di parti assemblate per minuto, sono
riportate nella tab. 10.11. Si vuole condurre l’analisi della varianza per il mo-
dello con effetti principali e interazione, verificando le ipotesi di interesse al
livello di significatività del 5%.
Tab. 10.11 – Numero di parti assemblate per minuto al variare del turno e della li-
nea produttiva
Linea produttiva
Turno
A B C D
26 43 40 44
33 34 34 45
1 37 31 33 51
40 36 33 49
27 38 20 43
34 25 39 41
37 43 35 50
2 33 32 38 49
28 33 25 39
35 30 33 50
21 21 34 28
27 21 28 33
3 14 31 21 33
23 21 28 23
30 27 18 35
331
Fig. 10.42 – Inserimento dati esempio 10.7
Fig. 10.43 – Strumento Analisi dati Analisi varianza: a due fattori con replica
332
Fig. 10.44 – Analisi varianza: a due fattori con replica (input)
Fig. 10.45 – Impostazioni per il calcolo dell’Analisi varianza: a due fattori con re-
plica
Fig. 10.46 – Analisi varianza: a due fattori con replica per i dati dell’esempio 10.7
333
Dall’analisi della fig. 10.46 risultano significativi sia gli effetti del fattore linea
produttiva sia quelli del fattore turno, mentre l’interazione linea produttiva tur-
no è da ritenersi trascurabile.
Esempio 10.8
Tab. 10.12 – Rilevazioni del contenuto di zolfo al variare dei laboratori e del meto-
do di analisi
Metodo di Laboratorio
analisi 1 2 3 4 5 6 7
0,107 0,127 0,115 0,108 0,097 0,114 0,155
A
0,105 0,122 0,112 0,108 0,096 0,119 0,145
0,105 0,127 0,109 0,117 0,110 0,116 0,164
B
0,103 0,124 0,111 0,115 0,097 0,122 0,160
334
Fig. 10.48 – Strumento Analisi dati Analisi varianza: a due fattori con replica
Fig. 10.50 – Impostazioni per il calcolo dell’Analisi varianza: a due fattori con re-
plica
335
Fig. 10.51 – Analisi varianza: a due fattori con replica per i dati dell’esempio 10.8
Dall’analisi della fig. 10.49 risultano non significativi gli effetti del fattore me-
todo di analisi e dell’interazione metodo di analisi laboratori, mentre risulta non
significativo l’effetto laboratorio.
Esempio 10.9
336
Tab. 10.13 – Misurazioni dimensionali (in mm) effettuate da 3 operatori con 3 tipo-
logie di precisione
Precisione misura
Operatore
M1 M2 M3
0,7 0,60 0,550
1,0 1,00 1,050
0,9 0,80 0,800
0,9 0,95 0,800
0,6 0,45 0,400
Op1
1,0 1,00 1,000
1,0 0,95 0,950
0,9 0,80 0,750
1,0 1,00 1,000
0,6 0,70 0,550
0,6 0,55 0,750
0,9 0,95 0,700
0,8 0,75 0,550
0,9 0,75 0,700
0,6 0,40 0,950
Op2
0,8 1,05 0,750
0,8 0,90 0,850
0,9 0,70 0,950
0,8 0,95 0,850
0,8 0,50 0,850
0,5 0,55 0,700
1,1 0,10 0,850
0,8 0,80 0,550
0,8 0,80 0,850
0,5 0,50 0,950
Op3
1,0 1,05 0,850
1,0 0,95 0,550
0,8 0,80 0,750
1,1 1,05 0,850
0,9 0,80 0,750
337
Fig. 10.52 – Inserimento dati esempio 10.9
Fig. 10.53 – Strumento Analisi dati Analisi varianza: a due fattori con replica
338
Nell’Intervallo di input: digitare $A$2:$D$32, nella cella Righe per campio-
ne: digitare 10 e spuntare la casella Nuovo foglio di lavoro: (fig. 10.55):
Fig. 10.55 – Impostazioni per il calcolo dell’Analisi varianza: a due fattori con re-
plica
Fig. 10.56 – Analisi varianza: a due fattori con replica per i dati dell’esempio 10.9
Dall’analisi della fig. 10.56 emerge chiaramente che risultano non significativi
gli effetti del fattore operatore, precisione e dell’interazione operatore metodo
di precisione.
339
11. Regressione e correlazione
1. Generalità
340
Per conseguire questo scopo il metodo più utilizzato è il metodo dei minimi
quadrati che costituisce un’applicazione della ricerca del minimo di una fun-
zione di più variabili mediante gli strumenti dell’analisi infinitesimale.
Si considerino due variabili X e Y sulle quali si sono effettuate n rileva-
zioni:
( x1 , y1 ), ( x2 , y 2 ), … , ( xi , yi ), … , ( xn , y n )
Sia:
y = f ( x ; a , b, c , … , k )
la funzione interpolatrice scelta.
Siano inoltre ŷi i valori teorici sulla curva corrispondenti ai valori xi rile-
vati.
La condizione di accostamento data dal metodo dei minimi quadrati è quel-
la di determinare i valori dei parametri in modo che sia minima la somma dei
quadrati delle differenze fra i valori osservati yi e i valori teorici ŷi (fig.
11.1):
y
( xi , y i )
yi
di
ŷ i ( x i , ŷ i )
x
xi
n
ϕ ( a, b, c, …, k ) = ∑ [ yi − f ( xi ; a, b, c, …, k )]2
i =1
dove i valori xi e yi sono noti, mentre sono incogniti i parametri a , b , c ,
… , k della funzione.
La condizione necessaria, supposta che la funzione sia derivabile rispetto a
tutti i parametri, è data dall’annullarsi delle derivate parziali prime della fun-
zione ϕ ( a, b, c, …, k ) rispetto ai parametri a , b , c , … , k , cioè deve essere:
∂ϕ ∂ϕ ∂ϕ ∂ϕ
= 0, = 0, = 0 , …, =0
∂a ∂b ∂c ∂k
341
Si perviene, quindi, alla soluzione del sistema di k equazioni in k inco-
gnite:
⎧ n 2 ∂ f
⎪ [ yi − f ( xi ; a, b, c, … , k )]
∑ =0
⎪ i =1 ∂a
⎪ n ∂f
⎪ [ yi − f ( xi ; a, b, c, … , k )]2
∑ =0
⎪ i =1 ∂b
⎪ n
⎪ 2 ∂ f
⎨ [ yi − f ( xi ; a, b, c, … , k )]
∑ =0
⎪ i =1 ∂c
⎪………………………………………
⎪
⎪ n 2 ∂ f
⎪ [ yi − f ( xi ; a, b, c, … , k )]
∑ =0
⎪ i =1 ∂k
⎪
⎩
che una volta risolto fornisce i valori di a , b , c , … , k .
2. Regressione lineare
342
La stima del parametro b , coefficiente angolare della funzione lineare, può
essere rappresentato nella forma:
n
(xi − x )( yi − y )
∑ n
bˆ = i =1 n
(xi − x )2
∑i =1 n
dove il denominatore è la varianza di X ( σ X2 ), mentre il numeratore è det-
to covarianza di X e Y ( σ XY ) e misura la variabilità congiunta delle coppie
( xi , yi ) di valori corrispondenti, rispetto al proprio valor medio; quindi, il co-
efficiente b della retta interpolante esprime la variabilità congiunta delle va-
riabili X e Y rapportata alla variabilità della sola X .
Excel mette a disposizione alcuni strumenti per l’interpolazione di una retta
di regressione:
Per quanto concerne il primo metodo, dopo aver selezionato i dati di inte-
resse escludendo le etichette, aprire il menu Inserisci e cliccare sulla voce Gra-
fico quindi seguire i passaggi fino a comporre un grafico a dispersione [Di-
spers. (XY)].
Dopo aver selezionato la serie dei dati sul grafico appena composto, sele-
zionare il comando Aggiungi linea di tendenza dal menu Grafico (fig. 11.2):
343
Dopo aver selezionato tra il Tipo di tendenza/regressione quello Lineare,
la scheda Opzioni di tale comando, fornisce le seguenti informazioni (fig.
11.3):
dove:
344
- Visualizza il valore di R al quadrato sul grafico: spuntando questa ca-
sella si visualizza un valore di R al quadrato per la linea di tendenza nel-
l'etichetta della linea di tendenza del grafico.
dove:
345
- Intervallo di input X: immettere il riferimento dell'intervallo di dati in-
dipendenti. Le variabili indipendenti di questo intervallo vengono dispo-
ste in ordine crescente da sinistra a destra. È possibile immettere un mas-
simo di 16 variabili indipendenti;
- Etichette: selezionare questa opzione se la prima riga o colonna dell'in-
tervallo o degli intervalli di input contiene etichette. In caso contrario de-
selezionarla, in quanto le etichette di dati appropriate per la tabella di
output vengono generate automaticamente;
- Livello di confidenza: selezionare questa opzione per calcolare un inter-
vallo di confidenza per le stime dei coefficienti della retta di regressione.
Immettere nella casella il livello di confidenza che si desidera applicare
oltre al livello predefinito del 95%.
Una volta che sia stata stimata la retta di regressione, potrebbe essere inte-
ressante conoscere l’insieme dei valori in cui si dovrebbero trovare i veri
ed ignoti parametri del modello ad un prefissato livello di significatività.
Nell’ipotesi che gli stimatori â e b̂ si distribuiscano normalmente, si può
dimostrare che l’intervallo di confidenza all’( 1 − α ) 100 per l’intercetta a
risulta essere:
[aˆ − tc ⋅ saˆ ; aˆ − tc ⋅ saˆ ]
mentre, l’intervallo di confidenza all’( 1 − α ) 100 per il coefficiente ango-
lare b è:
[ bˆ − t ⋅ s ; bˆ − t ⋅ s
c bˆ c bˆ
]
dove:
- s aˆ è le deviazione standard di â :
⎛ ⎞
⎜ 2
⎟
⎜1 x ⎟
s aˆ = s y x ⎜n+ n ⎟
⎜
⎜
⎝
∑
i =1
(xi − x )2 ⎟⎟
⎠
- sbˆ è la deviazione standard di b̂ :
1
sbˆ = s y x n
∑ (x − x )
i =1
i
2
346
n
∑ (y
i =1
i − yˆ i )
2
sy x =
n−2
- t c è il valore critico di una distribuzione t di Student con n − 2 gradi di
libertà;
- Passa per l'origine: selezionare questa opzione per far fare in modo che
la linea di regressione passi per l'origine;
- Intervallo di output: immettere il riferimento della cella superiore sini-
stra della tabella di output. Impostare almeno sette colonne per la tabella
di output di riepilogo, in modo da includere la tabella di analisi varianza,
i coefficienti, la stima dell'errore standard di y , i valori r 2 , il numero di
osservazioni e l'errore standard dei coefficienti;
- Nuovo foglio di lavoro: selezionare la casella per inserire un nuovo fo-
glio di lavoro nella cartella di lavoro corrente e incollare i risultati a parti-
re dalla cella A1 del nuovo foglio di lavoro. Per assegnare un nome al
nuovo foglio di lavoro, digitarlo nella casella di testo;
- Nuova cartella di lavoro: selezionare la casella per creare una nuova car-
tella di lavoro e incollare i risultati in un nuovo foglio della nuova cartella
di lavoro;
- Residui: selezionare questa opzione per includere i residui nella corri-
spondente tabella di output. In particolare si calcolano i valori approssi-
mati ( ŷi ) e i residui cioè la differenza tra valori osservati ( yi ) e valori
stimati ( ŷi ):
ε i = yi − yˆ i
- Residui standardizzati: selezionare questa opzione per includere i resi-
dui standardizzati nella corrispondente tabella di output; tali valori sono
ottenuti dal rapporto tra i residui e l’errore standard di regressione:
εi
ε i* =
sy x
- Tracciati dei residui: selezionare questa opzione per generare automati-
camente un grafico per ciascuna variabile indipendente contrapposta al
residuo. Si tratta di un grafico di dispersione in cui l’asse delle ordinate è
riferito ai residui ( ε i ) e l’asse delle ascisse ai valori stimati ( ŷi ). Se il
modello è ben specificato, i residui tenderanno a distribuirsi in modo ca-
suale attorno alla retta ε i = 0 senza mostrare valori anomali né tendenze
di fondo o comportamenti sistematici. Quando, invece, sul grafico i resi-
dui si dispongono in modo non casuale è il segnale che il modello di re-
gressione non rappresenta in modo appropriato la relazione statistica tra le
due variabili ed è necessario, pertanto, ricercare un nuovo modello. Attra-
347
verso questo grafico è possibile valutare se: la funzione di regressione è
lineare; se la distribuzione delle ε i presenta varianza costante per tutti i
valori della variabile X ; se le ε i sono variabili indipendenti; se la distri-
buzione delle ε i è normale;
- Tracciati delle approssimazioni: selezionare questa opzione per genera-
re un grafico per i valori previsti contrapposti ai valori osservati. Trattasi
di un grafico a dispersione simile al precedente nel quale al posto dei re-
sidui ( ε i ) vengono visualizzati i valori stimati ( ŷi ) consentendo, in que-
sto modo, di valutare la distanza esistente tra i valori osservati ed i valori
stimati;
- Tracciati delle probabilità normali: selezionare questa opzione per ge-
nerare un grafico relativo alla probabilità normale. In questo grafico la
proporzione cumulata per una singola variabile numerica, nel nostro caso
il residuo standardizzato ( ε i* ) vene messa a confronto con la proporzione
cumulata attesa nel caso in cui il campione provenga da una distribuzione
normale. Se il campione proviene da una distribuzione normale, i punti ri-
sulteranno allineati lungo la bisettrice.
dove, per quanto concerne la sezione relativa alla Statistica della regres-
sione le statistiche calcolate, sono:
348
- R multiplo: è il coefficiente di correlazione lineare di Pearson ( r ) (di cui
si discuterà nel § 3);
- R al quadrato: è il coefficiente di determinazione ( r 2 ) (di cui si discuterà
nel § 3);
- R al quadrato corretto: è il coefficiente di determinazione corretto ( rc2 )
utilizzato nel caso della regressione multipla, per riflettere sia il numero
di variabili esplicative sia la dimensione campionaria:
⎡ m ⎤
rc2 = r 2 − ⎢(1 − r 2 )
⎣ n − m − 1⎥⎦
dove m è il numero di variabili esplicative.
Nel caso della regressione lineare la statistica diventa:
⎡ n −1 ⎤
rc2 = 1 − ⎢(1 − r 2 )
⎣ n − 2 ⎥⎦
- Errore standard: restituisce l'errore standard ( s y x ) del valore previsto
per y per ciascun valore di x nella regressione. È una misura che indica
la quantità di errori commessi nella previsione del valore di y per cia-
scun valore di x e viene calcolato utilizzando la formula seguente:
⎡ ⎡ n ⎤ ⎤
2
⎢
1 ⎢ n ⎣ i =1
∑
⎢ ( xi − x ) ( y i − y ) ⎥ ⎥
⎦ ⎥
sy x = ∑ 2
⎢ ( yi − y ) −
(n − 2) ⎢ i =1 n ⎥
⎢ i =1
∑
( xi − x ) 2 ⎥
⎥
⎣ ⎦
- Osservazioni: è il numero di osservazioni ( n ).
- gdl regressione: gradi di libertà associati alla somma dei quadrati della
regressione ( SS R );
- gdl residuo: gradi di liberta associati alla somma dei quadrati dei residui
( SS E );
- gdl totale: gradi di libertà associati alla somma dei quadrati totali ( SST );
- SQ regressione: somma dei quadrati della regressione, cioè la somma dei
quadrati delle differenze dei valori stimati ŷi dalla media y :
n
SS R = ∑ ( yˆ
i =1
i − y)2
349
- SQ residuo: somma dei quadrati dei residui, cioè la somma dei quadrati
delle differenze tra i valori osservati yi e i valori stimati ŷi :
n
SS E = ∑(y
i =1
i − yˆ i ) 2
- SQ totale: somma totale dei quadrati, cioè la somma dei quadrati delle
differenze dei valori osservati yi dalla loro media ŷi :
n
SST = ∑(y
i =1
i − y)2
350
- Superiore 95% intercetta: limite superiore dell’intervallo di confidenza,
al livello di significatività del 95%, per a ;
- Superiore 95% X: limite superiore dell’intervallo di confidenza, al livel-
lo di significatività del 95%, per b .
infine, la parte relativa agli Output dati contengono i valori per la realizza-
zione del grafico dei Tracciati delle probabilità normali.
Un’alternativa all’utilizzo dello strumento Analisi dati Regressione, è rap-
presentato dalla funzione:
REGR.LIN(y_nota;x_nota;cost;stat)
che calcola le statistiche di una linea utilizzando il metodo dei minimi qua-
drati per calcolare la linea retta che si adatti meglio ai dati, quindi restituisce
una matrice che descrive la linea. Poiché la funzione restituisce una matrice di
valori, deve essere immessa come formula in forma di matrice.
Il significato dei parametri è:
352
Nell'analisi di regressione, per ogni punto viene calcolato il quadrato della
differenza tra il valore di y stimato per quel punto e il valore reale di y corri-
spondente. La somma dei quadrati delle differenze viene denominata somma
residua dei quadrati, sqres. Viene quindi calcolata la somma totale dei quadra-
ti, sqtot.
Se cost = VERO o è omesso, la somma totale dei quadrati è la somma del
quadrato della differenza tra i valori reali di y e la media dei valori y .
Se cost = FALSO, la somma totale dei quadrati è la somma dei quadrati
dei valori reali di y senza la sottrazione della media dei valori y da ogni valo-
re y . La somma della regressione dei quadrati, sqreg, si ottiene da:
sqreg = sqtot − sqres .
Minore è la somma residua rispetto alla somma totale dei quadrati, mag-
giore sarà il valore del coefficiente di determinazione, r 2 , il quale è un indica-
tore del livello di precisione con cui l'equazione ottenuta dall'analisi di regres-
sione spiega la relazione tra le variabili. r 2 è uguale a:
sqreg
sqtot
In alcuni casi, a una o più colonne di x (partendo dal presupposto che i va-
lori y e x siano disposti in colonne) potrebbero non corrispondere valori di
previsione aggiuntivi in presenza di altre colonne x . L'eliminazione di una o
più colonne x può risultare in valori y previsti altrettanto precisi. In questo
caso le colonne x ridondanti vanno omesse dal modello di regressione. Questo
fenomeno viene denominato collinearità poiché ogni colonna x ridondante
può essere espressa come somma di multipli delle colonne x non ridondanti.
REGR.LIN verifica la collinearità e rimuove le colonne x ridondanti dal mo-
dello di regressione, dopo averle individuate. Le colonne x rimosse vengono
indicate nell'output di REGR.LIN con il coefficiente 0 e con s = 0 . Se una o
più colonne vengono rimosse perché ridondanti, il grado di libertà cambia in
base al numero di colonne x effettivamente utilizzato per le previsioni. Se i
gradi di libertà vengono modificati in seguito alla rimozione delle colonne x
ridondanti, cambieranno anche i valori s y ed F . La collinearità si verifica ra-
ramente, ad eccezione che nel caso in cui le colonne x contengano soltanto 0 e
1 a indicare se il soggetto di un esperimento è membro di un determinato grup-
po o meno.
Se cost = VERO o è omesso, REGR.LIN inserisce effettivamente una co-
lonna x aggiuntiva di 1 per creare il modello dell'intercetta.
Se in una colonna viene indicato il numero 1 per ogni individuo di sesso
maschile e 0 per ogni individuo di sesso femminile ed è presente una colonna
in cui viene inserito il numero 1 per ogni individuo di sesso femminile e 0 per
353
ogni individuo di sesso maschile, quest'ultima colonna viene considerata come
ridondante, poiché i dati contenuti in essa possono essere ottenuti dalla sottra-
zione dei valori presente nella colonna dell'indicatore di sesso maschile dai va-
lori nella colonna che contiene con tutti i valori 1 aggiunta da REGR.LIN.
Infine, gdl viene calcolato nel seguente modo quando non viene rimossa al-
cuna colonna x dal modello a causa della collinearità.
Se sono presenti k colonne di x note e cost = VERO o è omesso, allora
gdl = n − k − 1 . Se cost = FALSO, allora gdl = n − k . In entrambi i casi, per
ogni colonna rimossa a causa della collinearità, il valore gdl aumenta di 1.
Quando si immette come argomento una costante matrice come x_nota,
utilizzare il punto e virgola (;) per separare i valori nella stessa riga e la barra
rovesciata (\) per separare le righe.
I caratteri separatori possono variare a seconda delle impostazioni della fi-
nestra di dialogo Impostazioni internazionali nel Pannello di controllo.
Si noti che i valori y stimati dall'equazione di regressione possono non es-
sere validi qualora siano al di fuori dell'intervallo dei valori y utilizzati per de-
terminare l'equazione.
Esempio 11.1
Tab. 11.2 – Lunghezze (in cm) di una molla sottoposta a successivi carichi (in kg)
Pesi 1 2 3 4 5
Lunghezze 12,0 13,5 14,8 16,5 18,2
Selezionare le celle A2:B6, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 11.8):
354
Fig. 11.8 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
355
Fig. 11.10 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
Nell’Asse dei valori (X) digitare Pesi, nell’Asse dei valori (Y): Lunghezze, ed
infine premendo ancora una volta il pulsante Avanti (fig. 11.12):
356
Fig. 11.12 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione del grafico
Dopo aver selezionato la casella Crea nuovo foglio e premuto il pulsante Fine,
si ottiene (fig. 11.13):
19,0
18,0
17,0
16,0
Lunghezze
15,0
14,0
13,0
12,0
11,0
0 1 2 3 4 5
Pesi
Dopo aver selezionato la serie dei dati sul grafico, aprire il menu Grafico e se-
lezionare il comando Aggiungi linea di tendenza (fig. 11.14):
357
Selezionare nella scheda Tipo di tendenza/regressione Lineare, nella scheda
Opzioni spuntare le caselle Visualizza l’equazione sul grafico e Visualizza il
valore R al quadrato sul grafico (fig. 11.15):
y = 10,38 + 1,54 x
18,0 2
R = 0,99731
17,0
16,0
Lunghezze
15,0
14,0
13,0
12,0
11,0
0 1 2 3 4 5
Pesi
358
Fig. 11.17 – Strumento Analisi dati Regressione
359
Fig. 11.19 – Immissione delle informazioni per i dati dell’esempio 11.1
Quindi, dopo aver premuto il pulsante OK, si ottiene (fig. 11.20, 11.21, 11.22,
11.23):
Fig. 11.20 – Output di riepilogo Analisi dati Regressione per i dati dell’esempio
11.1
360
Tracciato dei residui
0,15
0,1
0,05
0
0 1 2 3 4 5 6
Residui
-0,05
-0,1
-0,15
-0,2
-0,25
Pesi
Fig. 11.21 – Tracciato dei residui relativi alla regressione per i dati dell’esempio
11.1
Tracciato delle approssimazioni
19,0
18,0
17,0
16,0
Lunghezze
Lunghezze
15,0
Previsto Lunghezze
14,0
13,0
12,0
11,0
0 1 2 3 4 5
Pesi
Fig. 11.22 – Tracciato delle approssimazioni relative alla regressione per i dati
dell’esempio 11.1
361
Tracciato della probabilità normale
19,0
18,0
17,0
16,0
Lunghezze
15,0
14,0
13,0
12,0
11,0
0 10 20 30 40 50 60 70 80 90 100
Percentile campionaria
Fig. 11.23 – Tracciato della probabilità normale relativa alla regressione per i dati
dell’esempio 11.1
Esempio 11.2
Il materiale grezzo utilizzato per la produzione di una fibra sintetica viene im-
magazzinato in un ambiente che non dispone di controllo dell’umidità. Per 15
giorni vengono prese misurazioni abbinate dell’umidità atmosferica (in %) pre-
362
sente nel magazzino e dell’acqua assorbita (in %) dal materiale, ottenendo i se-
guenti risultati (tab. 11.3):
363
Fig. 11.26 – Regressione (input)
quindi, dopo aver premuto il pulsante OK, si ottiene (fig. 11.28, 11.29, 11.30,
11.31):
364
Fig. 11.28 – Output di riepilogo Analisi dati Regressione per i dati dell’esempio
11.2
Tracciato dei residui
9
3
Residui
-3
-5
Temperatura
Fig. 11.29 – Tracciato dei residui relativi alla regressione per i dati dell’esempio
11.2
365
Tracciato delle approssimazioni
100
90
80
Rendimento
70 Rendimento
Previsto Rendimento
60
50
40
90 110 130 150 170 190 210
Temperatura
Fig. 11.30 – Tracciato delle approssimazioni relative alla regressione per i dati
dell’esempio 11.2
Tracciato della probabilità normale
100
90
80
Rendimento
70
60
50
40
0 10 20 30 40 50 60 70 80 90 100
Percentile campionaria
Fig. 11.31 – Tracciato della probabilità normale relativa alla regressione per i dati
dell’esempio 11.2
366
una forte correlazione positiva tra le variabili temperatura e rendimento mentre
il valore di r 2 (coefficiente di determinazione) mostra che il 95,5% della varia-
zione del rendimento è attribuibile alla variazione della temperatura.
Per quanto riguarda l’Analisi varianza, essendo il valore di significatività F
molto piccolo, si concludere che l’ipotesi che non vi sia una relazione lineare
tra pesi e lunghezze delle molle può essere decisamente scartata.
L’analisi della fig. 11.29 (tracciato dei residui) non evidenzia andamenti parti-
colari anche se per valori elevati della temperatura vi è certamente un aumento
della variabilità; la fig. 11.30 (tracciato delle approssimazioni) permette di ve-
rificare immediatamente la bontà del modello lineare valutando; infine il fig.
11.31 (tracciato della probabilità normale) evidenza una quasi normalità dei
residui.
Esempio 11.3
La tab. 11.4 riporta i prezzi al lotto (in euro) di un prodotto rispetto al numero
di pezzi difettosi contenuti:
Tab. 11.4 – Prezzi al lotto di un prodotto al variare del numero di pezzi difettosi
contenuti
N° pezzi difettosi 2 5 10 13 20
Prezzo al lotto € 77,50 € 64,50 € 54,00 € 52,00 € 44,00
367
Fig. 11.33 – Statistiche aggiuntive di regressione della funzione REGR.LIN per i
dati dell’esempio 11.3
3. Correlazione
∑ (x − x) ( y
i =1
i i − y)
r=
n n
∑ (x − x) ∑ ( y
i =1
i
2
i =1
i − y)2
- − 1 ≤ r ≤ +1 ;
- risulta r = +1 quando tutti i dati sono allineati lungo una retta crescente
(fig. 11.34);
y
Fig. 11.34 – r = +1
- risulta r = −1 quando tutti i dati sono allineati lungo una retta decrescente
(fig. 11.35);
y
Fig. 11.35 – r = −1
- risulta r = 0 quando non esiste una relazione lineare tra i due caratteri
(fig. 11.36).
369
y
x
Fig. 11.36 – r=0
370
COVARIANZA(matrice1; matrice2)
dove:
Gli argomenti devono essere numeri oppure nomi, matrici o riferimenti che
contengano numeri.
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati. Le celle contenenti il valore zero verranno invece
incluse nel calcolo.
Se matrice1 e matrice2 contengono numeri diversi di dati, COVARIAN-
ZA restituirà il valore di errore #N/D.
Se matrice1 o matrice2 non contiene alcun dato, COVARIANZA restitui-
rà il valore di errore #DIV/0!.
Per quanto concerne il coefficiente di correlazione lineare, la funzione inte-
ressata è:
PEARSON(matrice1;matrice2)
dove:
Gli argomenti devono essere numeri oppure nomi, matrici o riferimenti che
contengono numeri.
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati. Le celle contenenti il valore zero verranno invece
incluse nel calcolo.
Se matrice1 e matrice2 contengono un numero differente di dati o nessun
dato, PEARSON restituirà il valore di errore #N/D.
Infine, per quanto riguarda il coefficiente di determinazione:
RQ(y_nota;x_nota)
dove:
Gli argomenti devono essere numeri oppure nomi, matrici o riferimenti che
contengono numeri.
Se una matrice o un riferimento contiene testo, valori logici o celle vuote,
tali valori verranno ignorati. Le celle contenenti il valore zero verranno invece
incluse nel calcolo.
371
Se y_nota e x_nota contengono un numero differente di valori o nessun
valore, RQ restituirà il valore di errore #N/D.
Esempio 11.4
Posizionarsi nella cella A11 e digitare: covarianza =, A13: Pearson (r) =, A15:
R quadrato =, B11: =COVARIANZA($A$2:$A$8;$B$2:$B$8), B13:
=PEARSON($A$2:$A$8;$B$2:$B$8), B15: =RQ($B$2:$B$8;$A$2:$A$8) ot-
tenendo (fig. 11.38):
372
Esempio 11.5
Posizionarsi nella cella A14 e digitare: covarianza =, A16: Pearson (r) =, A18:
R quadrato =, B14: =COVARIANZA($A$2:$A$11;$B$2:$B$11), B16: =PEA-
373
RSON($A$2:$A$11;$B$2:$B$11), B15: =RQ($B$2:$B$11;$A$2:$A$11) otte-
nendo (fig. 11.40):
4. Regressione logaritmica
⎪a
⎪ i =1
∑
ln( xi ) + bn = ∑ i =1
yi
⎨ n n n
⎪a [ ] [ln( xi )] yi
⎪
⎩ i =1
ln( x i )∑ 2
+ b ∑i =1
ln( x ∑
i ) =
i =1
dove si è posto:
- * xi = ln( xi ) ;
n
1
- *x =
n
∑ ln( x ) ;
i =1
i
n
1
- y=
n
∑y
i =1
i .
374
La funzione logaritmica può essere definita utilizzando i logaritmi decimali
o i logaritmi naturali. In entrambi i casi, la funzione può essere utilizzata con
insieme di dati in cui i valori della variabile indipendente sono positivi, in
quanto i logaritmi di valori nulli o negativi non sono numericamente definiti.
Esempio 11.6
La tab. 11.7 registra le temperature (in °C) misurate a varie profondità (in cm)
all’interno di una vasca contenente una soluzione chimica:
Tab. 11.7 – Temperature (in °C) al variare della profondità (in cm) di una vasca
contenente una soluzione chimica
Profondità 0,1 0,8 3,6 12 120 390 710 1200 1800 2400
Temperatura 21,2 27,3 31,8 35,6 42,3 45,9 47,7 49,2 50,2 51,4
Selezionare le celle A2:B11, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 11.42):
375
Fig. 11.42 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
376
Fig. 11.44 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
377
Fig. 11.46 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione del grafico
Dopo aver selezionato la casella Crea nuovo foglio e premuto il pulsante Fine,
si ottiene (fig. 11.47):
55
50
45
40
35
30
25
20
15
0 500 1.000 1.500 2.000 2.500
Dopo aver selezionato la serie dei dati sul grafico, aprire il menu Grafico e se-
lezionare il comando Aggiungi linea di tendenza (fig. 11.48):
378
Fig. 11.48 – Aggiungi linea di tendenza
379
55
50
45
y = 28,043 + 2,9851Ln(x)
2
R = 0,9999
40
35
30
25
20
15
0 500 1.000 1.500 2.000 2.500
5. Regressione polinomiale
Il metodo dei minimi quadrati può essere utilizzato anche per adattare una
funzione polinomiale a un insieme di dati.
Si consideri un polinomio di grado k :
y = a0 + a1 x + a2 x 2 + a3 x 3 + … + ak x k
Utilizzando il metodo dei minimi quadrati il sistema di equazioni da risol-
vere è:
⎧ n n n n
na
⎪ 0 1 + a∑ x i + a∑2 x 2
i + ∑
+ a k∑ x k
i = yi
⎪ i =1 i =1 i =1 i =1
⎪ n n n n
∑
⎨ i =1
∑
⎪⎪a1 xi + a2 xi + + ak
i =1
2
∑ ∑
i =1
xik =
i =1
xi y i
⎪…
⎪
⎪ n k n n n
∑ ∑
⎪a1 xi + a2 xi + + ak
⎪⎩ i =1 i =1
k +1
∑ ∑
i =1
xi2 k =
i =1
xik yi
380
Esempio 11.7
Si vuole verificare se esiste una relazione tra lo spessore di una fibra sintetica e
la sua resistenza alla trazione. La tab. 11.8 riporta la resistenza alla trazione (in
%) in funzione dello spessore (in cm) per un campione di 8 fibre.
Tab. 11.8 – Temperature (in °C) al variare della profondità (in cm) di una vasca
contenente una soluzione chimica
Spessore 31 34 36 40 41 44 49 50
Resistenza alla trazione 74,77 72,69 73,12 71,33 69,96 70,22 73,63 75,94
Selezionare le celle A2:B11, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 11.52):
381
Fig. 11.52 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
382
Fig. 11.54 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
383
Fig. 11.57 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione del grafico
Dopo aver selezionato la casella Crea nuovo foglio e premuto il pulsante Fine,
si ottiene (fig. 11.58):
77
76
75
74
73
72
71
70
69
30 35 40 45 50
Dopo aver selezionato la serie dei dati sul grafico, aprire il menu Grafico e se-
lezionare il comando Aggiungi linea di tendenza (fig. 11.59):
384
Fig. 11.59 – Aggiungi linea di tendenza
6 5 4 3 2
76 y = 0,0000218x - 0,0053963x + 0,5542653x - 30,2025186x + 920,6039106x - 14879,4341335x + 99684,1604592
R2 = 0,9896124
75
74
73
72
71
70
69
30 35 40 45 50
385
6. Regressione di potenza
- y * = ln( y ) ;
- a * = ln(a) ;
- x * = ln( x) ;
si ottiene:
y * = a* + b x*
Poiché questa è l’equazione di una retta, il sistema di equazioni ai minimi
quadrati sarà dato da:
⎧ * n * n
⎪a ∑
⎪ i =1
xi + b n =∑ i =1
yi*
⎨ n n n
⎪a *
⎪ ∑
⎩ i =1
( x * 2
i ) ∑
+ b
i =1
∑xi
*
=
i =1
xi* yi*
Esempio 11.8
Sono stati provati vari computer allo scopo di mettere a confronto i prezzi con
le prestazioni. La tab. 11.9 riporta le prestazioni (in %) ottenute con un noto
386
software di benchmarking in relazione al prezzo di vendita (in euro) del prodot-
to:
Selezionare le celle A2:B11, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 11.62):
387
Fig. 11.62 – Creazione guidata grafico – Passaggio 1 di 4 – Tipo di grafico
388
Fig. 11.64 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
389
Fig. 11.66 – Creazione guidata grafico – Passaggio 4 di 4 – Posizione del grafico
Dopo aver selezionato la casella Crea nuovo foglio e premuto il pulsante Fine,
si ottiene (fig. 11.67):
135
125
115
105
95
85
75
€ 1.700,00 € 1.800,00 € 1.900,00 € 2.000,00 € 2.100,00 € 2.200,00 € 2.300,00 € 2.400,00 € 2.500,00 € 2.600,00
Dopo aver selezionato la serie dei dati sul grafico, aprire il menu Grafico e se-
lezionare il comando Aggiungi linea di tendenza (fig. 11.68):
390
Fig. 11.68 – Aggiungi linea di tendenza
125 1,16611
y = 0,01319 x
2
R = 0,98996
115
105
95
85
75
€ 1.700,00 € 1.800,00 € 1.900,00 € 2.000,00 € 2.100,00 € 2.200,00 € 2.300,00 € 2.400,00 € 2.500,00 € 2.600,00
391
7. Regressione esponenziale
- y * = ln( y ) ;
- a * = ln(a) ;
si ottiene:
y* = a* + b x
Poiché questa è l’equazione di una retta, il sistema di equazioni ai minimi
quadrati sarà dato da:
⎧ * n n
⎪a
⎪ i =1
∑ xi + b n = ∑i =1
yi*
⎨ n n n
⎪a *
⎪
⎩ i =1
∑ x 2
i + b ∑i =1
x i = ∑i =1
xi yi*
Esempio 11.9
392
Tab. 11.10 – Caduta di tensione (in volt) in funzione del tempo (in sec)
Tempo 0 1 2 3 4 5 6 7 8 9 10 12
Tensione 10,00 6,10 3,70 2,20 1,40 0,80 0,50 0,30 0,20 0,10 0,07 0,03
Selezionare le celle A2:B13, aprire il menu Inserisci e cliccare sulla voce Gra-
fico (fig. 11.71):
393
Nella scheda Tipi standard selezionare Dispers. (XY) (fig. 11.72):
Fig. 11.73 – Creazione guidata grafico – Passaggio 2 di 4 – Dati di origine del gra-
fico
394
Premere ancora il pulsante Avanti (fig. 11.74):
Dopo aver selezionato la casella Crea nuovo foglio e premuto il pulsante Fine,
si ottiene (fig. 11.76):
7
0
0,5 2,5 4,5 6,5 8,5 10,5 12,5
395
Dopo aver selezionato la serie dei dati sul grafico, aprire il menu Grafico e se-
lezionare il comando Aggiungi linea di tendenza (fig. 11.77):
6
-0,4923 x
y = 9,7534 e
2
5
R = 0,9988
0
0,5 2,5 4,5 6,5 8,5 10,5 12,5
396
Allegato multimediale online
397
selezionare le voci Strumenti di analisi e Strumenti di analisi – VBA e
premere sul pulsante OK. A questo punto il programma attiverà gli Strumenti
di analisi che saranno disponibili dal menu Strumenti tramite la voce Analisi
dati:
398