Sei sulla pagina 1di 3

Esercizi sulla correlazione e sulla regressione

Esercizio 1. Si consideri la seguente tabella che mette in relazione il livello


del fumo con i tassi di morte per tumore ai polmoni o Leucemia:

Stato Sigarette Cancro ai Leucemia


Pro capite polmoni
California 2860 22,07 7,06
Idaho 2010 13,58 6,62
Illinois 2791 22,80 7,27
Indiana 2618 20,30 7,00
Iowa 2212 16,59 7,69
Kansas 2184 16,84 7,42
Kentucky 2344 17,71 6,41
Massachusetts 2692 22,04 6,89
Minnesota 2206 14,20 8,28
New York 2914 25,02 7,23
Alaska 3034 25,88 4,90
Nevada 4240 23,03 6,67
Utah 1400 12,01 6,71
Texas 2257 20,74 7,02

1. Calcolare (“a mano”) la covarianza tra le variabili Sigarette pro capite


e Cancro ai polmoni per i primi 5 Stati.
2. Calcolare i coefficienti di correlazione per le tre variabili con Excel.
3. Disegnare il diagramma di dispersione dei decessi per tumore ai
polmoni rispetto ai consumi di sigarette.
4. Valutare la migliore curva di regressione, motivando la scelta.
5. Se il consumo medio pro capite fosse di 2500 sigarette, quale sarebbe
il tasso previsto di morte per cancro ai polmoni?
Esercizio 2. Si consideri la seguente tabella che mette in relazione il
numero di fusti trasportati in container che sono risultati danneggiati in
occasione ad impatti a diverse velocità:

Velocità Fusti
danneggiati
3 54
3 62
3 65
5 94
5 122
5 84
6 142
7 139
7 184
8 254

1. Analizza I dati con un modello di regressione lineare.


2. Calcolare la retta di regressione.
3. Disegnare il grafico dei residui
4. Ti sembra che ciò che hai ottenuto ha un difetto nel modello? In
caso affermativo, individua un modello migliore.

Esercizio 3. Nella seguente tabella sono riportati il numero di matrimoni e


di divorzi registrati in alcune regioni italiane nel corso del 1984:

Regioni Matrimoni Divorzi


Piemonte 20534 1655
Lombardia 42732 3084
Trentino A. A. 4868 251
Veneto 22700 779
Friuli V. G. 5253 492
Liguria 7810 961
Emilia Romagna 16739 1436
Toscana 16074 895
Marche 6767 204
Lazio 26215 1939
Campania 36369 861
Puglia 24499 583
Calabria 12302 342
Sicilia 30330 954

1. Quale variabile è opportuno scegliere come x?


2. Determinare la retta di regressione. Qual è il significato del
coefficiente angolare della retta di regressione?
3. Determinare i coefficienti di correlazione.
4. Esiste una regressione migliore di quella lineare?
5. In base alla migliore regressione, quanti matrimoni sarebbero
previsti per una regione con 8000 matrimoni?