Sei sulla pagina 1di 11

CINQUANTA ESERCIZI DI RELAZIONI TRA VARIABILI QUANTITATIVE E QUALITATIVE 1.

Si conoscono i seguenti dati che si riferiscono ad un campione casuale semplice di 80 dati della v.c. X,Y: - per X, la media aritmetica 25 e la somma dei quadrati 58320 - per Y, la media aritmetica 32 e la somma dei quadrati 92480 - la codevianza tra X ed Y -640. Costruire un modello lineare per la relazione tra X ed Y determinando l'equazione di regressione lineare Y= + X. Saggiare la significativit della regressione e valutare con intervallo di confidenza al 95% il valore che potrebbe assumere Y fissando un valore di x = 26. 2. In una grande banca si vuole determinare se il tempo (in giorni) per espletare una pratica di erogazione di un mutuo dipenda dallimporto del mutuo stesso (in migliaia di Euro). Si rilevano di 12 pratiche estratte a caso e si ottengono i dati che seguono: Importo del mutuo (X): 120 118 136 50 132 144 Tempo di erogazione (Y): 14 18 16 9 16 14 85 113 104 180 152 114 10 12 10 18 12 10

Si chiede di: a) determinare la relazione lineare di Y in funzione di X; b) stimare, con intervallo di confidenza al 95%, il tempo di erogazione di un mutuo di 160 mila Euro; c) stimare quanta parte della variazione del tempo di erogazione spiegata dallimporto del mutuo e saggiarne la significativit al livello del 5%. 3. In un corso sulla lettura veloce si considerato un campione di 12 soggetti indipendenti e per ciascuno di essi rilevata la velocit di lettura (parole lette al minuto) in relazione al numero di lezioni ricevute. Con i dati che seguono si chiede di: a) di rappresentare i dati osservati e determinare la relazione lineare di Y in funzione di X; b) di dare una stima intervallare al 95% per la velocit di lettura di un soggetto che abbia seguito venti lezioni; c) di stimare quanta parte della varianza della Y spiegata dalla regressione con la X e saggiarne la significativit al livello del 5%. Numero di lezioni (X): 2 10 18 11 12 14 8 13 14 18 15 14 Velocit (Y): 34 118 146 124 136 140 108 146 160 184 162 170 4. La tabella che segue riporta i risultati di unindagine campionaria per valutare il gradimento di un dato prodotto. I 150 soggetti casuali sono distinti per classi di et e la qualit del prodotto valutata con un giudizio qualitativo. Si vuole stabilire se vi una differenza significativa nei giudizi espressi per le differenti fasce di et.
Classi di et 21-30 31-60 >60 TOTALE Scadente 23 17 5 45 Giudizio Accettabile 9 25 8 42 Buono 4 28 31 63 TOTALE 36 70 44 150

5. Volendo conoscere lopinione degli studenti circa una innovazione nella didattica di primo anno, si considera un campione di 320 studenti, 80 per ciascuno di quattro corsi di laurea (BAM, ECOEUR, ECOTUR, EPO). Danno giudizio positivo sulla innovazione didattica il 40% degli studenti di BAM, il 55% di quelli iscritti a ECOEUR e il 60% di quelli iscritti a ECOTUR. In complesso sono favorevoli allinnovazione il 60% degli studenti intervistati. Verificare, al livello di

significativit del 5%, lipotesi che le differenze di opinione riscontrate tra gli studenti dei diversi corsi di laurea siano dovute al caso. 6. Per valutare la diffusione di un romanzo tra gli studenti, si sono intervistati 400 studenti delle superiori e 200 studenti universitari scelti a caso e si stimato che il romanzo acquistato dal 25% degli studenti delle superiori e dall8% degli universitari. Si chiede di: a) costruire la tabella a doppia entrata 2x2 Livello istruzione x Acquirenti e b) di saggiare lipotesi di indipendenza tra i due caratteri al livello del 5%. 7. La tabella che segue riporta i dati di et e pressione arteriosa sistolica alle ore 11 di un campione casuale di 12 donne, tutte aventi una medesima patologia. Determinare la relazione lineare tra la pressione e l'et, verificare l'ipotesi che l'et non dia un contributo significativo alla spiegazione della variabilit della pressione sistolica e stimare, con intervallo di confidenza al 95%, la pressione sistolica alle ore 11 di una donna con quella patologia e di et 45 anni. Et: Pressione: 56 147 42 125 72 160 36 118 63 149 47 128 55 150 49 145 38 115 42 140 68 152 60 155

8. La tabella che segue riporta la distribuzione di un campione casuale di 320 unit estratto da una variabile doppia X,Y. Misurare il grado di correlazione lineare tra le due variabili e saggiarne la significativit. X 3 4 5 TOTALE Y 170 24 15 28 67 TOTALE 110 80 130 320

150 5 22 45 72

160 6 18 37 61

180 35 13 14 62

190 40 12 6 58

9. In un dato comune si rilevato un campione casuale di 15 appartamenti in affitto. I dati richiesti, X = superficie in mq e Y = canone di affitto mensile in Euro, sono riportati nella tabella seguente: X 65 74 89 103 87 Y 302 309 380 484 380 X 152 74 89 143 129 Y 600 400 420 520 540 X 97 68 159 52 81 Y 420 400 530 350 415

Sulla base della relazione lineare tra canone mensile e superficie dell'alloggio, determinare un intervallo di confidenza al 95% per la media dei canoni di affitto di appartamenti, siti in quello stesso comune, con superficie di 110 mq. 10. Da una variabile doppia X,Y si sono estratte a caso 30 unit e si calcolato che: la media aritmetica di X 25 e la media quadratica di X 27; la media aritmetica di Y 32 e la media quadratica di Y 34; la covarianza tra X ed Y -8. Si chiede di: a) determinare l'equazione di regressione lineare X= a+bY; b) dare una stima intervallare al 95% per il parametro di regressione; c) calcolare la quota della varianza della X spiegata dalla Y; d) verificare l'ipotesi che X ed Y non siano correlate.

11. Un campione casuale di 300 studenti universitari della stessa facolt e in possesso di maturit scientifica, sottoposto ad una prova test di matematica di base. La distribuzione dei 300 studenti per et e rendimento al test figura nella tabella seguente. Pu dirsi che il rendimento non dipende dall'et? Et 19-21 22-24 25-27 Totale Rendimento Scadente Sufficiente Buono 15 12 36 63 18 38 24 80 30 33 28 91 Ottimo 40 17 9 66 Totale 103 100 97 300

12. Un campione di 10 imprese di un dato settore stato classificato secondo il numero degli addetti e il numero totale di ore di sciopero effettuate nell'ultimo anno. Addetti: 15 135 99 25 53 104 72 18 28 10 Ore di sciopero: 30 302 105 67 40 250 190 45 53 22 Si chiede di: a) determinare la pi opportuna relazione lineare tra le due variabili e stimarla; b) stimare la quota della varianza della variabile dipendente spiegata dalla regressione con la variabile indipendente; c) saggiare l'ipotesi che il coefficiente di regressione ottenuto non sia diverso da zero. 13. Da una indagine sugli acquirenti di yogurt, dei quali 200 sono uomini e 400 donne, risultato che lo consumano quotidianamente il 40% dei primi ed il 20% delle seconde. Misurare la dipendenza tra consumo quotidiano di yogurt ed il sesso del consumatore. 14. Da una indagine su un campione casuale di 500 acquirenti di un prodotto alimentare, dei quali 200 hanno meno di 20 anni, 200 fra 20 e 30 anni e 100 pi di 30 anni, risultato che lo consumano quotidianamente il 20% dei primi, il 30% dei secondi ed il 10% dei terzi. Misurare la dipendenza tra consumo del prodotto ed et del consumatore e saggiare la significativit dell'indice utilizzato. 15. La tabella che segue riporta la distribuzione di frequenza di un campione casuale di 85 case di cura
private distinte per numero di medici e di posti letto. Verificare se esista dipendenza tra le due variabili e saggiare la significativit dell'indice statistico usato per misurare la dipendenza.

No. Posti letto 1 - 40 41 - 60 61 - 90 91-160 Totale

1 - 50 36 2

No. medici 51- 100 101 - 200 8 4 12 12 5 2 19

201-300

Totale 36 22 12 15 85

38

3 13 16

16. I dati di un campione casuale di 2000 occupati, distinti per settore di attivit economica e per sesso, figurano nella tabella che segue. Verificare se l'occupazione per settore di attivit pu ritenersi indipendente dal sesso.

Settori Agricoltura Industria Altre Attivit Totale

Sesso Maschi Femmine 145 81 527 162 654 431 1326 674

Totale 226 689 1085 2000

17. Un campione casuale di clienti degli alberghi della Provincia di Milano nel 2005, stato classificato per nazionalit e categoria alberghiera. La tabella di sintesi dei 700 dati rilevati riportata di seguito. Si pu ritenere che la scelta della tipologia alberghiera sia influenzata dalla nazionalit dei clienti? Categoria alberghiera in stelle 1 2 3 4 5 Totale Nazionalit Italiana 17 44 163 104 15 343 Straniera 31 150 58 100 18 357 Totale 48 194 221 204 33 700

18. Si condotta una indagine campionaria sul consumo di un dato prodotto, scegliendo a caso 350 studenti universitari e 150 impiegati. E' risultato che il prodotto viene acquistato almeno una volta al mese dal 20% dei primi e dal 40% dei secondi. Riportare queste informazioni in forma tabellare e verificare lipotesi che vi sia indipendenza tra acquisto del prodotto e tipologia dell'acquirente. 19. Un filo viene teso sotto lazione di un carico tra 5 e 50 Kg e se ne determina lallungamento. Prendendo un campione casuale di 10 fili di uguale lunghezza 1 metro, dallesperimento si sono ottenuti i seguenti risultati: Peso in Kg 5 10 Lunghezza in cm 103 106 15 109 20 25 30 35 40 45 50 112 117 121 124 127 131 135

Stimare la relazione lineare tra lunghezza e peso e determinare la quota della varianza dell'allungamento spiegata dal peso del carico. Saggiare l'ipotesi che questa quota della varianza spiegata non sia diversa da zero. 20. Si condotta una indagine su un campione di 400 aziende nel settore dellelettronica. Il personale delle 400 aziende stato classificato secondo il titolo di studio posseduto: scuola dellobbligo (1), diploma (2), laurea (3) ottenendo la seguente distribuzione:
Azienda A B C D E F Totale Titolo di studio 1 25 22 38 28 22 26 161 2 20 24 34 36 17 7 138 3 15 16 19 25 17 9 101 Totale 60 62 91 89 56 42 400

Verificare lipotesi che le aziende del settore elettronico abbiano stessa proporzione dei tre titoli di studio dei rispettivi dipendenti. 21. Su un campione casuale semplice di 200 dati della variabile doppia X,Y, sono stati stimati la covarianza, che risultata pari a 12, la varianza della X, pari a 26 e quella della Y pari a 58. Si chiede di determinare: a) la quota della varianza della variabile Y spiegata dalla X e b) di verificare, al livello del 5%, se tale quota differisca significativamente da zero. 22. Un gruppo di 400 soggetti, costituenti un campione casuale di utenti di un dato servizio, sono per il 40% con et maggiore di 60 anni. Tra questi ultimi, il 40% si dichiarato soddisfatto del servizio; si invece dichiarato soddisfatto del servizio solo il 30% dei soggetti con et non superiore a 60 anni. Si chiede: a) di misurare il grado di connessione tra l'et ed il giudizio (soddisfatto/non soddisfatto) espresso su quel servizio; b) di verificarne la significativit al livello del 5%. 23. Dei dati di un campione casuale di 16 unit della variabile doppia X,Y si conoscono i seguenti elementi:

x = 239 x
2

= 4035

y = 229 y
2

= 3677

Si conosce inoltre il coefficiente della regressione lineare, b=0,2738, che lega la variabile Y (dipendente) alla X (indipendente). Si chiede: a) di saggiare la significativit del coefficiente b; b) di determinare quanta parte della varianza di Y spiegata da X. 24. La tabella che segue riporta la distribuzione di un campione casuale di 160 unit di una variabile doppia X,Y. Sia la variabile X che la variabile Y sono qualitative. Misurare il grado di dipendenza tra le due variabili e verificare, al livello del 5%, lipotesi di indipendenza tra esse. X XA XB XC XD TOTALE YA 4 3 2 10 19 YB 19 5 7 5 36 Y YC 9 16 9 8 42 YD 3 7 15 13 38 YE 1 2 4 18 25 TOTALE 36 33 37 54 160

25. Si conoscono i seguenti dati che si riferiscono ad un campione casuale semplice di 15 dati della v.c. doppia X,Y: X: 12 13 15 16 17 18 18 19 20 20 21 22 24 25 27 Y: 92 90 91 89 88 89 86 83 85 82 81 80 81 78 76 Determinare la stima dellequazione di regressione lineare Y= + X e dare una previsione, con intervallo di confidenza al 95% per un valore individuale di Y per X=28.

26. La tabella seguente riporta i risultati di una indagine campionaria per valutare il grado di soddisfazione delle condizioni di lavoro di tre diverse categorie professionali di una grande azienda. Si vuole stabilire se vi una significativa differenza nel grado di soddisfazione al variare della categoria professionale. Professione Operai Impiegati Quadri e Dirigenti TOTALE Insoddisfatto/a 23 8 1 32 Soddisfazione TOTALE Soddisfatto/a Molto soddisfatto/a 19 4 46 26 9 43 2 8 11 47 21 100

27. In unazienda operano tre macchine A, B e C con tre turni di lavoro. Si sono rilevati i fermi macchina per un periodo di sei mesi, come risultano dalla tabella che segue. TURNI Primo Secondo Terzo TOTALI MACCHINE B C 17 2 25 7 23 6 65 15 TOTALI 29 42 49 120

A 10 10 20 40

Verificare, al livello di significativit del 5%, se la macchina che ha provocato il fermo e il turno di lavoro in cui avvenuto sono da considerare cause indipendenti. 28. In una fabbrica il materiale immagazzinato in ambiente senza controllo di umidit. Per 10 giorni vengono misurate lumidit del locale e la quantit dacqua assorbita dal materiale. I dati ottenuti sono i seguenti: Umidit (%) Acqua assorbita (ml/Kg) 46 53 29 61 36 39 47 49 52 38 12 15 7 17 10 11 11 12 14 9

Mediante un modello di regressione lineare stimare, con un intervallo di confidenza al 95%, il livello medio dellacqua che sarebbe assorbita dal materiale immagazzinato se si impiantasse nel locale un sistema deumidificante in grado di mantenere il livello di umidit al 25%. Misurare infine la correlazione tra le due variabili e verificarne la significativit al 5%. 29. La tabella che segue riporta la distribuzione di un campione di 50 dati estratti a caso da una variabile doppia X,Y. Determinare la linea di regressione di Y su X e saggiare la significativit del coefficiente di regressione al livello del 5%. X 3 4 5 6 Totale Y 150 2 160 5 6 2 13 170 3 4 9 8 24 180 2 3 6 11 Totale 10 12 14 14 50

30. A ciascuno di 16 studenti universitari in corso si chiede di rispondere alle due seguenti

domande: - A che anno di corso sei iscritto? - Quanti libri di testo hai acquistato in questo anno di corso? Le due risposte di ciascuno studente sono riportate di seguito: Anno di corso : 1 2 1 3 1 3 2 1 3 2 1 2 3 2 3 2 N. di libri : 5 6 5 7 6 7 7 6 7 7 6 7 8 7 8 7 c) Organizzare i dati in tabella a doppia entrata. d) Costruire la banda di confidenza al 95% per la funzione di regressione del numero dei libri in funzione dellanno di corso. e) Misurare il coefficiente di correlazione lineare tra le due variabili e saggiarne la significativit al livello del 5%. 31. Per valutare la diffusione di un settimanale tra gli studenti, si sono intervistati 500 studenti medi, 300 studenti delle superiori e 200 studenti universitari scelti a caso e si stimato che il settimanale acquistato dal 10% degli studenti medi, dal 20% degli studenti delle superiori e dal 5% degli universitari. Si chiede di: a) costruire la tabella a doppia entrata 3x2 Livello istruzione x Acquirenti; b) saggiare lipotesi di indipendenza tra i due caratteri al livello del 5%. 32. Per studiare la relazione tra ipertensione e fumo stato esaminato un campione di 180 soggetti e rilevato i seguenti dati:
IPERTENSIONE SI NO TOTALI SOGGETTI Non Fumatori Grandi TOTALI Fumatori moderati fumatori 20 37 28 85 50 27 18 95 70 64 46 180

Verificare, al livello di significativit del 5%, se ipertensione e fumo sono da considerare fattori indipendenti. 33. Calcolare i coefficienti di correlazione lineare tra le variabili dicotomiche X e Y nei casi in cui la loro distribuzione doppia sia rappresentata dalle seguenti quattro tabelle:
X 0 1 Totale X 0 1 Totale X 0 1 Totale Y 0 1 2 3 Y 0 0 1 1 Y 0 1 1 2 1 1 1 2 1 1 1 2 1 2 1 3 Totale 3 3 6 Totale 1 2 3 Totale 2 2 4

X 0 1 Totale

Y 0 2 1 3 1 1 2 3

Totale 3 3 6

34. In una fabbrica si produce un materiale igroscopico, che va immagazzinato in ambienti a temperatura controllata. Per decidere sulla temperatura ottimale per tenere lumidit sotto controllo, in 10 magazzini si effettua lesperimento di tenere il materiale a diversa temperatura per una settimana, dopo di che si misurata lumidit dei materiali immagazzinati. Le misurazioni di umidit su 10 campioni di materiali tenuti alle 10 diverse temperature sono risultate le seguenti: Temperatura (C) Umidit (%) 10 12 14 16 18 20 22 24 26 28 30 33 26 26 25 23 24 22 20 19

Ammettendo che tra umidit e temperatura intercorra una relazione lineare stimare, con un intervallo di confidenza al 95%, il livello medio dellumidit se il materiale fosse immagazzinato alla temperatura di 23 C. Misurare infine quanta parte della variabilit dellumidit spiegata dalla temperatura ambiente e verificarne la significativit al livello del 5%. 35. In 12 anni successivi in un dato paese si sono rilevati la spesa per consumi aggregata (Y in miliardi di Euro) e il reddito aggregato disponibile (X pure in miliardi di Euro). I dati in sequenza sono i seguenti: Y: 102 106 108 110 122 124 128 130 142 148 150 154 X: 114 118 126 130 136 140 148 156 160 164 170 178 Si chiede di: a) rappresentare i dati osservati e determinare la relazione lineare di Y in funzione di X, b) dare una stima intervallare al 95% per la spesa media per consumi con un reddito disponibile di 180 miliardi di Euro, c) stimare quanta parte della varianza della Y spiegata dalla regressione con la X e saggiarne la significativit al livello del 5%. 36. In unindagine di mercato sulla vendita di cravatte, si rilevato che in un campione di 200 acquirenti 60 erano di et inferiore a 30 anni e che il 35% delle cravatte vendute erano di seta. Si rilevato inoltre che il 25% degli acquirenti di et superiore a 30 anni aveva acquistato una cravatta di seta. Ci si domanda, al livello di significativit dell1%, se let dellacquirente influisca sulla scelta della qualit della cravatta. 37. Per un campione di 10 famiglie di quattro persone, con il solo capofamiglia impiegato statale, stato rilevato il reddito annuo lordo e lammontare annuo del reddito risparmiato. I dati ottenuti sono: Reddito (Eurox1000) 40 46 48 52 58 62 64 68 75 78 Risparmio (Eurox1000) 1 3 6 5 2 10 8 12 8 12

Determinare la relazione lineare tra reddito e risparmio, saggiare la significativit della regressione e stimare, con un intervallo di confidenza al 95%, lammontare del risparmio per una famiglia di quattro persone, col solo capofamiglia impiegato statale, e con un reddito annuo lordo di 70 mila euro. Misurare infine quanta parte della variabilit dellammontare risparmiato spiegata dal reddito annuo lordo e verificarne la significativit al livello del 5%.

38. In una indagine di mercato, si chiesto ad un campione di soggetti: a) il numero di volte in cui mensilmente si recano in un supermarket per acquisti alimentari b) limporto medio della spesa per ciascuna volta in cui si reca in un supermercato Le risposte di un campione casuale di 15 intervistati sono riportate di seguito: N. volte : 5 4 4 6 Spesa media: 25 36 28 37 7 36 5 57 6 27 7 26 4 70 5 47 6 56 5 42 4 80 5 67 4 68

c) Costruire la banda di confidenza al 95% per la funzione di regressione della spesa media in funzione del numero di volte in cui mensilmente ci si reca in supermarket. d) Determinare quanta parte della variabilit della spesa attribuibile al numero delle volte in cui mensilmente ci si reca al supermarket. e) Misurare il coefficiente di correlazione lineare tra le due variabili, saggiandone la significativit al livello del 5%. 39. In una indagine di mercato si sono intervistati 800 impiegati pubblici, 300 ministeriali, 200 regionali e 300 comunali scelti a caso e si stimato che si reca a pranzo in un fast food nelle vicinanze del luogo di lavoro il 10% dei ministeriali, dal 20% dei regionali e dal 5% dei comunali. Si chiede di: a) costruire la tabella a doppia entrata 3x2 Tipo impiego x Luogo pranzo; b) saggiare lipotesi di indipendenza tra i due caratteri al livello del 5%. 40. Un impianto produce pezzi la cui lunghezza e spessore. Su un campione di 16 pezzi si sono misurati Lunghezza e Spessore in millimetri ed ottenuto i dati seguenti: No. Unit: Lunghezza: Spessore: 1 2 3 4 5 6 7 8 9 10 11 86 24 12 87 23 13 88 24 14 89 24 15 86 22 16 86 23 88 89 87 23 22 24 87 88 88 89 87 86 88 22 24 23 24 22 23 23

a) Determinare la relazione lineare tra lo Spessore (variabile dipendente) e la Lunghezza (variabile indipendente); b) Stimare con un intervallo di confidenza al 95% lo Spessore medio in corrispondenza di un pezzo di Lunghezza 90 millimetri; c) Calcolare il coefficiente di correlazione tra Lunghezza e Spessore e saggiarne la significativit al livello del 5%. 41. La tabella che segue riporta la distribuzione di un campione casuale semplice di 160 soggetti ai quali stato chiesto di valutare la qualit del servizio clienti di una compagnia telefonica. Valutare se il giudizio espresso sia indipendente dalla categoria alla quale ciascun intervistato appartiene. Qualit Scadente Buono Ottimo TOTALI Categorie intervistati TOTALI Studenti Impiegati Commercianti 27 31 32 90 13 20 17 50 30 19 11 60 70 70 60 200

42. I dati di un campione casuale di 2000 occupati, distinti per settore di attivit economica e per genere, figurano nella tabella che segue. Verificare lipotesi che l'occupazione per settore di attivit non dipenda dal genere.

Settori di attivit economica Agricoltura Industria Altre attivit Totale

Genere Maschi Femmine 145 81 527 162 654 431 1326 674

Totale 226 689 1085 2000

43. In 12 paesi si sono rilevati i tassi di inflazione in un dato anno (X) e i consumi di un dato prodotto espresso in quintali. (Y). I dati rilevati sono i seguenti: X: 1,4 1,6 1,5 1,1 1,2 1,4 1,8 1,3 1,2 1,5 1,7 1,3 Y: 115 118 126 130 136 140 148 156 160 164 170 177 a) Determinare la relazione lineare di Y in funzione di X, e b) dare una stima intervallare al 95% per il consumo medio di quel prodotto per un tasso di inflazione dell1,9%. 44. In unindagine di mercato sulle vendite di videogame, si rilevato che in un campione di 180 videogame, 120 erano stati acquistati da persone di et inferiore a 20 anni, 100 erano di marca giapponese e che 70 videogame giapponesi erano stati acquistati da soggetti di et inferiore a 20 anni. Ci si domanda, al livello di significativit dell1%, se let dellacquirente influisca sulla scelta del tipo di videogame (giapponese o no). 45. In una indagine di mercato sulle vendite di automobili, si rilevato che in un campione di 150 auto vendute, 60 erano state acquistate da persone di et inferiore a 30 anni, 50 erano di marca non italiana e che 40 auto di marca italiana erano state acquistate da soggetti di et inferiore a 30 anni. Ci si domanda, al livello di significativit dell1%, se il tipo di auto acquistata (nazionale o estera) non dipenda dallet dellacquirente. 46. In una indagine per studiare la relazione tra ipertensione e fumo, si sono rilevati 86 soggetti ipertesi dei quali 20 non fumatori, 38 moderatamente fumatori e 28 grandi fumatori. Per confronto si sono rilevati 95 soggetti non ipertesi dei quali si determinato che 50 sono non fumatori, 27 fumatori moderati e 18 grandi fumatori. Verificare, al livello di significativit del 5%, lipotesi che lipertensione sia indipendente dal fumo. 47. In unindagine per studiare la relazione tra problemi respiratori e fumo, si sono rilevati 100 soggetti con problemi respiratori tra i quali 20 non sono fumatori, 36 sono moderatamente fumatori e 44 grandi fumatori. Per confronto si sono rilevati 100 soggetti senza problemi respiratori e si registrato che tra essi 50 non sono fumatori, 27 sono fumatori moderati e 23 grandi fumatori. Verificare, al livello di significativit del 5%, lipotesi che i problemi respiratori non siano connessi al fumo. 48. Da un dossier della magistratura sulla corruzione di politici e amministratori, si rilevano let in anni del magistrato e il numero di politici e amministratori indagati negli ultimi cinque anni: Et in anni : 52 43 37 40 53 55 49 45 42 57 49 30 50 35 30 49 30 N. indagati : 21 45 60 51 15 4 21 29 49 0 26 81 26 67 85 19 74 a) Determinare se esista una relazione lineare tra le due variabili e verificarne la significativit. b) Misurare la correlazione tra le due variabili e saggiarne la significativit. c) Prevedere, con intervallo di confidenza al 95%, il numero degli indagati per un magistrato di et 58 anni.

49. Per un campione casuale di 12 donne si sono rilevati let e la pressione arteriosa sistolica alle ore 11: Et: 56 42 Pressione: 147 125 72 160 36 118 63 149 47 128 55 150 49 145 38 115 42 140 68 152 60 155

Determinare la relazione lineare tra la pressione e l'et e stimare, con intervallo di confidenza al 95%, la pressione sistolica alle ore 11 di una donna di et 45 anni. Verificare inoltre l'ipotesi che l'et non contribuisca significativamente alla spiegazione della variabilit della pressione sistolica ( = 0,05). 50. La tabella seguente riporta i dati delle societ della provincia di Pavia al censimento 1981 distinte per
forma societaria e ramo di attivit. Si vuole stabilire se vi una significativa differenza nella tipologia societaria al variare del ramo di attivit. Ramo di attivit Industria Commercio Trasporti e comun. Credito e assicuraz. TOTALE SpA 323 81 12 25 441 Srl 437 255 19 74 785 Tipo di societ In accomandita In nome collettivo 145 618 163 381 12 64 33 38 353 1101 TOTALE 1523 880 107 170 2680