Sei sulla pagina 1di 37

RenatoAgatiAppuntidiStatistica

Pagina2

CONTENUTI

LASTATISTICA
LaStatistica

Lefasidiunindaginestatistica o Definizionedelfenomeno o Individuazionedellapopolazione o Levariabilistatistiche o Lescaledimisurazione o Rilevamentodeidati Elaborazioneerappresentazionedeidati o Costruzionedelletabelledellefrequenze o Rappresentazionegrafica Gliindicatoristatistici:indicidiposizione o Moda o mediaaritmetica o Mediana o Quantili Gliindicatoristatistici:indicididispersione o Campodivariazione o Scartosemplicemedio o Varianza o Deviazionestandard

RenatoAgatiAppuntidiStatistica

Pagina3

RenatoAgatiAppuntidiStatistica

Pagina4

LASTATISTICA
La statistica una scienza nata per analizzare e descrivere i fenomeni dimportanza sociale che riguardanounoStato. Oggivieneapplicataintuttiqueicampidoveintervengonofenomenicollettivideltuttocasuali,la cui mancanza di ripetitivit ne rende impossibile lo studio attraverso la sperimentazione scientifica. Sono fenomeni collettivi quei fatti, avvenimenti o situazioni che abbracciano un numero sufficientementegrandedifenomeniindividualifralorougualiosimili. Ad esempio, il fatto che Antonio alto cm 145 un fenomeno individuale mentre laltezza dei ragazzidellastessaetdiAntoniodituttelescuolediunpaeseunfenomenocollettivo. Ilfattocheiovengoascuolainautofenomenoindividuale.Ilmezzoutilizzatodatuttiidocentie alunnidellamiascuolaunfenomenocollettivo. Laumento della popolazione di uno stato, la comparsa di una certa malattia in un determinato ambiente, la diminuzione dei posti di lavoro in un particolare settore, sono quindi fenomeni collettivi, e la conoscenza delle caratteristiche o dellandamento di un fenomeno collettivo pu avveniresoloattraversolastatistica: Lastatisticalascienzachestudiaifenomenicollettividivariogenere.Essaraccoglie,analizzae interpreta (utilizzando metodi e strumenti matematici) le informazioni riguardanti il particolare fenomenoconsiderato,nemisuraestudiacertecaratteristicheepermettedifareprevisionisul futuroosullandamentodelfenomenostesso.

RenatoAgatiAppuntidiStatistica

Pagina5

Edaprecisareche,nelsuocomplesso,lastatisticanondrisultaticerti,maarrivasoloafaredelle previsioni su determinati fenomeni, previsioni che teoricamente sono certe ma anche quasi sicuramentecerte:occorrequindifarelevalutazioniconladovutaattenzione. Lastatisticadquindidelleprevisionipermettendodiprogrammaresoluzioniointerventiadatti. (es.laumentodiunamalattia).

RenatoAgatiAppuntidiStatistica

Pagina6

FASIDIUNINDAGINESTATISTICA
Unindaginestatistica,seppurbendefinitanelfenomenopresoinconsiderazione,puessereresa non appropriata o pu essere totalmente vanificata da una raccolta dei dati non corretta o una loropresentazioneinadeguata. Perevitareci,beneseguireunoschemaprecisoche,inlineadimassima,basatosullosviluppo diquattroFASIessenzialichesono: definireinmanieraesattaecompletailfenomenosucuisivuoleindagare; individuarelapopolazioneinteressataalfenomenosucuisiindaga; rilevareeraccogliereinmanieraappropriataidati; elaborareeinterpretareidatiraccoltierappresentarligraficamente. Queste fasi devono essere affrontate nella sequenza indicata: raccogliere dati prima di aver chiaramenteespressolefinalitdellindaginepufacilmentecondurreaanalisieinterpretazione deidatinonadeguatiequindiarisultatipocoattendibili.

DEFINIZIONEDELFENOMENO
Il primo passo la definizione del fenomeno su cui vogliamo indagare precisando anche, con accuratezza,iparticolariaspettichesivoglionoanalizzare. Elafaseinizialeepiimportanteaifinidiunpiprecisoproseguimentodellindaginestessa,in quanto bisogna predisporre, logicamente e praticamente, il tipo di indagine pi adatta al conseguimentodeinostriobiettivi. Seperesempiovogliamoprendereinesameilfenomenodistribuzionedemograficainunacitt saropportunoprecisaresevogliamounesamecheriguardi: lacaratteristicanumericacomplessiva(numerodiabitanti)
RenatoAgatiAppuntidiStatistica Pagina7

lacaratteristicanumericapersesso(numeromaschienumerofemmine) lacaratteristicanumericasecondoilreddito lacaratteristicanumericasecondolattivitlavorativa ecc.

INDIVIDUAZIONEDELLAPOPOLAZIONE
Definito il fenomeno, va indicata chiaramente la collettivit a cui il fenomeno si riferisce e sulla qualeverrquindisvoltalindagine. Tale collettivit in termini statistici si chiama popolazione statistica o, semplicemente, popolazione;ognisingoloelementodellapopolazionesichiamaunitstatistica. Si definisce popolazione qualsiasi insieme di elementi, reale o virtuale, che forma oggetto di studio. Costituisconounapopolazione,adesempio: Edifondamentaleimportanza(nonchindicatorediserietdellaricerca)definireesattamentela popolazionediriferimentodellindagine. glialunnidiunaclasse; gliimpiegatidiunazienda; tuttiiresidentinelcomunediTorinoil31/12/2007; lemalattietipichediunacertaregione.

RenatoAgatiAppuntidiStatistica

Pagina8

LEVARIABILISTATISTICHE
Se consideriamo una popolazione statistica, es. gli impiegati di unazienda, ogni unit statistica (ogniimpiegato)differiscedaunaltraunitperunaopicaratteristiche:ilsesso,lattivitsvolta,il mezzoditrasportoperrecarsiinazienda,lostatocivile,ilnumerodifigli,ecc. Queste caratteristiche prendono il nome di variabili statistiche ed rispetto ad una o pi di questevariabilichesieffettualindaginestatistica. Levariabilistatistichepossonoessere: variabiliquantitative,seespressedaunnumero variabiliqualitative,senonpossonoessereespressedaunnumero(statocivile,ilsesso,mezzodi trasporto,attivitsvolta,..) Sonopertantovariabiliquantitative: mentrelevariabiliqualitativepossonoessere: Possiamoquindidireche: Lindaginestatisticalostudiodiunfenomenocollettivo.Talestudioconsistenellanalizzarecome unapopolazionestatisticasidistribuiscerispettoadunacertavariabilestatistica. lostatocivile ilsesso ilmezzoditrasporto lattivitsvolta let ilnumerofigli lostipendiopercepito

RenatoAgatiAppuntidiStatistica

Pagina9

RILEVAMENTODEIDATI
Il fenomeno, la popolazione e la/le variabili statistiche su cui vogliamo indagare ci suggeriranno comemeglioprocederenellafasedirilevamentodati. Ilrilevamentodatipuesseredirettoocompletosevieneeseguitodirettamentesututteleunit statistiche che formano la popolazione interessata al fenomeno. Ci possibile quando la popolazione formata da un numero non eccessivo di unit e ogni unit statistica pu quindi essere contattata e intervistata. Fanno eccezione i censimenti e le indagini su nascite, morti, matrimoni(attraversogliarchivistatali). Spesso per lintera popolazione talmente vasta da non permettere il rilevamento diretto per varimotivi(costi,tempi,disponibilitditutteleunitstatistiche).Sidevepertantosceglierealsuo internounaparteridottadiunitstatistiche,ovverounopportunocampionerappresentativo,su cuisieseguirlindagine.Inquestocasosiparladirilevamentoindirettoopercampione,perch vieneeseguitosolosuunapartepiomenoestesadellapopolazione. La scelta del campione rappresentativo un momento molto importante e delicato, che deve tenerecontodialcunifattori: ilnumerodicampionideveesseretaledarendereattendibiliirisultati; lasceltadeicampioninondeverendereselettivalindaginestessa; i risultati ottenuti sul campione non devono provocare errori di valutazione quando vengonoestesiatuttalapopolazione. Per il numero dei campioni in genere si decide per una percentuale veramente rappresentativa, chenonsianristrettaninutilmentevasta. Perlasceltadelcampionesiricorreingenerea: rilevamentocasuale:sieffettuaestraendoacasoicampionidallinterapopolazione;senonesiste alcunvincolodiconvenienza(economica,sociale,ecc.)chepotrebbeimporrelasceltaragionatadi unoodellaltrocampione,icampionivengonodecisidalcaso.

RenatoAgatiAppuntidiStatistica

Pagina10

rilevamentostratificato:sieffettuasuddividendolapopolazioneinpistrati,oclassi,escegliendo a caso, in ognuno di essi, singoli campioni che complessivamente formano i campioni dellindagine. In ogni strato il numero dei campioni da scegliere sar proporzionale al numero totaledeglielementidellaclassestessa. Se per esempio si vuole indagare sul fenomeno reddito degli abitanti di una regione, opportuno fare il campionamento stratificato in quanto il reddito varia secondo alcuni strati o classidellapopolazione,straticheinquestocasosonolediverseattivitlavorative. Per una corretta e completa raccolta dati dobbiamo definire non solo il metodo di rilevamento (direttoopercampionamento)elevariabilistatistiche(quantitativeequalitative)gidescrittein precedenza,maanchealtricriteridiclassificazionequalilecosiddettescaledimisurazione.

LESCALEDIMISURAZIONE
Levariabilipossonoessereclassificateancheinbaseallascaladimisurazioneo,inaltreparole,alle operazionichesipossonofareconleloromodalit. Esistono quattro scale: la scala nominale, la scala ordinale, la scala per intervallo, la scala per rapporto. Scalanominale Lemodalitnonhannounordinamento(ilcasodellevariabiliqualitative) Esempi: giudiziosuunfilm:bello/brutto; si/no; coloredegliocchi;

RenatoAgatiAppuntidiStatistica

Pagina11

Scalaordinale Lemodalitsonoattributinonnumericimalogicamenteordinabili Esempi: titolodistudio; livellodisoddisfazioneperunprodotto(perniente,poco,abbastanza,ecc..); Scalaperintervallo Sonolevariabiliquantitativecheconsentonoconfrontisoloperdifferenzamanonperrapporto. Peresempio,semisuriamoungiornolatemperaturaminimaemassimaaTorinoeaNewYorkpotremmo


ottenereiseguentivalori: SevogliamoconfrontareletemperaturediTorinoediNewYork,hasensodirechelescursionetermica lastessanelleduecitt,manonhasensodirechelaminimaaNewYorklametdellaminimaaTorino. Torino NewYork
Temp. massime Temp. minime

25 17

16 8

Scalaperrapporto Sonovariabilinumericheperlequaliintrinsecaladefinizionedellozero. Esempisonoilpeso,laltezza,lalunghezza,laconcentrazione. Inquestocasolemodalitpossonoessereconfrontateperrapporto. Peresempio,sipuaffermarechelaconcentrazionedicloroinuncampionediacquadoppia rispettoaquelladiunaltrocampione.

RenatoAgatiAppuntidiStatistica

Pagina12

GLISTRUMENTI
Sceltoilmetodoperilrilevamentodati,direttoopercampionamento,sipassaallaraccoltadelle informazionichepuavveniretramite: interviste: si pongono a ciascuna unit statistica delle precise domande in merito al fenomenoesiregistranolerelativerisposte; questionari:sidistribuisceaciascunaunitstatisticaunquestionariochesuccessivamente vieneritiratoconlerisposte; consultazionediarchiviopubblicazionispecializzate. Sar pertanto necessario preparare gli opportuni strumenti per registrare facilmente i dati che dovremoraccogliere. Imoduliperlintervistadovrannoconsentircidisegnarevelocementelerispostecheotteniamo: unmodulogiorganizzatoacrocettecifarrisparmiaretemposiadurantelintervista,siadopo, quandodovremoelaborareidatiraccolti.Dicontro,unmodulocheciobbligaascriverecicheci rispondelapersonaintervistatafarsolamentespazientirelapersonastessa. Nella creazione e definizione di un questionario si deve invece porre attenzione a come la domanda viene formulata, affinch chi lo compila possa poter rispondere senza possibilit di equivoci. Esuperfluoprecisarecheiquestionari,essendocompilatisenzalapresenzaeassistenzadichista conducendolindaginestatistica,sonogeneralmentebasatisurispostepredefinitedacrocettare. Nelle pagine seguenti viene riportato, come esempio, il questionario che la casa automobilistica SEATinviaaisuoiclientiperindagaresullaqualitdelserviziodiassistenza.

RenatoAgatiAppuntidiStatistica

Pagina13


RenatoAgatiAppuntidiStatistica Pagina14

RenatoAgatiAppuntidiStatistica

Pagina15

RenatoAgatiAppuntidiStatistica

Pagina16

ELABORAZIONEERAPPRESENTAZIONEDATI
Questafase,nelsuocomplesso,abbracciadiversimomenti: Si dice dato statistico una qualsiasi informazione di cui si conosce il numero di volte con cui si ripeteinunindagine. Asecondadeidatistatisticiraccoltiedellelaborazionecheintendiamoeffettuareelaborazione che dipende anche dagli obiettivi della nostra indagine statistica possiamo creare vari tipi di tabelle: tabellasempliceotabelladifrequenzaassoluta tabelladellefrequenzerelative tabellamultiplaetabellaadoppiaentrata tabellaperclassi. sivadalriscontrodelleinformazioniallorospoglioperricavareiveridatistatistici; sipassaallalorotrascrizioneinappositetabelle; dallesamediquestetabellesiarrivaallelaborazioneveraepropriadeidati; siconcludeconlarappresentazionedeirisultatidellindaginemedianteopportunigrafici.

RenatoAgatiAppuntidiStatistica

Pagina17

LETABELLE
Tabellasemplice(tabelladifrequenzaassoluta)
Nome Maria Giulio Mario Ernesto Giorgio Elena Vittorio Marco Eleonora Fabio Ettore Massimo Cristian Rossana Elisabetta Roberto Walter Nicoletta Sara Nicola Altezza 145 148 149 151 140 148 149 151 145 140 149 151 145 149 138 145 140 152 145 148

Supponiamo di aver indagato sul fenomeno altezza dei ragazzi della classeIIIdiunascuolamediaediavereraccoltoinformazionirelative a20campioniscelti,comedatabellaquiasinistra: Eseguiamo successivamente lo spoglio delle informazioni realizzando una tabella dove nella prima colonna scriveremo tutte le altezze registrate e nella seconda colonna, sulla stessa riga, il numero dei ragazzichepresentanoquellaltezza. La tabella che otteniamo riportata qui adestra:
Altezza 138 140 145 148 149 151 152 TOTALE Numero ragazzi 1 3 5 3 4 3 1 20

Abbiamo ottenuto una tabella semplice di dati statistici, in grado di fornirci gi inimmagine del fenomeno. Idatiriportatinellasecondacolonna(numerodeiragazzi)rappresentanolafrequenzaassolutadi ciascundato(altezza),ovveroilnumerodivolteconcuiildatosipresentanellindagine.

RenatoAgatiAppuntidiStatistica

Pagina18

Tabelladellefrequenze Nelparagrafoprecedenteabbiamorealizzatounatabellaconindicatoilnumerodivolteconcuiun dato si presenta nellindagine, ovvero abbiamo indicato per ciascun dato la sua frequenza assoluta. Puessereavolteopportunoindicareperciascundatoilrapportotralasuafrequenzaassolutae iltotaledeicasiesaminati.Intalcasosiparladifrequenzarelativadiundato,chevieneespressa inpercentuale. Perottenerelafrequenzarelativadiundatosiapplicalaseguenteformula: frequenzarelativa=(frequenzaassoluta/totalecasi)*100 Applicandotaleformulaallanostratabelladellealtezzedi20ragazziotteniamoquantosegue:
Altezza 138 140 145 148 149 151 152 TOTALE Numero ragazzi 1 (1/20)*100=5 3 (3/20)*100=15 5 (5/20)*100=25 3 (3/20)*100=15 (4/20)*100=20 4 (3/20)*100=15 3 (1/20)*100=5 1 20 Altezza 138 140 145 148 149 151 152 TOTALE
Frequenza Frequenza assoluta relativa

1 3 5 3 4 3 1 20

5% 15% 25% 15% 20% 15% 5% 100%

RenatoAgatiAppuntidiStatistica

Pagina19

Tabellamultiplaetabellaadoppiaentrata Negli esempi fin qui riportati non abbiamo preso in considerazione il fatto che gli alunni del campione selezionato sono sia maschi che femmine e che il fenomeno altezza pu essere influenzatodallavariabilestatisticadelsesso. E opportuno prevedere ci in fase di definizione dellindagine, per raccogliere i dati in maniera opportunaerealizzare,pertantounatabellamultiplacomelaseguente:
Altezza 138 140 145 148 149 151 152 TOTALE Numero Numero ragazzi ragazze 0 3 2 2 3 3 0 13 1 0 3 1 1 0 1 7

Anche in questo caso posiamo, oltre alle frequenze assolute, calcolare e riportare in tabella le frequenzerelative:
Altezza 138 140 145 148 149 151 152 TOTALE Numeroragazzi totale% 0 3 2 2 3 3 0 13 0,0 23,1 15,4 15,4 23,1 23,1 0,0 100,0 Numeroragazze totale% 1 0 3 1 1 0 1 7 14,3 0,0 42,9 14,3 14,3 0,0 14,3 100,0

Questatabelladettatabellamultiplaadoppiaentrata: multiplaperchilfenomenoaltezzastatosuddivisoindueentrate(ragazzieragazze); a doppia entrata perch per ogni entrata abbiamo una suddivisione in due colonne, quella dellefrequenzeassoluteequelladellefrequenzerelative.

RenatoAgatiAppuntidiStatistica

Pagina20

Tabellaperclassi Supponiamo di eseguire unindagine sul fenomeno altezza dei ragazzi delle classi quinte di un liceoediraccogliereiseguentivalori:
1,50 1,61 1,72 1,65 1,80 1,72 1,60 1,76 1,57 1,78 1,69 1,64 1,65 1,58 1,62 1,66 1,81 1,73 1,70 1,77 1,68 1,61 1,59 1,68 1,66 1,62 1,85 1,71 1,68 1,82 1,57 1,79 1,65 1,54 1,81 1,63 1,71 1,70 1,85 1,70 1,61 1,69 1,67 1,55 1,73 1,54 1,65 1,69 1,67 1,78 1,58 1,68 1,60 1,82 1,75 1,74 1,73 1,74 1,80 1,85

Come si pu prevedere, lelaborazione di questi dati potrebbe non essere semplice in quanto le informazionisononumericompletamentediversitraloro.Calcolarelafrequenzaolapercentuale difrequenzarisulterebbenonsololaborioso,masopratuttopocosignificativo. Incasidelgeneresiprocedecompattandoirisultatiingruppierealizzandotabellesuddiviseper classi.Vediamocomeprocedere. Innanzituttodobbiamoriscrivereidatiinordinecrescente:
1,50 1,60 1,65 1,69 1,73 1,79 1,54 1,61 1,65 1,69 1,73 1,80 1,54 1,61 1,66 1,69 1,73 1,80 1,55 1,61 1,66 1,70 1,74 1,81 1,57 1,62 1,67 1,70 1,74 1,81 1,57 1,62 1,67 1,70 1,75 1,82 1,58 1,63 1,68 1,71 1,76 1,85 1,58 1,64 1,68 1,71 1,77 1,82 1,59 1,65 1,68 1,72 1,78 1,85 1,60 1,65 1,68 1,72 1,78 1,85

Consideriamo lintervallo numerico tra il dato pi piccolo e quello pi grande, cio 1,50 1,85; essorappresentailcampodivariazionedellavariabilestatisticaconsiderata. Consideriamogliestremidelcampodivariazioneeeseguiamolalorodifferenzachevale0,35m (1,85 1,50 = 0,35). Questa differenza detta ampiezza del campo di variazione, cio lampiezzadelraggruppamentodituttiidati. Suddividiamolampiezzainopportuniintervalliuguali,adesempiootto,ottenendochelampiezza diciascunintervallovale0,04m(0,35/8=0,04)

RenatoAgatiAppuntidiStatistica

Pagina21

Possiamoaquestopuntodefinireleottoclassidialtezzachesono: 1aclasse:1,501,54(da1,50a1,50+0,04) 2aclasse:1,551,59(da1,55a1,55+0,04) 3aclasse:1,601,64(da1,60a1,60+0,04) 4aclasse:1,651,69(da1,65a1,65+0,04) 5aclasse:1,701,74(da1,70a1,70+0,04) 6aclasse:1,751,79(da1,75a1,75+0,04) 7aclasse:1,801,84(da1,80a1,80+0,04) 8aclasse:1,851,89(da1,85a1,85+0,04) Inquesteottoclassisistemiamolanostrapopolazione:basterconsiderareglialunniappartenenti ad ogni classe per avere la frequenza della classe, ovvero la distribuzione di frequenza del raggruppamentodati.
Frequenza Frequenza Classidi assoluta relativa altezza 1,501,54 3 5 1,551,59 6 10

1,601,64 1,651,69 1,701,74 1,751,79 1,801,84 1,851,89 TOTALE

9 15 12 6 6 3 60

15 25 20 10 10 5 100

RenatoAgatiAppuntidiStatistica

Pagina22

LERAPPRESENTAZIONIGRAFICHE
Idatiraccoltinelletabellepossonoessererappresentatigraficamente. Igraficipiutilizzatisonogliistogrammi,igraficiabarre,igraficiatortaeigraficialinea. Lasceltadelgraficodipendedaltipoditabellecheabbiamocreato. Esistonovariprogrammisoftwareche,partendodallaseriedeidatiraccoltiintabella,realizzano automaticamente il grafico desiderato. Generalmente sono i programmi per lelaborazione dei cosiddettifoglielettronici. I pi popolari sono Microsoft Excel (contenuto nel pacchetto Microsoft Office, a pagamento) e OpenOfficeCalc(softwareditipoopensource,totalmentegratuito). Tabellasemplice(tabelladifrequenzaassoluta) In questo caso il grafico pi opportuno listogramma, serie di barre verticali la cui altezza proporzionalealvaloredellafrequenza.
Altezza 138 140 145 148 149 151 152 TOTALE Numero ragazzi 1 3 5 3 4 3 1 20

RenatoAgatiAppuntidiStatistica

Pagina23

Tabelladellefrequenzerelative Inquestocasoilgraficopiopportunolatortachedunimmediatomessaggiovisivodicomei datistatisticisonodistribuitilunorispettoaglialtri.

Altezza 138 140 145 148 149 151 152 TOTALE

Frequenza Frequenza assoluta relativa

1 3 5 3 4 3 1 20

5% 15% 25% 15% 20% 15% 5% 100%

Tabellamultipla Ancheperletabellemultiplelistogrammarappresentailgraficopiadatto. Si possono realizzare due tipi di istogrammi, a barreaffiancateeabarresovrapposte.


Altezza 138 140 145 148 149 151 152 TOTALE Numero Numero ragazzi ragazze 0 3 2 2 3 3 0 13 1 0 3 1 1 0 1 7

RenatoAgatiAppuntidiStatistica

Pagina24

Tabellamultiplaetabellaadoppiaentrata Nonesisteununicograficochepossarappresentaretuttiidatidiunatabellamultiplaeadoppia entrata.


Altezza 138 140 145 148 149 151 152 TOTALE Numeroragazzi totale% 0 3 2 2 3 3 0 13 0,0 23,1 15,4 15,4 23,1 23,1 0,0 100,0 Numeroragazze totale% 1 0 3 1 1 0 1 7 14,3 0,0 42,9 14,3 14,3 0,0 14,3 100,0

In tal caso si ricorre a pi di un grafico, come ad esempio un istogramma per rappresentare le frequenzeassolutedeiragazziedelleragazzeeduegraficiatortaperladistribuzionerelativadei ragazzi(ungrafico)edelleragazze(secondografico). Tabellaperclassi Una tabella per classi differisce da una tabella semplice solo per il fatto che levento rappresentatonondaunvaloresingolomadaunintervallodivalori.
Classidi altezza 1,501,54 1,551,59 1,601,64 1,651,69 1,701,74 1,751,79 1,801,84 1,851,89 TOTALE
Frequenza Frequenza assoluta relativa Unatabellaperclassipupertantoesserebenrappresentata

3 6 9 15 12 6 6 3 60

5 10 15 25 20 10 10 5 100

daistogrammi.

RenatoAgatiAppuntidiStatistica

Pagina25

Graficialinea Pu capitare che i dati in nostro possesso siano dati che rappresentano levoluzione nel tempo dellevento osservato, come landamento giornaliero delle quotazioni in borsa di un titolo azionariooletemperaturerilevatenellostessopostoadintervalliregolari. In questo caso i grafici a linea costituiscono la rappresentazione ideale in quanto danno immediatamente un messaggio visivo sullandamento del fenomeno, oltre a rappresentarne i valori. NellesempioquiriportatosonoindicateletemperatureminimeemassimerilevateaTorinonel periodo1/10/20061/09/2007(persemplicitsonostateriportateletemperaturedelprimodel mese).
Data 1/09/2007 1/08/2007 1/07/2007 1/06/2007 1/05/2007 1/04/2007 1/03/2007 1/02/2007 1/01/2007 1/12/2006 1/11/2006 1/10/2006
Temp. minima T

15,8 15,7 19,8 12,4 14,3 7,3 4,3 1,7 0,2 3,1 7,1 17,1

27,4 28,3 29,2 19,8 21,8 11,0 13,9 11,8 8,6 13,2 20,4 22,4

RenatoAgatiAppuntidiStatistica

Pagina26

GLIINDICATORISTATISTICI:INDICIDIPOSIZIONE
Gliindici,oindicatoristatistici,sonoirisultatidifunzionimatematichechevengonoutilizzatiper effettuareunasintesideidati. Gliindicipifrequentementeutilizzatisono: gliindicidiposizione:dannounideaapprossimatadellordinedigrandezzadeivaloriesistenti. Ipiutilizzatisonolamoda,lamedia,lamedianaeiquantili. gliindicididispersione:vengonoutilizzatiperdescriveresinteticamentecomeivaloridiuna distribuzionesonodistantidaunvalorecentrale(identificatosolitamenteconlamediaoconla mediana)

MODA SichiamaMODAdiunindaginestatisticaildatoolaclassedidatichehamaggiorefrequenza.
Altezza 138 140 145 148 149 151 152 TOTALE Numero ragazzi 1 3 5 3 4 3 1 20

Inquestocasolafrequenzamaggiore5ecorrispondealnumerodi ragazzialti145cm. Pertanto,lamoda145.

Inunadistribuzionepuesserciunsolovaloreaventelamaggiorefrequenza,oppureduevalorio pi:intalcasosiparladidistribuzioneunimodale,bimodale,trimodale,ecosvia.

RenatoAgatiAppuntidiStatistica

Pagina27

MEDIAARITMETICA InuninsiemedidatistatisticinumericilaMEDIAARITMETICAvieneutilizzataperriassumereun insiemedidaticonunsolovalore. Percalcolarelamediadiunadistribuzionesemplicesidevonosommaretuttiidatiedivideretale sommaperilnumerodeidati.

Inpresenzadiunatabelladifrequenzasicalcolalamediaaritmeticaponderata(opesata). I singoli valori prima di essere sommati vengono moltiplicati con il peso (ponderazione) a loro assegnato,ovveroalnumerodivolte(frequenza)incuiivaloricompaiono. Lasommaottenutadevepoiesseredivisanonconilnumerodivalorimaconlasommadeipesi.

RenatoAgatiAppuntidiStatistica

Pagina28

Epossibilecalcolarelamediaaritmeticaponderataanchenelcasodidistribuzioniperclassi,ma bisognaprimasostituireleclassiconillorovaloremedio,comenellesempiochesegue:

Aquestopuntosipucalcolarelamediaaritmeticaponderata. MEDIANA SidiceMEDIANAdiuninsiemedidatistatisticinumerici,dispostiinordinecrescente,ildatoche occupailpostocentrale. Perdeterminarelamedianasiprocedeinmodidifferentisecondocheabbiamounadistribuzione semplice,unadistribuzioneponderataounaperclassi. Caso1Distribuzionesemplice Scrivendoidatiinordinecrescente,seidatisonoinnumerodisparilamedianailtermineche occupa il posto centrale; se i dati sono in numero pari, la mediana rappresentata dalla media aritmeticatraiduevaloricentrali. Percalcolareinmanierasemplicequal/qualisonoiterminicentrali,bastadividereperdueil numerototaledeidati. Esempio:seabbiamounaseriedi49dati,poich49/2=24conilrestodi1,ilterminedimezzo il25esimo(cheavr24datiadestrae24datiasinistra).

RenatoAgatiAppuntidiStatistica

Pagina29

Seabbiamounaseriedi150dati,poich150/2=75,idueterminicentralisonoil75esimoeil 76esimo.Lamedianadatadallamediaaritmeticadiquestiduevalori,ottenibilesommandolitra loroedividendoilrisultatoper2.

Caso2Distribuzioneponderata Sicalcolanoanzituttolefrequenzecumulate.Aquestoscoposiscrivonoordinatamentelaprima frequenza,lasommadelleprimedue,lasommadelleprimetre,ecosvia


Valore 20 21 22 23 26 30 TOTALE Frequenza Frequenza Operando come nel caso di una distribuzione semplice, si cumulata 12 19 18 7 2 1 59 12 31 49 56 58 59

calcolachelamedianail30esimotermine.

Nellacolonnadellefrequenzecumulatesiricavacheil30esimo terminevale21:pertantolamediana21.

RenatoAgatiAppuntidiStatistica

Pagina30

Caso3Distribuzioneperclassi Consideriamolaseguentedistribuzioneperclassi(etdi400persone): Calcoliamolametdellafrequenzacumulatacomplessivaottenendo200(400/2);civuoldireche perarrivarealletmedianadobbiamocontareleprime200personedisposteinordinediet;ci vuoleanchedirechela200esimapersonahaunettrai40ei50anni. La mediana cade quindi nella classe 4050 ed precisamente: 40 + x, ove x rappresenta una frazionedellampiezza10dellaclasse. Per calcolare x si nota che le frequenze cumulate fino a 40 sono 152. Poich let mediana la 200esima,essala48esimaetnellaclasse4050(200152=48). Calcoliamoquindixapplicandoilcriteriodiproporzionalit: 48:114=x:10 Dove114ilnumerodielementidellaclasse4050.
Et 2030 3040 4050 5060 6070 7080 Frequenza Frequenza cumulata 60 92 114 86 40 8 60 152 266 352 392 400

Quindi: x=(48*10)/114=4,21 Indefinitivalamedianadelladistribuzioneperclassi: 40+4,21=44,21

RenatoAgatiAppuntidiStatistica

Pagina31

QUANTILI Sipureinterpretarelamedianacomelapipiccolamodalitchedividelaseriedeidatiindue partiuguali,lasciandoil50%delleunitstatisticheallasuasinistraeil50%allasuadestra. Seinvecedividolaseriedelleunitstatisticheinpididuepartiuguali,allorasiparladiquantili. I quantili sono modalit del carattere che suddividono la distribuzione dei dati in q distribuzioni parzialiciascunacontenente1/qdellanumerosittotale. Inquestosensolamedianadiventailquantilediordineq=1/2. Se q=4, allora si parla di quartili. I quartili ripartiscono la distribuzione in quattro parti caratterizzatedallastessanumerosit,parial25%dellanumerosittotale. Ilprimoquartileilvaloreolinsiemedeivaloripercuilafrequenzacumulatavale0,25(parial 25%),ilsecondoquartilecoincideconlamediana,ilterzoquartileilvaloreolinsiemedeivalori percuilafrequenzacumulatavale0,75(parial75%).

RenatoAgatiAppuntidiStatistica

Pagina32

GLIINDICATORISTATISTICI:INDICIDIDISPERSIONE
Consideriamoiseguentidati: Trestudenti,nelprimoquadrimestre,hannoriportatoleseguentisuccessionidivotinelleprove scrittedimatematica: Se calcoliamo le medie aritmetiche e le mediane dei voti di ogni studente, vediamo che esse coincidono: Nonostanteci,evidentecheletresuccessionidivotisonodiversetraloro. Perevidenziarequestedifferenzesideveintrodurreilconcettodivariabilit: Lavariabilitlattitudinechelagrandezzainoggettohadiassumerevaloripiomenodiversitra loro. Se i dati sono vicini al loro valore medio, allora la variabilit bassa. Se i dati si discostano fortementedallorovaloremedioalloralavariabilitalta. La variabilit dei dati viene misurata attraverso nuovi indici, detti indici di variabilit o indici di dispersione, che sono il campo di variazione, lo scarto semplice medio, lo scarto quadratico, la varianzaeloscartoquadraticomedio.
Studente Anna Giovanni Giuseppe Media 6 6 6 Mediana 6 6 6 Studente Anna Giovanni Giuseppe 5 4 3 6 5 4 Voti 6 7 8 7 8 9

RenatoAgatiAppuntidiStatistica

Pagina33

Campodivariazione Elindicedivariabilitpisemplice.Edatodalladifferenzatraildatomassimoeildatominimo edequivaleallampiezzadellintervallochecontienetuttiidati. Conriferimentoallesempioprecedenteabbiamo: ilcampodivariabilitdeivotidiAnna: 75=2 ilcampodivariabilitdeivotidiGiovanni:84=4 ilcampodivariabilitdeivotidiGiuseppe:93=6 PertantosipudedurrecheivotidiAnnasonopressochcostanti,mentrequellidiGiuseppesono moltodiversitraloro. Ilcampodivariazionenonperunbuonindicedivariabilit:seconsideriamo,adesempio,un quartostudente,Mario,icuivotisono4,4,8,8,evidentecheilcampodivariazionelostesso di quello di Giovanni, ma la variabilit (ovvero lattitudine che la grandezza in oggetto ha di assumerevaloridiversitraloro)diversa. Pertanto,ilcampodivariazionenonsufficienteesidevericorrereanuoviindicidivariabilitpi sensibili. Scartosemplicemedio Percalcolareloscartosemplicemediosiprocedenelseguentemodo. Si calcola innanzitutto lo scarto semplice, rappresentato dalla differenza del singolo valore dalla media (Xi M). Gli scarti semplici possono essere sia positivi che negativi, e la loro somma ugualeazero. Infatti,seconsideriamoperesempioivotidiGiuseppe(3,4,8,9,lacuimediavale6)ecalcoliamo lasommadegliscartisempliciabbiamo: (36)+(46)+(86)+(96)=(3)+(2)+(+2)+(+3)=0 Siricorrepertantoalloscartosemplicemedioottenutocalcolandolamediaaritmeticadeivalori assolutidegliscartisemplici,ovverolamediadegliscartisemplicipresiconilsegnopositivo: (|36|+|46|+|86|+|96|)/4=((+3)+(+2)+(+2)+(+3))/4=10/4=2,5

RenatoAgatiAppuntidiStatistica

Pagina34

Varianza Loscartosemplicemedio,sebbenediaindicazionisucomeivaloridelladistribuzionedifferiscono traloro,risultainsufficientequandoicampidivariazionesonominimi. Siricorrepertantoallavarianza,indicatoredidispersionechevalezerosoloneicasiincuituttii valorisonougualitradiloro(epertantougualiallaloromedia)echecresceconilcresceredelle differenzereciprochedeivalori. Lavarianzavienecalcolatanelseguentemodo:sicalcolanogliscartiquadraticichesonoiquadrati degliscartisemplici,esenecalcolalamediaaritmetica. ConsiderandoanchestavoltaivotidiGiuseppeabbiamo: ((36)2+(46)2+(86)2+(96)2)/4= ((3)2+(2)2+(+2)2+(+3)2)/4= (9+4+4+9)/4=26/4=6,5 SecalcoliamoanchelavarianzadeivotidiAnnaediGiovanniavremo: Deviazionestandard La varianza esprime meglio la distribuzione dei valori ma lelevamento al quadrato rappresenta unanomalia che pu essere recuperata solo con unoperazione inversa, lestrazione della radice quadrata. Ilvalorecheotteniamoladeviazionestandard,indicataconlalettera(sigma),edlindicedi variabilitpiutilizzatopermisurareladispersionedeidatiintornoalvaloreatteso. NellatabellacheseguesonoindicatiivariindicidivariabilitcalcolatisuivotidiAnna,Giovannie Giuseppe:
Campodi Scarto variazione semplice medio Anna 2 0,5 Giovanni 4 1,5 Giuseppe 6 2,5 Studente Varianza Scarto quadratico medio 0,70 1,58 2,54

0,5 2,5 6,5

RenatoAgatiAppuntidiStatistica

Pagina35

GLIINDICATORISTATISTICI:QUANDO,COME,PERCHE
QuandopreferibileutilizzarelaMODA? Lamodacalcolabilesiaconvariabiliqualitative,siaconquellequantitative,cicheconta lafrequenzadeidati. Lamodadiventaimportantequandotratuttiidatinespiccaunoconfrequenzamassima Setraidatiparecchihannolastessafrequenzaofrequenzesimili,enonnespiccaunoin particolare,lamodanondgrandisoddisfazioni Seidatihannotuttifrequenza1(ciotuttidiversitraloro)lamodanonesiste.

QuandopreferibileutilizzarelaMEDIA? Lamediacalcolabilesoloseidatisononumerici. La media pi utile (pi significativa) quando la distribuzione dei dati abbastanza uniforme Lamediapermettediconfrontareduesequenzedidatiancheseilnumerodidatiraccolti nelleduesequenzediverso

QuandopreferibileutilizzarelaMEDIANA? La mediana calcolabile solo se i dati sono riferiti a variabili quantitative o qualitative ordinate. La mediana, a differenza della media, non influenzata dal fatto che i dati non siano uniformi,madipendesolodallalorodistribuzione.

RenatoAgatiAppuntidiStatistica

Pagina36

RenatoAgati http://www.renatoagati.com
RenatoAgatiAppuntidiStatistica Pagina37