Sei sulla pagina 1di 21

Cos’è la STATISTICA?

La statistica studia come raccogliere i dati e come


analizzarli per ottenere informazioni utili a
soddisfare le domande che un ricercatore si pone
nel corso di una ricerca scientifica. La statistica si
occupa dell’analisi dei dati osservati. Lo scopo è
di ridurre il volume dei dati osservati,
esprimendo l’informazione rilevante contenuta in
tali dati per mezzo di grafici e indicatori numerici
che li descrivono. L’obiettivo del volume è far
acquisire cognizione circa l’importanza di un
approccio per le scienze umane e sociali al fine di
far comprendere che umanesimo e scienze
possono e devono coesistere. È la statistica in
quanto strumento a rappresentare un
indispensabile ausilio per introdurre i temi
dell’epistemologia. Attraverso lo studio della
statistica si ha la possibilità di conseguire una
capacità utile per l’acquisizione e lo sviluppo di
strumenti per distinguere il vero dal verosimile,
per comprendere la portata dei fatti e dei
fenomeni sociali.
Cos’è L’INDAGINE STATISTICA?
È l’insieme dell’attività statistica che si genera
intorno ad un fenomeno collettivo, ed è costituita
dalle procedure adottate per effettuare l’analisi
del fenomeno stesso.
Cos’è una RILEVAZIONE STATISTICA?
Consente di apprendere e analizzare un dato
fenomeno che caratterizza una determinata
collettività. Può essere: 1) totale: ovvero rilevata
evidenziando le manifestazioni del fenomeno su
ogni unità della collettività: 2) parziale, ovvero
rilevata soltanto su una parte delle unità afferenti
alla collettività. Nel caso in cui la rilevazione sia
totale si fa riferimento alla popolazione, ovvero
all’insieme di tutte le unità oggetto di studio; una
popolazione statistica si definisce inoltre: 1) reale
o empirica: se si tratta di un insieme le cui unità
possono essere tutte osservate; 2) virtuale o
teorica: se riguarda un insieme definibile ma non
concretamente osservabile.
Ne caso invece in cui la rilevazione statistica sia
parziale si parlerà di campionamento.

Cos’è la METODOLOGIA?
La metodologia della ricerca è quella parte della
logica che ha per oggetto le regole, i principi di
metodo e le condizioni formali che stanno alla
base della ricerca scientifica e che consentono di
ordinare, sistemare e accrescere le nostre
conoscenze. Consente ad una qualsiasi ricerca di
diventare ricerca scientifica.
- Concetto: categoria mentale che permette di
classificare e denominare in modo
convenzionale oggetti concreti o astratti
- Teoria: l’insieme di proposizioni
organicamente connesse e formulate secondo
un elevato livello di astrazione e
generalizzazione
- Spiegazione: deduzione logica di un
enunciato fondato o su condizioni singolari di
contesto o su proposizioni universali.
- Ipotesi: affermazione provvisoria, frutto della
relazione tra due o più concetti, derivata dalla
specificazione di una teoria e che necessita di
un controllo empirico per poter essere
confermata.
- Paradigma: prospettiva teorica condivisa e
riconosciuta dalla comunità scientifica
fondata in base ad acquisizioni precedenti.
Cosa significa SCEGLIERE UN PROBLEMA?
Significa passare da un contesto generale ad un
contesto particolare, ovvero restringere il campo
di analisi sui fenomeni che si ritiene possano
essere collegati al problema.
Cos’è un DISEGNO DI RICERCA?
Si definisce disegno di ricerca lo schema generale
delle fasi e dei momenti che l’organizzazione
della ricerca comporta e prevede; costituisce un
filtro attraverso cui leggere i problemi teorici,
organizzativi e tecnici. L’applicazione del metodo
scientifico comporta diversi passaggi: 1)il
problema viene definito; 2)il problema è
formulato nei termini di un quadro teorico
collegato ai risultati rilevanti ottenuti nel corso di
ricerche precedenti; 3) si formulano una o più
ipotesi: 4) si determina la procedura d usare per
la raccolta dei dati e per il controllo delle ipotesi;
5) si procede alla raccolta dei dati; 6) si procede
con l’analisi dei dati per capire se l’ipotesi è o
meno verificata; 7)nel dover determinare le
conclusioni si verifica se queste possono essere
collegate ad una teoria precedente che viene
eventualmente modificata in accordo con le
nuove risultanze.
Cos’è il CAMPIONAMENTO?
La rilevazione campionaria è una rilevazione
statistica in scala ridotta, che coinvolge solo una
parte delle unità statistiche che compongono
l’oggetto di studio, selezionate con criteri atti a
rappresentarne la totalità. Si definisce quindi
CAMPIONE la parte concretamente osservata
dalle unità statistiche.
Cos’è il modello di RILEVAZIONE?
È uno strumento tramite il quale si stabilisce il
legame tra il disegno della ricerca e le
manifestazioni del fenomeno che il ricercatore
intende osservare.
Cos’è una TABELLA STATISTICA?
Le tabelle statistiche forniscono un supporto a
chi vuole conoscere le manifestazioni dei
fenomeni oggetto di studio, nonché costituiscono
una base per le analisi statistiche successive che il
ricercatore vorrà intraprendere in futuro. La
tabella statistica si dice “semplice” se è riferita ad
un solo carattere; “doppia” se è riferita a due
caratteri; “multipla” se si riferisce a più di due
caratteri. Una tabella statistica semplice è
costituita da due colonne: la prima riporta le
varie modalità del carattere in esame; la seconda
riporta le frequenze.
Cos’è una RAPPRESENTAZIONE GRAFICA?
Le rappresentazioni grafiche hanno il pregio di
consentire di cogliere con un unico sguardo le
informazioni più importanti sull’andamento e o
sulla struttura dei dati; offrono numerosi
vantaggi ad esempio la facile lettura dei dati e
l’immediata comprensione dell’andamento del
fenomeno. Un primo metodo di rappresentazione
grafica è il diagramma a linee. Sull’asse
orizzontale si troveranno elencati i vari anni o
altre grandezze temporali, come le settimane, i
giorni o i mesi mentre su quello verticale i valori
che rappresentano la misura della grandezza
oggetto di studio nei diversi anni.
DOMANDA FREQUENTE: Da 1 a 5 qual è la
media? LA MEDIA E’ 3, PERCHE’ se
addizioniamo: 1+2+3+4+5 ci viene 15 che diviso
5 ci da 3.
Cos’è un ISTOGRAMMA?
È una rappresentazione della distribuzione
statistica che tenga conto delle aree delle colonne
anziché sulla loro altezza, appunto l’istogramma.
In questo caso, le frequenze associate a ciascuna
classe devono riferirsi a tutta la sua ampiezza.
Cosicché se si ipotizza che le unità statistiche
della classe si distribuiscono egualmente su tutta
la base, la frequenza corrispondente ad ogni
unità di base (ovvero l’altezza dell’istogramma) si
ricava dividendo la frequenza associata alla classe
per l’ampiezza della classe stessa.
QUANTI GRAFICI CONOSCI?
Diagramma a Radar, a Barre, a linee, diagramma
a dispersione, o cartogramma, piano cartesiano
con le asse delle ascisse e delle ordinate. Per
calcolare la mutabile statistica si fa riferimento ai
grafici AREALI per mezzo di aree e forme
geometriche, ad esempio il cerchio bisogna
prendere uno spicchio del cerchio, bisogna
estrarre la radice quadrata di ogni valore da
rappresentare della mutabile statistica. Il valore
rappresenta il lato del quadrato da disegnare e da
porre a confronto con gli altri quadrati della
mutabile.
QUALI SONO I PRINCIPALI VALORI MEDI DI
POSIZIONE?
Il valore medio centrale, la moda , la mediana e i
quartili 1, 2 e 3.
Cosa sono i RAPPORTI INDICI?
I rapporti indici (o numeri indici) hanno per
scopo il confronto tra le intensità (o le frequenze)
di uno stesso fenomeno rilevato, in luoghi e
tempi diversi. Quando il carattere di riferimento
è costituito da aree geografiche si ha una serie
territoriale di numeri indici. Quando, invece, il
carattere è il tempo si ha una serie storica (o
temporale) di numeri indici.
Cosa sono i VALORI MEDI?
Sono quei numeri che sintetizzano e
caratterizzano la variab. Statist. oggetto di studio.
Essi possono essere applicati solamente alle
variabili statistiche quantitative. Data una variab.
Statist. avente le seguenti modalità x1, x2 e così
via, un suo valore medio è la quantità che se
sostituita a ciascun termine (o valore) della
variabile stessa, mantiene inalterato il risultato
della operazione eseguita sui termini della
variabile.
Cos’è la MEDIA ARITMETICA?
La media aritmetica è quel valore che sostituito ai
singoli termini della variabile data, mantiene
inalterata la somma dei termini stessi. Nel caso di
una variab. Statist. in cui compaiono le
frequenze, indicate con il simbolo ni (il numero
di volte che nella variab. Statist. studiata una
modalità si ripete), per ottenere la somma totale
del carattere che compare al numeratore si
sommano i prodotti delle modalità per le
rispettive frequenze. La media aritmetica
possiede delle proprietà. La 1° è che la somma
algebrica degli scostamenti è uguale a zero; la 2°
è che la somma dei quadrati degli scostamenti (x-
µ) è un minimo, nel senso che è minore della
somma dei quadrati degli scostamenti dei valori
xi, da un altro valore qualsiasi diverso da µ
(media). *il valore è sempre positivo, mai
negativo*. La 3° è che la media aritmetica è
associativa nel senso che si può ottenere come
media aritmetica ponderata delle medie parziali.
La 4° è che la media aritmetica vale della
proprietà traslativa, nel senso che aggiungendo o
sottraendo a tutti i valori xi, una costante a, la
media aritmetica risulta aumentata o diminuita
di a. la 5° è che moltiplicando le xi, per una
costante b, la media aritmetica dei nuovi valori è
uguale a b.
Che cos’è la MEDIA?
Si ottiene sommando tutti i dati ottenuti diviso i
numeri (n) di dati ottenuti.
È la somma di xi’ni diviso il totale ni
Cos’è la MEDIA GEOMETRICA?
È quel valore che sostituito ai singoli termini
della distribuzione data, mantiene inalterata la
produttoria dei termini stessi.
Cos’è un LOGARITMO?
La trasformazione logaritmica è quell’operazione
matematica che consente il passaggio da una
serie di fattori moltiplicativi ad un modello
additivo, utilizzando le proprietà matematiche
dei logaritmi.
Cos’è la MEDIA QUADRATICA?
È quel valore che sostituito ai singoli termini
della distribuzione data, mantiene inalterata la
somma dei quadrati dei termini stessi.
Cos’è la MEDIA ARMONICA?
È quel valore che sostituito ai singoli termini
della distribuzione data, mantiene inalterata la
somma dei reciproci dei termini stessi.
Cosa sono i VALORI MEDI DI POSIZIONE?
Sono modalità che occupano una determinata
posizione dopo aver ordinato la variab. Statist. in
senso crescente.
Cos’è una FREQUENZA CUMULATA?
Una generica frequenza cumulata, individuata
con il simbolo Ni, indica il numero di unità
statistiche che hanno manifestato una modalità
inferiore o uguale alla i-esima (significa generico
numero);
Cos’è una FREQUENZA CUMULATA
RELATIVA?
Non è altro che il rapporto tra la frequenza
cumulata Ni ed il totale delle unità statistiche
oggetto di studio ovvero N.
Cos’è il VALORE CENTRALE?
Il valore centrale esprime la modalità teorica che
occupa la posizione centrale della variab. Statist.
oggetto di studio. Si calcola effettuando la
semisomma tra la modalità più piccola e quella
più grande della variabile data e cioè VC=
X(1)+X(N)/2
Cos’è la MODA?
La moda è quella modalità della distribuzione
statistica alla quale è associata la frequenza
assoluta ni o relativa maggiore. Bisogna ricercare
nella colonna delle frequenze assolute (o delle
frequenze relative y), il valore più elevato e
risalire successivamente alla modalità
corrispondente. Questo procedimento si adatta
facilmente alla determinazione della moda in una
variab. Statist. con carattere qualitativo (o
mutabile statistica), mentre, per le variabili
quantitative, il procedimento di calcolo si
modifica nel caso in cui le modalità sono
raggruppate in classi di ampiezza diversa. In tal
caso si parlerà di classe modale e il suo calcolo
passa attraverso la valutazione delle densità di
frequenza hi.
Formula: valori (li troviamo nella tab. principale
che ci viene data) con maggiore frequenza diviso
due.
Cos’è il QUARTILI O QUARTILE?
Il quartile è quella modalità della variab. Statist.
che individua, fissata una percentuale, il numero
di modalità al di sotto e al di sopra della
percentuale stessa. È calcolato per definire,
all’interno di una variab. Statist., la percentuale
di modalità che sono al di sotto del 1° quarto, del
2° quarto e del 3° quarto.
- Per il 1° quartile si intende la modalità che
occupa la posizione della variab. Statist. che,
dividendo in due la variabile stessa, lascia
sotto di sé il 25% dei casi ed al di sopra il
restante 75%.
Formula: disp N+1/4 pari N/4
- Si ottiene invece come 2° quartile (mediana)
la modalità che divide in parti uguali la
variabile oggetto di studio
Formula: disp N+1/2 pari N/2 e N/2+1
- Ed infine il 3° quartile ribalta le percentuali
definite per il 2° quartile
Formula: disp 3(N+1)/4 pari 3N/4
DOPO AVER TROVATO I RISULTATI
TROVARE DA ESSI ATTRAVERSO LA
FORMULA:
estremo inferiore classe + distanza classe/ni
corrispondente (percentuale (risultato) – Ni
precedente)
Cos’è il CAMPO DI VARIAZIONE?
È una delle misure di variab. che si ottiene come
differenza tra il più grande ed il più piccolo
termine della variab. Statist. oggetto di studio,
ordinata in ordine crescente. Formula: CV=xn –
x1
Cos’è la DIFFERENZA INTERQUARTILICA?
È una delle misure di variab. ed è la differenza tra
il terzo ed il primo quartile della variabile data.
Permette di definire un valore inferiore, in
quanto risulta meno sensibile ai valori anomali
che di solito si trovano agli estremi della variab.
Statist. oggetto di studio. Formula: CVq= Q3-Q1
Cosa sono gli INDICI DI DISPERSIONE?
Misurano di quanto variano in media i termini
della variab. Statist.oggetto di studio, da una
grandezza caratteristica predefinita (ad esempio
voler misurare come varia in media, in un mese
la temperatura atmosferica effettiva di una città
rispetto alla temperatura che di solito si attende
in quello stesso periodo. Gli indici di dispersione
misurano la variabilità di una variab. Statist.
commisurando i valori della stessa con un valore
significativo e rappresentativo della variabile
stessa. Di oslito utilizzano la media aritmetica
come grandezza caratteristica predefinita.
Cosa sono gli INDICI DI DISUGUAGLIANZA?
Misurano di quanto, in media, i termini della
variab. Statist. differiscono gli uni da tutti gli altri
ed, eventualmente anche da se stessi.
Cos’è uno SCOSTAMENTO MEDIO?
Uno scostamento medio è indice di variabilità
poiché soddisfa le proprietà
Cos’è uno SCOSTAMENTO SEMPLICE MEDIO o
scarto semplice medio?
È un primo indice di dispersione dal valore
medio x (con il trattino sopra); ed è ottenuto
dalla media aritmetica delle distanze |xi-x(con il
tratt. Sopra). È sempre positivo in quanto
presenta al numeratore il valore assoluto delle
distanze. Gli scostamenti semplici medi più
comuni sono quello della media aritmetica e
quello della medianna. Formula: |xi-µ|ni/N
Cos’è il VALORE ASSOLUTO?
Per valore assoluto si intende il valore che si
attribuisce a un numero relativo (n)
Cos’è uno SCOSTAMENTO QUADRATICO
MEDIO o scarto quadratico medio?
È la media quadratica delle distanze |xi-x(con il
tratt. Sopra). Tra gli infiniti scostamenti
quadratici medi, il più usato è quello della media
aritmetica (con e senza frequenze). La
caratteristica di questo indice è che registra, tra
tutti i possibili scostamenti quadratici medi, il
valore più piccolo possibile. Il quadrato dello
scostamento quadratico medio prende il nome di
varianza. Formula: √(xi-µ)²ni/N
Cos’è la DIFFERENZA MEDIA DI GINI?
Indicata con la lettera greca (delta), non è altro
che la media aritmetica degli scostamenti |xi-xh|
di ciascun termine con tutti gli altri.
Cos’è la DIFFERENZA SEMPLICE MEDIA CON
RIPETIZIONE?
Si parla di differenza semplice media con
ripetizione nel caso in cui si introduce anche la
differenza di ciascun termine con se stesso.
Cos’è la MUTABILITA’?
Le misure di mutabilità rilevano se, rispetto ad
un certo carattere, tutte le unità statistiche
presentano la stessa modalità. Una prima misura
di eterogeneità di una mutabile statistica è
l’indice di entropia dove prende in
considerazione le intensità relative della
mutabilità statistica. Un altro indice di mutabilità
che assume una diversità di valori compresi in un
intervallo predefinito è l’indice di eterogeneità di
Gini. Questo indice può assumere una diversità
di valori compresi in un intervallo predefinito
delimitato dal valore zero e dal valore
rappresentativo della eterogeneità massima.
Cos’è la MUTABILITA’ RELATIVA e
ASSOLUTA?
La determinazione degli indici di mutabilità
relativa segue la logica degli indici di variab.
Relat. rapportati al massimo della variabi. Assol.
di una data variab. Statist. Infatti per calcolare
l’indice di entropia relativa è sufficiente
rapportare l’indice di entropia assoluto H al suo
valore massimo log(K). Inoltre gli indici di
dispersione utilizzano la media aritmetica come
grandezza predefinita, invece gli indici di
disuguaglianza misurano di quanto in media gli
indici di variabilità statistica differiscono gli uni
da tutti gli altri e da se stessi.

Cos’è la VARIABILITA’ RELATIVA?


Gli indici di variabilità e mutabilità espressi da
numeri puri sono detti indici di variabilità e
mutabilità relativa. Gli indici di variabilità
relativa possono essere costruiti utilizzando un
indice di variabilità assoluta, rapportato ad uno
dei valori medi della variab. Statist. di
riferimento. Formula: Vr=Va/x(trattino
sopra)*100. Indice di variabilità relativa è un
numero puro in quanto è il rapporto tra due
quantità omogenee. Esso esprime quanta parte
della variabile assoluta misurata da Va è
attribuibile in media a 100 unità di (x con
trattino sopra); pertanto l’indice ha la finalità di
eliminare l’influenza esercitata dal valore medio
(xcon il trattino) sull’indice di variabilità assoluta
(V). Si ha una massima variabilità assoluta, in
una variab. Statist. data, quando i termini della
variabile stessa sono concentrati agli estemi,
ovvero in corrispondenza della più piccola e più
grande modalità. Tra i possibili indici di
variabilità relativa il più usato è il coefficiente di
variazione. Tra gli indici di variabilità assoluta
rientrano gli indici di dispersione (scarti) e gli
indici di disuguaglianza. Poi c’è la mutabilità
assoluta e cioè l’indice di entropia e di
eterogeneità di Gini
Cos’è il COEFFICIENTE DI VARIAZIONE?
Il coefficiente di variazione esprime quale è la
variabilità misurata dallo scarto quadratico
medio, in percentuale, rispetto alla media
aritmetica.
Cos’è la CONCENTRAZIONE?
La concentrazione è un’altra forma di
rappresentazione della variabilità. Essa è spesso
utilizzata per descrivere le disparità nella
distribuzione di reddito e di ricchezza all’interno
di una comunità. Si ha concentrazione nulla
quando tutti i redditieri possiedono la stessa
quota parte dell’ammontare totale; si ha invece
concentrazione massima quando tutte le unità
presentano una quota nulla dell’ammontare
totale tranne una che detiene l’ammontare totale
del carattere: questo è anche il caso della
variabilità massima. Di conseguenza, un indice di
concentrazione deve assumere valore zero
quando e solo quando tutti i termini sono uguali
tra loro e deve crescere all’aumentare delle
diversità dei termini. Può essere rappresentata
graficamente utilizzando la curva di
concentrazione e può essere definita
matematicamente utilizzando gli indici di
concentrazione. Formula: C=Ɛpi-qi/Ɛpi ;
qi=Ai/An ; pi=Ni/N
Cos’è la SCOMPOSIZIONE DELLA DEVIANZA?
Ha lo scopo di individuare le cause che
determinano la variabilità totale del fenomeno
oggetto di studio, nonché quanta parte della
variabilità totale è insita nel fenomeno studiato.
Cosa sono le RELAZIONI TRA VARIABILI?
Ha lo scopo sia di misurare l’entità del legame
esistente tra esse, sia di poter effettuare
previsioni relative ai singoli casi.
Cosa sono le DISTRIBUZIONI MARGINALI E
DISTRIBUZIONI PARZIALI?
I totali delle righe e delle colonne della tabella
rappresentano due distribuzioni semplici e sono
dette “distribuzioni marginali” della distribuzione
doppia di frequenze. Invece le frequenze
riportate in una generica riga o colonna,
costituiscono le distribuzioni parziali della
distribuzione doppia.
Cos’è L’INDIPENDENZA?
L’analisi dell’indipendenza ha la finalità di
verificare l’esistenza di un legame matematico
tale da poter affermare che il variare delle
modalità di una variabile è più o meno
influenzato dal variare delle modalità dell’altra
variabile.
Cos’è la VARIABILE STATISTICA o (variabilità)?
In statistica per variabile si intende un insieme di
caratteristiche rilevate su una o più unità
statistiche appartenenti ad una popolazione o a
un campione di riferimento come esito di
un’indagine.
Cos’è la MEDIANA?
La mediana è la modalità che occupa la posizione
di riferimento centrale; sarà la m. aritm delle
modalità che occupano le posizioni di riferimento
centrali. Formula: se N è dispari: N+1/2 ( tutto
diviso 2) ; se N è pari: N/2+(N/2+1)/2 (tutto
diviso 2)
ALTEZZA O L’ALTEZZA
Formula: ni/d ; ni sarebbe la distanza tra i valori
principali in tabella.
Qi: si calcola Ai/An
Pi: Ni (frequenza cumulata)/N ogni Ni diviso il
totale ni
QUALITATIVO/QUANTITATIVO
In una modalità di carattere qualitativo la
risposta è fornita in forma letterale ad esempio
dichiarare il luogo di nascita.
In una modalità di carattere quantitativo la
risposta è fornita in forma numerica ad esempio
dichiarare l’età
Sono due tipi di metodi e raccolta di dati: se un
ricercatore decide di utilizzare la ricerca
qualitativa, vuol dire che utilizzerà la narrazione,
l’autobiografia che i soggetti offriranno della loro
esperienza e della loro storia; invece il metodo
quantitativo è una raccolta dati più numerica,
dopo aver sottoposto i campioni a dei test e
valutazioni di tipo numerico

Potrebbero piacerti anche