Sei sulla pagina 1di 18

20/2/23

STATISTICA
L’informazione statistica è data da un numeroun conto è parlare di numeri un conto è parlare di
informazione statistica. Nella predisposizione dei progetti dobbiamo tenere distinte le due cose.
L’informazione statistica sono i numeri più qualcos’altro.
La statistica come scienza e informazione statistica come prodotto di questa scienza.
La statistica come scienza è la scienza della misura che deve produrre un’informazione statistica che non
sempre è un numero ma è qualcosa in più.
Chi produce informazione statistica (persona o enti) e dove trovarla.
L’obiettivo è misurare chi e cosa partendo dal presupposto di misurare un fenomeno. La statistica misura i
fenomeni sociali, economici, demografici, socialifenomeno trasversale
L’impatto economico del turismo è molteplice. Valuti in termini non monetari come arrivi e presenze e poi
in termini monetari ma le due cose non implicano un delta proporzionato. Ci sono forme di turismo a bassa
spesa e altre ad alta capacità di spesa. Devi saper valutare la sostenibilità dei servizi (indicatori di pressione
turistica).
Distinguo i fenomeni semplici dai complessi nell’approccio metodologico.
Il fenomeno semplice è quando è definito e definibile. Il turismo non è definito ma è definito il turista.
692/2011 CE definisce il turista ma non il turismo. Il turismo è il risultato delle azioni svolte dal turista.
Il fenomeno complesso non ha una definizione statistica ne è possibile fornirne una es: la qualità della vita.
L’informazione statistica proveniente da fonti ufficiali: ISTAT, EUROSTAT, OCSE…

22/02/23

Società che disponeva di una scarsa informazione statistica a una società caratterizzata da abbondanza di
dati. Misurare quantitativamente/qualitativamente la realtà il problema risulta essere orientarsi in questi
dati. Il primo problema è selezionare i dati proprio perché abbiamo un diluvio di dati spesso contrastanti tra
loro. (es: non c’è allineamento dati nazionali con dati spesa turistica come mi oriento)
Quando vogliamo fare un processo di valutazione dobbiamo chiarire il modo di trasformazione del
problema reale in problema statistico. Il problema statistico poi può essere di misura quantitativo e
qualitativo.
A seconda dell’approccio ho metodologie diverse se quantitativo o qualitativo.
C’è un comune denominatore: raccogliere informazioni. L’approccio odierno è machine learning di massa
ignorando la qualità dei dati dando importanza ai dati di massa. I dati sono talmente tanti che nascono
relazioni sconosciute alla mente umana. Per questo ci sono gli algoritmi con deep learning con algoritmi
che apprendono dagli errori commessi nel caso di analisi di dati.
I fenomeni valutabili sono: demografici, sociali, economici ma anche generali o specifici come progetti. A
seconda del soggetto e di come lo valuto cambia lo strumento: seleziono le modalità di scelta e il tipo di
dati.
Nel processo di valutazione esistono due approcci:
-costruisco indicatori ovvero delle misure costruite partendo dalle variabili (reddito pro capite, densità
turistica, numero posti letto lordo o netto)
-l’altro è chiamato econometrico alla valutazione utilizza metodi e modelli statistici
Riprendendo il discorso di fenomeno semplice e complesso:

SEMPLICE: è definibile ex ante ed è definito. Nel turismo non vi è definizione di esso, esiste la definizione
statistica di turista, essendo statisticamente definito, ma non del turismo. Es: il disoccupato è
statisticamente rilevato essendo colui che ricerca attivamente lavoro, se sei inattivo non sei incluso.
Discernere.
Se valuto efficacia di programmi e progetti il problema della definizione statistica diventa meno importante
perché ho coerenza interna sempre se non lo applico universalmente esternamente.

Dal punto di vista delle statistiche il detto “lo dicono i dati” è privo di senso. I dati hanno senso se
rappresentano la realtà semplificata da una realtà istituzionale a statisticamente definita.

Non sempre i fenomeni sono definibili, altri sono in evoluzione e devono essere definibili. Le indagini sul
turismo sono sotto regolamento comunitario 692/2011disciplina stats sul turismo e parte su ambiente.
Prima del 2011 le stats sul turismo erano sotto direttiva comunitaria che si differenzia dal regolamento
perché non stringente.
Ciò che precede la produzione del dato e le fasi che devo rispettare per produrre dati statistici di fonte
statistica e fonte amministrativa. Le fasi vengono racchiuse nel termine METADATI.

COMPLESSO: detto anche fenomeno multidimensionale. Necessitano nell’essere definiti di dimensioni e


indicatori che definiscono tali dimensioni. Bisogna evitare l’errore di attribuzione agli indicatori. Ad esempio
considerando la dimensione della competitività con riferimento al turismo ho bisogno di altre dimensioni:
economia, erogazione servizi connessi a presenza turisti sul posto. Il fenomeno multidimensionale è
definibile ex post ovvero dopo la scelta delle dimensioni che insieme nel concetto di competitività che
coprono il fenomeno concettualmente. All’interno di ogni dimensione riporto degli indicatori che le
definiscono e mi aiutano a dare una misurabilità alla dimensione. Ho n dimensioni e cerco n indicatori. è
necessario avere indicatori di variabile di controllo. Ex post perché dipende da indicatori che ho deciso per
rappresentarlo

La realtà statisticata è omogenea nel tempo e spazio ma semplificata e quindi la capacità di descrivere la
realtà può variare a seconda della realtà istituzionale.

27/02/23
Fonti primarie (gia esistente) e fonti secondarie (io effettuo rilevazione).
Quindi o le rilevo o uso dati statistici esistenti.
I dati statistici sono qualcosa in più rispetto al numero. È quella misura che è un linguaggio convenzionale.
La realtà statisticata è omogenea nel tempo e nello spazio.
Dove trovare le definizioni statistiche: esempi di misurazione di fenomeno multidimensionale.
1)BES
2)well being index codex OECD
I fenomeni multidimensionali non sono misurati alla stessa maniera proprio perché le dimensioni scelte non
sono perfettamente identiche.
Esempio di fenomeno complesso/multidimensionale:
sito ISTATglossarioalfabeto permette di conoscere dimensioni statisticamente definito.
BES: Concetto di qualità della vitafondi come pnrr si rivolgono alle aree interne. Il turismo è uno degli
strumenti principali per lo sviluppo economico delle aree interne. In queste aree si vuole sperimentare uno
stile di vita differente legato alle identità territorialiconcetto di enogastronomia e territorio
paesaggistico.
Si è convinti che alcune destinazioni avendo un prodotto più standard non è detto che possa offrire star
bene/qualità della vita rispetto ad altre località meno blasonate.
Come si costruisce la qualità della vita
Cartogrammamappa
Ortogrammagrafico a colonne
Es: BESindicatori e osservazione di fenomeni multidimensionali

Es: andiamo su dati, better life index, dimensioni di una better life e non coincidono con il BES quindi
diversa rappresentazione qualità della vita. In questo caso vi è l’housing, jobs, occupation etc…
Una volta scelti i domini/indicatori devo capire se è meglio avere tanti o pochi? Sono meglio poi indicatori
legati o incorrelati? Dagli indicatori posso arrivare a un unico indicatore di sintesi?
1) con 150 e passa indicatore si pone il problema di interpretazionedifficile comprendere se la qualità
della vita è buona o noindicatore di sintesi che combini linearmente gli indicatori più similiindicatore
composito. Questa analisi Z1 è la sintesi ovvero somma degli indicatori elementari.
L’ISTAT si ferma alle dimensioni iniziali e non fa questo tipo di processoinformazione statistica
disaggregata che non permette neanche un ranking.
Alla domanda meglio tanti o pochi indicatori quindi utilizzo il principio della parsimonia ovvero cerco di
avere un’informazione statistica utilizzando il minimo degli indicatori possibili. Gli indicatori vanno scelti in
base a quello che vuoi venga stimato in base a una coerenza teorica.
Nel better life index vediamo in prima pagina che c’è già un sistema di sintesi.
Un elemento che mi da questo index riguarda la correlazione o meno tra gli indicatori. a destra vi è una
colonna che permette di aumentare o diminuire determinati indicatori a seconda del peso che do ad essi.

Significato concettuale degli indicatori


Mi devo porre il problema del numero degli indicatori e se le dimensioni sono pesati allo stesso modo.

17 obiettivi agenda fino al 2030


Il turismo non è presente ma è spacchettato. Ci sono 17 goals e il turismo rientra nel goal 8, 11, 12, 14.
Il turismo risulta essere completamente trasversale. Nel turismo incoming le variabili sono le nazioni con
reddito pro capite elevato.

Come scegliere i dati e distinzione tra fonti statistiche ufficiali e non ufficiali.
Ufficiali si attengono ad una definizione condivisa in ambito nazionale e internazionale e metodo di
rilevazione omogeneo nel tempo e spazio dato dagli organismi internazionalicomparabile.
È importante vedere se sono sotto direttiva comunitaria o regolamento.

1/03/23
Le fonti statistiche ufficiali hanno definizioni che rispondono a metodologie omogenee uguali per tutti gli
enti e richiedono tempo tra la progettazione/rilevazione statistica e la sua diffusione.

Tutti i soggetti che fanno parte del Sistan hanno un ufficio statistico con il quale colloquia chiedendo i dati
statistici rilevanti o delucidazioni.
Le fonti ufficiali sono quelle che dovrebbero essere quelle di parità qualitativamente superiori e si
oppongono ad esse quelle non ufficiali.
Esse non sono tenute a rispettare definizioni e metodologie fissate per quelle ufficiali. Es: il CENSIS che nel
rapporto fa un’indagine sul turismo romano produce datinon ufficiale perché ha utilizzato metodologie
differenti da quelle alle quali sono tenute quelle ufficiali.
Le fonti ufficiali (enti che partecipano al Sistan) decidono le indagini che devono fare o perché gli viene
imposto dall’alto EUROSTAT oppure dal basso i soggetti del Sistan competenti per area tematica richiedono
di poter fare indagine inserendola nel PSN nel quale andiamo a scrivere tutte le indagini effettuate nel
triennio successivo per area tematica di competenza.
Il dibattito si sviluppa nei circoli di qualità nei quali i rappresentanti discutono insieme ad altri nel Sistan.

La regione è il primo ente Sistan che si occupa di produrre dati statistici sul turismo che poi invia all’ISTAT.
I dati sul turismo escono a 6 settimane e inviati quindi all’ISTAT dopo tale tempo mentre le territoriali
regionali escono a 6-8 mesiproblema tempestività dei datibig data immediata informazione con GPS.
L’ISTAT risponde all’EUROSTATdipartimento che sta sotto all’ufficio affari socialiche si rifà alle nazioni
unite.
Entrambi enti sovra nazionali.
Banca di Italia non fa parte del Sistan anche se è considerata come fonte statistica ufficialeeccezione. È
un’istituzione importante per il turismo perché va a misurare il turismo in entrata/uscita (inbound ed
outbound) che concorre alla bilancia dei pagamenti rientrando nei servizi nei quali rientra il turismo. la
bilancia dei pagamenti registra crediti e debiti.
Lo strumento SIQUAL è lo strumento del sistema della qualità delle statistiche o dati dando la possibilità di
vedere le fasi dell’indagine statistica vedendo rilevazioni ed elaborazioni.
Nella lista SIQUAL le varie voci sono affiancate da R (rilevazione) E (elaborazione).
L’informazione statistica diffusa non coincide con quella potenzialmente disponibile perché quella diffusa è
solo una parte di quella rilevata che io ISTAT ritengo quella importante
In realtà ogni rilevazione statistica lavora con microdati

2/03/23

Cosa è il turismo? è un settore economico? l’aggregato più importante è la spesa spesa turistica. Nelle
statistiche è necessario capire la distinzione tra turisti e viaggiatoriglossario ISTAT
Il turismo può essere indagato tramite le classificazioni economiche.
Il turismo ha due grandi misure: economico (monetario) e non economico (non monetarioarrivi e
presenze). Il turismo è definito multi settoriale e non è un settore economico. il turismo come settore
economico non esiste.
Settore economico: ?
usiamo la classificazione delle attività economiche per classificare le sezioni interne o che partecipano nel
turismo. indice ATECO stabilisce un codice per ogni attività in base alla sezione economica.
È un settore anticiclico non varia spesa con la variazione del ciclo economico.
A: Agricoltura
B-E: industria in senso stretto con F si ha il settore industriale
G-U: servizi che si dividono in market o non completamente di mercato. Es: istruzione e parte di mercato
non mercato.
La sezione I in prima approssimazione può essere associata al turismo (servizi di alloggio e ristorazione)
Per alcune sezioni di attività economiche possiamo misurare il valore aggiunto che il turismo ha nei vari
settori economici. Utilizzando le attività economiche ho una prima misurazione del turismo anche se non
posso valutare l’effettivo peso dal punto di vista economico.
La contabilità satellite è un altro strumento oltre l’indice ATECO che permette ulteriori valutazioni del
settore del turismo.

ISTATClassificazione attività economicheindividuo codice attivitàposso vedere le classificazioni delle


varie
La classificazione ATECO è omogenea e deriva da NACE REV 2 è garantita fino alla terza digit (55.1; 55.2;
55.3)

6/03/23
La NACE REV2 è coerente con la ISIC REV 3comanda a livello totale dandomi un’informazione superiore.
Quando utilizziamo la classificazione ATECO vediamo le statistiche economiche normalmente usate nella
misura delle attività economiche (occupati, valore aggiunto etc.).
Il settore ATECO è un primo strumento per definire il settore turistico ma per alcune attività economiche
questo tipo di approssimazione va bene (55.1,2,3) mentre per altre classificazioni va utilizzato un altro
metodo.

L’HoREca (hotel, restaurant, catering) e fa parte dell’elencazione 56.


Definizione di turismo 692/2011 regolamento CE
L’istat manda a eurostat i dati aggregati sul turismo (lvl nazionale) a 8 settimane/6 settimane. Il problema in
ottica di progetti e PNRR le statistiche non servono a lvl aggregato ma a lvl comunale, territoriale,
provinciale, regionale che ottengo però in 8 mesipossibili cambiamenti drastici in un lasso così grande di
tempo.
Un dato subnazionale ha una tempestività diversa rispetto a un dato nazionale/aggregato.
“Tourism, in a statistical context, refers to the activity of visitors taking a trip to a destination outside
their usual enviroment, for less than a year. It can be for any main purpouse, including business and
leisure.”

“Visitors and “usual” sono concetti chiave.


Le statistiche sul turismo prendono in considerazione le azioni dei VISITATORI durante il viaggo.
Uno dei motivi di caduta dei flussi turistici (diminuzione inbound e outgoing) passando a una
redistribuzione ed è diventata rilevante la diminuzione di turismo per lavoro (causa covides: call a
distanza)
Questa definizione di turismo diventa fondamentale quando la considero lato domanda/lato famiglia.
Il lato domanda per l’ISTAT è l’ex viaggi/vacanze divenuta poi indagine per spesa delle famiglie.

Quando lavoro sui microdati nella matrice di daticolonne=variabili/campi; righe=record


Lavorare sui microdati mi da la possibilità di comprendere il profilo del turista che sceglie quella
destinazione tramite la profilazione dei dati.
Differenza traveller e visitor

Al traveller sono associate: bilancia pagamenti, trasporti, migrazioni, statistiche turismo.


Quando il traveller diventa visitor rientrano esclusivamente le statistiche sul turismo
Le statistiche sul turismo riguardano i turisti e gli escursionisti.

NUTS2: Nomenclutare territorial unitsNUTS2: regionale; NUTS3: provinciale


L’indagine effettuata dal lato offerta arriva fino al particolare territoriale perché quello lato domanda è di
tipo campionario perdendo però l’ambiente abituale.
Domanda e offerta non danno le stesse stime di arrivi e presenze.

8/3/23

Copia appunti

9/3/23
Viaggi e vacanze: l’indagine in conformità al regolamento europeo 692/2011, dal 1° gennaio 2012 ha
sostituito la direttiva europea 95/57/CE, soddisfa l’esigenza di raccogliere regolarmente dati sulla
“domanda turistica” e di garantire, insieme ai dati sull’offerta, la disponibilità, in ambito nazionale di un
sistema integrati di informazioni statistiche sul turismo.

La variabile monetaria non ha lo stesso andamento della variabile economica anche quando si fanno i
progetti. Se il concetto di sviluppo economico (ha pure le componenti sociali) è diverso dalla crescita
economica. Con sviluppo intendo dire aspetti sociali come alfabetizzazione e altri aspetti connessi e quando
faccio un progetto li tengo in considerazione. La variabile spesa la si ritrova anche nell’indagine di viaggi e
vacanze. L’indagine ci fornisce le caratteristiche sociodemografiche e per tale indagine sono disponibili i
microdati (dati elementari). Il campione composto da famiglie (unità è la famiglia) è una parte che essendo
casuale probabilistico ha i risultati riportabili all’universale.
Nell’analisi dati utilizzando i coefficienti di espansioni ho lo svantaggio di non poter scendere al dettaglio
territoriale e si ferma a quello regionale.
NB: dall’indagine ex viaggi e vacanze (indagine sulla spesa) è l’unica che offre dati sulla spesa (?). nella
contabilità satellite l’aggregato spesa non è quello rilevato da indagine ISTAT o banca di Italia. Un altro
elemento importante che viene da viaggi e vacanze è la distinzione tra vacanze brevi e lunghe.
Vacanze brevi: max 3 notti
Lunghe: 4 o più notti
L’indagine fornisce altre informazioni sul movimento turistico, caratterizzandolo, per esempio in base alla
destinazione del viaggio, al motivo per cui si è viaggiato, alla forma di organizzazione del viaggio, al tipo di
alloggio utilizzato, al mezzo di trasporto, alla durata o periodo anno.

Dal 97 al 2013 l’indagine è stata condotta trimestralmente con tecnica CATI su un campione nazionale
annuo di circa 14k famiglie (Circa 3.5k per trimestre per un totale di 32k annuo di individui)
Dal 2014 è diventata un focus incluso nell’intervista inziale/finale dell’indagine sulle spese delle famiglie. È
condotta mensilmente con tecnica CAPI (COMPUTER ASSISTED PERSONAL INTERVIEW) su un campione
teorico nazionale di 19k famiglie (7k per trimestre)

INDAGINE SUL TURISMO INTERNAZIONALE BANCA D’ITALIA


L’analisi della spesa va fatta con le spese di trasporto e senza di esse. Le spese di trasporto sono elemento
di distorsione perché incide anche 30/40% di spesa complessiva del viaggio.
Bilancia pagamenti partite correnti (bilancia commerciale senso stretto e partite invisibili con servizi e
quindi viaggi) e partite controcapitale.
Il disegno di campionamento è complesso
Nel momento di campionamento viene effettuata per tipi di frontiera. Il questionario comporto usa
l’intervista face to face.
La spesa turistica viene pensata in base a 100k intervista ed è un concetto di spesa che mira alla spesa
effettivamente sostenuta.

ASIA (archivio statistico imprese attive)come unità statistica non è esaustivo. Se andiamo a vedere il
numero di unità con le imprese attive sfuggono molte unità (esercizi para o extra albergh). Le imprese a cui
fa riferimento sono le attività economiche con il problema di pesare le singole attività economiche.

Nel questionario devo distinguere tra indagini di fonti statistiche e fonti amministrative.
Per indagine da fonte statistica (es sistema SIQUAL):
1)bisogna fare attenzione al rispondente che deve essere chiaro l’obiettivo della ricerca.
2)scegliere tecnica di indagine attraverso il quale rilevo l’info statistica coerente con le domande che devo
fare (face to face, questionario, CAPI)
3)dividere il questionario in sezioni catturando l’attenzione del rispondente.
Imbuto capovolto:
Imbuto a botte: domande parte centrale
Indagine statistica volta alla customer statisfaction diventa un elemento importante
Nella predisposizione dei quesiti ci sono quelli di controllo per migliorare la qualità del questionario.
L’indagine può essere censuaria
Le altre fonti sono amministrativeho un beneficio o un costo. Il beneficio è che avendo fonti
amministrative ho il caso del singolo albergatore che ha l’obbligo di inviare alla questura i dati relativi alla
struttura. Queste fonti vengono utilizzate perché hanno fatto un adempimento amministrativo.

13/3/23
L’archivio unificato avviene tramite procedura di normalizzazione dopo aver applicato una chiave
identificativa.
Standardizzazione:
censimenti:

BIG DATA: dati telefonici ci permettono di vedere il movimento di dati all’interno della popolazione
Network analysis

ISTATPubblicazionirapporto competitività

Le pubblicazioni che dobbiamo conoscere sono tre:


-Annuario statistico italiano;
-Noi Italia;
-Rapporto competitività.
È qui che prendiamo i dati aggregati sul turismo andiamo su annuario statistico italianole pubblicazioni
prendono in considerazione l’anno precedente

Variazioni congiunturali
Variazione assoluta: La variazione assoluta è una misura del cambiamento numerico di una grandezza
economica, come il reddito, la produzione o il prezzo, senza tener conto del contesto in cui si verifica il
cambiamento.
Ad esempio, se il reddito di un individuo passa da 40.000 euro a 50.000 euro all'anno, la variazione assoluta
del reddito è di 10.000 euro, ovvero la differenza tra il reddito attuale e quello precedente.
La variazione assoluta è utile per misurare il cambiamento numerico di una grandezza economica, ma può
essere limitata nel fornire un'indicazione del significato di tale cambiamento. Ad esempio, un aumento del
prezzo di un bene di 10 euro potrebbe essere significativo se il prezzo originale era di 5 euro, ma potrebbe
essere insignificante se il prezzo originale era di 1000 euro.
Per questo motivo, la variazione relativa o percentuale, che tiene conto del contesto in cui si verifica il
cambiamento, può fornire una migliore indicazione dell'importanza del cambiamento in relazione alla
grandezza originale.

Variazione relativa: La variazione relativa, anche nota come variazione percentuale, è una misura del
cambiamento percentuale di una grandezza economica rispetto al suo valore originale.
Ad esempio, se il prezzo di un bene aumenta da 100 euro a 110 euro, la variazione relativa è del 10%,
poiché la differenza tra i due prezzi (ovvero 10 euro) rappresenta il 10% del prezzo originale (ovvero 100
euro).
La variazione relativa è spesso utilizzata per confrontare i cambiamenti in grandezze economiche di diverse
dimensioni, ad esempio per confrontare l'andamento dei prezzi di beni di diverso valore. Inoltre, la
variazione percentuale è utile per capire l'entità del cambiamento in relazione alla grandezza originale.
La variazione percentuale è calcolata dividendo la differenza tra il valore finale e quello iniziale della
grandezza per il valore iniziale e moltiplicando il risultato per 100. Ad esempio, se il prezzo di un bene passa
da 100 euro a 110 euro, la variazione percentuale è [(110 - 100) / 100] x 100 = 10%.

16/3/23
Piano strategicodocumento più importante
Annuario statistico italiano24 capitoli, 19 sul turismo

ISTATrapporto annuale 2022-situazione del paese


Banche datipubblicazioni
Il primo capitolo che si trova è sempre macroeconomico
NoiItaliaindustria e serviziripartizione per regione in noiItalia ho informazioni statistiche che
riguardano l’italia e l’europa con la permanenza media, posti letto etc variabili necessarie per fare
determinati calcoli.
La divisione è a lvl nazionale, regionale ed europeo.
https://noi-italia.istat.it/pagina.php?id=3&categoria=8&action=show&L=0
il rapporto sulla competitività riprende la classificazione Ateco E NON ritroviamo il turismo
specificatamente anche se è stato fatto un focus sul turismo. da un quadro sintetico sull’andamento
economico anche se non circoscrive in maniera sintetica il turismo.

IpuntoStattavole personalizzatequesta pagina io aprirò quando dovrò consultare le statistiche


dell’OCSE.
Carattere qualitativo nominale (non ordinabile tipo maschi e femmine)

20/3/2023
La variabile statistica può essere:
-quantitativa (numero)
-qualitativa (attributo)

La quantitativa può essere discreta o continua: continua quando è infinitamente numerabile


A seconda della natura del carattere posso applicare certe metodologie: gli arrivi e presenze sono di
carattere discreto.
Quando sono davanti a un carattere discretoconto gli arrivi non li misuro.
L’altezza di una persona è continuo e la misuro.
Il qualitativo può essere ordinabile o no: nominale (posso dire che A è diverso da B; il sesso è un carattere
qualitativo non ordinabile su scala nominale; non posso dire che i maschi vengono prima delle femmine). Le
variabili qualitative vengono anche chiamate mutabili
Poi il carattere qualitativo può essere ordinale e posso affermare che A viene prima/dopo di B e quindi
ordinabile.
DATA WHEREHOUSE: andando su i.stat (che verrà sostituito da istat data) ho le aree tematiche: lato
domanda ho la sezione “viaggi e vacanze” dove trovo le notizie sociali, demografiche, economiche e poi
vado su cultura, comunicazioni e viaggiviaggiHo le varie classificazioni di viaggi (svago, piacere, lavoro
etc)
Sempre sulla colonna a sinistra ho altri dati relativi ad altri tipi di classificazioni.
Lato offertaserviziturismocapacità e movimento che sono le rilevazioni di movimento utilizzate nel
lato offertacapacità servizi ricettivi comunali
movimento servizi ricettivi sono annuali e mensili per vedere la stagionalità

a livello comunale l’istat non diffonde a livello mensile la diffusione delle statistiche.
-Arrivi, presenze, permanenza media

Un’altra banca dati utile èbanca dati settorialiabbiamo statistiche sulle politiche di sviluppo e l’atlante
statistico dei comuni.

Il concetto di valore aggiunto rimanda allo schema di contabilità satellite che usiamo per misurare il valore
aggiunto del turismo. la contabilità satellite a lvl regionale non esisteper avere tale valore aggiunto quindi
usiamo la classificazione ATECOvalore approssimativo
ASC
Banca di Italia: l’indagine è condotta dal 96 ed è campionaria e riguarda il turismo internazionale, le
informazioni vengono utilizzate per compilare la sezione viaggi della bilancia dei pagamenti che si divide in
due sezioni: PARTITE CORRENTI e MOVIMENTO DEI CAPITALI
Le partite correnti si dividono in bilancia commerciale con esportazioni e importazioni nella quale rientra
anche la sezione viaggi. La bilancia dei pagamenti è lo strumento contabile attraverso il quale registro i
flussi in entrata e in uscita che l’Italia ha nei confronti degli altri paesi (flussi di servizi, beni e capitali tutto
registrato nella bilancia) essendo un’indagine campionaria face to face con circa 70 punti frontiera
selezionati. Una delle variabili più importanti oltre ai flussi è la spesa dei viaggiatori. La spesa viene ripartita
tra trasporto e NON trasporto.
La spesa viene rilevata a fine viaggiospesa effettivamente rilevata
Se andiamo sul sito banca italiapubblicazionirapporti con esteroindagine su turismo
internazionalereport annuale2020 CHIARAMENTE parla del COVID

22/3/23
CAMPIONAMENTO

Quando si fa un campionamento esistono due tipi di campione: campione ragionato o campione


probabilistico. In qualunque valutazione di campionamento probabilistico NON posso effettuare inferenze
statistiche.

Esempio; In uno spazio campionario ciascun campione è pari a 5. Se vado ad estrarre ciascuna estrazione da
risultati differenti ma molto simili tra loro poiché si vanno a concentrare in un valore medio dove quindi i
risultati di molti campioni sono simili. Questo significa che; più i campioni sono tanti, più il livello di
probabilità di sbagliare aumenta.

La distribuzione campionaria converge ad un valore medio che è stato ottenuto facendo una media.
Ovviamente è importante che il campione sia di numerosità elevata---> TEOREMA DI LIMITE CENTRALE.

Esempio; mettiamo caso che i membri della classe abbiano tutti la stessa altezza, non avrebbe alcun senso
prendere in considerazione più di un campione poiché ne basta uno.

Più aumenta la variabilità e più aumenta la probabilità, di conseguenza siamo in presenza di più campioni
diversi. Più varia è la probabilità più si ha un’inferenza statistica.

È importante tenere presente la differenza tra incertezza e imprevedibilità;

-incertezza: è probabilisticamente misurabile perché è un modello probabilistico e mi dà una stima


probabilistica. Quindi in questo caso l’errore è misurabile

-imprevedibilità: non è probabilisticamente misurabile perché è imprevedibile (vedi il covid)

Ad ogni modo il campionamento può essere di due tipi;

RAGIONATO= dove il modello e campione non è misurabile quindi l’errore è contemplato e infatti molto
spesso si commette

PROBABILISTICO= dove il modello o campione è misurabile, infatti l’errore non è contemplato


CONTABILITA’ SATELLITE

Lo schema di contabilità è uno schema che deriva dal manuale di contabilità nazionale, ossia il regolamento
comunitario UE n.549/2013.

Il sistema europeo di contabilità del 2010 definisce i principi e metodi di contabilità nazionale a livello
europeo e deriva dal System of National Account 2008 delle Nazioni Unite.

Lo schema di contabilità satellite è previsto dallo SNA e SEC che elaborano delle tabelle producendo delle
informazioni che sono coerenti con alcuni aggregati della contabilità nazionale. Quindi, esiste un quadro
centrale che è la contabilità. I conti satelliti possono soddisfare specifiche in materia di dati ed informazioni
statistiche offrendo maggiori dettagli, organizzando ed approfondendo alcuni concetti presenti nel quadro
centrale. Lo schema di contabilità satellite può anche prevedere alcune informazioni supplementari.

La contabilità satellite è fondamentalmente il modo in cui noi approfondiamo l’andamento


macroeconomico di alcuni indicatori. In particolare, gli indicatori macroeconomici sono quelli misurati
nell’economia di un paese attraverso gli schemi di contabilità nazionale, come il PIL sebbene non sia un
indicatore economico ma un aggregato economico.

23/3/23
La contabilità satellite misura il contributo del turismo sul sistema economico (es: il turismo contribuisce 6%
sul PIL).
Computational equilibrium model: misurano l’impatto sul sistema economico
Moltiplicatori keynesiano: impatto
Tavola input-output: impatto
contabilità satellite: contributo
la differenza tra impatto e contributo è che l’impatto mi permette di collegare il turismo alla variazione del
prodotto interno lordo relazione. L’impatto lo posso misurare quando a determinate variabili collego
l’effetto su una variabile come il PIL.
il contributo è una specificazione ed è misurata dalla contabilità satellite.
La contabilità è definita satellite perché gira intorno a quella nazionale e come appendice dei conti satelliti
che sono tematici:
-conto amministrazioni pubbliche
-conto sul turismo
-conto sull’ambiente
Il sistema europeo dei conti (SEC) e il System national account 2008. Tra i due conti non c’è linearità. La
contabilità satellite non è sotto regolamento e direttiva e risulta essere un esercizio volontario. Ogni 3 anni
viene fatta una relazione sulla quale si suggeriscono le implementazioni che possono essere fatte dal
regolamento. La volontarietà però porta ad avere un approccio soggettivo e quindi non omogeneo (es:
consideriamo PIL Spagna e Italia). La contabilità satellite prevede alcune informazioni supplementari.
Nei conti satellite posso avere caratteristiche diverse:
-conti satellite funzionali: sono strutturati guardano alle funzioni che svolgono gli aggregati economici.
-conti satellite settoriali: mettono in relazione i prodotti con le branche di attività economica (ATECO divide
per settori); il turismo rientra tra i conti settoriali perché mette in relazioni prodotti per branche. Il fatto che
il conto satellite del turismo sia settoriale vuol dire che la contabilità satellite turistica ha come scopo quello
di individuare l’industria turistica perché l’insieme di branche attività economiche aggregate danno il
concetto di industria. Partendo dall’approccio spesa dei visitatori per i prodotti turistici.
La spesa turistica non proviene da indagine viaggi e vacanze o dalla banca d’Italia ma proviene dalla
contabilità nazionale (aggregazione di più dati per quantificare generalmente i consumi delle famiglie
nazionali). I paesi nordici utilizzano i dati che provengono dal lato domanda.
L’approccio per la contabilità satellite è un approccio spesa.

Il conto satellite della prevenzione sociale è collegato ai settori istituzionali: con la contabilità nazionale
parliamo di un insieme di conti che hanno come obiettivo di descrivere la produzione di beni e servizi,
distribuzione e redistribuzione del reddito e il risparmio. Guardando alla contabilità nazionale posso dire
che ho un aggregato di riferimento che è il PIL; ho il gruppo di conti che descrive la redistribuzione (reddito)
generato e come viene distribuito tra chi ha concorso alla produzione di beni e servizi.
Questo gruppo di redditi riceve sussidi o subisce un prelievo fiscale distribuzione/redistribuzione
secondaria. Questo secondo gruppo di conti genera un altro reddito definito reddito disponibile. Il reddito
disponibile in parte viene consumato e in parte risparmio (conti di accumulazione) che verrà reinvestito.
Questo gruppo di conti ha un’entrata e uscita a seconda della posta e si presenta a livello integrato (tutta
italia) oppure a sua volta suddiviso per singoli settori istituzionaliimprese finanziarie, non finanziarie,
amministrazione pubblica, famiglie, settore no profit, resto mondo. Questa articolazione ha delle
specificità per ogni suddivisione.
Nella contabilità ambientale abbiamo i flussi stock (ammontare) e i flussi di materia dove vengono presi in
considerazione flussi e stock misurando l’azione antropica su ambiente (deterioramento) e poi al suo
interno abbiamo il modulo della spesa della produzione ambientale.

Il PIL che misura la produzione di beni e servizi finali (beni e servizi consumati dalle famiglie) e l’ottengo
facendo la differenza tra produzione totale e beni intermedimetodo del valore aggiunto
PIL verde: mira ad isolare le spese che hanno un effetto sul PIL ma rappresentano una riparazione al danno
che la produzione dei beni effettua sull’ambiente.

I conti del turismo rientrano tra i conti di attività economica e prodotti. La compilazione dei conti satellite
deve prevedere sempre quattro fasi (slide)
Tavola 1 spese del turismo inbound per prodotto e per tipologia di visitatori

27/03/23
A seconda del paradigma prescelto si avrà la contabilità satelliteSNA e SEC
Nel capitolo 21 riporta i conti relativi alle attività delle aziende; nel capitolo 22 i conti del settore pubblico,
nel 23 i conti delle istituzioni.
Un aggregato economico non è altro che un valore monetario: tendiamo ad esprimerlo come la
sommatoria di un determinato numero di beni considerando il prezzo per la quantitàaggregato
economico
Questo aggregato può essere espresso in due modi a prezzi correnti ovvero a valori di mercato, è un
aggregato economico in termini nominali (p e q stesso periodo di riferimento). Es: se guardo il PIL a valore
di mercato mi sto riferendo a prezzi e quantità di beni turistici per i rispettivi prezzi dello stesso periodo.
Se mantengo i prezzi a un tempo base precedente e quantità invece che rimane correnteaggregato
economico in termini reali/volume (variazioni).

PIL: aggregato macroeconomico. Da un punto di vista concettuale descrive il valore economico di beni e
servizi finali prodotti all’interno del territorio economico. concetto di produzione finale.
Intero: fa riferimento al territorio economico
Lordo: non viene scorporata l’obsolescenza del capitale fisico (ammortamento). Se la togliessi misurerei il
PINprodotto interno netto.
Il pil misura l’incremento della ricchezza. Questa produzione di beni e servizi finali misura l’incremento
della ricchezza.
Misurando l’incremento di ricchezza assumo che la produzione sia un flusso mentre la ricchezza è uno stock
(quindi l’ammontare).
La produzione si divide in market e non market. Il criterio che si utilizza è quello del 50%. Quando i ricavi
superano il 50% dei costi allora la produzione è market. Distinzione è importante perché quando vado a
valutare i metodi di misura del PIL ne posso considerare tre:
-metodo valore aggiunto
-metodo personale o dei redditi
-metodo della spesa
Un bene è finale quando varca le soglie dell’impresa e va direttamente alle famiglie. Es: mela è bene finale
se da supermarket va direttamente alle famiglie.
La stessa mela invece se divenisse bene per un succo allora diventerebbe bene intermedio per un altro
prodotto finale.

Quando i beni e servizi sono non market uso il metodo personale o redditi e considero la produzione di
attività non market venga fatta dal punto di vista dei costi che sono le retribuzioni.
La produzione finale descrive delle operazioni economiche condotte dagli operatori economici.
Gli operatori sono le unità istituzionali: unità con contabilità completa e autonomia decisionale. Il sistema di
contabilità nazionale considera gli operatori economici aggregati a seconda delle funzioni prevalentemente
svolte.

Cina usa lo SNA…

La somma dei valori aggiunti non da il PIL ma devo inserire le imposte al netto dei contributi sui prodotti.

TAVOLA 5 CONTO DELLA PRODUZIONE DELLE INDUSTRIE TURISTICHE E DELLE ALTRE INDUSTRIE

30/3/23
Ripresa tavola 5
GLOSSARIO: (https://www.istat.it/it/files//2020/06/Conto-satellite-turismo.pdf)
Il consumo turistico interno contabilizza spese ricevute senza esborso monetarioconsumi collettivi. Es:
bonus vacanze non è spesa ma un consumo perché è un trasferimento dal punto di vista della contabilità.
La spesa non coincide con il consumo.
La tavola 5 abbiamo lo studio dell’industria turistica non da intendersi come quella considerata dall’ATECO.
Abbiamo due grandi aggregati VATI (valore aggiunto industrie turistiche) e VAT (industrie turistiche e non).
Nella colonna PRODOTTI abbiamo i servizi/prodotti considerati.
Il valore aggiunto è la differenza tra la produzione totale e i consumi intermedi. Il basi price è al netto di
alcune imposte.
Nella tavola 6 ho l’offerta turistica interna e consumo turistico interni a prezzo di acquisto con iva e
imposte, abbiamo l’output e quota turistica (pari al consumo turistico interno) e quindi il valore aggiunto
quota turismo per quanto riguarda alloggi e visitatori è pari al 99%.
L’industria turistica come definita non ha omogeneità nella perimetralizzazione

Tavola 7: occupazione nelle industrie turistiche. Sono presenti l’industria turistica. Per quanto riguarda i
posti occupati non viene considerato il singolo ma quanti posti occupati dal singolo anche differenti tra loro.
Con le tavole 10a,b,c. prevedono tavole non monetarie a differenze di quelle precedenti.
Le unità di analisi sono il numero di viaggi e numero di pernottamenti. Il numero di viaggi fa riferimento ai
viaggi al di fuori del proprio ambiente economico e poi il numero di pernottamenti. I viaggi sono un flusso il
numero di pernottamenti sono uno stock.
La 10a è a doppia entrata con turisti ed escursionisti e il totale con la somma dei due precedenti. Questa
analisi viene fatta per il turismo inbound, domestico e outbound. Con i pernottamenti parliamo di presenze
e quindi notti.
Per quanto riguarda i pernottamenti se andiamo a vedere quelli del turismo inbound (proveniente da un
Paese diverso da quello di riferimento) nel 2019 sono stati superiori al turismo domestico (italiani che
rimangono in Italia).
Tavola 10b: arrivi e pernottamenti per tipologia di trasporto nel turismo inbound.
10c tipo di alloggio con indici di terminizzazione netti
10b: tavola che ci consente di misurare le unità produttive nell’industria turistica per classi dimensionali di
addetti. Le industrie vengono classificate in base al numero di addetti (1-4, 5-9 etc) e si nota che l’industria
1-4 (conduzione familiare) è quella che prevale.

Per quanto riguarda il conto satellite del 2020 non è stata rilasciata una tavola, è presente il testo integrale
ma non le tavole.

3/04/23

Turismo sostenibile: WTO ultima pubblicazione è del 2015.


Per vedere ciò dovremmo andare a misurare la pressione antropica che l’industria turistica così come
definita nella contabilità satellite genera a livello nazionale e territoriale con riferimento all’industria
turistica. Per realizzare ciò dovremmo avere una filiera a bassa pressione antropica.
Il concetto di pressione antropica si riferisce anche al modo con il quale l’uomo interagisce con
l’ambienteindicatore pressione turistica.

Se estendiamo la sostenibilità tra ambiente e uomoampliamento dei progettiutilizzo spazi in modo


equo e razionale. Per ogni destinazione turistica sarebbe utile avere una capacità di carico. A tutto questo
colleghiamo la sostenibilità a lvl individuale cercando di capire se effettivamente andando in una
destinazione la persona torna con un senso di benessere. Se si torna dalla vacanza stressato dalla
destinazione turistica a causa dello stress stesso della destinazione allora la destinazione ha fallito.
Frameworkdocumentazione statistica per supportare il tipo di progetto.
Conti ambientali: facciamo riferimento al SISTEMA DEI CONTI AMBIENTALI ED ECONOMICI SEA 2003-2012
ed è un manuale ecologico di riferimento. Questo sistema viene predisposto in maniera strutturata nel
2003 con una prima versione nel 93.
Si parla per la rpima volta di ecosistema. Con il sea del 2012
Se devo vedere l’interazione tra ambiente ed economia devo vedere il totale dell’economia.
8*Il quadro del SEEA 2003 e 2012 comprende 4 categorie:
a)conti di flusso fisico e ibrido
b)conti del patrimonio ambientale in termini fisici e monetari
c)conti economici per le operazioni ambientali
d)conti per le spese di protezione ed esaurimento delle risorse (prodotto dall’ISTAT)

12/04/23
ISPA nel panorama delle fonti statistiche redige le fonti informative.
PNRR piano nazionale ripresa e resilienza e REACT-EU.

13/04/23
SLIDES
Prnnm

21/04/23
La valutazione è fornire misura delle azioni svolte, senza azione e quindi strumento di misura non possiamo
parlare di valutazione. La valutazione può essere quantitativa o qualitativa.
Es: customer satisfaction è una valutazione qualitativa fatta di giudizi. Le valutazioni qualitative vengono
analizzate con delle scale potendole trasformare da qualitative a quantitative o viceversa. (Scala di Lickert).
Oppure utilizzo le parole come elemento formativo e faccio un’analisi lessicale con gli attributi che
maggiormente ricorrono (studio delle ricorrenze)analisi testualesentiment analysisprendo il
fenomeno di studio (turismo) e in base al vocabolario che mi sono creato vado a misurare la ricorrenza
delle parole (buono, accogliente, economico etc) che mi aiutano a sintetizzare le ricorrenze di un vocabolo.
Indicatori per il breve terminecongiunturali che vanno a prendere campioni molto ampi (es: clima di
fiducia delle famiglie). I dati (big data) per questo tipo di analisi vengono presi in generale dai social media
in primis Twitter e i dati telefonici.
L’aspetto qualitativo è sempre quello più importante.
APE digitale: tramite valutazioni statistiche viene fatta una profilazione degli utenti e si va a vedere i luoghi
e destinazioni più consoni in base ai dati inseriti. Con il secondo progetto tutte le strutture ricettive si sono
iscritte al portale avendo come obiettivo finale la sostituzione di booking creando un portale nazionale.
Turismo tedesco
Slide VALUTAZIONE.
Fondamentale risulta essere l’individuazione dei bisogni e dei soggetti così da poter effettuare un
miglioramento.
IL SISTEMA DI VALUTAZIONE EX ANTE ed EX POST ha due vie differenti: indicatori soggettivi e oggettivi e dei
modelli statistici ed econometrici dove abbiamo una variabile risposta e altre variabili che possono spiegare
(causa-effetto).
Una variabile discretaconto
Con la variabile continuamisuro
Quando i dati sono di conteggio e applico come metodo di valutazione una regressione…
SLIDE SERIE STORICA
-una serie storica: è una serie di dati

Quando il numero indice è a base fissa è tendenziale


Se è a base mobile allora sarà congiunturale. (serie storica infra-annuale)
Il termine congiuntura vale solo se i periodi sono contigui ma viene utilizzato quando i dati sono infra-
annuali allora vediamo l’effettiva variazione congiunturale.
Quando i dati sono numero indice a base mobile sono mensili o trimestrali la variazione congiunturale è
rispetto al periodo immediatamente precedente ma se utilizzo lo stesso mese dell’anno precedente scatta
la variazione tendenziale con numero indice a base fissa.

26/04/23
Big data è un’informazione che non costa
Errore campionario è misurabile
Distinzione tra approccio scientifico e sociologico a sua volta distinti tra chi utilizza gli indicatori e chi no
Per fare un programma deve essere chiaro cosa fare e chi intercettare
Per fare un progetto devo intercettare una linea di bisogni emergenti non soddisfatti fino ad ora e sto
individuando quindi un mercato potenziale e di riferimento,
la valutazione può essere ex ante o ex post (monitoraggio).

27/4/23

3/5/23
Media, mediana etc

4/5/23
Media aritmetica
Frequenza assoluta e relativa
La media è un valore virtuale e non reale. Il concetto inoltre risente dei valori anomali; nel concetto di
media risultano tutti i viaggi anche di quelli che viaggiano gratuitamente nella casa di proprietà.
Essendo un indicatore virtuale bisogna capire in primis come va ottenuto e capire quale sia il concetto di
scarto nella media presentata.
Le proprietà fondamentali sono due:
-la somma degli scarti è zero
-per levare il problema di segno elevo al quadrato o ragiono in termini assoluti
La somma degli scarti al quadrato è un minimo
Quando lavoro sullo scarto lavoro sulla dispersione intesa come dispersione dei dati rispetto a un centro
La media aritmetica va applicata quando l’andamento dei dati è lineare.
Concetto di scartovariabile scartoscarto quadratico medio derivante dalla varianza

Quando la crescita è esponenziale e non più lineare non posso più applicare la media. Se la classe pesa 70kg
e la classe è composta da 30 avrei risultato X ma con la media geometrica poiché esponenziale perché
cresce l’evoluzione dei dati è la radice nesima del prodotto X con i. i casi studiati.
Calcolo di una distribuzione unitaria di dati che compaiono una sola volta e la radice ha n osservazioni.
Quando la media geometrica è ponderata allora effettuo la radice di n osservazioni per x dati presi in n
osservazioni.
Facendo la media dei valori trasformati in logaritmo ottengo la media geometrica.
Se applico una media piuttosto che un’altra la differenza è minima. Molti usano la media geometrica anche
con valori anomali perché essendo sotto radice abbassa l’influenza dei valori anomali. Per risolvere il
problema dei valori anomali uso la media troncata applicando la media aritmetica togliendo il 25% dei
valori più piccoli/grandi se voglio fare la media troncata al 50%.
Un secondo caso: il valore anomalo è molto diverso dai successivi e lo rimuovo esso però potrebbe essere
importante per l’analisi del fenomeno.

Concetto di moda: media di esposizione calcolabile con ogni tipo di carattere. In una eventuale tabella ho il
numero di consumi di un bene e il numero di luoghi nel quale utilizzato (farmaco/reparto)
La diffrequenza: numerosità assoluta/ ampiezza classe

Mediana: nella mediana i numeri devono essere ordinati per dati qualitativi ordinabili (licenza media,
elementare etc) e inoltre non risente dei dati anomali. La mediana non ragiona sui caratteri ma sugli
elementi di posizione. La mediana è un concetto di bipartizione del concetto statistico e non
necessariamente coincidono. Se media e mediana coincidono la distribuzione statistica è simmetrica e la
curva risulterebbe a campana.
Un altro modo per calcolare il valore mediano è la frequenza relativa cumulata e osservare il valore in
corrispondenza del quale la frequenza relativa cumulata raggiunge il 50%.

Percentili: sono quei valori che dividono la distribuzione in cento parti di uguale numerosità
Se divido in quartili il secondo quartile corrisponde alla mediana. 25-50; 50-50; 75-25.

10/5/23

11/5/23
Carattere indice concentrazione
-Cumulabile
-trasferibile
Essendo l’indice relativo esso vale tra zero e uno. Se non lo dividessi non andrei ad avere un indice relativo.
Cartogramma nel quale l’Italia non c’erano grandi aree di concentrazione di rapporto (?).
Turismo e attivazione di altri settori è 3,32 euro. Poco interscambio con altri settoriservizi poco connessi
ai flussi turistici
Statistica bivariata è quell’indice che utilizziamo per capire se esiste relazione tra variabili. Cosa significa
avere qualche relazione?
Le relazioni sono bivariate: peso o altezza oppure due caratteri qualitative (sesso ((sisi grazie)) e titolo di
studio)

Relazioni statistiche: di per se misura un legame associativoil legame non può essere considerato di causa
effetto e una delle grandi problematiche di questi grandi indici è che dal punto di vista empirico non
possiamo stabilire un nesso di causa effetto ma semplicemente stabilire dei nessi di connessione. Cosa è
che ci spinge a ragionare in termini di causa effetto? È la regolarità con la quale vediamo il simultaneo
accadimento degli eventi, noi concettualmente riproduciamo uno schema di causa effetto laddove il nesso
che si registra è di semplice co-variazione.
Se vogliamo saggiare empiricamente una relazione causale allora dobbiamo ricorrere a un metodo
sperimentale nel quale metto la mia variabile dipendente manipolandola vedendo gli effetti sulla variabile
indipendente.
Sarebbe corretto parlare di covarianza e non rapporto causa-effetto perché il disegno sperimentale sul
quale si basano le indagini statistiche non permettono tutto questo (?).
Quando c’è una regolarità allora anche in un disegno non sperimentale (?)

In generale la covarianza o la correlazione does not imply causation.


Noi partiamo dal presupposto che la presentazione TABELLARE raddoppia perché ha due variabili x e y.
Frequenza assoluta congiunta e poi marginale di riga e colonna. Abbiamo visto le diverse letture che
potevamo dare alle diverse ?
Lo strumento di cui mi servo per costruire l’indice p quadrato è l’analisi delle frequenze partendo dal tipo di
ragionamento:
-associazione nulla è quando ho ni con j fratto ni punto è uguale a ni punto j fratto ni punto punto. Se righe
e colonne combaciano associazione è nulla perché non cambia.

Ho la frequenza osservata tramite la tabella e da questa ne costruisco una teorica che soddisfa la
condizione di indipendenza (ho la relazione dove moltiplico freq ass di riga per colonna per tutto il collettivo
ho la freq teorica di indipendenza)
Quando la somma delle contingenze è zero allora le elevo al quadrato (contingenza è valore osservato
meno valore teorico tutto al quadrato) la contingenza al quadrato la divido per la corrispondenza e
frequenza teorica e ottengo ?
Devo trasformare l’indice assoluto in relativo dividendo il p quadro per n che moltiplica il meno per n righe
e n colonne.

Interdipendenza tra caratteri quantitativi (SLIDE)


Ips ipsilon
Quarto azze
Cosa accade quando è uguale a zero? Controversa: due situa: se r è uguale a zero allora i caratteri sono
indipendenti se invece è uguale a zero ma non è lineare (parabolico con legame di secondo grado) allora i
caratteri sono indifferenti

15/5/23
Differenza sostanziale tra campionamento probabilistico e no. Se è probabilistico scelgo in maniera
ragionata le persone oppure effettuo un campionamento a valanga/questionario che sono di basso costo e
pongo delle questioni più disparate. SEGUENDO un campione probabilistico quando commento mi riferirò
alla percentuale dei corrispondenti.
Nel campionamento probabilistico poiché il campione è una variabile casuale i risultati che ottengo dal
campione essendo probabilistico è una variabile che definisco casuale. Le stime che effettuo a partire da
quel campione vuol dire che quella che prima era una variabile statistica prima era casuale. La stima che
faccio sul campione (es altezza media) anch’essa è basata su variabile casuale.
Modello d’urna: associo un modello probabilistico con variabili che possono essere discrete e continue.
Tutte le variabili tendono a una curva che è quella normale. Se io dimostro che i campioni si distribuiscono
secondo un modello d’urna e che lo stimatore scelto come campione ha andamento normale allora sono in
grado di calcolare l’errore di andamento.
Evento 0 è impossibile, 1 è certo, tra 0 e 1 è incertezza.
La normalità è numero di casi favorevoli fratto il numero di casi possibili e ciò risulta essere la frequenza
relativa.
La frequenza relativa in termini matematici è connessa alla legge dei grandi numeri secondo la quale
all’aumentare del numero di ripetizioni di un esperimento la proporzione con la quale uno specifico
risultato si osserva tende sempre più vicina alla probabilità di ottenere lo specifico risultato.

Variabile statistica diventa casuale quando inserisco p(x) ovvero probabilità che si verifichi un evento.
Definiamo come spazio campionario un insieme di possibili risultati. È il numero di campioni
potenzialmente estraibili da una popolazione n.
Io ho interesse a fare un’indagine campionaria perché voglio dati più tempestivi, più facilmente
maneggiabili e con bassi costi. Il problema è che il campione mi da dei risultati differenti: ho lo spazio
campionario che mi determina tante stime a seconda del campione che estraggo.

Media popolazione= media campionaria + errore


Con condizione esistenza: media campionaria – e < media < media campionaria + e
Sigma è variabilità di popolazione e do origine a un campionamento stratificato. La somma complessiva
delle m per strati mi dà la totalità del campione.
Se la popolazione dal quale estraggo il campione è normale allora i campioni estratti e le medie
campionarie calcolate sono normali. Se non è normale interviene il teorema del limite centrale con n>30
(campioni maggiori o uguali a 30) qualunque andamento abbia la popolazione la media tende al normale.

Potrebbero piacerti anche