Sei sulla pagina 1di 16

Risultati sondaggio “Analisi Utente Medio TV Digitale Terrestre”

Si passerà, in questa sede, ad un’analisi puramente quantitativa. I dati sono stati ricavati da un
questionario sviluppato dallo stesso autore e somministrato ad un campione. Il modello di
questionario sarà disponibile in Appendice al seguente capitolo. La modalità di somministrazione è
avvenuta online attraverso la piattaforma Survey Monkey1 . Il questionario è stato compilato ed
inviato, in totale, da 99 persone, la maggior parte dei quali donne (54%). Il grafico seguente, illustra
le fasce di età che hanno risposto al sondaggio

Tabella1- Rispondenti al sondaggio: fasce di età

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Come si può evincere graficamente, è forte la preponderanza di soggetti appartenenti alle fasce di
età più giovani e più vicine all’età dell’autore. La distribuzione da un punto di vista anagrafico
risulta profondamente sbilanciata. Questo, invero, rappresenta un primo bias all’analisi in quanto
dette osservazioni non risultano sufficientemente rappresentative del campione totale della
popolazione. Altra distorsione dei dati, riguarda il livello territoriale. Il campione è fortemente
rappresentativo con riguardo alle zone meridionali dell’Italia, in particolare alla Sicilia. Sono altresì
presenti, rappresentanze di quasi tutte le regioni italiane.

Andando ad analizzare il livello di istruzione del campione, si può evidenziare come più del 40%
del campione abbia conseguito almeno un Diploma di Scuola Superiore. La quasi totalità ha
proseguito gli studi con un 35% che ha terminato l’intero percorso accademico. Un campione,
quindi, che ha un livello di istruzione medio-alto che risulta quasi totalmente all’interno di percorsi
professionali e/o di formazione. Solo il 19% risulta attualmente non occupato o non frequentante
alcun percorso di formazione. La maggior parte di questi, comunque, ha raggiunto l’età

1
https://it.surveymonkey.com/
1
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
pensionabile. Il campione risulta quindi, rappresentare in maniera preponderante una certa parte
della popolazione. Una popolazione relativamente giovane, che è nata in un periodo di transizione
tra l’analogico e il digitale (Millennials) o che, addirittura ha sempre vissuto in un mondo a trazione
digitale (Generazione Z). Un campione per la quasi totalità impegnato in percorsi formativi o di
lavoro che, quindi, avrebbe poco tempo per guardare la TV. Nonostante, la forte distorsione dei
dati, secondo l’opinione dell’autore, può risultare opportuna e praticabile un’analisi più
approfondita del campione. In questo senso, si andrà a dimostrare se alcune delle ipotesi ricavate
dal sentire comune, come da molto più autorevoli fonti, risultino plausibili anche in questa sede. In
particolare, da un po’ di tempo gli esperti del settore cercano di intercettare quelle che sono le
nuove abitudini di consumo delle nuove generazioni. Secondo un articolo del World Economic
Forum2, le fasce di età classificabili nella cosiddetta Generazione Z, risultano un po’ l’incognita di
questi ultimi tempi. Una generazione, quella Z, che ha preso fortemente coscienza di quelli che
sono i problemi attuali e di come questi possano cambiare totalmente il mondo in cui vivranno. Una
generazione pronta a combattere e a manifestare per il proprio futuro, che risulta pienamente
conscia del proprio potere. Sia esso potere di acquisto o elettorale, i Millennials, ancor di più la
Generazione Z, rappresentano le nuove frontiere del mercato. Sono quindi oggetto analisi da esperti
di tutti i campi che cercano di esplorare le tendenze e le abitudini di consumo per poterli
intercettare. Il settore dell’intrattenimento, non si esime da questo tipo di ragionamento e cerca di
venire a capo di questa nuova classe di futuri o prossimi consumatori. Seppur in maniera molto
limitata e con tutte le premesse del caso, il seguente lavoro vuole essere un, anche minimo,
contributo a tutta questa serie di analisi. In questo senso, si cercherà di utilizzare i dati ricavati dal
sondaggio per poter rispondere ad alcune questioni fondamentali e utili. La prima, e significativa
questione, riguarda il rapporto tra le nuove generazioni e i servizi televisivi. Si sente dire troppo
spesso che il mondo della TV non è abitato dai giovani. Millennals e Generazione Z, non
usufruiscono di TV nel senso più letterale del termine. Secondo alcuni, le nuove generazioni
preferiscono lo schermo dei loro dispositivi mobili a quello della cosiddetta sofaTV. Come già
evidenziato in questa sede, e nei capitoli precedenti, il panorama dell’intrattenimento TV risulta
molto più variegato e composito rispetto a quello di qualche anno fa. I comportamenti televisivi
risultano radicalmente mutati, anche con riguardo a fasce più vecchie della popolazione come la
Generazione X. Di fatto, il campione ricavato dal sondaggio afferma che per più della metà fruisce
di servizi televisivi attraverso il proprio PC.

2
https://www.weforum.org/agenda/2019/01/greta-thunberg-at-davos-why-gen-z-has-real-power-to-influence-business-
on-climate-change/?fbclid=IwAR1K6fHnupDTxmiv4I-9m3F1n1pNnUbUi56siLT1BYyHi5KrxU29n4bhrhg
2
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Tabella 2- Quali altri supporti utilizza per fruire dei servizi televisivi?

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Il resto del campione si distribuisce tra Tablet (14%) e Smartphone (25%). Solo il 9% ha dichiarato
di non utilizzare altri dispositivi per consumare prodotti televisivi. Da qui, si può concludere che,
gran parte del campione associa o sostituisce totalmente lo schermo televisivo a quello dei propri
dispositivi mobile. Un trend che risulta dimostrato anche da analisi ben più rigorose di questa. Da
un lato si esaltano le caratteristiche di flessibilità ed indipendenza delle trasmissioni via mobile.
Dall’altro, almeno in termini di esigenze informative, si percepisce una certa diffidenza.

Al di là di una semplice dimostrazione di dati, il seguente lavoro proverà ad arricchire l’analisi


utilizzando alcuni strumenti statistici a riprova di queste affermazioni. Da un punto di vista
metodologico, una regressione logistica multipla rappresenta un valido elemento per poter trarre
ulteriori conclusioni. In primis, attraverso un’analisi di regressione è possibile stabilire una certa
relazione funzionale tra due variabili. La più comune forma di analisi di regressione, è quella di tipo
lineare che cerca di stabilire se esista e sia statisticamente rilevante, una relazione di tipo appunto
lineare tra le variabili considerate. Secondo una notazione statistica, si identifica come Y la
variabile dipendente e con Xj i=1,…,k le variabili indipendenti. Attraverso la regressione lineare si
cerca di stabilire se esiste e di che natura sia l’influenza delle variabili indipendenti X sulla Y. In
particolare, la regressione si focalizza su rapporti funzionali di tipo lineare rispetto ad altri. In
maniera rigorosa, dato un insieme di osservazioni n una variabile Y e una o più variabili X, la
regressione lineare cerca di stabilire se è verificata e statisticamente rilevante una relazione di
questo tipo:

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋11 + ⋯ + 𝛽𝑖 𝑋𝑖𝑗 + ⋯ + 𝛽𝑘 𝑋𝑛𝑘 [1]


con i= 1,...n e j=1,…k

3
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Secondo certe assunzioni, tale equazione dovrebbe approssimare con una certa esattezza la vera
relazione che sussiste tra le variabili X e Y. Una regressione lineare di questo tipo, risulta
l’archetipo di tutta una serie di modelli che si adattano alle necessità e alla natura delle variabili. Un
tipo molto comune di variabile è la cosiddetta booleana. Questo tipo di variabili può assumere
valori che sono Vero o Falso, generalmente rappresentate con 0 e 1. Quando una variabile che si
vuole analizzare come dipendente, risulta essere di tipo booleano, è necessario ricorrere ad un tipo
di regressione specifica. La più diffusa forma di analisi della relazione funzionale con variabili di
questo tipo è la regressione logistica o modello logit/probit. Attraverso questo modello è possibile
predire il comportamento di una determinata variabile dipendente in relazione a una o più variabili
indipendenti. La variabile dipendente in questione, sarà necessariamente una variabile di tipo
booleano. Da un punto di vista logico, questo modello permetterà di stabilire se, attraverso le
variabili indipendenti, sia possibile predire l’avvenimento di un certo risultato della variabile
dipendente (o 0 o 1). In questa sede, come quando in generale si analizzano i risultati di un
sondaggio, il modello logit sarà in grado di stabilire se è possibile predire attraverso le variabili X
che sceglieremo, una certa risposta ad una domanda del sondaggio. Formalmente, dato un certo
numero di individui i per i= 1,…n una variabile Y che può assumere valori

0, 𝜋
𝑌={ [2]
1, 1 − 𝜋

e Xj con j=1,…,k variabili indipendenti, l’equazione del modello logit sarà


𝜋(𝑥 )
𝑙𝑜𝑔 1−𝜋(𝑥𝑖 ) = 𝛽0 + 𝛽1𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ + 𝛽𝑘−1 𝑥𝑖𝑘−1 [3]
𝑖

La prima relazione che si cerca di dimostrare è se sia possibile predire quante ore in media un
individuo fruisce di servizi televisivi, in base alla sua età. Per provare ciò, si sceglierà come
variabile dipendente la risposta alla domanda “Quante ore in media dedica alla fruizione
televisiva?”. Ai fini del modello logit, sono state accorpate diverse classi di risposte. La variabile
dipendente creata, avrà valore 0 se il rispondente ha dichiarato di dedicare meno di 3 ore alla
fruizione televisiva. Nel caso i soggetti abbiano dichiarato di dedicare più di 3 ore, la variabile avrà
valore 1.

Tabella 3 – Variabile dipendente “Quante ore in media dedica alla fruizione televisiva?”

Valore Ore
0 Fino a 3 ore
1 Più di 3 ore
Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Come variabile indipendente, si utilizzeranno le risposte alla domanda “Età” che è stata suddivisa
in fasce e gli sono stati attribuiti dei valori definiti. Allo stesso procedimento sono state sottoposte
le altre variabili ricavate dalle altre domande del sondaggio. In particolare ci si riferisce a
“Istruzione”, “Occupazione”, “Quali altri supporti utilizza per guardare programmi televisivi?”,
“Sesso”. La seguente tabella riassume quanto specificato

4
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Tabella 4 – Variabile indipendente e controllate

Valore Fascia d’età Istruzione Occupazione Quali altri supporti


utilizza per
guardare
programmi
televisivi?
1 19-24 Diploma di Scuola Media Impiegato (pubblico, PC
Inferiore privato)
2 25-34 Diploma di Scuola Media Studente Tablet
Superiore
3 35-44 Laurea Triennale Libero Professionista Smartphone
4 45-54 Laurea Magistrale Non occupato Console
Specialistica
5 55-64 - - Nessuno
Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Le variabili in questione, verranno trattate come categoriche non avendo alcun ordine di importanza
tra loro. Da un punto di vista logico, si utilizzerà la variabile Età come variabile esplicativa del
modello. Le altre variabili esplicative saranno utilizzate per controllare l’effetto della variabile
indipendente sulla Y. A queste si aggiunge la variabile bernoulliana “Sesso” che assumerà valore 0
se il rispondente ha dichiarato “Uomo” e 1 se ha dichiarato “Donna”. Allo stesso modo si è definita
la variabile “Social” che proviene dalla risposta alla domanda “E’ solito/a pu

Tabella 5- Variabili “Sesso”

Valore Sesso
0 Uomo
1 Donna
Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Una volta definite le variabili dipendenti ed indipendenti, si passerà ad un analisi esplorativa dei
dati per cercare di intuire quali potrebbero essere le possibili distorsioni all’analisi. Per le variabili
categoriche “Età”, “Occupazione” e “Istruzione” si è provveduto a costruire i rispettivi boxplot che
daranno un’idea della simmetria delle distribuzioni di frequenza.

5
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Tabella 6 – Boxplot variabile esplicativa “Età”

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Come si può evincere dal grafico, nella variabile “Età” la maggior parte della distribuzione si
concentra tra le classi 1 e 4 corrispondenti alle fasce 19-24 e 45-54. La mediana della distribuzione
risiede nel valore corrispondente alla fascia di età 25-34. Il campione, quindi, non risulta
simmetrico e fortemente sbilanciato verso le fasce più giovani di età. Questo potrebbe, in effetti,
avere delle ripercussioni sull’analisi in quanto la distribuzione della variabile esplicativa, risulta
distorta.

Tabella7- Boxplot variabile indipendente “Istruzione”

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

6
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Per quanto riguarda la variabile “Titolo di Studio”, notiamo come la mediana e il 3° quartile
coincidano. La distribuzione si concentra verso la parte centrale dei valori. Anche si può parlare di
distribuzione asimmetrica, in quanto più del 50% della distribuzione è rappresentato dal valore 3
che corrisponde a “Laurea Triennale”

Tabella 8 – Boxplot variabile indipendente “Occupazione”

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

La distribuzione della covariata “Occupazione” è quella che risulta maggiormente distribuita.


Invero il campione può definirsi sufficientemente rappresentativo di tutte le classi. La sua mediana
risiede nel valore 2 che rappresenta la risposta “Studente”. Invero, questa distribuzione è quella che
risulta meno asimmetrica da un punto di vista grafico rispetto alle altre.

Tabella 9 – Boxplot variabile risposta alla domanda “Quali altri supporti utilizza per guardare
programmi televisivi?”

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

7
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Con riguardo alla distribuzione della variabile “Quali altri supporti utilizza per guardare programmi
televisivi”, la medianda coincide con il primo quartile. Ciò porta ad indurre come, anche in questo
caso, più della metà della distribuzione, è rappresentata dal valore 2 che corrisponde alla risposta
“PC”.

Passando all’analisi delle variabili binarie “Sesso” e “Ore”, un indice interessante, è quello della
proporzione di un certo risultato, rispetto al totale. La percentuale di Uomini (0) è del 44% contro
un 54% di Donne.

Tabella 10- Proporzione risposte Variabili Binarie “Sesso” e “Ore”

Risposta Sesso Ore


0 0.44 0.73
1 0.54 0.24
Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Un dato molto più significativo ha a che fare con la variabile dipendente, in cui è presente una certa
sproporzione. Come si evince dalla tabella, circa il 73% dei risultati è 0, cioè “Fino a 3 ore”, mentre
il circa il 24% ha risposto 1. Questo, potrebbe avere effetto sulla regressione in quanto il dataset non
risulta bilanciato. I risultati potrebbero risentire di questa ulteriore distorsione. Per avere risultati più
chiari, bisognerebbe attribuire una stessa proporzione di risposte ad entrambi i valori 0 e 1. Per
mantenere intatta la base dei dati, non si provvederà in questa sede a tale approssimazione.

Successivamente ad un’analisi delle distribuzioni delle variabili, si passerà ad un’analisi esplorativa


per constatare le loro capacità predittive. Alcuni strumenti, invero, permetteranno di misurare
quanto le variabili indipendenti qui scelte, saranno in grado di predire la variabile dipendente. In
primis, si introdurrà il concetto di Weight of Evidence (WOE). Tale misura rimanda la forza
predittiva di una variabile indipendente. Formalmente

% 𝑛𝑜𝑛 − 𝑒𝑣𝑒𝑛𝑡𝑜
𝑊𝑂𝐸 = ln( )
% 𝑒𝑣𝑒𝑛𝑡𝑜

In particolare, considerando la variabile dipendente scelta. La WOE, si ottiene calcolando il


logaritmo naturale del rapporto tra la distribuzione dell’evento fratto la distribuzione del non-evento
riferita a ciascuna classe del predittore scelto. La sommatoria di tutti questi valori, scalata per lo
stesso WOE, rappresenta il cosiddetto Information Value (IV). Formalmente

% 𝑛𝑜𝑛 − 𝑒𝑣𝑒𝑛𝑡𝑜
𝐼𝑉 = ∑ ln ( ) ∗ 𝑊𝑂𝐸
% 𝑒𝑣𝑒𝑛𝑡𝑜
L’IV, dà una generale valutazione sulle capacità predittive della variabile indipendente scelta. Una
volta ottenuto l’IV per i nostri predittori, si avrà una disamina della capacità predittiva delle singole
variabili e, quindi, dell’intero modello. La seguente tabella sintetizza il valori che potrebbe
assumere l’Information Value e la loro valutazione ai fini dell’efficacia del modello

8
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Tabella 11- Valori rappresentativi Infromation Value e relativo giudizio

Valore Capacità predittiva


<0.02 Troppo Bassa
0.02-0.1 Debole
0.1-0.3 Media
0.3-0.5 Forte
>0.5 Troppo alta o sospetta
Fonte: https://www.listendata.com/2015/03/weight-of-evidence-woe-and-information.html

Da un punto di vista strettamente logico, la procedura inizierà calcolando il WOE per ciascuna
classe delle variabili indipendenti. Una volta ottenuti i WOE, si passerà alla costruzione dell’IV e al
relativo giudizio. Si utilizzerà il pacchetto “Information3” del software R per espletare tutte le
procedure. La seguente tabella rappresenterà una sintesi di tutto il processo logico sopra descritto.

Tabella 12- Information Value Variabile Dipendente ‘Ore’4

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Da un punto di vista strettamente statistico, i valori delle prime variabili risultano eccessivamente
alti. Soprattutto con riguardo alle prime due variabili Occupazione e Titolo di Studio che registrano
1.518 e 0.711. Invero, ciò è dovuto alla costruzione dell’indice. Di fatto, il numero basso di
osservazioni del campione rimanda un indice che risulta eccessivamente positivo. E’ altamente
probabile che il risultato della regressione possa essere influenzato da questo fattore. Dall’analisi
della tabella si può evincere come la maggiore forza predittiva è attribuita alla variabile
“Occupazione”. La variabile “Sesso”, con punteggio 0.001 ha un potere predittivo decisamente
basso. Invero, considerando i valori della tabella sovrastante, si procederà all’analisi del seguente

3
R Larsen Kim (2016). Information: Data Exploration with Information Theory (Weight-of-Evidence and Information
Value). R package version 0.0.9.
4
Per la resa grafica si è utilizzato il pacchetto di R Hlavac, Marek (2018). stargazer: Well-Formatted Regression and S
ummary Statistics Tables. R package version 5.2.1

9
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
modello come descritto dall’Equazione [3]. Invero, si metteranno a confronto tre regressioni
logistiche. La prima contenente tutti le variabili indipendenti. La seconda, le variabili indipendenti
“Occupazione” e “Titolo di Studio”. Nelle ultime due si sono isolate le variabili “Occupazione” e
“Titolo di Studio” ed “Età”

Tabella 13- Modello logit variabile dipendente “Ore”5

5
Per la resa grafica si è utilizzato il pacchetto di R Hlavac, Marek (2018). stargazer: Well-Formatted Regression and
Summary Statistics Tables. R package version 5.2.1
10
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Per la scelta del modello più adatto a spiegare la relazione che intercorre tra i dati, si utilizzerà
l’AIC (Aikake’s Infromation Criterion). Data la costruzione dell’indice, si tende a scegliere il
modello che rimanda l’AIC più basso. In questo, caso, l’AIC più basso corrisponde a quello del
modello che considera solo “Occupazione” e “Titolo di Studio”. Altra maniera, specifica di una
11
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
regressione logistica, di selezionare il modello più predittivo, è esaminare la Receiving Operating
Characteristic Curve6 (ROC Curve). La curva viene costruita all’interno di un insieme di assi in
cui, alle ascisse troviamo la Sensitivity. In altre parole, misura il tasso di veri positivi (True Positive
Rate o TPR), vale a dire quanto il modello riesce a predire quelli che sono effettivamente i casi 0 e
1. Sull’asse delle ordinate viene invece misurata la Specificity (False Positive Rate), che indica
quanto il modello non sia riuscito a distinguere tra le classi 0 e 1.

Tabella 14- ROC modelli logit variabile dipendente “Ore”

Fonte: elaborazione propria su dati questionario “Analisi Utente Medio TV Digitale Terrestre”

Nel grafico (Tabella 14) in alto si è provveduto a costruire le curve ROC per ciascuno dei modelli
costruiti. Un modello risulta già predittivo se la sua ROC viene rappresentata nella parte sinistra
della bisettrice. In questo caso, tutti i modelli logit costruiti risultano rispettare questa prima regola.
Come seconda regola, un modello risulta più predittivo rispetto ad un altro, quanto più la sua curva
ROC si avvicina al margine sinistro del sistema di assi. Da un punto di vista strettamente numerico,
quanto più l’area al di sotto della curva (AUC - Area Under the Curve) è maggiore, tanto più il
modello risulta predittivo.

Tabella 15- AUC modelli logit variabile dipendente “Ore”7

6
Per ultetiori informazioni: https://towardsdatascience.com/understanding-auc-roc-curve-68b2303cc9c5per la costruzio
ne delle curve ROC si è utilizzato il pacchetto Robin X. et al. (2011).” pROC:
an open-source package for R and S+ to analyze and compare ROC curves”. BMC Bioinformatics, 12, p. 77.
7
Per la resa grafica si è utilizzato il pacchetto di R Hlavac, Marek (2018). stargazer: Well-Formatted Regression and S
ummary Statistics Tables. R package version 5.2.1
12
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Fonte: elaborazione propria dati questionario “Analisi Utente Medio TV Digitale Terrestre”

La Tabella 15 riassume i valori di AUC per ogni singolo modello considerato. Si può notare come, i
primi due più alti valori appartengono rispettivamente al modello in cui si considerano tutte le
variabili e a quello in cui solo “Occupazione” e “Titolo di Studio” sono inserite. Dall’analisi di AIC
, AUC e ROC , è possibile affermare con un relativo grado certezza, che il modello con la maggiore
forza predittiva è quello che considera come predittori le variabili “Occupazione” e “Titolo di
Studio”. Passando all’analisi, quindi, della seconda colonna (Tabella 13), si può notare un alto
grado di significatività del valore “Non Occupato” e una debole significatività (p<0.1) per il valore
“Studente”. Invero, si può inferire che lo status di non occupato, influenza positivamente il numero
di ore trascorse davanti al TV. Questo risulta, consistente da un punto di vista logico. Coloro che
hanno risposto con “Non Occupato”, sono anche coloro che hanno deciso di non lavorare o che non
lavorano più per motivi di anzianità. Astrattamente, avrebbero quindi più tempo da dedicare alla
TV. Il risultato del valore “Studente”, è negativo e leggermente significativo (p<0.1). Anche questo
potrebbe considerarsi intuitivo. Chi è impegnato in un qualsiasi percorso di formazione potrebbe
non aver tempo di guardare la TV. Ancora più verosimile, sarebbe l’ipotesi che gli studenti, in
quanto appartenenti alle fasce più giovani, non guardino la TV. In questo senso, si è provveduto a
costruire un modello logit che tenesse in considerazione le variabili “Occupazione” ed “Età” come
variabile di controllo. Tale modello non ha generato alcun tipo di effetto significativo. Invero, il suo
AIC risulta più alto di quello del modello di riferimento (seconda colonna, Tabella 13). Altro
risultato intuitivo riguarda l’alta significatività della costante nel modello “Occupazione”(terza
colonna, Tabella 13). In questo caso, la costante rappresenta il valore della logit quando tutte le altre
variabili sono =0. Nel caso specifico, corrisponde alla risposta “Impiegato”. Anche qui, si può
facilmente inferire che, i lavoratori in generale hanno molto meno tempo per guardare la TV. Si è
provveduto altresì al controllo di eventuali collinearità nelle variabili “Occupazione” e “Titolo di
Studio”, attraverso una regressione lineare semplice tra le due. Almeno per il campione considerato,
non risulta presente alcun tipo di relazione causale. Questo potrebbe sembrare controintuitivo, in
quanto, ci si potrebbe aspettare una correlazione positiva tra status occupazionale e istruzione.
L’interpretazione socio-demografica di questo dato, è argomentata dalla natura fortemente
territoriale del campione. Un campione che proviene prevalentemente dal Mezzogiorno in cui, a

per il calcolo degli AUC si è utilizzato il pacchetto Robin X. et al. (2011).” pROC:
an open-source package for R and S+ to analyze and compare ROC curves”. BMC Bioinformatics, 12, p. 77.

13
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
detta delle statistiche nazionali, è ancora difficile trovare una collocazione lavorativa, nonostante il
livello di istruzione. Per ultimo, si passerà all’analisi del modello logit in cui si è isolata la variabile
“Età”. Si registrano significatività più o meno deboli (p<0.1 e p<0.05) con riguardo alle fasce di età
più vecchie del campione. L’effetto di entrambi i coefficienti è positivo. Per quanto riguarda
l’intercetta che, in questo modello, rappresenta il valore logit della fascia di età 19-24, il
coefficiente è negativo con una significatività abbastanza alta. Questo risulta in linea con le ipotesi
formulate all’inizio. In ogni caso, come già esplicato, non è il modello più adatto da un punto di
vista predittivo. Al di là del risultato, in linea con le ipotesi formulate, non è possibile affermare che
la variabile dipendete “Età” possa predire un certo risultato della variabile “Ore”.

Le conclusioni tratte dall’analisi delle regressioni, risultano in linea, da un punto di vista logico, con
la realtà dei fatti. Coloro che hanno più tempo, tendono a guardare più TV. Rispetto, invece, a chi
risulta inserito in un percorso professionale o di formazione. Almeno con riguardo al campione
analizzato, non è possibile concludere che i giovani guardino meno TV. Il modello, risulta
profondamente influenzato dalla natura del campione. Come già anticipato, oltre alla modalità
online di distribuzione del sondaggio, vi è anche l’influenza della fascia di età dell’autore.
Considerando, però, la grande percentuale di Millennials e Generazione Z che ha risposto, al di là
del bias territoriale, il risultato può venire considerato abbastanza valido ed esplicativo di un certo
comportamento, almeno con riguardo al campione considerato. E’ del tutto inappropriato estendere
tali affermazioni verso tutta la popolazione campionaria.

La somministrazione del sondaggio secondo criteri statisticamente rigorosi potrebbe essere il


successivo passo, per cercare di estendere e rendere questo lavoro quanto più esplicativo possibile.
Si rimanda a futuri lavori, la possibilità di ottenere un campionamento più ampio.

Appendice

14
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
Questionario “Analisi Utente Medio TV Digitale Terrestre”

1. Sesso
- Uomo
- Donna
2. Età
- 4-7
- 8-14
- 15-19
- 19-24
- 25-34
- 35-44
- 45-54
- 55-64
- 64+
3. Istruzione (più altro titolo di studio acquisito)
- Diploma di Scuola Media Elementare
- Diploma di Scuola Media Inferiore
- Diploma di Scuola Media Superiore
- Laurea Triennale
- Laurea Magistrale/Specialistica
- Altro (Specificare)
4. Occupazione
- Impiegato (pubblico, privato)
- Studente
- Libero Professionista
- Non Occupato
- Altro (specificare)
5. Regione d’Italia
6. Quante ore in media dedica alla fruizione televisiva?
- Meno di una
- 1-3
- 3-5
- +5
7. Quali altri supporti utilizza per guardare programmi televisivi?
- PC
- Tabet
- Smartphone
- Altro (Specificare)
8. Quale genere di programmi televisivi guarda maggiormente? (Voto massimo da 1 a 5)
- TG/News
- Film
- Serie Tv
- Programmi di approfondimento (Documentari, Talk Show)

15
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre
- Sport
9. E’ solito/a condividere sui social networks quello che vede? (Post, tweet, storie)
- Sì
- No
10. Se potesse cosa modificherebbe dell’attuale offerta di canali TV sul digitale terrestre?

16
Quatrosi Marco- Analisi Utente Medio TV Digitale Terrestre