Sei sulla pagina 1di 45

UNIVERSITÀ DEGLI STUDI DI SASSARI

Dipartimento di Scienze Economiche e Aziendali

Corso di laurea magistrale in Economia


Curriculum
Finanza Impresa e Mercati

TESI
“Il drop out universitario: l'esperienza di
Sassari”

Relatore:
Prof. Dimitri Paolini

Candidato:
Marco Mureddu

ANNO ACCADEMICO: 2017-2018


Indice

INTRODUZIONE ....................................................................................................................... 3

CAPITOLO 1 .............................................................................................................................. 4

1. IL DROP OUT IN ITALIA ................................................................................................. 4

1.1 IL SISTEMA UNIVERSITARIO ITALIANO. ..................................................................................5


1.2 SINTESI NARRATIVA. ........................................................................................................6
CAPITOLO 2 .............................................................................................................................. 9

2. IL CASO-STUDIO: L’UNIVERSITÀ DI SASSARI ........................................................ 9

2.1. IL DROP-OUT NELL’UNIVERSITÀ DI SASSARI ...........................................................................9


2.2. MATERIALI & METODI ................................................................................................... 11
2.1.1.DATI........................................................................................................................... 11
2.1.2.VARIABILI. ................................................................................................................... 12
CAPITOLO 3 ............................................................................................................................ 15

3. EMPIRICAL STUDY ........................................................................................................ 15

3.1. ANALISI DEI DATI .......................................................................................................... 15


3.2. FACTOR ANALYSYS ........................................................................................................ 23
3.3. ANALISI BIVARIATA DEGLI INDICI DI ASSOCIAZIONE DEI SINGOLI FATTORI. .................................... 25
3.4. FORMULAZIONE DEL MODELLO EMPIRICO ........................................................................... 30
3.5. REGRESSIONI MULTIPLE DELLA DURATA DEI PERCORSI DIDATTICI DI CHI HA CONSEGUITO LA LAUREA. . 32
3.6. APPLICAZIONE DEI MODELLI A BINARY OUTCOMES; ............................................................... 35
3.7. ANALISI DEI CLUSTER. .................................................................................................... 39

CONCLUSIONI ........................................................................................................................ 42

BIBLIOGRAFIA, SITOGRAFIA............................................................................................ 44
Introduzione

Il drop out universitario rappresenta un problema di lunga data per le università italiane.
Malgrado tale fenomeno determini un’ingente dispersione di risorse, sia in termini
economici che di capitale umano, il flusso di ricerca e il numero di studi che hanno
contribuito all’individuazione degli elementi che lo caratterizzano e ne favoriscono la
diffusione è relativamente scarso. Questo lavoro presenta i principali risultati emersi
dall'analisi dei dati amministrativi di 3.105 studenti iscritti nel 2010 a corsi di laurea
triennali dell'Università di Sassari. L'obiettivo è inferire su le determinanti del successo
universitario e del drop out...
Capitolo 1

1. Il drop out in Italia

Il fenomeno del drop out universitario in Italia è stato ampiamente osservato e


documentato per molti anni. I problemi di finanziamento delle università e le implicazioni
sul mercato del lavoroconnesse all’abbandono degli studi universitari hanno reso la
comprensione delle decisioni di drop out una preoccupazione centrale per le politiche
rivolte al sistema universitario. Secondo gli ultimi dati OCSE (2017) l'Italia è in coda
nella distribuzione Population with tertiary education per i paesi OCSE, mantenendo un
divario persistente con altri paesi sviluppati. Fra il 2010 e il 2017 la frazione della
popolazione italiana di età compresa tra 25-34 anni con un titolo di laurea è salita di 6
punti percentuali (dal 20,72 % al 26,82 %), ma resta attualmente molto al di sotto della
media OCSE (44,5 %). Rispetto alle loro controparti dell'OCSE, un gran numero di
studenti italiani lascia l'università prima di laurearsi e un numero significativo di
abbandoni si verifica durante il primo anno di studio; solo uno studente su tre riesce a
conseguirela laurea, in un tempo maggiore rispetto alla media OCSE.
Nel 2016, secondo la banca dati Eurostat, i giovani in possesso di diploma di scuola
superiore che hanno iniziato gli studi universitari senza concluderli erano in Italia 524
mila. Gli esperti della Commissione Europea hanno sintetizzato i motivi del drop out in
cinque categorie. Il 36,8 %, che lascia dopo uno o più anni di lezioni ed esami, è spinto
fuori dagli atenei "dal desiderio di lavorare". Oltre un quarto (il 27,3 %) è rimasto deluso
dalla proposta universitariao dal piano di studio. Seguono coloro che hanno dovuto
rinunciare alla laurea per problemi di salute, di famiglia (o altro): il 18,1 %.
Il 9,5 % non ha saputo superare non meglio precisate difficoltà. Relativamente pochi i
ragazzi che hanno abbandonato per "motivi economici": l'8,3 %.
1.1. Il sistema universitario italiano.

Il sistema universitario italiano (basato sulla riforma 3+2, entrata in vigore nel
2001/2002) è organizzato in tre cicli consecutivi: un diploma accademico di primo ciclo
(Laurea Triennale) consente l'accesso al secondo ciclo (Laurea Magistrale, Diploma di
Master Universitario di 1° livello) che, a sua volta, concede l'accesso a corsi di terzo ciclo
(Dottorato di Ricerca, Diploma di Master Universitario di 2° livello). Negli ultimi anni,
le università hanno anche implementato la legge n. 240/2010, la cosiddetta "Riforma
Gelmini", che ha introdotto importanti cambiamenti nella governance universitaria. In
particolare, i dipartimenti universitari sono attualmente responsabili della ricerca e delle
attività didattiche.
L’ammissione agli studi universitari presuppone il possesso di un Diploma di Scuola
Superiore riconosciuto, indipendentemente dal tipo. Eccezion fatta per specifici
Dipartimenti, come quelli nel campo della medicina e qualche università privata,
l'iscrizione all'università non è basata su un test di ammissione. I corsi di laurea sono
caratterizzati da una notevole rigidità dei curricula, che di fatto non consente agli studenti
di decidere quali lezioni o corsi seguire. Inoltre, nelle università pubbliche e private, non
esiste un limite massimo di anni per il conseguimento del titolo: gli studenti possono
ripetere gli esami più volte durante l’arco della carriera universitaria e possono rifiutare
un voto se non lo considerano soddisfacente. La XX Indagine sul profilo dei laureati 2017,
condotta da Almalaurea, mostra che l’età media alla laurea per il complesso dei laureati
del 2017 è pari a 26,0 anni (nel 2016 era 26,1 anni): 24,8 anni per i laureati di primo
livello, 27,0 per i laureati magistrali a ciclo unico, 27,4 anni per i laureati magistrali
biennali. L’età alla laurea è diminuita in misura apprezzabile rispetto alla situazione pre
riforma e il trend è ancora in discesa: l’età media era infatti 27,0 anni nel 2007, di un anno
più elevata rispetto al 2017. Anche la regolarità negli studi, che misura la capacità di
conseguire la laurea nei tempi previsti dagli ordinamenti, ha registrato negli ultimi anni
un marcato miglioramento. Se nel 2007 concludeva gli studi in corso il 37,9 % dei
laureati, nel 2017 il dato raggiunge il 51,1 % (48,8 % nel 2016): in particolare il 58,6 %
tra i magistrali biennali, il 50,8 % tra i laureati di primo livello e il 39,1 % tra i magistrali
a ciclo unico. Se10 anni fa a terminare gli studi con quattro o più anni fuori corso erano
17,4 laureati su 100, oggi si sono quasi dimezzati (9,8 %).
1.2. Sintesi narrativa.

La performance degli studenti universitari è stata oggetto di molti studi ed esiste un corpus
di letteratura internazionale sul fenomeno del drop out. Il quadro teorico fondamentale è
riconducibile all'articolo di Tinto (Tinto, 1975), che illustra il processo che potrebbe
portare al drop out universitario. Tuttavia, la ricerca sul fenomeno in questione,
soprattutto in Europa, è guidata dai dati più che dalla teoria. Nello specifico, le analisi
empiriche americane ed europee si concentrano sulle caratteristiche del lato della
domanda, come l'istruzione secondaria, l'età, la motivazione, i vincoli finanziari, quelli
socio-demografici e altri attributi individuali (Smith e Naylor, 2001; Montmarquette et
al. (2001); Harrison, 2006).
Smith e Naylor(2001) considerano la coorte di studenti del Regno Unito iscritti a tempo
pieno in un corso di laurea di 3 o 4 anni nell'anno accademico 1989-1990, utilizzando un
modello probit binomiale per stimare la probabilità che l'individuo si ritirerà l'università
prima del completamento degli studi. L'analisi mostra come il conseguimento del titolo
sia influenzato significativamente dalla preparazione accademica precedente l'università,
da attributi personali, dalle caratteristiche del corso di studi stesso. La probabilità di drop
out aumenta infatti con l'età; è minore per gli studenti sposati, maggiore per gli studenti
stranieri, così come per coloro che vivono al domicilio dei genitori o fuori dal campus.
Rilevante è anche l'influenza della disoccupazione nella contea di residenza, soprattutto
per gli studenti maschi più poveri. Implementando un modello probit bivariato su un
campione di 3.400 studenti canadesi, Montmarquette et al. (2001) offrono alcune prove
coerenti con quanto sopra riportato. In particolare, mostrano che una miglior prestazione
accademica al college non riduce la probabilità di drop out, mentre, se uno studente è
iscritto in un corso a numero chiuso, la probabilità di perseveranza è significativamente
più alta.
Harrison (2006) riporta i risultati di un sondaggio telefonico su 151 studenti universitari
inglesi della coorte 2002-2003, ritiratisi nel primo anno di studi. L'intervista si concentra
sulle esperienze negative vissute durante il tempo trascorso all'università e le ragioni
ultime di drop out, esplorando in particolare le questioni relative alla scelta del corso,
all'esperienza accademica, alla socializzazione e al sostegno economico. A tali
informazioni si aggiungono quelle personali (genere, tasse) detenute dall'università. Il test
del chi quadro è stato utilizzato per stabilire le relazioni tra variabili; quelle con un livello
di significatività al 95% sono riportate nel documento.
L’alto tasso del drop out calcolato per gli studenti universitari italiani è stato discusso in
vari contributi, scindibili in due categorie in relazione ai diversi approcci utilizzati per
l’analisi: un primo flusso di ricerca si focalizza sui singoli casi studio delle università
italiane (Boero et al. 2005; Belloc et al. 2010); il secondo considera i tassi del drop out
per l’intero sistema universitario italiano, fissando l’attenzione su le determinanti del drop
out dal lato della domanda, come il background socio-demografico, le dinamiche del
mercato del lavoro, la motivazione degli studenti e la distanza tra la casa dello studente e
l’università (Cingano e Cipollone,2007; D'Hombres, 2007).
I contributi riguardanti il drop out in singole università italiane sono limitati. Belloc et
al.(2010) utilizzano i dati amministrativi della Facoltà di Economia dell'Università "La
Sapienza" di Roma, su 9.725 studenti iscritti a corsi di laurea triennali dal 2001 al 2007.
I risultati, ottenuti implementando un Generalized Linear Mixed Model, mostrano che
l’elevata probabilità di drop out è correlata al voto finale di diploma di Scuola Superiore
e allo scarso rendimento all'università, suggerendo che gli studenti che si ritirano sono
inadeguati o insoddisfatti del percorso universitario. Inoltre l’analisi empirica svela che
caratteristiche degli studenti quali la nazionalità e il reddito hanno un impatto
statisticamente significativo sul tasso di drop out. Boero et al. (2005) utilizzano i dati
amministrativi sugli studenti di due università italiane, quella di Cagliari e Viterbo, riferiti
agli iscritti per la prima volta nell'anno accademico 2001-2002. La stima è eseguita
sfruttando due distinti modelli econometrici, un modello probit binomiale per identificare
le determinanti della probabilità di drop out e una regressione OLS per individuare le
determinanti della progressione degli studenti. L’analisi ha suggerito che, nonostante gli
sforzi riformativi, il tasso di ritiro è ancora molto alto e solo una piccola partedi studenti
completagli studi entro il tempo istituzionale. In particolare, la stima evidenzia effetti
marginali molto ampi associati all'istruzione precedente dello studente (istituto
professionale piuttosto che un liceo).
Fra i contributi che si prestano ad un’analisi dell'intero sistema universitario italiano,
fissando l’attenzione su un gruppo relativamente piccolo di variabili correlato alle
caratteristiche personali degli studenti, quello di Di Pietro e Cutillo (2008) esamina
l'impatto sul comportamento degli studenti delle varie misure politiche introdotte negli
ultimi anni, relativamente alla durata, struttura e contenuto dei corsi di laurea, rilevando,
attraverso un modello probit bivariato delle decisioni di iscrizione e ritiro, l’impatto
positivo sui tassi di drop out della riforma del 2001. Risultati simili sono raggiunti da
D'Hombres (2007), la quale considera anche l'impatto motivazionale della riforma nel
comportamento degli studenti: infatti, la possibilità di ottenere un diploma universitario
in un arco di tempo istituzionale minore rispetto al passato, funge da incentivo per gli
studenti nel completamento del percorso di studi. In entrambi i contributi, i dati sono tratti
da indagini trasversali realizzate dall'ISTAT nel 1998, 2001 e 2004 su studenti che hanno
conseguito il diploma di scuola secondaria rispettivamente nel 1995, 1998 e 2001 e
intervistati per i successivi tre anni.
Cingano e Cipollone (2007) combinano dati a livello di singolo e di aggregato sul rendimento
scolastico degli studenti per studiare le determinanti del drop out. Usando i dati di un campione
di circa 23.000 individui rappresentativo degli studenti diplomati nel 1998 e dell’offerta locale
di corsi universitari (indagine ISTAT, 2001), mostrano come il background familiare ed
educativo sono determinanti rilevanti per la probabilità di successo negli studi.
Il contributo di Becker (2001) confronta i tassi di ritiro in Germania e Italia in un quadro
decisionale univariato. L'autore sostiene che gli studenti italiani che abbandonano gli studi
universitari possono essere separati in due gruppi principali: 1) studenti mal preparati per
l’ottenimento di un titolo di laurea: la decisione di iscriversi all’università deriverebbe
dall’impossibilità di trovar un lavoro e può essere spiegata da una concezione errata delle
proprie capacità; la scelta di ritirarsi è conseguenza dell’incapacità di conseguire il titolo; 2)
studenti che si ritirano non appena ricevono la prima offerta di lavoro adeguata, ma ottengono
una laurea nel caso in cui non dovessero riceverla durante gli studi.
Aina (2011), attraverso i dati Eurostat estratti dal sondaggio ECHP (European Community
Household Panel) esamina i tassi di ingresso e ritiro universitari italiani nel contesto di
specifiche caratteristiche parentali e familiari, con lo scopo di valutare gli effetti delle condizioni
culturali e finanziarie della famiglia sugli investimenti nell'istruzione terziaria. I dati, elaborati
per 8 anni, dal 1994 al 2001, includono informazioni demografiche, comportamento della
forza-lavoro, reddito, salute, istruzione, formazione professionale e mobilità. La stima
conferma la persistenza di correlazioni intergenerazionali legate all'educazione: se i vincoli
culturali influenzano l'iscrizione e il drop out dagli studi, il basso reddito influisce
negativamente sulla transizione dalla scuola superiore all'università.
Capitolo 2

2. Il Caso-Studio: l’Università di Sassari

2.1. Il Drop-out nell’Università di Sassari

L'Università di Sassari è strutturata in 13 dipartimenti, attivati in ottemperanza della legge


n. 240/2010 e attivi dal 1º gennaio 2012; questi sostituiscono le facoltà e i vecchi
dipartimenti, occupandosi dell'organizzazione dei corsi di laurea. Esistono sedi distaccate
nei comuni di Alghero, Budoni, Ghilarza, Nuoro, Olbia. L'offerta formativa per l'anno
accademico 2018/2019 prevede 56 corsi di laurea: 29 triennali, 21 magistrali, 6 corsi di
laurea magistrale a ciclo unico, 6 corsi internazionali e 1 corso di laurea
professionalizzante, l’unico della Regione. In totale 35 corsi ad accesso libero e 21 corsi
ad accesso programmato nazionale o locale.
400
351
350

300

250 230

200
164
153
144
150
122

100
60 63
54 48 52 52
38 44 42 38
50 33 33 29
19 24
8 4
0

Tabella 1: studenti immatricolati a corsi di laurea triennali; a.a. 2017-2018. Fonte: Elaborazione su dati MIUR -
Ufficio di Statistica.

Classi di Laurea: L-1: Beni culturali; L-2: Biotecnologie; L-10: Lettere; L-12: Mediazione linguistica; L-13: Scienze
biologiche L-14: Scienze dei servizi giuridici; L-15: Scienze del turismo; L-16: Scienze dell'amministrazione e
dell'organizzazione; L-17: Scienze dell'architettura; L-18: Scienze dell'economia e della gestione aziendale; L-19:
Scienze dell'educazione e della formazione; L-20: Scienze della comunicazione; L-21: Scienze della pianificazione
territoriale, urbanistica, paesaggistica e ambientale; L-24: Scienze e tecniche psicologiche; L-25: Scienze e tecnologie
agrarie e forestali; L-26: Scienze e tecnologie alimentari; L-27: Scienze e tecnologie chimiche; L-32: Scienze e
tecnologie per l'ambiente e la natura; L-36: Scienze politiche e delle relazioni internazionali; L-39: Servizio sociale;
L/SNT1: Professioni sanitarie, infermieristiche e professione sanitaria ostetrica; L/SNT2: Professioni sanitarie della
riabilitazione; L/DS: Scienze della difesa e della sicurezza.
Nella Tabella 1 sono indicati i nuovi iscritti per corso di laurea triennale relativi all'anno
accademico 2017-2018, in accordo con il campione di studenti oggetto dell'analisi.
La Tabella 2 riporta la serie storica degli studenti immatricolati a corsi di laurea triennale
dall'a.a. 2010-2011 al 2017-2018. Il grafico mostra un andamento stabile nel primo
triennio, con un calo di iscritti nel 2013-2014, una flessione pari al 16 %. Nei successivi
anni si nota un trend in crescita, con un tasso di crescita pari a 18 % nell'a.a. 2016-2017.

2000

1800

1600

1400

1200

1000

800

600

400

200

Tabella 2: serie storica degli studenti immatricolati a corsi di laurea triennali. Fonte: Elaborazione su
dati MIUR - Ufficio di Statistica.

10000
9000
8000
7000
6000
5000
4000
3000
2000
1000
0

Tabella 3: serie storica degli studenti iscritti a corsi di laurea triennali. Fonte: Elaborazione su dati
MIUR - Ufficio di Statistica.
Allargando il campo di osservazione al numero totale di iscritti a corsi di laurea triennali
nello stesso periodo si evidenzia un calo costante nel trend sino all'a.a. 2015-2016 (-17 %
fra il 2010 e il 2015); nel successivo biennio la tendenza si inverte, con una crescita pari
al 9 % fra il 2015 e il 2017.

Guardando al numero di studenti laureati in corsi triennali fra il 2010 e il 2017, il grafico
mostra nei primi 5 anni un andamento alternato: infatti, ad un incremento del 5 % nel
2011-2012 fa seguito una flessione di 11 punti percentuali l'anno successivo, una crescita
del 5% nel 2013 ed infine una nuova flessione (-11 %) nel 2014. Il trend dal 2014-2015
registra un leggera crescita (media 2 %).

1600

1400 1407
1335 1315
1247 1213 1218
1200 1165

1000

800

600

400

200

Tabella 4: serie storica degli studenti laureati in corsi di laurea triennali. Fonte: Elaborazione
su dati MIUR - Ufficio di Statistica.

2.2. Materiali & Metodi

2.1.1. Dati.

I dati forniti dall'ISTAT o da altre indagini istituzionali spesso ignorano caratteristiche


rilevanti nella decisione di ritiro dagli studi universitari; di conseguenza questo lavoro
utilizza i dati amministrativi, i quali, malgrado manchino di informazioni sul background
educativo familiare, forniscono informazioni sulla performance universitaria degli
studenti, che è trascurata in gran parte delle analisi empiriche precedentemente
disponibili, fissando l'attenzione sulle caratteristiche individuali osservate e latenti. In
particolare, l'analisi empirica in oggetto è eseguita su un set di dati che raccoglie
informazioni su 3.105 studenti iscritti in 32 corsi di laurea triennali dell'Università di
Sassari nell'anno accademico 2010-2011; è possibile monitorare la carriera degli stessi
sino all'anno accademico 2017-2018. Oltre ai dati anagrafici raccolti al momento di prima
immatricolazione, (sesso, nazionalità, data di nascita, luogo di residenza) il dataset
comprende informazioni sul titolo di diploma di scuola secondaria superiore (tipo, data
di uscita, voto); inoltre vi sono informazioni sulla carriera e performance universitaria del
singolo studente, riguardanti la data di prima iscrizione, la tipologia di accesso al corso
di studi (accesso libero o programmato), il numero di crediti ottenuti di anno in anno, le
tasse dovute e pagate, la borsa di studio, la data di ritiro/conseguimento del titolo.

2.1.2. Variabili.

Il dataset considerato consente la costruzione di diverse variabili; una descrizione


statistica completa delle stesse è fornita nella Tabella 5. Molti studi hanno mostrato
l'effetto significativo di variabili sociali e familiari sul comportamento degli studenti
universitari (Bennett 2009). In linea con lo studio del fenomeno di interesse primario
dell'analisi si individua la variabile "day0" funzionale allo stesso; binaria, assume valore
1 se lo studente si è immatricolato prima del 30-09-2010, valore 0 se l'iscrizione è
avvenuta in seguito. Il background educativo può essere analizzato considerando il tipo
di scuola superiore frequentato, in quanto funge da proxy per la preparazione accademica
insieme al voto di diploma. In Italia, gli istituti universitari collegano spesso l'ammissione
dello studente al corso di laurea al voto di diploma di scuola secondaria, con l'obiettivo
di limitare il numero di iscrizioni; questa politica si basa su una relazione positiva tra le
credenziali dello studente e il successo universitario (più alto è il voto di diploma di scuola
secondaria, più alta è la probabilità di riuscita in un programma di istruzione superiore).
L'analisi seguente porrà l'attenzione anche su tale aspetto, per verificare se questo è in
linea di massima vero o no. A tal scopo si considerano due tipi di diploma di scuola
superiore: licei, istituti tecnici e professionali; mentre i licei forniscono un'istruzione di
sfondo maggiormente adatta per una carriera universitaria, le scuole tecniche sono
esplicitamente mirate a fornire un'istruzione professionale. Con riferimento al voto di
diploma di scuola secondaria si individuano 5 variabili binarie relative a differenti fasce
di voto. Le variabili di controllo incluse nell'analisi si riferiscono a caratteristiche
personali, quali il sesso, il luogo di residenza; queste possono essere rilevanti sul
comportamento degli studenti universitari, come suggerito da diversi autori (es.
Mastekaasa e Smeby 2008). In seconda battuta, si vuole considerare la situazione
economica degli studenti, per indagare se la pressione finanziaria può influenzare o meno
il conseguimento del titolo di laurea. Tuttavia, trattare con il reddito nelle specifiche
econometriche richiede alcune soluzioni empiriche; l'analisi utilizza una proxy,
individuata nelle tasse dovute nel 2010, come indicatore della capacità finanziaria a
intraprendere un percorso universitario; questa variabile è considerata attraverso quattro
dummy. Altre variabili forniscono informazioni sulla carriera e performance universitaria
del singolo studente; l'analisi pone l'attenzione su la tipologia di ingresso al corso di studi
(accesso libero o programmato), l'accesso alla borsa di studio,il numero di crediti
conseguiti il primo anno...; infine la variabile dummy "Prima_Carriera" assume valore 1
se la prima immatricolazione è avvenuta nel 2010 e 0 altrimenti.
Tabella 5.
Variabile Frequenze relative
Cons_Laurea 45.29
day0 71.63
res_SS 26.21
Borsa_Studio 18.76
Prima_carriera 65.57
Femmina 62.67
Liceo 49.29
Anno_diploma_2010 52.71
Accesso_prog 30.59
Corso_Laurea_n
CFU_1°_Anno
Reddito_1°_Fascia 20.08
Reddito_2°_Fascia 18.38
Reddito_3°_Fascia 44.87
Reddito_4°_Fascia 16.67
Voto_dipl_Molto_Basso 17.92
Voto_dipl_ Basso 15.41
Voto_dipl_Medio 31.04
Voto_dipl_Alto 17.38
Voto_dipl_Molto_Alto 14.96
Capitolo 3

3. Empirical Study

3.1. Analisi dei dati

3.1.1. Analisi univariata delle variabili.

Definito nei capitoli precedenti, il background teorico di riferimento, è ora possibile


determinare con maggiore precisione quelli che sono gli obiettivi che la parte di ricerca
empirica presentata nelle pagine a seguire, si prefigge di raggiungere.
In particolare, gli obiettivi dell’indagine sono riconducibili a tre principali tematiche:
1. valutare se sul drop-out e sul comportamento degli studenti universitari è possibile
riscontrare un effetto significativo delle variabili sociali e familiari (Bennett 2009)
quali ad esempio la condizione economico-reddituale o l’essere residenti o meno
a Sassari.;
2. individuare il profilo di un studente “tipo”, vale a dire di quelle che sono le
caratteristiche peculiari che contraddistinguono lo studente che tipicamente
abbandona il corso di studi o, al contrario che termina il suo percorso didattico
con il conseguimento del titolo accademico;
3. capire se gli strumento impiegati con l'obiettivo di limitare il numero di iscrizioni
spesso l'ammissione dello studente al corso di laurea possono influenzare o meno
la probabilità che lo studente consegua la laurea.
Per raggiungere gli obiettivi indicati è stata realizzato analizzato il dataset descritto al
capitolo precedente.
Nelle pagine che seguono, si riportano le elaborazioni eseguite, le analisi realizzate e i
risultati ottenuti; l’interpretazione dei risultati è riportata in fine capitolo e finalizzata nel
capitolo delle conclusioni.
Le indagini condotte hanno permesso di studiare i contributi empirici ottenuti dalle
diverse variabili, rappresentanti dei fattori di influenza ritenuti più rilevanti nella
formulazione della predisposizione a terminare gli studi degli studenti dell’Università di
Sassari. L’analisi dei dati ottenuti nelle diverse condizioni indagate ha dunque consentito
di gerarchizzare diversi fattori in base alla loro rilevanza dei attraverso la formulazione
di un modello empirico da adottare per fare stime di marketing.
Come indicato nei precedenti capitoli, lo scopo dell’indagine è quello di capire quale
potrebbe essere la corretta strategia di azione da adottare per prevenire l’abbandono e/o
prevedere quale possa essere sia l’impatto che essa possa avere sugli studenti, l’eventuale
ricorso a strumenti e meccanismi incentivanti per la conclusione degli studi.
Occorre specificare tuttavia, che l’ambito di ricerca dell’analisi non è rivolto solo
all’indagine relativa all’abbandono degli studi da parte del singolo, inteso come
comportamento specifico, ma anche come parte di un processo più esteso, a livello di
comportamento aggregato attraverso un processo di clusterizzazione.
Lo studio è stato strutturato in più fasi come di seguito elencato:
• Analisi descrittive dei singoli fattori d’influenza;
• Factor Analysys;
• Formulazione delle variabili e dei fattori;
• Analisi bivariata degli indici di associazione dei singoli fattori;
• Formulazione del modello empirico;
• Regressioni multiple delle variabili dipendenti, indipendenti e delle control variables;
• Applicazione dei modelli a binary outcomes;
• Analisi dei Cluster.
Per le analisi statistiche è stato utilizzato il software STATA ed il Dataset è stato ottenuto
nella sua forma finale seguendo la procedura di seguito descritta.
Le variabili di partenza sono riportate nella tabella che segue.
Le ultime righe (segnalate in grigio) sono invece riferite a variabili dipendenti
appositamente create, la cui definizione è riportata nei paragrafi successivi.
NOME TIPOLOGIA RUOLO SIGNIFICATO
codice_fiscale Dummy variable generica C Codice identificativo dstudente
id_anno_accademico_10 Dummy variable dicotomica I Matricola studente nell’anno accademico 2010
id_anno_accademico_11 Dummy variable dicotomica I Matricola studente nell’anno accademico 2011
id_anno_accademico_12 Dummy variable dicotomica I Matricola studente nell’anno accademico 2012
id_anno_accademico_13 Dummy variable dicotomica I Matricola studente nell’anno accademico 2013
id_anno_accademico_14 Dummy variable dicotomica I Matricola studente nell’anno accademico 2014
id_anno_accademico_15 Dummy variable dicotomica I Matricola studente nell’anno accademico 2015
id_anno_accademico_16 Dummy variable dicotomica I Matricola studente nell’anno accademico 2016
id_anno_accademico_17 Dummy variable dicotomica I Matricola studente nell’anno accademico 2017
Corso_Laurea Dummy variable generica I Corso di laurea a cui iscritto lo studente
Reddito Dummy variable generica I Reddito ricavato da Fascia di appartenenza
res_SS Dummy variable dicotomica I =1 se residente a Sassari
CFU_1°_Anno Dummy variable generica C differenza CFU 2011-CFU 2010;
Voto_diploma Dummy variable generica I Voto conseguito col diploma
Borsa_Studio Dummy variable dicotomica I =1 se lo student ha ricevuto la borsa di studio
Prima_Carriera Dummy variable dicotomica C 1 se la prima immatricolazione è stata nel 2010
Femmina Dummy variable dicotomica C Genere, =1 se donna
Liceo Dummy variable generica I =1 se lo studente proviene da un Liceo
DESCRIZIONE_Laurea Dummy variable generica C Stato finale relativo al conseguimento laurea
DESCRIZIONE_uscita Dummy variable generica C Stato finale relativo al termine degli studi
Anno diploma 2010 Dummy variable generica C =1 se lo studente ha ottenuto il diploma nel 2010
Accesso_prog Dummy variable dicotomica C Attenzione verso Sostenibilità ambientale
Reddito_1°_Fascia Dummy variable generica I =1 se Tasse<=0, 0 altrimenti;
Reddito_2°_Fascia Dummy variable generica I = 1 se Tasse>0 & Tasse<=420 (ISEE 20000)
Reddito_3°_Fascia Dummy variable generica I 1 se Tasse>420 & Tasse<=840 (ISEE 30000)
Reddito_4°_Fascia Dummy variable generica I 1 se Tasse>840, 0 altrimenti.
day0 Dummy variable dicotomica I =1 per immatricolati prima del 30-09-2010
Cons_Laurea Dummy variable dicotomica D =1 per chi si è laureato, altrimenti =0

durata Dummy variable generica D Durata del corso di studi


durata_positiva Dummy variable generica D Durata del corso di studi per chi si è laureato
durata_negativa Dummy variable generica D Durata del corso di studi per chi si è laureato
Dove:
I = Variabile Indipendente
D = Variabile Dipendente
C = Variabile di Controllo
Dati relativi al Dataset
Data inizio rilevazioni = 20/09/2010
Data fine = 31/01/ 2017
Mezzo di trasmissione = Email, Whatsapp
Modalità = Elaborazione dati amministrativi segreteria
Numerosità risposte analizzate = 2323
Tabella 3.1
3.1.2. Analisi descrittive dei Fattori d’influenza

Le analisi condotte hanno permesso di studiare in che modo le diverse variabili indagate,
rappresentanti i fattori rilevanti nel processo che porta gli studenti ad abbandonare il
percorso di studi o quali sono gli elementi che se mancanti, precludono la strada verso il
conseguimento della laurea.
Per l’analisi è stato fatto riferimento al dataset Progetto.dta, il cui contenuto è stato
allegato in appendice.
È stata in primis effettuata un’analisi descrittiva della variabile dipendente, di tutte le
variabili indipendenti scelte e delle variabili di controllo sopra elencate (Tabella 3.1), per
andare poi a calcolare l’indice di associazione tra di esse.
L’analisi è proseguita con la regressione lineare multipla OLS, ed infine con l’analisi
diagnostica delle ipotesi del modello.

3.1.3. Definizione delle variabili dipendenti, indipendenti e di controllo

Come primo passo sono state analizzate tutte le variabili oggetto dello studio: partendo
dai dati presenti nel dataset, si è giunti ad una forma contratta nella quale sono state
incluse le variabili indicate nell’ultimo paragrafo del precedente capitolo.
A questo punto, le prime operazione ad essere eseguite sono state quelle necessarie a
istituire l’univocità della corrispondenza tra identificativo del soggetto (nel nostro caso
codice_fiscale) e osservazione: in parole povere, si è fatto in modo che ogni osservazione
fosse riferita ad un identificativo diverso in modo che ad ogni studente corrispondesse
una osservazione del dataset diversa e non ci fossero due osservazioni distinte aventi lo
stesso valore del codice identificativo.
In tal modo il dataset è stato riarrangiato tenendo debitamente conto di tutti quei casi in
cui lo studente è comunque arrivato al conseguimento della laurea ma iscrivendosi più
volte a diversi corsi, o i casi in cui lo studente ha comunque rinunciato a terminare i propri
studi ma dopo essersi iscritto a più corsi e aver provato vari iter didattici.
Una volta riorganizzato il dataset, è stato possibile creare delle variabili che
evidenziassero la durata del percorso accademico di ogni studente e se questo percorso
fosse terminato con il conseguimento della laurea o meno.
Le variabili calcolate sono:
- durata = durata del percorso accademico complessivo di ogni studente
(indipendentemente da quanti cambi di corso di laurea abbia fatto). Ipotizzando che
lo studente abbia effettuato i cambi di corso, durata è la somma delle durate di ogni
i-esimo persorso.
- durata positiva = durata del percorso accademico complessivo di ogni studente
(indipendentemente da quanti cambi di corso di laurea abbia fatto) che ha avuto
come esito finale il conseguimento della laurea triennale.
- durata negativa = durata del percorso accademico complessivo di ogni studente
(indipendentemente da quanti cambi di corso di laurea abbia fatto) che non ha, al
2017, ancora portato al conseguimento della laurea triennale.
Di queste variabili si è proceduto all’analisi univariata:
. tab durata

Durata in anni | Freq. Percent Cum.


----------------+-----------------------------------
0 | 480 20.66 20.66
1 | 161 6.93 27.59
2 | 333 14.33 41.93
3 | 278 11.97 53.90
4 | 193 8.31 62.20
5 | 224 9.64 71.85
6 | 199 8.57 80.41
Più di 7 | 455 19.59 100.00
----------------+-----------------------------------
Total | 2,323 100.00

. tab durata_positiva

durata_ |
positiva | Freq. Percent Cum.
------------+-----------------------------------
|
|
2012| 179 17.72 17.72
2013| 148 14.65 32.38
2014| 155 15.35 47.72
2015| 122 12.08 59.80
2016| 180 17.82 77.62
2017| 226 22.38 100.00
------------+-----------------------------------
Total | 1,010 100.00
. tab durata_negativa

durata_nega |
tiva | Freq. Percent Cum.
------------+-----------------------------------
2010 | 480 36.56 36.56
2011 | 161 12.26 48.82
2012 | 107 8.15 56.97
2013 | 98 7.46 64.43
2014 | 71 5.41 69.84
2015 | 69 5.26 75.10
2016 | 51 3.88 78.98
Dal 2017 | 276 21.02 100.00
------------+-----------------------------------
Total | 1,313 100.00

Dai dati risulta che coloro che, al 2017, non ha ancora conseguito il titolo accademico
sono 1313 su 2323 (56,5%) mentre i laureati sono 1010 (43,5%).
Facendo un’analisi delle durate dei percorsi didattici per chi si è laureato, si nota una
percentuale pressoché uniforme di persone che conseguono il titolo anno per anno, mentre
per i non laureati risulta altissima la rinuncia entro i primi tre anni (748 su 1313, il 57,0%).
Indagando sulla durata in funzione del corso si studi e tenendo presente che è stata operata
una suddivisione dei corsi in sette aree accademiche, si ottiene:
tab durata Corso_Laurea

| Aree didattiche
durata | 1. Materi 2. Materi 3. Materi 4. Scienz 5. Scienz 6. Archit | Total
-------+------------------------------------------------------------------+----------
0 | 105 74 169 8 108 16 | 480
1 | 37 31 58 10 22 3 | 161
2 | 74 22 69 135 22 11 | 333
3 | 56 20 86 56 43 17 | 278
4 | 42 19 54 24 42 12 | 193
5 | 34 35 70 8 64 13 | 224
6 | 35 21 69 15 51 8 | 199
7 | 85 69 130 53 105 13 | 455
-------+------------------------------------------------------------------+----------
Total | 468 291 705 309 457 93 | 2,323
tab durata_positiva Corso_Laurea

durata_pos | Aree didattiche


itiva | 1. Materie 2. Materie 3. Materie 4. Scienze 5. Scienze 6. Archittura | Total
letterarie giuridiche economiche argo/forest. Naturali e urbanistica
-----------+----------------------------------------------------------------------+----------
1 | 28 23 64 26 32 6 | 179
2 | 26 15 51 12 38 6 | 148
3 | 24 23 46 6 44 12 | 155
4 | 30 8 34 15 27 8 | 122
5 | 40 10 56 37 22 15 | 180
6 | 57 8 38 108 6 9 | 226
-----------+----------------------------------------------------------------------+----------
Total | 205 87 289 204 169 56 | 1,010

. tab durata_negativa Corso_Laurea

durata_neg | Aree didattiche


ativa | 1. Materie 2. Materie 3. Materie 4. Scienze 5. Scienze 6. Archit | Total
letterarie giuridiche economiche argo/forest. Naturali e urbanistica
-----------+-----------------------------------------------------------------------+----------
0 | 105 74 169 8 108 16 | 480
1 | 37 31 58 10 22 3 | 161
2 | 17 14 31 27 16 2 | 107
3 | 16 10 30 19 21 2 | 98
4 | 12 11 20 9 15 4 | 71
5 | 10 12 24 2 20 1 | 69
6 | 9 6 18 3 13 2 | 51
7 | 57 46 66 27 73 7 | 276
-----------+-----------------------------------------------------------------------+----------
Total | 263 204 416 105 288 37 | 1,313

Studenti Studenti % Studenti Studenti % Studenti


iscritti laureati al laureati al non laureati non laureati
Area didattica al 2010 2017 2017 al 2017 al 2017
Materie letterarie 468 205 43,8% 263 56,2%
Materie giuridiche 291 87 29,9% 204 70,1%
Materie economiche 705 289 41,0% 416 59,0%
Scienze Agro/forestali 309 204 66,0% 105 34,0%
Scienze naturali 457 169 37,0% 288 63,0%
Architettura ed Urbanistica 93 56 60,2% 37 39,8%
Tabella 3.2

Dai dati, e ancora più direttamente dalla loro elaborazione in excel riportata in tabella 3.2,
è evidente che, in alcune aree didattiche, chi consegue la laurea entro il 2017, ha
percentuali praticamente doppie rispetto ad altre ( ad esempio Scienze Agro-forestali, con
il 66%, rispetto a Materie Giuridiche, con il 29%).
Terminato questo lavoro preliminare, attraverso il comando STATA “summarize” sono
stati valutati gli indici statistici di posizione, di variabilità e di forma di tutte le variabili
osservate.
L’output ottenuto è riportato in Tabella 3.3.
Variable Obs Mean Std. Dev. Min Max
id_anno_a~10 2,323 2010 0 2010 2010
id_anno_a~11 1,755 2011 0 2011 2011
id_anno_a~12 1,613 2012 0 2012 2012
id_anno_a~13 1,194 2013 0 2013 2013
id_anno_a~14 929 2014 0 2014 2014
id_anno_a~15 789 2015 0 2015 2015
id_anno_a~16 600 2016 0 2016 2016
id_anno_a~17 455 2017 0 2017 2017
Voto_Diploma 2,315 76.16847 11.71943 60 100
Borsa_Studio 2,323 .1915626 .3936154 0 1
Prima_carr~a 2,323 .7120103 .4529238 0 1
Femmina 2,323 .6310805 .482616 0 1
Liceo 2,323 .4791218 .4996715 0 1
day0 2,323 .7387 .4394377 0 1
Cons_Laurea 2,323 .4347826 .4958352 0 1
res_SS 2,323 .2483857 .4321697 0 1
Anno_di~2010 2,323 .5570383 .4968429 0 1
Accesso_prog 2,323 .3039173 .4600464 0 1
CFU_1°_Anno 2,323 17.76711 18.32738 0 108
Reddito_1°~a 2,323 .203616 .4027733 0 1
Reddito_2°~a 2,323 .1773569 .3820527 0 1
Reddito_3°~a 2,323 .4511408 .4977142 0 1
Reddito_4°~a 2,323 .1678864 .3738458 0 1
durata 2,323 3.41455 2.546534 0 7
durata_pos~a 1,010 3.647525 1.812991 1 6
durata_neg~a 1,313 2.693069 2.784061 0 7
Reddito 2,323 2.583297 .9932225 1 4
Corso_Laurea 2,323 3.118381 1.482665 1 6
Tabella 3.2
3.2. Factor Analysys

Per quanto riguarda le variabili estrapolate dal Survey, esse sono risultate molto
numerose: è convenuto, quindi, effettuare modellazioni che permettessero di concentrare
più variabili in un indicatore, e si è proceduto ad eseguire una Factor analysys.
L'analisi fattoriale è una tecnica che permette di evidenziare l'esistenza di una struttura di
tratti latenti o fattori/dimensioni non misurabili direttamente, all'interno di un insieme di
variabili direttamente osservabili (variabili strumentali) che si relazionino con tali tratti
latenti. Al loro interno, le dimensioni sono caratterizzate da una propria coerenza teorica,
ossia i fattori non si limitano a rappresentare l'esistenza di un'associazione statistica tra
variabili ma sono interpretabili dal punto di vista razionale.
In particolare, l'analisi fattoriale che deve essere condotta ai fini del lavoro è quella di tipo
esplorativo (EFA, Exploratory Factor Analysis) in cui i fattori vengono estrapolati a
partire dalla matrice di correlazione attraverso il metodo dei fattori principali e la stima
di massima verosimiglianza. Il metodo estrae un numero di fattori pari al numero di
variabili misurate ma solo una parte di essi sarà necessario. La scelta del numero di fattori
da considerare nella soluzione fattoriale può essere effettuata secondo il criterio di Kaiser,
in base al quale si considerano tutti i fattori il cui autovalore sia superiore o uguale a 1
(gli autovalori si relazionano con la quota di variabilità "spiegata" dal fattore e assumono
valori discendenti man mano che dal primo fattore ci si sposta verso l'ultimo).
Il risultato può venire poi sottoposto a rotazione con vari metodi: quello qui utilizzato è
il metodo a rotazioni oblique (Promax) che rilascia il vincolo di indipendenza dei fattori
per migliorarne l'interpretabilità.
Di seguito si riportano i risultati della Factor Analysys applicata ai dati ottenuti.

. factor Corso_Laurea Anno_diploma_2010 Borsa_Studio CFU_1°_Anno Femmina Liceo Prima_carriera


> Reddito res_SS, pcf
(obs=2,323)
Factor analysis/correlation Number of obs = 2,323
Method: principal-component factors Retained factors = 4
Rotation: (unrotated) Number of params = 30

--------------------------------------------------------------------------
Factor | Eigenvalue Difference Proportion Cumulative
-------------+------------------------------------------------------------
Factor1 | 2.05345 0.40889 0.2282 0.2282
Factor2 | 1.64456 0.48304 0.1827 0.4109
Factor3 | 1.16151 0.11892 0.1291 0.5399
Factor4 | 1.04260 0.08777 0.1158 0.6558
Factor5 | 0.95483 0.09083 0.1061 0.7619
Factor6 | 0.86400 0.07762 0.0960 0.8579
Factor7 | 0.78638 0.50234 0.0874 0.9453
Factor8 | 0.28404 0.07540 0.0316 0.9768
Factor9 | 0.20864 . 0.0232 1.0000
--------------------------------------------------------------------------
LR test: independent vs. saturated: chi2(36) = 4290.65 Prob>chi2 = 0.0000

Factor loadings (pattern matrix) and unique variances

---------------------------------------------------------------------
Variable | Factor1 Factor2 Factor3 Factor4 | Uniqueness
-------------+----------------------------------------+--------------
Corso_Laurea | 0.0481 0.2991 -0.0892 -0.7718 | 0.3046
Anno_di~2010 | 0.6028 0.6691 -0.1353 0.1332 | 0.1529
Borsa_Studio | 0.7990 -0.4140 0.0766 -0.1187 | 0.1703
CFU_1°_Anno | 0.2413 0.1394 0.6903 -0.0728 | 0.4405
Femmina | 0.2114 -0.1404 0.4342 0.4266 | 0.5650
Liceo | 0.0144 0.4329 0.5975 -0.1719 | 0.4258
Prima_carr~a | 0.6162 0.5787 -0.3076 0.1702 | 0.1617
Reddito | -0.7178 0.5433 0.0933 0.0427 | 0.1791
res_SS | -0.2266 0.2817 -0.0625 0.4092 | 0.6980
---------------------------------------------------------------------

. rotate,promax

Factor analysis/correlation Number of obs = 2,323


Method: principal-component factors Retained factors = 4
Rotation: oblique promax (Kaiser off) Number of params = 30

--------------------------------------------------------------------------
Factor | Variance Proportion Rotated factors are correlated
-------------+------------------------------------------------------------
Factor1 | 1.90360 0.2115
Factor2 | 1.74526 0.1939
Factor3 | 1.25764 0.1397
Factor4 | 1.09176 0.1213
--------------------------------------------------------------------------
LR test: independent vs. saturated: chi2(36) = 4290.65 Prob>chi2 = 0.0000

Rotated factor loadings (pattern matrix) and unique variances

---------------------------------------------------------------------
Variable | Factor1 Factor2 Factor3 Factor4 | Uniqueness
-------------+----------------------------------------+--------------
Corso_Laurea | -0.0014 0.0600 0.1213 0.8231 | 0.3046
Anno_di~2010 | -0.0274 0.8970 0.1055 0.0441 | 0.1529
Borsa_Studio | -0.8927 0.0902 0.0727 0.0115 | 0.1703
CFU_1°_Anno | -0.1070 -0.0327 0.7353 -0.0290 | 0.4405
Femmina | -0.1633 -0.0202 0.3345 -0.5214 | 0.5650
Liceo | 0.2289 0.0560 0.7156 0.1469 | 0.4258
Prima_carr~a | -0.0882 0.9117 -0.0874 0.0213 | 0.1617
Reddito | 0.8970 -0.0343 0.1458 0.0579 | 0.1791
res_SS | 0.4260 0.2090 -0.0722 -0.3206 | 0.6980
---------------------------------------------------------------------

Factor rotation matrix

--------------------------------------------------
| Factor1 Factor2 Factor3 Factor4
-------------+------------------------------------
Factor1 | -0.8134 0.6204 0.2365 -0.0231
Factor2 | 0.5648 0.7132 0.3139 0.2660
Factor3 | -0.0394 -0.2485 0.9133 -0.2249
Factor4 | 0.1336 0.2113 -0.1072 -0.9371
--------------------------------------------------

. predict factor1 factor2 factor3 factor3


(regression scoring assumed)

Scoring coefficients (method = regression; based on promax(3) rotated factors)

------------------------------------------------------
Variable | Factor1 Factor2 Factor3 Factor4
-------------+----------------------------------------
Corso_Laurea | -0.01221 0.00694 0.07185 0.75879
Anno_di~2010 | 0.01268 0.52826 0.07705 0.00793
Borsa_Studio | -0.47646 0.02142 0.08541 0.01594
CFU_1°_Anno | -0.08051 -0.02907 0.60468 -0.04838
Femmina | -0.09204 -0.00344 0.29509 -0.49261
Liceo | 0.10064 0.02945 0.57177 0.10869
Prima_carr~a | -0.01309 0.53749 -0.07795 -0.00673
Reddito | 0.47322 0.00746 0.08996 0.03952
res_SS | 0.24104 0.15001 -0.06355 -0.30754
------------------------------------------------------

La Factor analysys evidenzia la possibilità di accorpare le 9 variabili analizzate in 4


Factors: questi fattori possono essere utilizzati come indicatori chiave (KI-key indicator)
per lo studio.
I Key indicator suggeriti alla Factor sono i seguenti:
Factor1 = Reddito + res_SS
Factor2 = Anno_di_Studio_2010 + Prima_Carriera
Factor3 =CFU_1°_Anno + Femmina + Borsa_di_Studio + Liceo
Factor4 =Corso_di_Laurea
Dal momento che l’esito della Factor analysys non è risultato essere di facile lettura ed
interpretazione e tenendo conto che il passaggio da 9 variabili a 4 Factors non sarebbe
consistito in una semplificazione sensibile del modello, si è preferito non utilizzare i KI
ma continuare le analisi riferendosi alle variabili in forma non aggregata.

3.3. Analisi bivariata degli indici di associazione dei singoli fattori.


Per le analisi bivariate tramite il software STATA, si è fatto riferimento principalmente
alle variabili indicatore KPI definite nel paragrafo precedente, soprattutto per quanto
riguarda la variabile dipendente che per il resto delle analisi viene identificata nel KPI
WTBd nel Dataset.
Di seguito si riportano i risultati ottenuti dall’analisi suddetta:
Analisi bivariata della durata_negativa
. tab durata_negativa Anno_diploma_2010, chi2 V

durata_neg | Anno_diploma_2010
ativa | 0 1 | Total
-----------+----------------------+----------
0 | 291 189 | 480
1 | 91 70 | 161
2 | 66 41 | 107
3 | 52 46 | 98
4 | 40 31 | 71
5 | 33 36 | 69
6 | 19 32 | 51
7 | 110 166 | 276
-----------+----------------------+----------
Total | 702 611 | 1,313

Pearson chi2(7) = 40.4573 Pr = 0.000


Cramér's V = 0.1755

. tab durata_negativa Borsa_Studio , chi2 V

durata_neg | Borsa_Studio
ativa | 0 1 | Total
-----------+----------------------+----------
0 | 425 55 | 480
1 | 136 25 | 161
2 | 96 11 | 107
3 | 87 11 | 98
4 | 60 11 | 71
5 | 55 14 | 69
6 | 42 9 | 51
7 | 216 60 | 276
-----------+----------------------+----------
Total | 1,117 196 | 1,313

Pearson chi2(7) = 19.4336 Pr = 0.007


Cramér's V = 0.1217

. tab durata_negativa CFU_1°_Anno , chi2 V


Pearson chi2(357) = 998.0713 Pr = 0.000
Cramér's V = 0.3295

. tab durata_negativa Femmina , chi2 V


durata_neg | Femmina
ativa | 0 1 | Total
-----------+----------------------+----------
0 | 200 280 | 480
1 | 77 84 | 161
2 | 45 62 | 107
3 | 41 57 | 98
4 | 25 46 | 71
5 | 23 46 | 69
6 | 17 34 | 51
7 | 101 175 | 276
-----------+----------------------+----------
Total | 529 784 | 1,313
Pearson chi2(7) = 9.1575 Pr = 0.242
Cramér's V = 0.0835
. tab durata_negativa Liceo , chi2 V

durata_neg | Liceo
ativa | 0 1 | Total
-----------+----------------------+----------
0 | 343 137 | 480
1 | 87 74 | 161
2 | 72 35 | 107
3 | 51 47 | 98
4 | 40 31 | 71
5 | 35 34 | 69
6 | 24 27 | 51
7 | 137 139 | 276
-----------+----------------------+----------
Total | 789 524 | 1,313

Pearson chi2(7) = 52.4126 Pr = 0.000


Cramér's V = 0.1998

. tab durata_negativa res_SS , chi2 V

durata_neg | res_SS
ativa | 0 1 | Total
-----------+----------------------+----------
0 | 380 100 | 480
1 | 123 38 | 161
2 | 79 28 | 107
3 | 67 31 | 98
4 | 54 17 | 71
5 | 53 16 | 69
6 | 32 19 | 51
7 | 208 68 | 276
-----------+----------------------+----------
Total | 996 317 | 1,313

Pearson chi2(7) = 10.9982 Pr = 0.139


Cramér's V = 0.0915

. tab durata_negativa Reddito , chi2 V

durata_neg | Reddito
ativa | 1 2 3 4 | Total
-----------+--------------------------------------------+----------
0 | 73 154 196 57 | 480
1 | 27 34 71 29 | 161
2 | 12 19 59 17 | 107
3 | 10 15 50 23 | 98
4 | 10 19 38 4 | 71
5 | 16 12 33 8 | 69
6 | 10 11 21 9 | 51
7 | 67 49 117 43 | 276
-----------+--------------------------------------------+----------
Total | 225 313 585 190 | 1,313

Pearson chi2(21) = 61.9939 Pr = 0.000


Cramér's V = 0.1255

. tab durata_positiva Corso_Laurea , chi2 V


durata_pos | Aree didattiche
itiva | 1. Materi 2. Materi 3. Materi 4. Scienz 5. Scienz 6. Archit | Total
-----------+------------------------------------------------------------------+----------
1 | 28 23 64 26 32 6 | 179
2 | 26 15 51 12 38 6 | 148
3 | 24 23 46 6 44 12 | 155
4 | 30 8 34 15 27 8 | 122
5 | 40 10 56 37 22 15 | 180
6 | 57 8 38 108 6 9 | 226
-----------+------------------------------------------------------------------+----------
Total | 205 87 289 204 169 56 | 1,010

Pearson chi2(25) = 226.2878 Pr = 0.000


Cramér's V = 0.2117

Analisi bivariata della dicotomica Cons_Laurea

. tab Cons_Laurea Borsa_Studio , chi2 V

Cons_Laure | Borsa_Studio
a | 0 1 | Total
-----------+----------------------+----------
0 | 1,117 196 | 1,313
1 | 761 249 | 1,010
-----------+----------------------+----------
Total | 1,878 445 | 2,323

Pearson chi2(1) = 34.8684 Pr = 0.000


Cramér's V = 0.1225

. tab Cons_Laurea CFU_1°_Anno , chi2 V

Pearson chi2(64) = 895.5349 Pr = 0.000


Cramér's V = 0.6209

. tab Cons_Laurea Femmina , chi2 V

Cons_Laure | Femmina
a | 0 1 | Total
-----------+----------------------+----------
0 | 529 784 | 1,313
1 | 328 682 | 1,010
-----------+----------------------+----------
Total | 857 1,466 | 2,323

Pearson chi2(1) = 14.9722 Pr = 0.000


Cramér's V = 0.0803

. tab Cons_Laurea Liceo , chi2 V

Cons_Laure | Liceo
a | 0 1 | Total
-----------+----------------------+----------
0 | 789 524 | 1,313
1 | 421 589 | 1,010
-----------+----------------------+----------
Total | 1,210 1,113 | 2,323

Pearson chi2(1) = 77.5137 Pr = 0.000


Cramér's V = 0.1827

. tab Cons_Laurea res_SS , chi2 V

Cons_Laure | res_SS
a | 0 1 | Total
-----------+----------------------+----------
0 | 996 317 | 1,313
1 | 750 260 | 1,010
-----------+----------------------+----------
Total | 1,746 577 | 2,323

Pearson chi2(1) = 0.7822 Pr = 0.376


Cramér's V = 0.0184

. tab Cons_Laurea Corso_Laurea , chi2 V

Cons_Laure | Aree didattiche


a | 1. Materi 2. Materi 3. Materi 4. Scienz 5. Scienz 6. Archit | Total
-----------+------------------------------------------------------------------+----------
0 | 263 204 416 105 288 37 | 1,313
1 | 205 87 289 204 169 56 | 1,010
-----------+------------------------------------------------------------------+----------
Total | 468 291 705 309 457 93 | 2,323

Pearson chi2(5) = 105.9756 Pr = 0.000


Cramér's V = 0.2136

Analisi di correlazione multipla tra tutte le variabili risultate meglio correlate

| Cons_L~a du~ativa Corso_~a Ann~2010 Borsa_~o CFU_1°~o Liceo Prima_~a Reddito


-------------+----------------------------------------------------------------------------+---

Cons_Laurea | 1.0000
durata_neg~a | . 1.0000
Corso_Laurea | 0.0547 0.0619 1.0000
Anno_di~2010 | 0.2105* 0.1660* 0.1022* 1.0000
Borsa_Studio | 0.1225* 0.1076* -0.0138 0.1632* 1.0000
CFU_1°_Anno | 0.5888* 0.3346* 0.0022 0.1064* 0.1692* 1.0000
Liceo | 0.1827* 0.1692* 0.0885* 0.1787* -0.0311 0.1594* 1.0000
Prima_carr~a | 0.1551* 0.0666 0.0803* 0.6979* 0.1598* 0.0575 0.0067 1.0000
Reddito | 0.0226 -0.0105 0.0566 -0.0548 -0.7596* 0.0072 0.1491* -0.1108* 1.0000

Nelle analisi bivariate sopra riportate è stato calcolato anche l’indice di connessione di
Pearson, che misura il grado di connessione tra due caratteri statistici ed è ottenuto come
somma delle contingenze quadratiche relative. Per Variabili qualitative o quantitative in
classi, l’indice Chi-quadrato vale zero quando tutte le contingenze sono pari a zero e
assume valori via via crescenti quanto maggiore è l’associazione tra i due caratteri.
Conseguentemente, valori elevati di Chi-quadrato indicheranno forte interdipendenza tra
le due variabili esaminate, valori di Chi-quadrato prossimi allo zero indicheranno
indipendenza tra queste ultime.
Il valore dell’indice risulta influenzato dalla numerosità del collettivo e dal numero di
modalità dei due caratteri, il che non consente il confronto in termini assoluti tra due
valori dell’indice. Tuttavia è ampiamente usato per verificare l’ipotesi di associazione tra
caratteri. Una misura relativa di associazione che, risultando variabile tra zero e uno,
consente, quindi, un confronto in termini assoluti tra diversi valori ottenuti per
l’indicatore stesso, è data dall’indice V di Cramer: esso consiste in una versione
normalizzata dell’indice di contingenza media quadratica, che calcola la media delle
contingenze al quadrato relative.
Nell’ultima tabella, è riportata l’analisi multivariata di tutte le variabili risultate più
correlate attraverso la matrice di correlazione.
Contemporaneamente è stato condotto un Bonferroni test con livello di significatività pari
a 0,01 i cui risultati sono indicati tramite il ricorso alle stelle laterali al coefficiente
trovato.
Nella tabella di seguito sono riportati i Chiquadro e i V di Cramer di tutte le variabili
analizzate con evidenza delle correlazioni più forti e di quelle più deboli.

: Correlazioni deboli Correlazioni forti

V di
Var.#1 Variabile #2 Chiquadro p-value
Cramer
durata_negativa Voto_Diploma 40.4573 0.000 0.1755
durata_negativa Borsa_Studio 19.4336 0.007 0.1217
durata_negativa Prima_carr~a 35.0135 0.004 0.1824
durata_negativa Femmina 9.1575 0.242 0.0835
durata_negativa Liceo 52.4126 0.000 0.1998
durata_negativa res_SS 10.9982 0.139 0.0915
durata_negativa Anno_di~2010 284.9746 0.000 0.5205
durata_negativa Accesso_prog 269.9987 0.000 0.5066
durata_negativa CFU_1°_Anno 998.0713 0.000 0.3295.
durata_negativa Reddito 61.9939 0.000 0.1255
durata_negativa Corso_Laurea 226.2878 0.000 0.2117

3.4. Formulazione del modello empirico

Una volta analizzato l’insieme delle variabili estratte dal Dataset ed elaborata una più
chiara visione complessiva delle correlazioni tra variabile dipendente e variabili
indipendenti, è stato possibile finalmente elaborare la formulazione di un modello teorico
di natura empirica che permettesse di fare predizioni ed elaborare strategie.
Il modello completo ipotizzato è esprimibile attraverso la seguente formula:
𝑑𝑢𝑟𝑎𝑡𝑎𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 = 𝛽1 ∙ 𝑉𝑜𝑡𝑜𝐷𝑖𝑝𝑙𝑜𝑚𝑎 + 𝛽2 ∙ 𝐵𝑜𝑟𝑠𝑎𝑑𝑖 𝑆𝑡𝑢𝑑𝑖𝑜 + 𝛽3 ∙ 𝑃𝑟𝑖𝑚𝑎𝑐𝑎𝑟𝑟𝑖𝑒𝑟𝑎 + 𝛽4 ∙ 𝐿𝑖𝑐𝑒𝑜
+ 𝛽5 ∙ 𝐴𝑛𝑛𝑜𝑑𝑖𝑆𝑡𝑢𝑑𝑖𝑜2010 + 𝛽6 ∙ 𝐴𝑐𝑐𝑒𝑠𝑠𝑜𝑝𝑟𝑜𝑔 + 𝛽7 ∙ 𝐶𝐹𝑈1 °𝐴𝑛𝑛𝑜 + 𝛽8

∙ 𝐶𝑜𝑟𝑠𝑜_𝑑𝑖_𝐿𝑎𝑢𝑟𝑒𝑎 + 𝛾1 ∙ 𝐹𝑒𝑚𝑚𝑖𝑛𝑎 + 𝛾2 ∙ 𝑟𝑒𝑠_𝑆𝑆 + 𝛾3 ∙ 𝑅𝑒𝑑𝑑𝑖𝑡𝑜


Nel modello empirico sopra espresso è stata fatta distinzione tra le variabili indipendenti,
correlate attraverso un coefficiente 𝛽𝑖 , e le variabili di controllo, combinate alla
durata_positiva tramite i coefficienti 𝛾𝑖 .
Il modello così ipotizzato può essere testato in Stata attraverso una regressione
multivariata ed eventualmente semplificato eliminando le variabili con coefficienti non
significativi.
Nella formulazione del modello stesso si è tenuto conto delle seguenti ipotesi:
H1. Il drop-out degli iscritti all’Università di Sassari dipende da variabili socio-
demografiche e reddituali;
H2. Il drop-out degli iscritti all’Università di Sassari dipende dall’utilizzo di
strumenti impiegati con l'obiettivo di limitare il numero di iscrizioni e/o
l'ammissione dello studente al corso di laurea

H3. Il drop-out degli iscritti all’Università di Sassari dipende dalla pre-formazione


degli studenti: quindi dipende dal fatto che lo studente abbia conseguito da
poco il diploma (e quindi abbia ancora ottimi ricordi di ciò che ha studiato
alle scuole superiori) e se abbia frequentato un Liceo o una scuola di altro
tipo.

Contestualmente ai test le cui ipotesi sono state sopra formulate, si vuole anche tentare di
individuare il profilo di un studente “tipo”, vale a dire di quelle che sono le caratteristiche
peculiari che contraddistinguono lo studente che tipicamente abbandona il corso di studi
o, al contrario che termina il suo percorso didattico con il conseguimento del titolo
accademico.
Mentre per rispondere ai test si ricorre all’utilizzo di regressioni lineari multiple, per la
ricerca del profilo si ricorre all’analisi dei Cluster.
A questo modello lineare viene poi affiancato un modello ad outcomes binari di tipo
Probit che però interessa la variabile dipendente dicotomica Cons_Laurea.
3.5. Regressioni multiple della durata dei percorsi didattici di chi ha
conseguito la laurea.

Per validare ed eventualmente semplificare il modello empirico, si è proceduto eseguendo


una regressione multivariata della variabile durata_positiva con tutte le variabili
dipendenti e di controllo previste dal modello.
Di seguito si riportano i risultati ottenuti con evidenziate in giallo le variabili risultate
significative:
reg durata_positiva Anno_diploma_2010 Borsa_Studio i.Corso_Laurea CFU_1°_Anno Femmina Liceo
> Prima_carriera Reddito res_SS Accesso_prog,robust

Linear regression Number of obs = 1,313


F(14, 1298) = 21.06
Prob > F = 0.0000
R-squared = 0.1775
Root MSE = 2.5385

---------------------------------------------------------------------------------------------
| Robust
durata_negativa | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------------------------+----------------------------------------------------------------
Anno_diploma_2010 | .9185446 .1938621 4.74 0.000 .5382272 1.298862
Borsa_Studio | .419181 .2979347 1.41 0.160 -.1653052 1.003667
|
Corso_Laurea |
2. Materie giuridiche | .455952 .2481283 1.84 0.066 -.0308245 .9427284
3. Materie economiche | -.1211158 .2164851 -0.56 0.576 -.5458148 .3035831
4. Scienze agro-forestali | .2043076 .3454902 0.59 0.554 -.4734728 .882088
5. Scienze naturali | .4372803 .2352599 1.86 0.033 -.0242511 .8988117
6. Architettura e urbani.. | -.5229367 .4173158 -1.25 0.210 -1.341624 .2957507
|
CFU_1°_Anno | .0681367 .0057308 11.89 0.000 .0568939 .0793794
Femmina | .1839231 .1469605 1.25 0.211 -.104383 .4722292
Liceo | .5950361 .1516317 3.92 0.000 .297566 .8925062
Prima_carriera | -.0356083 .1988976 -0.18 0.858 -.4258042 .3545876
Reddito | .0259125 .1096826 0.24 0.813 -.189262 .241087
res_SS | .2765707 .1737154 1.59 0.112 -.0642231 .6173645
Accesso_prog | .2606124 .2483322 1.05 0.294 -.226564 .7477888
_cons | .9898891 .373628 2.65 0.008 .2569083 1.72287
---------------------------------------------------------------------------------------------
Dall’analisi dei risultati in tabella è possibile trascurare le variabili risultate non
significative e ripetere la regressione includendo solo le altre.
Il risultato ottenuto è il seguente:

Source | SS df MS Number of obs = 1,313


-------------+---------------------------------- F(8, 1304) = 33.80
Model | 1746.35206 8 218.294008 Prob > F = 0.0000
Residual | 8422.95487 1,304 6.45932122 R-squared = 0.1717
-------------+---------------------------------- Adj R-squared = 0.1666
Total | 10169.3069 1,312 7.75099614 Root MSE = 2.5415

---------------------------------------------------------------------------------------------
durata_negativa | Coef. Std. Err. t P>|t| Beta
----------------------------+----------------------------------------------------------------
Anno_diploma_2010 | .9625319 .1489484 6.46 0.000 .1725148
|
Corso_Laurea |
2. Materie giuridiche | .3577045 .2380994 1.50 0.033 .0165615
5. Scienze naturali | .3828546 .2219833 1.72 0.085 .0569264
|
CFU_1°_Anno | .0704033 .0054234 12.98 0.000 .3420231
Liceo | .6228922 .1458749 4.27 0.000 .1096072
_cons | 1.329177 .1804422 7.37 0.000 .
---------------------------------------------------------------------------------------------

Il modello risulta ben ipotizzato essendo F(8, 1304) =33.80 con Prob > F =0.0000
e R-squared= 0.1717 e gli elementi rilevati possono essere sinteticamente riassunti come
segue:
- durata_positiva non risulta dipendere dalle condizioni economiche e reddituali della
famiglia a cui appartiene lo studente;
- durata_positiva non risulta dipendere dal conseguimento o meno della borsa di
studio;
- durata_positiva non risulta dipendere da aspetti socio-demografici come l’essere
uomo o donna o il risiedere nella provincia di Sassari;
- durata_positiva risulta dipendere in maniera positiva dal fatto che il diploma sia stato
conseguito l’anno stesso in cui ci si è iscritti all’Università o meno;
- durata_positiva dipende in maniera rilevante dai “successi” raggiunti dallo studente
nel percorso didattico durante il primo anno e misurato attraverso i CFU conseguiti;
- durata_positiva dipende positivamente dal fatto che lo studente provenga da un liceo
invece che da un istituto tecnico o professionale;
- durata_positiva mostra una correlazione con alcuni corsi di laurea, in particolare per
Scienze Naturali e corsi dell’area giuridica.
Questi risultati confermano in parte delle relazioni di dipendenza che intuitivamente
potevano essere già ritenute esistenti.
Dai risultati si potrebbe quindi affermare che:
1. l’ipotesi H1 viene rifiutata;
2. l’ipotesi H2 viene rifiutata;
3. l’ipotesi H3 viene accettata.
Il modello risultante ha espressione:

𝑑𝑢𝑟𝑎𝑡𝑎𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 = 0.9625 ∙ 𝑉𝑜𝑡𝑜𝐷𝑖𝑝𝑙𝑜𝑚𝑎 + 0.3577 ∙ 𝑀𝑎𝑡𝑒𝑟𝑖𝑒𝐺𝑖𝑢𝑟𝑖𝑑𝑖𝑐ℎ𝑒 + 0.3828


∙ 𝑆𝑐𝑖𝑒𝑛𝑧𝑒_𝑁𝑎𝑡𝑢𝑟𝑎𝑙𝑖 + 0.6229 ∙ 𝐿𝑖𝑐𝑒𝑜 + 0.0704 ∙ 𝐶𝐹𝑈1 °𝐴𝑛𝑛𝑜

Le indagini diagnostiche effettuate hanno confermato la validità del modello.

Dalla bibliografia sono però emersi interessanti elementi che ci hanno indotto a condurre
delle indagini con outcomes binario.
Nel successivo paragrafo sono illustrate le condizioni che ci hanno indotto a valutare
questa alternativa, ed i risultati conseguiti.
3.6. Applicazione dei modelli a binary outcomes;

Il modello generico utilizzato nell'analisi del precedente paragrafo è riconducibile ad un


modello in forma matriciale del tipo:
yij*=βij Xij + εij
dove:
- i valori osservati di y sono i risultati per l'individuo "i" iscritto alla facoltà "j",
generati dai regressori.
- X è un vettore di variabili esogene che rappresenta le caratteristiche personali
dell'individuo (come sesso e residenza), la qualifica pre-università (voto, tipo di
diploma), indicatori sul background familiare (ad esempio reddito), possibili
effetti derivanti dal peer group e caratteristiche della facoltà misurate con variabili
dummy.
- βij è un insieme di parametri da stimare e ε è un termine di errore.
In letteratura in realtà, il modello più utilizzato sono un logit o un probit binomiale per la
probabilità di drop out dell'individuo, dove yij=1 se l'individuo si ritira (yij*=
registrazione non rinnovata) e yij=0 altrimenti.

La regressione logistica si avvale della funzione logistica, per determinare la


classificazione dei valori di input, chiamata anche funzione sigmoidea, una curva a forma
di S che può prendere qualsiasi numero di valore reale e mapparlo in un valore compreso
tra 0 e 1, estremi esclusi. Essa è descrivibile tramite la seguente equazione:
1
𝐹(𝑥) = 1+𝑒 −(𝛽0+𝛽1 𝑥1+𝛽2 𝑥2+...+𝛽𝑛𝑥𝑛)

Con 𝛽0 , 𝛽1 , 𝛽2 , . . . , 𝛽𝑛 = coefficienti di regressione e 𝑥1 , 𝑥2 , . . . 𝑥𝑛 variabili indipendenti.


La funzione logistica trasforma i valori reali arbitrari in numeri compresi tra 0 e 1, come
mostrato nel grafico a lato; maggiore è il valore reale, maggiore sarà vicino a 1 il risultato
e viceversa.
L’equazione di regressione logistica può essere rappresentata dalla seguente equazione:
𝑒 (𝛽0 +𝛽1 𝑥1 +𝛽2 𝑥2 +...+𝛽𝑛 𝑥𝑛 )
𝑃(𝑋) = 𝑦(𝑥1 , 𝑥1 … 𝑥𝑛 ) =
1+𝑒 (𝛽0 +𝛽1 𝑥1 +𝛽2 𝑥2 +...+𝛽𝑛 𝑥𝑛 )

Con Y = valore output da predire. I coefficienti Beta dell’algoritmo di regressione


logistica vengono stimati tramite il metodo di massima verosimiglianza. Questo metodo
prevede di ottenere quella serie di coefficienti di regressione per i quali la probabilità di
ottenere i dati che abbiamo osservato è massima in quanto permette di cercare valori per
i coefficienti che minimizzano l’errore nelle probabilità previste dal modello rispetto a
quelle nei dati (usando un efficiente algoritmo di ottimizzazione numerica come il metodo
Quasi-newton).
Ricordando che ex è la funzione inversa del logaritmo naturale ln(x), con qualche
passaggio matematico, possiamo esprimere la regressione logistica come:
𝑃(𝑋) 𝑃(𝑋)
Funzione Logit = 𝑙𝑛 (1−𝑃(𝑋)) = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 +. . . +𝛽𝑛 𝑥𝑛 odds= E(1−𝑃(𝑋))

L’odds rappresenta il valore atteso del rapporto della probabilità p(X) di un evento e la
probabilità che tale evento non accada (1 – p(X)). La funzione logit, invece, permette di
associare le probabilità (quindi un valore incluso tra 0 e 1) all’intero intervallo di numeri
reali; è una funzione di collegamento, rappresenta l’inversa della funzione logistica ed è
utile perché il calcolo dell’output a destra è di nuovo lineare (proprio come la regressione
multivariata lineare) e l’input a sinistra è un log della probabilità.
Detta in altri termini, la funzione logit è il logaritmo naturale della probabilità che Y sia
uguale a una delle classi: in effetti il modello è ancora una combinazione lineare degli
input, ma che questa combinazione lineare si riferisce al logaritmo della probabilità (o
log odds) della classe predefinita.
Utilizzando il modello logistico nel caso esaminato riferito alla variabile dipendente
Cons_Laurea, si ottiene quanto riportato di seguito.
. logit Cons_Laurea Borsa_Studio Prima_carriera Femmina Liceo day0 res_SS Anno_diploma_2010 Ac
> cesso_prog CFU_1°_Anno i.Reddito i.Corso_Laurea

Iteration 0: log likelihood = -1590.3636


Iteration 1: log likelihood = -1055.3595
Iteration 2: log likelihood = -1050.9225
Iteration 3: log likelihood = -1050.9087
Iteration 4: log likelihood = -1050.9087

Logistic regression Number of obs = 2,323


LR chi2(17) = 1078.91
Prob > chi2 = 0.0000
Log likelihood = -1050.9087 Pseudo R2 = 0.3392

---------------------------------------------------------------------------------------------
Cons_Laurea | Coef. Std. Err. z P>|z| [95% Conf. Interval]
----------------------------+----------------------------------------------------------------
Borsa_Studio | .0804908 .411108 0.20 0.845 -.7252661 .8862478
Prima_carriera | .6068325 .1849151 3.28 0.001 .2444057 .9692594
Femmina | .1638328 .1171784 1.40 0.162 -.0658326 .3934982
Liceo | .3327325 .114333 2.91 0.004 .1086439 .5568212
day0 | -.0494475 .1409302 -0.35 0.726 -.3256656 .2267706
res_SS | .1999992 .1297631 1.54 0.023 -.0543319 .4543303
Anno_diploma_2010 | .6654685 .1647594 4.04 0.000 .342546 .9883909
Accesso_prog | .1186397 .1715639 0.69 0.489 -.2176194 .4548989
CFU_1°_Anno | .0822961 .0037463 21.97 0.000 .0749535 .0896387
|
Reddito |
2 | -.214583 .4122573 -0.52 0.603 -1.022592 .5934264
3 | .0857505 .4101765 0.21 0.834 -.7181806 .8896817
4 | .2790278 .4250729 0.66 0.512 -.5540998 1.112155
|
Corso_Laurea |
2. Materie giuridiche | -.4625296 .2093453 -2.21 0.027 -.8728388 -.0522204
3. Materie economiche | -.3464297 .1714955 -2.02 0.043 -.6825547 -.0103048
4. Scienze agro-forestali | .7911684 .2175723 3.64 0.000 .3647347 1.217602
5. Scienze naturali | -.0251671 .1750755 -0.14 0.006 -.3683087 1.317974
6. Architettura e urbani.. | -.1582572 .3308936 -0.48 0.632 -.8067967 .4902822
|
_cons | -2.942607 .4510691 -6.52 0.000 -3.826686 -2.058528
Calcolando gli Odds ratio:
. logistic Cons_Laurea Prima_carriera Liceo day0 res_SS Anno_diploma_2010 Accesso_prog CFU_1°_
> Anno Reddito_2°_Fascia

Logistic regression Number of obs = 2,323


LR chi2(8) = 1045.50
Prob > chi2 = 0.0000
Log likelihood = -1067.6142 Pseudo R2 = 0.3287

-----------------------------------------------------------------------------------
Cons_Laurea | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
------------------+----------------------------------------------------------------
Prima_carriera | 1.7107 .309191 2.97 0.003 1.200406 2.43792
Liceo | 1.468558 .1637101 3.45 0.001 1.180326 1.827176
Anno_diploma_2010 | 1.883521 .3026145 3.94 0.000 1.374716 2.580644
Accesso_prog | 1.903066 .2238662 5.47 0.000 1.511204 2.396539
CFU_1°_Anno | 1.085464 .0038937 22.86 0.000 1.077859 1.093122
_cons | .0582229 .0100949 -16.40 0.000 .0414486 .0817857
-----------------------------------------------------------------------------------

Utilizzando il modello logistico i risultati risultano cambiati rispetto al caso in cui l’analisi
è stata effettuata con la multivariata.
In particolare:
- il drop-out non risulta dipendere dalle condizioni economiche e reddituali della
famiglia a cui appartiene lo studente;
- il drop-out non risulta dipendere dal conseguimento o meno della borsa di studio;
- il drop-out non risulta dipendere da aspetti socio-demografici come l’essere uomo o
donna o il risiedere nella provincia di Sassari;
- il drop-out risulta dipendere in maniera negativamente dal fatto che il diploma sia
stato conseguito l’anno stesso in cui ci si è iscritti all’Università o meno: se ci si
diploma l’anno in cui ci si immatricola, risulta più elevata la probabilità di conseguire
il titolo di laurea;
- il drop-out dipende in maniera rilevante dai “successi” raggiunti dallo studente nel
percorso didattico durante il primo anno e misurato attraverso i CFU conseguiti;
- il drop-out dipende negativamente dal fatto che lo studente provenga da un liceo
invece che da un istituto tecnico o professionale: se proviene da un liceo è più elevata
la probabilità di conseguire il titolo di laurea;
- il drop-out dipende negativamente dal fatto che lo studente abbia dovuto superare
una prova d’ingresso per corsi ad accesso programmato;
- il drop-out dipende negativamente dal fatto che lo studente sia alla Prima carriera
accademica; se è alla prima immatricolazione si laurea con maggior probabilità.
- il drop-out mostra una correlazione con molti corsi di laurea, in particolare per tutti
tranne quelli di Architettura ed Urbanistica.
Dai risultati si potrebbe quindi affermare che:
1. l’ipotesi H1 viene rifiutata;
2. l’ipotesi H2 viene accettata;
3. l’ipotesi H3 viene accettata.

3.7. Analisi dei Cluster.

Tramite una funzionalità interna al software STATA, dal Dataset è stato possibile
effettuare una clusterizzazione delle osservazioni del campione analizzato, al fine di
ottenere il profilo di quello che potrebbe rappresentare il modello tipico dello studente
che potrebbe abbandonare il corso di studi senza conseguire la laurea.
La Cluster Analysis è una tecnica che conduce alla classificazione delle unità statistiche
in gruppi (cluster) aventi le proprietà di omogeneità interna e disomogeneità esterna (tra
i gruppi). Nel marketing viene frequentemente applicata a supporto di decisioni sia
strategiche che operative.
L’analisi dei Cluster è una ricerca di segmentazione e, in quanto tale, si propone di
identificare gruppi di entità (persone, mercati, organizzazioni) che condividano
determinate caratteristiche (benefici ricercati nel prodotto/servizio, attitudini,
propensione all’acquisto, preferenze nei confronti dei diversi media).
La Cluster Analysis, quindi, ha l’obiettivo di raggruppare un insieme di unità in un certo
numero di gruppi sulla base delle loro similarità in relazione alle variabili contenute nella
matrice dei dati rappresentata dal Dataset. È stata utilizzata a tal scopo, la metodologia di
classificazione automatica offerta da STATA.
I risultati dell’analisi sono di seguito riportati.
. cluster wardslinkage Anno_diploma_2010 Corso_Laurea Borsa_Studio CFU_1°_Anno Femmina Liceo P
> rima_carriera Reddito Voto_Diploma res_SS Cons_Laurea, measure(L2) name(cluster005)

. cluster stop , rule(calinski) groups(2/7)

+---------------------------+
| | Calinski/ |
| Number of | Harabasz |
| clusters | pseudo-F |
|-------------+-------------|
| 2 | 2067.79 |
| 3 | 2124.10 |
| 4 | 2102.13 |
| 5 | 1765.83 |
| 6 | 1822.54 |
| 7 | 1910.19 |
+---------------------------+

Dall’analisi Calinski/Harabasz dei cluster risulta che il numero di insiemi omogenei che
è possibile individuare nella popolazione che massimizza il valore della psuedo F
Statistica è 3.
Il dendrogramma che ne consegue è riportato in figura.

Clusterizzando e tagliando la struttura dendridica a livello 3 otteniamo la suddivisione in


3 gruppi la cui numerosità è riportata in tabella.
. cluster gen cl05=groups(3), name (cluster005)

. table cl05
----------------------
cl05 | Freq.
----------+-----------
1 | 684
2 | 642
3 | 989
----------------------
L’analisi della composizione dei singoli cluster ci permette di capire come si
suddividerebbe l’insieme costituito dagli studenti esaminati.
Tramite un apposito comando è possibile chiedere a STATA di esplicitare i criteri
utilizzati per aggregare gli elementi con caratteristiche comuni.
Di seguito è riportato lo stralcio di report STATA dal quale è possibile astrarre i suddetti
criteri e, conseguentemente i profili dei 3 studenti tipo.

. tabstat Anno_diploma_2010 Corso_Laurea Borsa_Studio CFU_1°_Anno Femmina Liceo Prima_carriera


> Reddito Voto_Diploma res_SS Cons_Laurea, by (cl05)

Summary statistics: mean


by categories of: cl05

cl05 | Ann~2010 Corso_~a Borsa_~o CFU_1°~o Femmina Liceo Prima_~a Reddito


---------+--------------------------------------------------------------------------------
1 | .5584795 3.134503 .2032164 21.29386 .628655 .5409357 .6929825 2.660819
2 | .6464174 3.143302 .3006231 40.71651 .7040498 .546729 .7725857 2.523364
3 | .5025278 3.092012 .1142568 .4499494 .5844287 .3953488 .6916077 2.572295
---------+--------------------------------------------------------------------------------
Total | .5589633 3.11879 .1922246 17.77538 .6306695 .4803456 .7144708 2.584881
------------------------------------------------------------------------------------------

cl05 | Voto_D~a res_SS Cons_L~a


---------+------------------------------
1 | 70.27047 .2397661 .5438596
2 | 84.7352 .2227414 .7943925
3 | 74.68655 .2719919 .1263903
---------+------------------------------
Total | 76.16847 .2488121 .4349892
----------------------------------------
----------------------------------------------------------------------------------------------------

L’analisi dei Cluster evidenzia 3 profili che in realtà sono piuttosto simili tra loro.
Il profilo più interessante è quello del Cluster n.3 che avendo un basso valore di
Cons_Laurea, sembrerebbe il più incline ad abbandonare il corso di laurea.
Il profilo avrebbe le seguenti caratteristiche:
1. non ha conseguito la borsa di studio;
2. non viene dal Liceo;
3. ha un reddito tra la seconda e la terza fascia;
4. ha pochissimi crediti formativi conseguiti al primo anno;
5. ha voto al diploma medio-alto.
Conclusioni

In questo lavoro è stato esaminato il drop out universitario per l’Università di Sassari
attraverso un’analisi empirica di un Dataset relativo alle iscrizioni accademica che hanno
interessata l’Università stessa nel periodo compreso tra il 2010 ed il 2017.
Si è così provato ad analizzare quali sono le cause e gli aspetti da monitorare per
controllare quello che rappresenta un problema di lunga data per le università italiane.
Dalle analisi effettuate è risultato che:
1. Il drop-out degli iscritti all’Università di Sassari non dipende da variabili socio-
demografiche e reddituali;
2. Il drop-out degli iscritti all’Università di Sassari dipende dall’utilizzo di strumenti
impiegati con l'obiettivo di limitare il numero di iscrizioni e/o l'ammissione dello
studente al corso di laurea: in particolare, se il corso di laurea è ad accesso
limitata, è più probabile che lo studente porti a conclusione i suoi studi
conseguendo la laurea
3. Il drop-out degli iscritti all’Università di Sassari dipende dalla pre-formazione
degli studenti: in particolare, se lo studente abbia conseguito da poco il diploma (e
quindi abbia ancora ottimi ricordi di ciò che ha studiato alle scuole superiori) e/o
se ha frequentato un Liceo invece che una scuola di altro tipo, ha maggior
probabilità di conseguire la laurea.
Utilizzando il modello logistico si sono ottenuti anche i seguenti risultati:
- il drop-out non risulta dipendere dal conseguimento o meno della borsa di studio;
- il drop-out dipende in maniera rilevante dai “successi” raggiunti dallo studente nel
percorso didattico durante il primo anno e misurato attraverso i CFU conseguiti:
quindi, se lo studente ha raggiunto un numero elevato di CFU durante il suo primo
anno di corso, è incentivato a continuare proficuamente gli studi;
- il drop-out dipende negativamente dal fatto che lo studente sia alla Prima carriera
accademica; se è alla prima immatricolazione si laurea con maggior probabilità.
- il drop-out mostra una correlazione con molti corsi di laurea, in particolare per tutti
tranne quelli di Architettura ed Urbanistica.
Da questi risultati si potrà prendere in considerazione l’adozione di opportuni strumenti
che potranno agire in modo da ridurre il fenomeno del drop-out all’Università di Sassari.
Bibliografia, sitografia.

Aina, Carmen. (2013). Parental background and universitydropout in Italy. Higher


Education. 65. 10.1007/s10734-012-9554-z.
Becker, S.O. (2001). Why don’t Italians finish university? Explaining enrollment
behaviour in Italy and Germany. European University Institute, Department of
Economics.
Belloc, F., Maruotti, A., & Petrella, L. (2010). University drop-out: an Italian experience.
Higher Education,60, 127-138.
Boero, G., Laureti, T., Naylor, R., 2005. An econometric analysis of student withdrawal
and progression in post-reform Italian universities, Università di Cagliari.
Cingano, F., & Cipollone, P. (2007). University drop-out: The case of Italy. Temi di
discussione, Banca D’Italia n. 626
Consorzio Interuniversitario AlmaLaurea, Rapporti 2018 sul profilo e sulla condizione
occupazionale dei laureati (XX edizione), 11-06-2018.
Di Pietro, G., & Cutillo, A. (2008). Degree flexibility and university drop out: The Italian
experience. Economics of Education Reviews, 27, 546-555.
D’Hombres, B., 2007. The impact of university reforms on dropout rates and students’
status: Evidence from Italy, European Commission, Joint Research Centre,
Luxembourg: Office for Official Publications of the European Communities.
Eurostat, “Population with medium educational attainment not in formal education who
started but never completed tertiary education by sex, age, educational attainment
level, work experience while studying and reason for not completing tertiary
education”. Last update: 06-03-2018.
Harrison, N., 2006. The impact of negative experiences, dissatisfaction and attachment
on first year undergraduate withdrawal. J. Furth. High. Educ. 30 (4), 377-391.
Montmarquette, C., Mahseredjian, S., & Houle R. (2001). The Determinants of university
dropouts: A bivariate probability model with sample selection. Economics of
Education Review, 20, 475–484.
OECD(2018). Population with tertiary education (indicator). doi: 10.1787/0b8f90e9-en
(Accessed on 13 November 2018).
OECD(2018). Educationat a glance 2018: OECD indicators. OECD Publishing.
Smith, J.P., Naylor, R.A., 2001. Dropping out of university: a statistical analysis of the
probability of withdrawal for UK students. J. Roy. Statist. Soc. Ser. A 164 (2), 389-
405.
Tinto, V. (1975). Dropout from higher Education: A theoretical synthesis of recent
research. Review of Educational Research, 45(1), 89-125.