Sei sulla pagina 1di 2

Univariata - Domanda A

Per confrontare i risultati di due serie di misure ripetute si ricorre ad un t-test . Per ogni serie di
misure avremo una media, una deviazione standard e numero di gradi di libert. Si parte da un
ipotesi iniziale nulla, ovvero che non ci sia differenza significativa tra le due medie. Prima di
procedere al t-test vero e proprio si verifica se sussiste o meno una differenza significativa tra le due
deviazioni standard mediante un F-test. Successivamente si esegue il t-test vero e proprio. Sulla
base dei gradi di libert del problema e dei livello di significativit scelto si ricava dalle tabelle tstudent il valore del t-tabulato. Si ricava poi il t-osservato, mediante un semplice calcolo. Si
confrontano t-tabulato e t-osservato. Se t-osservato minore di t-tabulato allora l'ipotesi nulla
confermata e non vi una significativa differenza statistica tra le due serie di misure; se t-osservato
maggiore di t-tabulato allora vi una significativa differenza tra le due misure.
Univariata - Domanda B
La retta di taratura ci permette di quantificare un analita in una matrice a partire da un segnale
analitico. Si preparano una serie di standard a concentrazione nota di analita in una matrice che si
avvicini il pi possibile per caratteristiche alla matrice reale. Tali standard si sottopongono alla
misura strumentale e si ottengono pertanto per ciascuno standard una coppia di dati (Xi, Si), che
vengono riportati su un grafico. Tramite un metodo di regressione lineare, ad esempio il metodo dei
minimi quadrati, si ottengono i coefficienti a e b della retta che meglio si adatta ai dati sperimentali.
Prima di procedere all'analisi del campione incognito, bisogna verificare che non vi sia effetto
matrice. Per fare ci si calcola una retta di regressione con il metodo delle aggiunte standard su un
campione reale. Se le pendenze delle due rette (b-retta taratura e b-agg.standard) non sono
statisticamente differenti allora non vi effetto matrice (il confronto si fa tramite un t-test tra due
intervalli di confidenza). A questo punto si sottopone il campione incognito alla misura strumentale,
si ottiene un segnale S0 e per interpolazione sulla retta di taratura si ricava la concentrazione
incognita, x0.
Multi-variata Domanda A
Nell'analisi delle componenti delle componenti principali la matrice degli scores, rappresenta le
coordinate dei campioni (oggetti) nello spazio delle componenti principali. Gli scores plot ci
permettono di analizzare graficamente gli oggetti nello spazio delle componenti principali (ad
esempio considerando solo PC1 e PC2, la rappresentazione grafica quella classica su un piano).
Questo ci permette di individuare velocemente cluster e outlier. Con gli scores plot si perde
l'informazione sul ruolo delle variabili. I loading plot ci permettono di recuperare questa
informazione. I loading plot, derivano dalla matrice di loading. Considerando anche in questo caso
per semplicit solo due PC, dal loading plot si pu osservare quanto le variabili contribuiscono alla
definizione delle PC (Maggiore il contributo della variabile, pi vicino a 1 il corrispondete valore
nella matrice loading) Ancora pi informativi sono i biplot che sovrappongono i grafici di loading
e degli scores.
Multi-variata Domanda B
La PLS-DA un metodo di classificazione, che si basa sull'applicazione di un algoritmo utilizzato
per risolvere problemi di regressione, l'algoritmo PLS (Partial Least Squares). La PLS-DA
trasforma un problema di classificazione in un problema di regressione, introducendo come
variabili risposta un vettore che contenga informazioni sull'appartenenza alla classe. In altre parole
si introducono delle variabili risposta numeriche ( dummy variable, generalmente comprese tra 0 e
1) che esprimono il grado di appartenenza di un oggetto appartenga ad una classe. Come nella

normale PLS, nella costruzione del modello di regressione si va a massimizzare la varianza non solo
delle variabili indipendenti (X) del data set, ma anche delle variabili indipendenti (Y, le risposte). In
questo modo la PLS-DA trova un buon compromesso tra descrivere gli oggetti nello spazio delle
componenti e predire le risposte.