Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Captulo 7, Visauta Vinacua, Anlisis Estadstico Con SPSS . Docente: Tamara Otzen
Pruebas Estadsticas
Paramtricas
No Paramtricas
Nos permiten analizar cualquier dato siempre y cuando su distribucin sea normal
Nos permiten analizar datos en escala nominal u ordinal a pesar de que no se conozcan los parmetros de una poblacin, utilizada para hacer un contraste de hiptesis.
Pruebas no paramtricas
Utilizacin:
Cuando los datos puntualizan a las escalas nominal u ordinal. Se utiliza solo la frecuencia. Poblaciones pequeas. Cuando se desconocen los parmetros media, moda, etc. Cuando los datos son independientes. Cuando se quiere contrastar o comparar hiptesis. Investigaciones de tipo social. (Muestras pequeas no representativas <5). Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias. Cuando la muestra es seleccionada no probabilsticamente.
PRUEBAS T
Capitulo 9 y 10, Aron y Aron, Estadstica para Psicologa.
Introduccin
Cuando se desea comprobar si los valores de una caracterstica que es posible cuantificar (como podra ser la edad o la cifra de tensin arterial, entre otras) difieren al agruparlas en dos o ms grupos (por ejemplo segn gnero, o por diagnstico de hipertensin arterial) hablaremos de comparacin de medias.
Dentro del men que incluye SPSS se encuentra la opcin comparar medias, la cual nos permite calcular las medias y otros estadsticos, as como la comparacin de medias para diferentes tipos de variables, mediantes las pruebas de t de Student y ANOVA.
PRUEBAS T DE STUDENT
La prueba t de Student es utilizada para la estimacin de medias y proporciones en variables cuantitativas y para la comparacin de medias y proporciones en distintas poblaciones. El procedimiento Comparar medias ofrece varias opciones en funcin de la procedencia de los datos que queremos comparar.
Supuestos de la prueba t
La distribucin normal de los observadores La homogeneidad de las varianzas La independencia del error
PRUEBA DE KOLMOGOROV-SMIRNOV
La distribucin del estadstico de Kolmogorov-Smirnov es independiente de la distribucin poblacional especificada en la hiptesis nula y los valores crticos de este estadstico estn tabulados.
Si la distribucin postulada es la normal y se estiman sus parmetros, los valores crticos se obtienen aplicando la correccin de significacin propuesta por Lilliefors. H0 : Las varianzas son iguales (son homogeneas)
PRUEBA DE SHAPIRO-WILK
Cuando la muestra es como mximo de tamao 50 se puede contrastar la normalidad con la prueba de shapiro Shapiro-Wilk.
Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de significacin dado. H0 : Las varianzas son iguales (son homogeneas)
Contrastes de normalidad
Un caso especfico de ajuste a una distribucin terica es la correspondiente a la distribucin normal. Este contraste se realiza para comprobar si se verifica la hiptesis de normalidad necesaria para que el resultado de algunos anlisis sea fiable, como por ejemplo para el ANOVA.
Para comprobar la hiptesis nula de que la muestra ha sido extrada de una poblacin con distribucin de probabilidad normal se puede realizar un estudio grfico y/o analtico.
La distribucin normal
Test de Kolmogorov Smirnov
PRUEBA DE KOLMOGOROV-SMIRNOV
Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para contrastar la hiptesis de normalidad de la poblacin, el estadstico de prueba es la mxima diferencia. La distribucin del estadstico de Kolmogorov-Smirnov es independiente de la distribucin poblacional especificada en la hiptesis nula y los valores crticos de este estadstico estn tabulados. Si la distribucin postulada es la normal y se estiman sus parmetros, los valores crticos se obtienen aplicando la correccin de significacin propuesta por Lilliefors.
PRUEBA DE SHAPIRO-WILK
Cuando la muestra es como mximo de tamao 50 se puede contrastar la normalidad con la prueba de shapiro Shapiro-Wilk. Para efectuarla se calcula la media y la varianza muestral, S2, y se ordenan las observaciones de menor a mayor. A continuacin se calculan las diferencias entre: el primero y el ltimo; el segundo y el penltimo; el tercero y el antepenltimo, etc. y se corrigen con unos coeficientes tabulados por Shapiro y Wilk.
Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de significacin dado.
Y si no.
Para 1 muestra: Wilcoxon Muestras Relacionadas: VARIABLES CUALITATIVAS: TEST DE Mc NEMAR: evala las variaciones de una variable dicotmica antes y despus de algo VARIABLES CUANTITATIVAS CONTRASTE DE LOS SIGNOS PARA LA MEDIANA DE LAS DIFERENCIAS: para variables continuas evaluamos las diferencias de antes y despus de algo pero a travs de su signo: +, - 0 TEST DE LOS RANGOS CON SIGNO DE WILCOXON: DATOS APAREADOS: similar al test de los signos por aumento o disminucin de la variable; pero teniendo adems en cuenta la magnitud del cambio . Por tanto es ms potente este test que el test de los signos.
Para muestras Independientes: TEST DE LA MEDIANA la prueba se fundamenta en analizar si las medianas de las ms de dos poblaciones son distintas. Esta prueba es adecuada para comparar ms de dos variables cuantitativas y los tamaos poblacionales pueden ser distintos. El test se basa en que si las dos medianas son iguales, la proporcin de casos de cada muestra que son mayores o menores que la mediana global sern iguales. Pero por el contrario, si ambas medianas son diferentes, la proporcin de casos por encima o por debajo de la mediana global sern significativamente diferentes en ambas muestras. Es decir, realiza tablas de contingencia al categorizar la variable continua en dos categoras segn el valor de la mediana. Por tanto, la hiptesis nula: Ho es que la Mediana de A = Mediana de B=...= Mediana de n; mientras que la hiptesis alternativa, H1: es que al menos 1 es diferente.
Ejemplo
1. Replantear el problema en funcin de hiptesis e hiptesis nula sobre poblaciones. Cuestionario de sentirse esperanzado ( de 1 a 7) Punto medio de la escala 4 Poblacin 1: personas que sufrieron inundacin Poblacin 2: personas que no sufrieron inundacin Ho: x1 = x2 Hi: x1 x2 Muestra 10 personas 2= 3,57 Media muestral = 4,7
2. Determinar las caractersticas de la distribucin comparativa. Varianza poblacional estimada de 3,57 = (32,10 /9) Varianza muestral estimada = 3,57 / 10 = 0,36 Desviacin estndar muestral estimada = 0,36 = 0,60
Ejemplo continuacin.
3. Determinar el valor muestral de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula. Nivel de significancia de 0,01 No es hiptesis direccional Ver tabla = Prueba de dos colas, con 9 grados de libertad = 3,25 4. Determinar e valor muestral en la distribucin comparativa. Media muestral 4,7 (0,7/0,6) = 1,17 = t = 1,17 5. Comparar los valores de los pasoso 3 y 4 para decidir si se rechaza o no la hiptesis nula.
Se acepta la hiptesis de nulidad
En valor de prueba se introduce 12,55 ya que es el promedio de beneficios de todas las empresas
Resultados:
Puesto que el valor de significacin es mayor a 0,05 no se puede rechazar la hiptesis nula.
Manual
Nmero de sujeto 1 2 3 4 5 Antes 4,7 6,5 4 5,8 4,2 Despues 5 6,6 4,2 5,8 4
Nmero de sujeto
Antes
Despus
Diferencia
Desvo
Desvo Cuadrtico
1
2 3 4 5
4,7
6,5 4 5,8 4,2
5
6,6 4,2 5,8 4
-0,3
-0,1 -0,2 0 0,2
Suma de las diferencias
-0,22
-0,02 -0,12 0,08 0,28 -0,4
0,0484
0,0004 0,0144 0,0064 0,0784
Suma de los D.C.
0,148
-0,08
M
gl u
=
= =
-0,08
4 0
-0,4 /5
5-1 (valor fijo tomado como base de ausencia de cambio)
S2
S2m Sm N.S. t t real
=
= = = = =
0,037
0,0074 0,086023253 0,05 2,1318 -0,92998111
0,148/4
0,037/5 0,0074 1 cola (-0,08 0)/0,086023253
EN SPSS
Paso 1:
Paso 2:
Resultados:
En esta figura aparecen el numero de empresas, el coeficiente de correlacin entre ambas variables y el nivel de significacin del mismo.
Numero 1 2 3
-2 colas - Parmetro poblacional 5
Numero 1 2 3
Despues 4 2 8
Dos colas
MANUAL
Nmero de sujeto 1 2 3 4 5 Numero de sujeto 6 7 8 9 10
Nmero de sujeto 1 2 3 4 5
Desvio de la media 0,52 1,82 -1,88 -0,78 0,32 5,08 Desvio de la media -0,86 1,64 1,54 -1,86 -0,46 5,06
Desvio cuadratico de la media 0,2704 3,3124 3,5344 0,6084 0,1024 Suma de los D.C. 7,828 Desvio cuadratico de la media 0,7396 2,6896 2,3716 3,4596 0,2116 Suma de los D.C. 9,472
PSICO
S2 1 N1 gl1 S2m1 M1
= = = = = = =
7,828/4 5-1 2,16/5 25,4/5 9,472/4 5-1 2,16/5 25,3/5 4+4 ((gl1/gltotal)*(S21))+ (gl2/gltotal)*(S22)) S2m1+S2m2 S2m1+S2m2 dos colas 2,306 (M1-M2)/Sdiferencia
MED
S2 2 N2 gl2 S2m2 M2
= = = = = = =
0,02150413
Ahora.. Paso 1
Paso 2
Paso 3
En este paso se exige introducir las dos categoras de esta variable. En grupo 1 se introduce 1 (servicios), y en grupo 2 se introduce 2 (industriales).
Resultados:
Test de Levene
Valores en prueba t
t: estadstico utilizado para el contraste de hiptesis. gl: nmero de grados de libertad del estadstico t. Cuando se asumen varianzas iguales, gl es igual a (n1 + n2 2), pero cuando las varianzas no son iguales hay que calcularlo de otras formas. La ms usada es la aproximacin de Satterthwaite, que SPSS calcula. Este valor ser menor que el anterior porque se pierde precisin con la desigualdad de las varianzas.
Valores en prueba t
Sig. (bilateral) : valor p de significacin estadstica obtenido para el contraste de hiptesis.
Diferencia de medias : estimador puntual de la diferencia de medias.
Valores en prueba t
Error tp. de la diferencia : valor del error estndar de la diferencia de medias (obtenido a partir de los errores estndar de la tabla superior). Intervalo de confianza para la media : lmites inferior y superior del intervalo de confianza que valora la precisin dela estimacin que estamos realizando para la diferencia de medias.