Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADSTICA NO PARAMTRICA
VENTAJAS
No se requiere de los
supuestos paramtricos
Se puede usar para
variables no numricas.
Clculos fciles,
originados por tamaos
de muestra pequeos.
Son convenientes
cuando no se conoce la
distribucin de la
poblacin.
DESVENTAJAS
Utilizan menor informacin
de la variable.
Es menos potente que los
resultados obtenidos en los
mtodos paramtricos.
ESTADISTICA
Test de hiptesis
No paramtricos: no se
refieren a parmetros de
la poblacin; se aplican
tpicamente cuando no
conocemos la distribucin
de la poblacin, o cuando su
distribucin es no normal.
Prueba Chi-Cuadrado.
Prueba de Signos
Prueba de Rangos Signados de Wilcoxon,
Prueba de Mann y Whitney
Prueba de Kruskal Wallis
Prueba de Correlacin
Prueba de Kolgomorov Smirnov
X2
Hiptesis a probar:
Correlaciones
Variables
involucradas:
Nivel de medicin de
las variables
Procedimiento
CARACTERSTICAS
1. La Distribucin X2 se lee con grados de libertad G.L =
(N de filas - 1)(N de columnas - 1).
2. No tiene valores negativos. El valor mnimo es 0.
3. Todas las curvas son asimtricas
4. Cuando aumentan los grados de libertad las curvas son
menos elevadas y ms extendidas a la derecha.
5. Se utiliza para variables medidas en escala nominal u
ordinal.
6. Las frmulas son:
Prueba de hiptesis:
Determinar si las variables del estudio son independientes o no entre ellas
H0:
H1:
Si
X2obtenido
X2obtenido X2crtico
Paso N 1
Paso N 2
Paso N 3
Paso N 4
Chi Cuadrado :
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una
forma de distribucin particular planteada como hiptesis. Si el ajuste es
razonablemente cercano, puede concluirse que si existe la forma de distribucin
planteada como hiptesis.
Prueba chi-cuadrada
donde k: Nmero de categoras o clases
k-m-1: grados de libertad donde m es el nmero de parmetros a estimar.
EJERCICIO:
Juan Prez, director de Mercadeo de Alden de Jurez, tiene la responsabilidad de
controlar el nivel de existencias para cuatro tipos de automviles vendidos por la
firma. En el pasado, ha ordenado nuevos automviles bajo la premisa de que los
cuatro tipos son igualmente populares y la demanda de cada tipo es la misma. Sin
embargo, recientemente las existencias se han vuelto ms difciles de controlar, y
Juan considera que debera probar su hiptesis respecto a una demanda uniforme.
Sus hiptesis son:
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.
Ventas observadas
15
11
10
12
Ventas esperadas
12
12
12
12
7.815. Rechazar si
7.815"
Corriente
TIPO
CUENTA
Vista
VIP
20
30
40
25
Variable
Categora
CLIENTE
PREMIUN
Corriente
TIPO
CUENTA
Vista
VIP
20
30
40
25
NIVEL DE EDUCACIN
Primaria
APRENDIZAJE
Secundaria
Conceptual
180
100
Procedimental
190
280
Actitudinal
170
120
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
TOTAL
TOTAL
Primaria
Secundaria
180
100
280
190
280
470
170
120
290
540
500
1040
Procedimental (470)(540)/1040
Actitudinal (290)(540)/1040
marginal de columnas
540
Secundaria
Marginal
de filas
(280)(500)/1040
280
(470)( 500)/1040
470
(290)(500)/1040
290
500
1040
Frecuencia observada:
NIVEL DE EDUCACIN
Primaria
APRENDI
ZAJE
TOTAL
secundaria
Conceptual
180
100
280
Procedimental
190
280
470
Actitudinal
170
120
290
540
500
1040
Donde:
O: frecuencia observada
en cada celda
E: frecuencia esperada
en cada celda
TOTAL
Frecuencia esperada:
NIVEL DE EDUCACIN
Primaria
APRENDIZ
AJE
TOTAL
Secundaria
Conceptual
145,4
134,6
280
Procedimental
244,0
226,0
470
Actitudinal
150,6
139,4
290
540
500
1040
TOTAL
X2
O-E
(O-E)2
(O-E)2 / E
Conceptual/Primaria
180
145,4
34,6
1197,16
8,23
Procedimental/ Primaria
190
244,4
-54,4
2959,36
12,11
Actitudinal / Primaria
170
150,6
19,4
376,36
2,50
Conceptual / Secundaria
100
134,6
-34,6
1197,16
8,69
Procedimental /Secundaria
280
226,0
54,0
2916,00
12,80
Actitudinal / Secundaria
120
139,4
-19,4
376,36
2,70
Celda
X2 =
47,33
N de columnas
= 2; entonces
Luego, acudimos a la tabla de distribucin de Chicuadrado, eligiendo nuestro nivel de confianza ( = 0,05
= 0,01).
Si el valor obtenido de X2 es igual o superior al valor de la
tabla, decimos que las variables estn relacionadas o no
son independientes.
Aplicacin:
Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla
es 5,9915 (ver tabla).
X2Obtenido = 47,33
X2Crtico = 5,9915 tabla
Prueba de hiptesis:
H0:
H1:
X2obtenido
X2crtico
entonces se rechaza la
hiptesis nula (H0), y por lo tanto se acepta la hiptesis
alterna (H1).
X2obtenido
X2crtico
Ejercicio:
Una fabrica est pensando en implantar uno de los tres sistemas de calificaciones
para el desempeo: (1) todas las calificaciones son aprobados-reprobado; (2) todas
las calificaciones estn en el sistema 4.0 y (3) 90% de las calificaciones estn en el
sistema 4.0 y 10% son a aprobados-reprobado. Se realiza una encuesta para
determinar si existe una relacin entre el rea de laboral de cada trabajador y su
preferencia para algn sistema de calificacin. Se elige una muestra aleatoria de
200 trabajadores del rea operaciones, 200 administrativos, y 100 de produccin.
Se pregunta a cada trabajador cul de los tres sistemas de calificaciones prefieren.
Los resultados aparecen en la siguiente tabla:
Sistema Calificacin Desempeo
Aprobado-reprobado
4,0
4,0 y aprobado-reprobado
Produccin
26
55
19
Administrativos
24
118
58
Operaciones
20
112
68
Ejercicio:
frecuencia
Noruegos
Suecos
399
193
Irlandeses Alemanes
63
Italianos
82
13
Ejercicio:
Debido a la inflacin, el gobierno est considerando la imposicin de un control
de precios y salarios. Un economista del gobierno, interesado en determinar si
existe una relacin entre el empleo y la actitud hacia este control, rene los
siguientes datos. Los datos muestran, para cada tipo de empleo, el nmero de
individuos en la muestra que estn a favor o contra de los controles.
Actitud hacia el control de precios y salarios
A favor
En contra
Obreros
90
60
Empresarios
100
150
Profesionales
110
90
EJERCICIO
La Prueba U de Mann-Whitney
Se utiliza para saber si dos muestras
independientes provienen de poblaciones que
difieren en su ubicacin (tendencia central).
Es la contraparte de la prueba t para muestras
independientes. Prueba la hiptesis de que la mediana
de las dos poblaciones son iguales contra que no lo
son.
La Prueba U de Mann-Whitney
Ordenacin
por rango
Smbolos
La Prueba U de Mann-Whitney
Estadstico U
U = n1 n2 + n1 (n1 + 1)
R1
2
Una medida de la diferencia entre las observaciones
ordenadas por rangos de las dos muestras
Media del
Estadstico
Clculo del
error estndar
U = n1 n2
2
u = n1 n2 (n1 + n2 + 1)
12
www.leondariobello.com
ldbello@leondariobello.com
Formulacin
de la hiptesis
Lmites de la
regin de
aceptacin
= nivel de significancia
www.leondariobello.com
ldbello@leondariobello.com
Interpretacin
de resultados
www.leondariobello.com
ldbello@leondariobello.com
ldbello@leondariobello.com
Suposiciones
La muestra es aleatoria
La variable es continua
La poblacin se distribuye simtricamente
alrededor de su media
Hiptesis
a)
Ho: = o
b) Ho: o
b) Ho: o
Ha: o
Ha: < o
Ha: > o
3. Asignar:
A las diferencias positivas se les asigna
como W+
A las diferencias negativas se les
asigna como W Sumar cada grupo
El menor valor de los dos anteriores se
asigna como W.
Ejemplo
En un experimento para medir la efectividad de
un medicamento para dormir, basndose en
las horas de sueo de los pacientes, un
siclogo seleccion aleatoriamente 10
pacientes a los cuales se les suministr el
medicamento y luego un placebo.
Horas de sueo
Paciente
Droga
Placebo
Diferencia
Rango
(Ignorando el signo)
6.1
5.2
0.9
3.5*
7.0
7.9
-0.9
3.5*
8.2
3.9
4.3
10
7.6
4.7
2.9
6.5
5.3
1.2
8.4
5.4
3.0
6.9
4.2
2.7
6.7
6.1
0.6
7.4
3.8
3.6
10
5.8
6.3
-0.5
W+ = 50.5
W- = 4.5
W = 4.5
W- = 4.5
W = 4.5
.025
.01
.005
.05
.02
.01
---------
--------
--------
10
11
11
12
14
10
13
17
13
10
14
21
16
13
15
25
20
16
16
30
24
20
17
35
28
23
18
40
33
28
19
46
38
32
20
52
43
38
N
horas de s ueo con
el placebo - horas de
sueo c on la droga
Rangos
negativ os
Rangos
pos itiv os
Empates
Total
0c
10
Suma de
rangos
6.31
50.50
2.25
4.50
Z
Asy mp. Sig. (2-t ailed)
a. Basado en los rangos positivos
b. Pr ueba de los r ang os con signo de Wilcoxon
-2.346 a
.019
Paso 1
Asignar rangos ascendentemente para
cada grupo
Paso 2
Sume los rangos en el grupo con el tamao
de muestra ms pequeo.
Si los dos grupos tienen el mismo tamao,
se debe elegir uno.
Paso 3
Compare esta suma con el valor hallado en la
tabla de Wilcoxon.
Hallar la fila correspondiente al tamao del grupo
con la muestra ms pequea (n).
Si el valor de W es menor que el hallado en la
tabla, se rechaza la hiptesis nula, es decir, hay
diferencias significativas.
Ho: No existen diferencias significativas entre
medias
Ha: Existen diferencias significativas entre medias
Ejemplo
Se afirma que un estudiante universitario de ltimo ao
puede aumentar su calificacin en el rea del campo de
especialidad del examen de registro de graduados en al
menos 50 puntos si de antemano se le proporcionan
problemas de muestra. Para probar esta afirmacin, se
dividen 20 estudiantes del ltimo ao en 10 pares de
modo que cada par tenga casi el mismo promedio de
puntos de calidad general en sus primeros aos en la
universidad. Los problemas y respuestas de muestra se
proporcionan al azar a un miembro de cada par una
semana antes del examen. Se registran las siguientes
calificaciones del examen:
Con problemas de
muestra
Sin problemas de
muestra
531
509
22
-28
621
540
81
31
663
688
-25
-75
579
502
77
27
3.5
451
424
27
-23
660
683
-23
-73
591
568
23
-27
3.5
719
748
-29
-79
10
543
530
13
-37
10
575
524
51
di
di d0
Rangos
= 6 + 3.5 + 1 = 10.5
Decisin y Conclusin:
Como 10.5 es menor que 11 se rechaza
Ho y se concluye con un = 0.05 que
los problemas de muestra, en
promedio,
no
aumentan
las
calificaciones de registro de graduados
en 50 puntos.
Media del
Estadstico
Clculo del
error estndar
n(n 1)
W
4
n(n 1)(2n 1)
24
w = n(n+1)
4
= n(n + 1)
4
En la expresion anterior n es el tamao de
la muestra.
DESVIACION ESTANDAR
n(n 1)(2n 1)
24
A partir de las expresiones anteriores
deducimos la expresion para Z curva normal
tipificada para esta prueba y seria asi:
Valor tipificado
n(n 1)
W
4
n(n 1)(2n 1)
24