Sei sulla pagina 1di 264

1

Programa de certificacin
de Black Belts
VI. Lean Seis Sigma Anlisis B
Segunda Parte

P. Reyes / Abril de 2010
2
VI.F Mtodos de anlisis
adicionales
3
Mtodos adicionales de anlisis
1. Anlisis de brecha

2. Anlisis de causa raz

3. Anlisis del Muda
4
VI.F.1 Anlisis de brecha
5
El anlisis de brecha (Gap Analysis) es una
herramienta de evaluacin para comparar el
desempeo actual de la organizacin, a un
desempeo potencial deseado.

Identifica la diferencia de lo que es y lo que debera
ser
6
Anlisis de brecha
Se pueden redirigir los esfuerzos a objetivos como:
Permanecer en el negocio
Mantener o incrementar la participacin del mercado
Mejorar el clima laboral
Igualar o exceder a Benchmarks
Igualar o exceder a la competencia
Reducir tiempos de ciclo
Lograr certificaciones
Mejorar la productividad
Mejorar los niveles de calidad
7
Anlisis de brecha
Se requieren tres categoras de informacin
Dnde estamos?
Dnde queremos ir?
Cmo vamos a medir los resultados?

8
Planeacin de escenarios
Al elaborar planes estratgicos, los directivos pueden
confiarse o ser orgullosos de aceptar cambios. Por lo
que se sugiere considerar escenarios del mejor y del
peor caso, para evitar errores en la toma de
decisiones

Los escenarios permiten imaginar el desempeo
futuro de la organizacin ante riesgos, para tomar las
mejores decisiones y atender estos eventos. Aunque
algunos elementos sean desconocidos
9
Planeacin de escenarios
El proceso de planeacin es como sigue:
Seleccionar al personal que pueda dar muchas
perspectivas
Desarrollar una lista de cambios percibidos, sociales,
tcnicos y econmicos
Agrupar estas percepciones en patrones relacionados
Desarrollar una lista de las mejores percepciones
(prioridades)

10
Planeacin de escenarios
El proceso de planeacin es como sigue:
Desarrollar un escenario grueso del futuro basado en
estas prioridades
Determinar como afectan los escenarios a la
organizacin
Determinar los cursos de accin potenciales a tomar
Monitorear, evaluar, y revisar los escenarios
11
Planeacin de escenarios
Por lo comn se perciben de 6 10 amenazas u
oportunidades en 2 o 3 escenarios desarrollados.
Evitar las siguientes trampas:

No utilizar un facilitador experimentado

Considerar escenarios como pronsticos

Hacer escenarios simplistas

Limitar el impacto global de los escenarios
12
Planeacin de escenarios
Evitar las siguientes trampas..:
No incluir a un equipo directivo en el proceso

Tratar los escenarios solo como actividad informativa

Limitar el estmulo imaginativo en el diseo del
escenario

No desarrollar escenarios para rea de impacto clave
del negocio
13
Planeacin Hoshin
Es una herramienta de ejecucin, usada para
organizar y desplegar planes estratgicos

Hoshin traduce la visin de la empresa en resultados
medibles dramticos y rupturas estratgicas

Hoshin se enfoca a identificar los pocos logros vitales
de ruptura
14
Planeacin Hoshin
Tiene seis objetivos:
Alinear las metas organizacionales

Enfocarse en las pocas brechas vitales estratgicas

Trabajar con otros para cerrar las brechas

Especificar los mtodos para lograr los objetivos

Hacer visible el enlace entre planes locales

Mejora continua del proceso de planeacin
15
Otras tcnicas de anlisis clave
Benchmarking

Anlisis FODA

Anlisis PEST

Las cinco fuerzas competitivas de Porter
16
Evaluacin organizacional
Anlisis funcional con datos de coleccin:
Entrevistas cara a cara
Seleccin de muestra apropiada
Entradas de grupo de enfoque
Observaciones de visitas a la planta
Datos colectados de fuentes de la industria

Se divide a la organizacin en reas funcionales clave
Liderazgo, prcticas de negocio, anlisis financiero,
mercadotecnia, gestin de la calidad, diseo y
desarrollo, manufactura, salud y seguridad, etc
17
Evaluacin organizacional
Se deben analizar los resultados y presentarlos a la
direccin, quien debe promover e implementar
planes de accin claros

Normalmente el consultor colecta y resume la
informacin en categoras principales para su revisin
por la direccin. Quienes deben generar e
implementar las soluciones y guiar al xito
18
Mtricas organizacionales
Se establecen metas de desempeo organizacional y
sus mtricas en las reas de:
Utilidades
Tiempos de ciclo
Recursos
Respuestas del mercado

Por cada meta organizacional mayor deben
desarrollarse mtricas, con unidades y mtodos de
medicin.
19
Mtricas organizacionales
Para los anteriores, las mtricas pueden ser:
Utilidades a corto y largo plazo
Valor de acciones, inversin de capital, costos
personales, comparaciones competitivas, ROI, ventas$

Tiempos de ciclo
Tiempos de ciclo actuales
Benchmarks internos
Benchmarks externos
Reduccin en tiempos de ciclo
20
Mtricas organizacionales
Recursos
No. De proyectos de mejora, ROI de proyectos, estudios de
capacidad de procesos, reducciones de variabilidad, costos
de calidad con relacin a una base, porcentaje de defectos
con relacin a alguna base

Respuestas del mercado
Encuestas con clientes
Anlisis de devoluciones
Desarrollo de nuevos productos
Retencin de clientes
Prdidas con clientes
Tasas de cortesas e instalaciones
21
Mtricas organizacionales
Las mtricas permiten medir los avances en relacin a
las metas organizacionales

De acuerdo a Juran se debe tomar en cuenta lo
siguiente:
Las mtricas deben tener un significado estndar
Deben apoyar el proceso de toma de decisiones
Deben proporcionar informacin valiosa
Debe ser fcil de instalar
Si son valiosas, deben usarse en todo
Las mtricas se basan en la retroalimentacin con
base en clientes, proveedores, o internas
22
VI.F.2 Anlisis de causa raz
23
Anlisis de causa raz
Un equipo tiene la responsabilidad de determinar la
causa raz de una deficiencia y corregirla. Pueden
tomar varios pasos:

Situacin (presa con fuga)
Accin inmediata (desahogarla)
Accin intermedia (reparar la presa)
Accin en la causa raz (identificar que caus la fuga
para evitar su recurrencia y reconstruir la presa)
24
Anlisis de causa raz
Se pueden utilizar las siguientes herramientas:
Herramientas subjetivas:
Preguntar por qu cinco veces, tormenta de ideas,

anlisis de flujo de proceso, PHVA, grupo nominal,

observacin de operacin, diagrama de causa efecto,

tcnicas de consenso, seis sombreros de pensamiento,

equipos de trabajo, FMEA, FTA

25
Anlisis de causa raz
Se pueden utilizar las siguientes herramientas:
Herramientas analticas:
Coleccin y anlisis de datos

Anlisis de Pareto, anlisis de regresin, hoja de
verificacin

Anlisis de matriz de datos
Anlisis de capacidad de procesos, divisin de variacin

Subgrupos de datos, experimentos simples, DOE
Pruebas analticas, cartas de control

26
Anlisis de causa raz
Ante una accin correctiva permanente, la direccin
debe determinar si:

El anlisis de causa raz ha identificado el impacto
completo del problema

La accin correctiva es efectiva para eliminar o
prevenir la recurrencia

La accin correctiva es realista y sostenible
27
Los 5 Por qus
Se hace la pregunta Por qu? Cinco veces
Por qu? Nos faltaron partes por mquina daada
Por qu? La mquina no ha tenido mantenimiento en
los ltimos 3 meses
Por qu? El departamento de mantenimiento se ha
reducido a 6 personas de 8
Por qu? Se pas del presupuesto, les quitaron el
tiempo extra y dos personas
Por qu? La empresa no ha tenido los resultados
esperados y el director ha hecho recortes para salvar la
situacin, teme por su puesto
28
5Ws y 1H
El mtodo de las 5Ws y 1H se resume al preguntar
quin?, qu?, cundo?, dnde?, por qu? Y
cmo?.

Pueden usarse las ramas del diagrama de causa
efecto
29
Diagrama de causa efecto
Rompe el problema en partes ms pequeas
Muestra muchas causas potenciales grficamente
Muestra como interactan las causas
Sigue las reglas de la tormenta de ideas
Las sesiones tienen tres partes:
Tormenta de ideas
Dar prioridades (identificar las tres causas principales)
Desarrollo de un plan de accin
30
Diagrama de Pareto
Sirve para identificar problemas u oportunidades
prioritarias o mayores

De acuerdo a Juran permite identificar los pocos
vitales de los muchos triviales

El principio de Pareto sugiere que unas cuantas
categoras de problemas (20% aprox.) presentan la
mayor oportunidad para la mejora (80% aprox.)
31
Mtodo de las 8 disciplinas - Ford
El mtodo de Ford para el anlisis de causa raz es:
D1. Establecer el equipo
D2. Describir el problema
D3. Desarrollar una accin de contencin
D4. Identificar la causa raz
D5. Desarrollar alternativas de solucin
D6. Implementar una accin correctiva permanente
D7. Prevenir la recurrencia
D8. Reconocer al equipo y las contribuciones individuales
32
Anlisis de rbol de falla - FTA
FTA es un mtodo sistemtico deductivo, para definir
un evento singular especfico e indeseable, y
determinar todas las posibles razones (fallas) que
pueden hacer que ocurra el evento

Se utiliza el las primeras fases del diseo como
herramienta para impulsar modificaciones iniciales de
diseo.
33
Anlisis de rbol de falla - FTA
Otras reas de su aplicacin son:
Anlisis funcional de sistemas complejos
Evaluacin de requerimientos de seguridad,
confiabilidad,
defectos de diseo,
riesgos de peligro,
acciones correctivas,
simplificacin de mantenimiento y deteccin de falla,
eliminacin lgica de causas de falla
34
Anlisis de rbol de falla - FTA
Se prefiere el FTA en vez del FMEA cuando:
La seguridad el personal es importante
Se pueden identificar un nmero pequeo de eventos
superiores
Hay alto potencial de falla
El problema es cuantificar la evaluacin del riesgo
La funcionalidad del producto es altamente compleja
El producto no es reaprables
35
Anlisis de rbol de falla - FTA
Se prefiere el FMEA en vez del FTA cuando:
Los eventos superiores no se pueden definir
explcitamente
Son factibles mltiples perfiles potencialmente exitosos
La identificacin de todos los modos de falla es
importante
La funcionalidad del producto tiene poca intervencin
externa
36
Anlisis de rbol de falla - FTA
Smbolos de compuertas lgicas para determinar la
confiabilidad del sistema. Hay smbolos de eventos y
smbolos de compuertas

Smbolos de eventos

Evento superior, falla a nivel sistema o evento
indeseable

Evento bsico, evento falla de ms bajo nivel
a estudiar

Evento de falla, evento de falla de bajo nivel. Puede recibir
entradas o proporcionar salidas a una compuerta lgica
37
Anlisis de rbol de falla - FTA
Smbolos de compuertas lgicas

AND. El evento de salida ocurre solo
Si ocurren todos los eventos de entrada
Simultaneamente

OR. El evento de salida ocurre si
Ocurre alguno de los eventos de
La entrada
38
Anlisis de rbol de falla - FTA
Ejemplo: se asume que falla el sistema superior

39
Anlisis de rbol de falla - FTA
La probabilidad de falla del sistema es 5.02%. Se
indica que el teclado es prioritario (0.20), despus la
CPU (0.015) y el monitor (0.015)
40
VI.F.3 Anlisis del Muda
41
Anlisis de Muda
Las actividades que no agregan valor se clasifican
como Muda, de acuerdo a Imai son:
Sobreproduccin
Inventarios
Reparaciones / rechazos
Movimientos
Transportes
Re Procesos
Esperas
42
Sobreproduccin
Se produce ms en cierto momento, por:
Producir ms de lo necesario por el siguiente proceso
Producir antes de lo requerido por el siguiente proceso
Producir ms rpido de lo requerido por el siguiente
proceso
Sus consecuencias son:
Espacio extra en las instalaciones del cliente
Materias primas adicionales en uso
Utilizacin de energticos y transportes adicionales
Costos de programacin adicionales
43
Inventario en exceso
Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman el
inventario, el inventario es Muda ya que requiere:
Espacio en piso, Transporte, Montacargas
Sistemas de transportadores
Inters sobre el costo de los materiales

Puede verse afectado por:
El polvo, deterioro, obsolescencia
Humedad (oxidacin), dao durante el manejo


44
Inventario en exceso
Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman el
inventario, el inventario es Muda ya que requiere:
Espacio en piso, Transporte, Montacargas
Sistemas de transportadores
Inters sobre el costo de los materiales

Puede verse afectado por:
El polvo, deterioro, obsolescencia
Humedad (oxidacin), dao durante el manejo


45
Reparaciones / defectos
Las reparaciones o el retrabajo de partes defectivas
significa un segundo intento de producirlas bien. Se
rompe el Takt Time

Puede haber desperdicio de materiales o productos
no recuperable

Si hay defectos, no puede implementarse el flujo de
una pieza
Los cambios de diseo tambin son Muda

46
Movimientos
Los movimientos adicionales del personal son Muda.
Caminar mucho, cargar pesado, agacharse, estirarse
mucho, repetir movimientos, etc.

El lugar de trabajo debe disearse ergonmicamente,
analizando cada estacin de trabajo

La ergonoma puede causar daos y produccin
perdida
47
Movimientos
Algunas reglas de la ergonoma incluyen:
Enfatizar la seguridad todas las veces
Adecuar el empelado a la tarea
Cambiar el lugar de trabajo para que se adecue al
empleado
Mantener posiciones neutrales del cuerpo
Redisear las herramientas para reducir esfuerzo y
daos
Variar las tareas con rotacin de puestos
Hacer que la mquina sirva al ser humano

48
Reprocesos
Consiste de pasos adicionales en el proceso de
manufactura, por ejemplo:
Remocin de rebabas
Maquinado de partes mal moldeadas
Agregar procesos de manejo adicionales
Realizar procesos de inspeccin
Repetir cambios al producto innecesarios
Mantener copias adicionales de informacin
49
Transportes
Todo transporte es Muda excepto la entrega al
cliente. Incluye:
Uso de montacargas
Uso de transportadores
Uso de movedores de pallets y camiones

Puede ser causado por:
Deficiente distribucin de planta o de celdas
Tiempos de espera largos, reas grandes de
almacenaje, o problemas de programacin
50
Esperas
Ocurre cuando un operador est listo para realizar su
operacin, pero permanece ocioso, por falla de
mquina, falta de partes, paros de lnea, etc. El Muda
de espera puede ser por:
Operadores ociosos
Fallas de maquinaria
Tiempos de ajuste y preparacin largos
Tareas no programadas a tiempo
Flujo de materiales en lotes
Juntas largas e innecesarias
51
Mudas adicionales
Otros mudas adicionales a los 7 desperdicios son:
Recursos mal utilizados
Recursos poco utilizados
Actividades de conteo
Bsqueda de herramientas o partes
Sistemas mltiples
Manos mltiples
Aprobaciones innecesarias
Fallas de mquinas
Envo de producto defectivo al cliente o mal servicio
52
VI.B.3 Regresin lineal mltiple
53
Regresin mltiple
Cuando se usa ms de una variable independiente para predecir
los valores de una variable dependiente, el proceso se llama
anlisis de regresin mltiple, incluye el uso de ecuaciones
lineales.



Se asume que los errores cu tienen las caractersticas siguientes:
Tienen media cero y varianza comn o2.
Son estadsticamente independientes.
Estn distribuidos en forma normal.
u uk k u u u
X X X Y c | | | | + + + + + = .......
2 2 1 1 0
54
Regresin mltiple
Estimacin de los parmetros del modelo
Se trata de minimizar los errores cuadrticos en:



El modelo de regresin mltiple en forma matricial es:
Y = X | + c = [1 : D] | + c
Y es un vector N x 1.
X es una matriz de orden N x (k + 1), donde la 1. columna es 1s.
| es un vector de orden (k + 1) x 1.
c es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k

=
=
N
u
uk u u u k
X X Y R
1
2
2 2 1 1 0 1 0
) ..... ( ) ,..., , ( | | | | | | |
55
Regresin mltiple
Estimacin de los parmetros del modelo:

b = (XX)-1 XY
El vector de valores ajustados se puede expresar como:



La varianza del modelo se estima como:



Hy Y X X X X Xb Y = = =

' ) ' (

1
Xb Y =

e e e Y Y SSE
n
i
i i
' )

(
1
2 2
= = =

=
Xb X b Y X b Y Y Xb X b Xb Y Y X b Y Y Xb Y Xb Y SSE ' ' ' ' 2 ' ' ' ' ' ' ' ) ( )' ( + = + = =
Y X b Y Y SSE ' ' ' =
p N
SSE
MSE s

= =
2
56
Tamao de muestra
Tomar 5 observaciones para cada una de las
variables independientes, si esta razn es menor de5
a 1, se tiene el riesgo de sobreajustar el modelo

Un mejor nivel deseable es tomar 15 a 20
observaciones por cada variable independiente
57
Ejemplo de regresin mltiple
Un embotellador est analizando las rutas de servicio de
mquinas dispensadoras, est interesado en predecir la
cantidad de tiempo requerida por el chofer para surtir las
mquinas en el local (Y).

La actividad de servicio incluye llenar la mquina con refrescos y
un mantenimiento menor.

Se tienen como variables el nmero de envases con que llena la
mquina (X1) y la distancia que tiene que caminar (X2).
58
Ejemplo de regresin mltiple
X2-Dist X1-CAS Y-TENT Fit SE Fit Residual St Resid
Obs
16.68 7.0 16.680 21.708 1.040 -5.028 -1.63
1
11.50 3.0 11.500 10.354 0.867 1.146 0.36
2
12.03 3.0 12.030 12.080 1.024 -0.050 -0.02
3
14.88 4.0 14.880 9.956 0.952 4.924 1.58
4
13.75 6.0 13.750 14.194 0.893 -0.444 -0.14
5
18.11 7.0 18.110 18.400 0.675 -0.290 -0.09
6
08.00 2.0 8.000 7.155 0.932 0.845 0.27
7
17.83 7.0 17.830 16.673 0.823 1.157 0.37
8
79.24 30.0 79.240 71.820 2.301 7.420 3.21RX
9
21.50 5.0 21.500 19.124 1.444 2.376 0.81
10
40.33 16.0 40.330 38.093 0.957 2.237 0.72
11
21.00 10.0 21.000 21.593 1.099 -0.593 -0.19
12
13.50 4.0 13.500 12.473 0.806 1.027 0.33
13
19.75 6.0 19.750 18.682 0.912 1.068 0.34
14
24.00 9.0 24.000 23.329 0.661 0.671 0.21
15
29.00 10.0 29.000 29.663 1.328 -0.663 -0.22
16
15.35 6.0 15.350 14.914 0.795 0.436 0.14
17
19.00 7.0 19.000 15.551 1.011 3.449 1.11
18
09.50 3.0 9.500 7.707 1.012 1.793 0.58
19
35.10 17.0 35.100 40.888 1.039 -5.788 -1.87
20
17.90 10.0 17.900 20.514 1.325 -2.614 -0.88
21
52.32 26.0 52.320 56.007 2.040 -3.687 -1.45 22
18.75 9.0 18.750 23.358 0.662 -4.608 -1.44 23
19.83 8.0 19.830 24.403 1.132 -4.573 -1.50 24
10.75 4.0 10.750 10.963 0.841 -0.213 -0.07 25


R denotes an observation with a large standardized residual
X denotes an observation whose X value gives it large influence.

Durbin-Watson statistic = 1.17
59
Ejemplo de regresin mltiple
Solucin matricial
Matrix M5 = X'
[ 1 1 1 1 1 1 1 1 1 1 1 1
1
7 3 3 4 6 7 2 7 30 5 16 10
4
560 220 340 80 150 330 110 210 1460 605 688 215
255

1 1 1 1 1 1 1 1 1 1 1 1
6 9 10 6 7 3 17 10 26 9 8 4
462 448 776 200 132 36 770 140 810 450 635 150 ]

Matrix M6 = X'Y

[ 25 219 10232
219 3055 133899
10232 133899 6725688 ]

Matrix M7 = X'Y

[ 560
7375
337072 ]

60
Ejemplo de regresin mltiple
Solucin matricial
Matrix M8 = INV(X'X)

0.113215 -0.004449 -0.000084
-0.004449 0.002744 -0.000048
-0.000084 -0.000048 0.000001

Matrix M9 = INV(X'X) X'Y

2.34123
1.61591
0.01438

The regression equation is
Y-TENT = 2.34 + 1.62 X1-CAS + 0.0144 X2-DIST

Predictor Coef SE Coef T P
Constant 2.341 1.097 2.13 0.044
X1-CAS 1.6159 0.1707 9.46 0.000
X2-DIST 0.014385 0.003613 3.98 0.001

S = 3.259 R-Sq = 96.0% R-Sq(adj) = 95.6%

61
Ejemplo de regresin mltiple
Solucin matricial
Clculo de la estimacin de la varianza:
Data Display

Matrix M10 = Y'

[ 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50
40.33
21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32
18.75 19.83 10.75 ]

Matrix M11 = Y'Y = 18310.6

Matrix M12 = b' = [ 2.34123 1.61591 0.01438 ]

Matrix M13 = b'X'Y = 18076.9

Matrix M14 = SSe = Y'Y - b'X'Y = 233.732

624 . 10
3 25
732 . 233
2
=

=
p N
SS
S
E

62
Ejemplo de regresin mltiple
Solucin matricial
Intervalo de confianza para Beta 1





Por tanto el intervalo de confianza para el 95% es:
1.26181 s |1 s 1.97001
) ( ) (
1 22 , 025 . 1 1 1 22 , 025 . 1
b se t b b se t b + s s |
) 17073 . 0 )( 074 . 2 ( 6191 . 1 ) 00274378 . 0 )( 6239 . 10 ( ) 074 . 2 ( 61591 . 1
1
+ s s |
63
Ejemplo de regresin mltiple
Solucin matricial
El embotellador desea construir un intervalo de confianza sobre
el tiempo medio de entrega para un local requiriendo:

X1 = 8 envases y cuya distancia es X2 = 275 pies.




La varianza de la Y0 estimada es (tomando M8=inv(XX) :

(
(
(

=
275
8
1
0
X
| | minutos b X Y 22 . 19
01438 . 0
61591 . 1
34123 . 2
275 , 8 , 1 '

0 0
=
(
(
(

= =
| | 56794 . 0 ) 05346 . 0 ( 6239 . 10
275
8
1
8 275 , 8 , 1 6239 . 10 ) ' ( ' )

(
0
1
0
2
0
= =
(
(
(

= =

M X X X X S Y Var
64
Ejemplo de regresin mltiple
Solucin matricial
El intervalo de confianza sobre el tiempo medio de entrega para
un local requiriendo es para 95% de nivel de confianza:



Que se reduce a: 17.66 s Y0 s 20.78


56794 . 0 074 . 2 22 . 19 56794 . 0 074 . 2 22 . 19
0
+ s s Y
65
Ejemplo de regresin mltiple
Solucin matricial
El anlisis de varianza es:

Analysis of Variance
SST = 18,310.629 -
25
) 6 . 559 (
2
= 5784.5426
SSR = 18,076.930 -
25
) 6 . 559 (
2
= 5,550.8166
SSE = SST SSR = 233.7260

24 . 261
6239 . 10
4083 . 2775
0
= = =
MSE
MSR
F

44 . 3
22 , 2 , 05 . 0
= F

Como la F calculada es mayor que la F de tablas, se
concluye que existe el modelo con alguno de sus
coeficientes diferente de cero
Con el paquete Minitab se obtuvo lo siguiente:
Source DF SS MS F P
Regression 2 5550.8 2775.4 261.24 0.000
Residual Error 22 233.7 10.6
Total 24 5784.5
66
Ejemplo de regresin mltiple
Solucin matricial
El comportamiento de los residuos es como sigue:

67
Multicolinealidad
La multicolinealidad implica una dependencia cercana entre
regresores (columnas de la matriz X ), de tal forma que si hay
una dependencia lineal exacta har que la matriz XX sea
singular.

La presencia de dependencias cercanamente lineales impactan
dramticamente en la habilidad para estimar los coeficientes de
regresin.

La varianza de los coeficientes de la regresin son inflados
debido a la multicolinealidad. Es evidente por los valores
diferentes de cero que no estn en la diagonal principal de XX.
Que son correlaciones simples entre los regresores.
68
Multicolinealidad
Una prueba fcil de probar si hay multicolinealidad entre dos
variables es que su coeficiente de correlacin sea mayor a 0.7

Los elementos de la diagonal principal de la matriz XX se
denominan Factores de inflacin de varianza (VIFs) y se usan
como un diagnstico importante de multicolinealidad. Para el
componente j simo se tiene:



Si es mayor a 10 implica que se tienen serios problemas de
multicolinealidad.
2
1
1
j
j
R
VIF

=
69
Anlisis de los residuos
Los residuos graficados vs la Y estimada, pueden mostrar
diferentes patrones indicando adecuacin o no adecuacin del
modelo:

Grfica de residuos aleatorios cuya suma es cero (null plot)
indica modelo adecuado

Grfica de residuos mostrando una no linealidad curvilnea
indica necesidad de transformar las variables

Si los residuos se van abriendo indica que la varianza muestra
heteroestacidad y se requiere transformar las variables. Se
puede probar con la prueba de Levene de homogeneidad de
varianzas
70
Escalamiento de residuos
En algunos casos es difcil hacer comparaciones directas entre
los coeficientes de la regresin debido a que la magnitud de bj
refleja las unidades de medicin del regresor Xj. Por ejemplo:




Para facilitarla visualizacin de residuos ante grandes
diferencias en los coeficientes, se sugiere estandarizar o
estudentizar los residuos
2 1
1000 5

X X Y + + =
71
Escalamiento de residuos
Residuos estandarizados
Se obtienen dividiendo cada residuo entre la desviacin
estndar de los residuos



Despus de la estandarizacin, los residuos tienen una
media de 0 y desviacin estndar de 1

Con ms de 50 datos siguen a la distribucin t, de
manera que si exceden a 1.96 (lmite para alfa 0.05)
indica significancia estadstica y son outliers

,
MSE
e
d
i
i
=
72
Escalamiento de residuos
Residuos estudentizados
Son similares a los residuos donde se elimina una
observacin y se predice su valor, pero adems se elimina la
i-sima observacin en el clculo de la desviacin estndar
usada para estandarizar la -sima observacin

Puede identificar observaciones que tienen una gran
influencia pero que no son detectadas por los residuos
estandarizados

H = X (XX)-1X es la matriz sombrero o hat matriz.
,
) 1 (
ii
i
i
h MSE
e
r

=
73
Escalamiento de residuos
El estadstico PRESS (Prediction Error Sum of Squares) es una
medida similar a la R2 en la regresin. Difiere en que se estiman
n-1 modelos de regresin.

En cada modelo se omite una observacin en la estimacin del
modelo de regresin y entonces se predice el valor de la
observacin omitida con el modelo estimado. El residuo isimo
ser:


El residuo PRESS es la suma al cuadrado de los residuos
individuales e indica una medida de la capacidad de prediccin



) ( ) (

i i i
Y Y e =
| |

= =
=
2
) (
1
2
) (

i i
N
i
i
Y Y e PRESS
YY
ediccin
S
PRESS
R =1
2
Pr
74
Grficas parciales de regresin
Para mostrar el impacto de casos individuales es ms efectiva la
grfica de regresin parcial. Un caso outlier impacta en la
pendiente de la ecuacin de regresin (y su coeficiente).

Una comparacin visual de la grfica de regresin parcial con y
sin la observacin muestra la influencia de la observacin

El coeficiente de correlacin parcial es la correlacin de la
variable independiente Xi la variable dependiente Y cuando se
han eliminado de ambos Xi y Y

La correlacin semiparcial refleja la correlacin entre las
variables independiente y dependiente removiendo el efecto Xi
75
Matriz sombrero
Los puntos de influencia son observaciones substancialmente
diferentes de las observaciones remanentes en una o ms
variables independientes

Contiene valores (sombrero en su diagonal) para cada
observacin que representa influencia. Representa los efectos
combinados de todos las variables independientes para cada
caso
76
Matriz sombrero
Los valores en la diagonal de la matriz sombrero miden dos
aspectos:
Para cada observacin miden la distancia de la observacin
al centro de la media de todas las observaciones de las
variables independientes

Valores altos en la diagonal indica que la observacin tiene
mucho peso para la prediccin del valor de la variable
dependiente, minimizando su residuo
El rango de valores es de 0 a 1, con media p/n, p es el
nmero de predictores y n es el tamao de muestra. Valores
lmite se encuentran en 2p/n y 3p/n

77
Distancia de Mahalanobis
D
2
es una medida comparable a los valores sombrero (hat
values) que considera slo la distancia de una observacin del
valor medio de las variables independientes.

Es otra forma de identificar outliers

La significancia estadstica de la distancia de Malahanobis se
puede hacer a partir de tablas del texto:
Barnett, V., Outliers in Statistical Data, 2nd. Edition, Nueva
York, Wiley, 2984
78
Influencia en coeficientes
individuales
El impacto de eliminar una observacin simple en cada
uno de los coeficientes de la regresin mltiple se muestra
con la DFBETA y su versin estandarizada SDFBETA.

Se sugiere aplicar como lmites 1.0 o 2 para tamaos
de muestra pequeos y n para muestras medias y
grandes

La distancia de Cook (Di) captura el impacto de una
observacin:
La dimensin del cambio en los valores pronosticados
cuando se omite la observacin y la distancia de las
otras observaciones, el lmite es 1 o 4/(n-k-1)
Influencia en coeficientes
individuales
La medida COVRATIO estima el efecto de la observacin
en la eficiencia del proceso, en sus errores estndar de los
coeficientes de la regresin. Considera a todos los
coeficientes colectivamente.

El lmite puede ser establecido en 1 3p/n, los valores
mayores al lmite hacen el proceso ms eficiente y los
menores ms ineficiente

La medida SDFFIT es el grado en que cambian los
valores ajustados o pronosticados cuando el caso se
elimina. El valor lmite es 2*raz((k+1)/(n-k-1))
80
Ejemplo de regresin mltiple
Solucin con Excel y Minitab
81
Ejemplo de Regresin Mltiple
Cat. (US News) GMAT Salario Inicial ($) % Aceptacin
Stanford 1 711 82000 7.4
Harvard 2 670 80000 12.8
Penn (Wharton) 3 662 79000 14.7
MIT (Sloan) 4 650 78000 15.1
Chicago 5 680 65000 25.0
Northwestern 6 660 70000 16.0
Columbia 7 660 83000 14.8
Dartmouth 8 670 70000 12.6
Duke 9 646 67500 20.5
Berkeley 10 653 70000 13.3
Virginia 11 660 66000 18.9
Michigan 12 645 65000 28.0
NYU 13 646 70583 20.9
Carnegie Mellon 14 640 67200 30.8
Yale 15 675 65000 23.5
U.N.C. 16 630 60000 19.8
UCLA 17 651 65000 17.5
Texas-Austin 18 630 60000 27.3
Indiana 19 630 61500 44.7
Cornell 20 637 64000 25.4
Rochester 21 630 58500 36.0
Ohio State 22 611 61000 23.2
Emory 23 626 60000 33.0
Purdue 24 603 63700 20.7
Maryland 25 640 53000 18.9
Interpretacin de Resultados de Excel- Regresin Multiple
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8749313 R Square 0.76550478
Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations 25

ANOVA
df SS MS F Significance F
Regression 3 1.12E+09 374977790.1 22.851355 8.17E-07
Residual 21 3.45E+08 16409433.67
Total 24 1.47E+09

Coefficients Standard t Stat P-value Lower 95% U pper 95%
Error
Intercept 122481.40 41473.13 2.953271081 0.007589 36233.29 208729.5

X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32 -513.424

X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.659 65.76118

X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.957 69.49917


Resultados de Excel- Regresin slo con slo X1
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.855974
R Square 0.732691
Adjusted R Square 0.721069
Standard Error 4132.688
Observations 25

ANOVA
df SS MS F Significance F

Regression 1 1.08E+09 1.08E+09 63.04264 4.88E-08
Residual 23 3.93E+08 17079107
Total 24 1.47E+09

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 79230.32 1703.951 46.49801 2.98E-24 75705.43405 82755.20595
X Variable1 -910.077 114.6201 -7.93994 4.88E-08 -1147.186411 -672.9674353




Con slo X1, el Modelo se simplifica enormemente
poca importancia prctica se pierde en R
2
(ajustada)
La ecuacin de regresin es:
y = 79230 - 910 x

Predictor Coef Desv. Estndar T p
Constante 79230 1704 46.50 0.000
x -910.1 114.6 -7.94 0.000

S = 4133 R
2
= 73.3% R
2
(ajustada) = 72.1%

Anlisis de Variancia

Fuente DF SS MS F p
Regresin 1 1076712008 1076712008 63.04 0.000
Error 23 392819470 17079107
Total 24 1469531477
Reduccin del Modelo
Vuelva a correr la regresin usando la categora
US News, como el nico agente de prediccin (predictor)
El Modelo se simplifica enormemente..poca
importancia prctica se pierde en R
2
(ajustada)
85
Corrida en Minitab
Se introducen los datos en varias columnas C1 a C5
incluyendo la respuesta Y (heatflux) y las variables
predictoras Xs (North, South, East)
HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50
251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28
86
Corrida en Minitab
Utilzar el archivo de ejemplo Exh_regr.mtw
Opcin: Stat > Regression > Regression
Para regresin lineal indicar la columna de respuesta
Y (Score2) y X (Score1)

En Regresin lienal en opciones se puede poner un
valor Xo para predecir la respuesta e intervalos. Las
grficas se obtienen Stat > Regression > Regression
> Fitted line Plots

Para regresin mltiple Y (heatflux) y las columnas
de los predictores (north, south, east)

87
Resultados de la regresin lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00
88
Resultados de la regresin lineal
9 8 7 6 5 4 3 2
3.5
2.5
1.5
Score1
S
c
o
r
e
2
S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %
Score2 = 1.11771 + 0.217670 Score1
95% PI
95% CI
Regression
Regression Plot
89
Resultados de la regresin Mltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
90
La regresin slo puede utilizarse con informacin de variables
continuas.

Los residuos deben distribuirse normalmente con media cero.

Importancia prctica: (R
2
). Importancia estadstica: (valores p)

La regresin puede usarse con un predictor X o ms,
para una respuesta dada

Reduzca el modelo de regresin cuando sea posible,
sin perder mucha importancia prctica
Resumen de la Regresin
91
VI.B.4 Herramientas
multivariadas
92
Herramientas multivariadas
1. Introduccin

2. Anlisis de componentes principales

3. Anlisis factorial

4. Anlisis discriminante

5. MANOVA
93
Introduccin
En el anlisis multivariado se incluyen dos o ms
variables dependientes Y1, Y2, etc. Consideradas
simultneamente para las variables independientes
X1, X2, ., Xn

Normalmente se resuelven con herramientas
computacionales tales como Minitab y SPSS.

Entre las herramientas principales se encuentran:
Componentes principales, anlisis factorial, anlisis
discriminante, anlisis de conglomerados, anlisis
cannico, MANOVA
94
Anlisis de componentes principales
El anlisis (PCA) y el anlisis factorial (FA) se usan
para encontrar patrones de correlacin entre muchas
variables posibles y subconjuntos de datos

Busca reducirlas a un menor nmero de
componentes o factores que representen la mayor
parte de la varianza.

Normalmente se requieren al menos 100
observaciones y cinco observaciones por variable

95
Anlisis de componentes principales
Pasos de anlisis en Minitab
Se usa una matriz de correlacin para determinar la
relacin entre componentes
Las matrices definen cantidades como eigenvalores y
eigenvectores
Se suman los eigenvalores y se calculan las
proporciones de cada componente
Se identifican los PC1, PC2, que explican la mayor
parte de la varianza
Se puede hacer un diagrama de Pareto como apoyo

96
Ejemplo: Alimentos en Europa
Pas RMEAT WMEAT EGGS MILK FISH CERL STARCH NUTS FR-VEG
1 10.1 1.4 0.5 8.9 0.2 42.3 0.6 5.5 1.7
2 8.9 14 4.3 19.9 2.1 28 3.6 1.3 4.3
3 13.5 9.3 4.1 17.5 4.5 26.6 5.7 2.1 4
4 7.8 6 1.6 8.3 1.2 56.7 1.1 3.7 4.2
5 9.7 11.4 2.8 12.5 2 34.3 5 1.1 4
6 10.6 10.8 3.7 25 9.9 21.9 4.8 0.7 2.4
7 8.4 11.6 3.7 11.1 5.4 24.6 6.5 0.8 3.6
8 9.5 4.9 2.7 33.7 5.8 26.3 5.1 1 1.4
9 18 9.9 3.3 19.5 5.7 28.1 4.8 2.4 6.5
10 10.2 3 2.8 17.6 5.9 41.7 2.2 7.8 6.5
11 5.3 12.4 2.9 9.7 0.3 40.1 4 5.4 4.2
12 13.9 10 4.7 25.8 2.2 24 6.2 1.6 2.9
13 9 5.1 2.9 13.7 3.4 36.8 2.1 4.3 6.7
14 9.5 13.6 3.6 23.4 2.5 22.4 4.2 1.8 3.7
15 9.4 4.7 2.7 23.3 9.7 23 4.6 1.6 2.7
16 6.9 10.2 2.7 19.3 3 36.1 5.9 2 6.6
17 6.2 3.7 1.1 4.9 14.2 27 5.9 4.7 7.9
18 6.2 6.3 1.5 11.1 1 49.6 3.1 5.3 2.8
19 7.1 3.4 3.1 8.6 7 29.2 5.7 5.9 7.2
20 9.9 7.8 3.5 24.7 7.5 19.5 3.7 1.4 2
21 13.1 10.1 3.1 23.8 2.3 25.6 2.8 2.4 4.9
22 17.4 5.7 4.7 20.6 4.3 24.3 4.7 3.4 3.3
23 9.3 4.6 2.1 16.6 3 43.6 6.4 3.4 2.9
24 11.4 12.5 4.1 18.8 3.4 18.6 5.2 1.5 3.8
25 4.4 5 1.2 9.5 0.6 55.9 3 5.7 3.2

X1 X2 X3 X4 X5 X6 X7 X8 X9
97
Corrida en Minitab
2 Stat > Multivariate > Principal components
3 En Variables, X1, X2, X3, X4, X6, X7, X8, X9

4 En Number of factors to extract, 3. Seleccionar
Correlation Matrix
5 Click Graphs y seleccionar Scree Plot, Score plot for first
2 components Loading plot for first 2 components

8 Click Storage e indicar las columnas donde se guarden los
coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2
9. Click OK en cada uno de los cuadros de dilogo
98
Ejemplo: Alimentos en Europa

Component Number
E
i
g
e
n
v
a
l
u
e
9 8 7 6 5 4 3 2 1
4
3
2
1
0
Scree Plot of RMEAT, ..., FR-VEG

First Component
S
e
c
o
n
d

C
o
m
p
o
n
e
n
t
0.4 0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3 -0.4 -0.5
0.2
0.1
0.0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
FR-VEG
NUTS
STARCH
CERL
FISH
MILK
EGGS
WMEAT
RMEAT
Loading Plot of RMEAT, ..., FR-VEG
Dos componentes exceden
El eigenvalor de ref. de 1
99
Ejemplo: Alimentos en Europa

Se tiene la grfica siguiente de pases:
Europa occidental Europa oriental Balcanes
Z1
Z
2
4 3 2 1 0 -1 -2 -3
2
1
0
-1
-2
-3
-4
-5
25
24
23 22
21
20
19
18
17
16
15
14
13
12 11
10
9
8
7
6
5
4
3
2
1
Scatterplot of Z2 vs Z1

Pennsula ibrica


Ejemplo: factores principales para
crecimiento tecnolgico en la comunidad
Factores independientes
Miles de trabajadores en alta tecnologa
Cultura emprendedora (inicios por ao)
Interacciones con la universidad (proyectos por ao)
Clases de creatividad (porcentaje de profesionales)
Cantidad de capital de aventura (millones de dlares)
100
Matriz de correlacin del ejemplo
101
Resultados
La suma de los eigenvalores es aprox. cinco

La proporcin de la varianza explicada por el
componente 1 es de 71.7%

PC1 y PC2 explican el 89.2% de la varianza, por
tanto son los componentes principales

102
103
Anlisis factorial
Es una tcnica de reduccin de variables para
identificar factores que expliquen la variacin,
aunque se reiere un juicio subjetivo.

Las variables de salida estn relacionadas
linealmente con las variables de entrada.

Las variables deben ser medibles y simtricas. Debe
haber cuatro o ms factores de entrada para cada
variable independiente

104
Anlisis factorial
Se especifican un cierto nmero de factores comunes

El anlisis factorial se hace en dos etapas:
Extraccin de factores, para identificar los factores
principales para un estudio posterior
Rotacin de factores, para hacerlos ms significativos

105
Corrida con Minitab
2 Stat > Multivariate > Factor Analysis.
3 En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4 En Number of factors to extract, 4.
En Method of Extraction, seleccionar Principal components
6 En Type of Rotation, seleccionar Varimax.
7 Click Graphs y seleccionar Loading plot for first 2 factors
y Scree Plot.
Click Results y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para ponderaciones,
coeficientes, Zs, eigenvalores, etc.
Click OK en cada uno de los cuadros de d
106
Ejemplo

First Factor
S
e
c
o
n
d

F
a
c
t
o
r
1.00 0.75 0.50 0.25 0.00 -0.25 -0.50
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
FR-VEG
NUTS
STARCH
CERL
FISH
MILK
EGGS
WMEAT
RMEAT
Loading Plot of RMEAT, ..., FR-VEG
Rotated Factor Loadings and Communalities
Varimax Rotation

Variable Factor1 Factor2 Factor3 Factor4 Communality
X1 RMEAT 0.051 -0.931 0.014 0.037 0.871
X2 WMEAT 0.943 -0.127 -0.100 0.050 0.918
X3 EGGS 0.628 -0.664 0.163 0.020 0.862
X4 MILK 0.197 -0.610 0.219 0.579 0.795
X5 FISH -0.226 -0.088 0.921 -0.104 0.919
X6 CERL -0.395 0.549 -0.624 -0.145 0.867
X7 STARCH 0.515 -0.004 0.683 -0.026 0.732
X8 NUTS -0.638 0.263 -0.326 -0.515 0.849
X9 FR-VEG -0.010 0.003 0.178 -0.937 0.910

Variance 2.2054 2.0749 1.9273 1.5165 7.7240
% Var 0.245 0.231 0.214 0.168 0.858
107
Ejemplo:

Z1
Z
2
2 1 0 -1 -2
2
1
0
-1
-2
Yugoslavia
Alemania Occ
Rusia
Reino Unido
Suiza
Suecia
Espaa
Rumania
Portugal
Polonia
Noruega
Holanda
Italia
Irlanda
Hungra
Grecia
Francia
Finlandia
Alemania orien
Dinamarca
Checa
Bulgaria
Blgica
Autria
Albania
Scatterplot of Z2 vs Z1

108
Anlisis discriminante
Si se tiene una muestra con grupos conocidos, el
anlisis discriminante clasifica las observaciones o
atributos en dos o ms grupos

Puede utilizarse como herramienta predictiva o
descriptiva

Las variables deben ser multivariadamente normales,
con la misma varianza y covarianza poblacional entre
variables dependientes, y las muestras exhiben
independencia
109
Ejemplo de actividades en pases
No
Grupo
Ciudad Agr Min Man Ps Con Ser Fin Sps Tc
1
1
Blgica 3.3 0.9 27.6 0.9 8.2 19.1 6.2 26.6 7.2
2
1
Dinamarca 9.2 0.1 21.8 0.6 8.3 14.6 6.5 32.2 7.1
3
1
Francia 10.8 0.8 27.5 0.9 8.9 16.8 6.0 22.6 5.7
4
1
Alemania Occ. 6.7 1.3 35.8 0.9 7.3 14.4 5.0 22.3 6.1
5
1
Irlanda 23.2 1.0 20.7 1.3 7.5 16.8 2.8 20.8 6.1
6
1
Italia 15.9 0.6 27.6 0.5 10.0 18.1 1.6 20.1 5.7
7
1
Luxenburgo 7.7 3.1 30.8 0.8 9.2 18.5 4.6 19.2 6.2
8
1
Holanda 6.3 0.1 22.5 1.0 9.9 18.0 6.8 28.5 6.8
9
1
Inglaterra 2.7 1.4 30.2 1.4 6.9 16.9 5.7 28.3 6.4
10
1
Austria 12.7 1.1 30.2 1.4 9.0 16.8 4.9 16.8 7.0
11
1
Finlandia 13.0 0.4 25.9 1.3 7.4 14.7 5.5 24.3 7.6
12
2
Grecia 41.4 0.6 17.6 0.6 8.1 11.5 2.4 11.0 6.7
13
1
Noruega 9.0 0.5 22.4 0.8 8.6 16.9 4.7 27.6 9.4
14
2
Portugal 27.8 0.3 24.5 0.6 8.4 13.3 2.7 16.7 5.7
15
2
Espaa 22.9 0.8 28.5 0.7 11.5 9.7 8.5 11.8 5.5
16
1
Suecia 6.1 0.4 25.9 0.8 7.2 14.4 6.0 32.4 6.8
17
1
Suiza 7.7 0.2 37.8 0.8 9.5 17.5 5.3 15.4 5.7
18
2
Turqua 66.8 0.7 7.9 0.1 2.8 5.2 1.1 11.9 3.2
19
3
Bulgaria 23.6 1.9 32.3 0.6 7.9 8.0 0.7 18.2 6.7
20
3
Checa 16.5 2.9 35.5 1.2 8.7 9.2 0.9 17.9 7.0
21
3
Alemania Ori. 4.2 2.9 41.2 1.3 7.6 11.2 1.2 22.1 8.4
22
3
Hungra 21.7 3.1 29.6 1.9 8.2 9.4 0.9 17.2 8.0
23
3
Polonia 31.1 2.5 25.7 0.9 8.4 7.5 0.9 16.1 6.9
24
3
Rumania 34.7 2.1 30.1 0.6 8.7 5.9 1.3 11.7 5.0
25
3
Rusia 23.7 1.4 25.8 0.6 9.2 6.1 0.5 23.6 9.3
26
3
Yugoslavia 48.7 1.5 16.8 1.1 4.9 6.4 11.3 5.3 4.0

110
Corrida con Minitab
2 Stat > Multivariate > Discriminant Analysis.

3 En Groups, poner SalmonOrigin.

4 En Predictors, poner Freshwater Marine. Click OK.
111
Corrida con Minitab

Canonical Discri minant Functions
Function 1
6 4 2 0 -2 -4 -6
F
u
n
c
t
i
o
n

2
3
2
1
0
-1
-2
-3
-4
GRUPO
Group Centroids
3
2
1
3
2
1
112
Anlisis de conglomerados
113
Anlisis de conglomerados
Se usa para determinar agrupaciones o
clasificaciones de un conjunto de datos

Las personas se pueden agrupar por IQ, padres,
hbitos de estudio, etc.

Se trata de dar sentido a grandes cantidades de
datos de cuestionarios, ecnuestas, etc.
114
Ejemplo
Suponer que un estudio de
mercado trata de determinar
segmentos de mercado en
base a los patrones de
lealtad de marcas (V1) y
tiendas (V2), medidas del 0
al 10 en 7 personas (A-G).
Variables V1 V2
A 3 2
B 4 5
C 4 7
D 2 7
E 6 6
F 7 7
G 6 4
115
Corrida en Minitab
Stat > Multivariate Anlisis > Cluster Observations
Distance Measured Euclidean Seleccionar Show
Dendogram OK

Observations
D
i
s
t
a
n
c
e
7 6 5 4 3 2 1
3.16
2.11
1.05
0.00
Dendrogram with Single Linkage and Euclidean Distance
116
Anlisis de correlacin cannico
Prueba la hiptesis de que los efectos pueden tener
causas mltiples y de que las causas pueden tener
efectos mltiples (Hotelling 1935)

Es como una regresin mltiple para determinar la
correlacin entre dos conjuntos de combinaciones
lineales, cada conjunto puede tener varias variables
relacionadas.
La relacin de un conjunto de variables dependientes
a un conjunto de variables independientes forma
combinaciones lineales
117
Anlisis de correlacin cannico
Se usan los ms altos valores de correlacin para los
conjuntos. Los pares de combinaciones lineales se
denominan variates cannicas con correlaciones
cannicas (Rc con valor mayor a 0.3)

Por ejemplo se quiere determinar si hay una
correlacin entre las caractersticas de un ingeniero
industrial y las habilidades requeridas en la
descripcin de puesto del mismo ingeniero.
Ejemplo: Statgraphics - coches
118
Ejemplo: Statgraphics - coches
119
Ejemplo: Statgraphics - coches
120
Ejemplo: Statgraphics - coches
121
Ejemplo: Statgraphics - coches
122
La primera correlacin de 0.94 tiene correlaciones
cannicas asociadas:

U1 = 0.262 Engine Size + 0.127 Horsepower + 0.024
Length + 0.041 Wheelbase - 0.068 Width + 0.004 Rear
Seat + 0.658 Weight

V1 = 0.257 Mid Price 0.097 * GPM Highway + 0.652
GPM City + 0.322 U Turn Space

Las variables estn estandarizadas. Parece haber una
relacin primaria entre peso del vehculo y las millas por
galn de rendimiento.
123
MANOVA
(Anlisis de varianza mltiple)
Es un modelo para analizar la relacin entre una o
ms variables independientes y dos o ms variables
dependientes

Prueba si hay diferencias significativas en las medias
de grupos de una combinancin de respuestas Y.

Los datos deben ser normales, con covarianza
homogenea y observaciones independientes
124
MANOVA
(Anlisis de varianza mltiple)
125
Diferencias de ANOVA y MANOVA
126
Ejemplo:
Extrusin de pelcula plstica
Se realiza un estudio para determinar las condiciones
ptimas para extruir pelcula plstica.

Se miden tres respuestas Tear, gloss y opacity
cinco veces en cada combinacin de dos factores
tasa de extrusin y cantidad de aditivo cada grupo
se pone en niveles bajos y altos.

Se utiliza el MANOVA balanceado para probar la
igualdad de las medias.
127
Ejemplo:
Extrusin de pelcula plstica
Tear Gloss Opacity Extrusin Additive
6.5 9.5 4.4 1 1
6.2 9.9 6.4 1 1
5.8 9.6 3 1 1
6.5 9.6 4.1 1 1
6.5 9.2 0.8 1 1
6.9 9.1 5.7 1 2
7.2 10 2 1 2
6.9 9.9 3.9 1 2
6.1 9.5 1.9 1 2
6.3 9.4 5.7 1 2
6.7 9.1 2.8 2 1
6.6 9.3 4.1 2 1
7.2 8.3 3.8 2 1
7.1 8.4 1.6 2 1
6.8 8.5 3.4 2 1
7.1 9.2 8.4 2 2
7 8.8 5.2 2 2
7.2 9.7 6.9 2 2
7.5 10.1 2.7 2 2
7.6 9.2 1.9 2 2

128
Ejemplo:
Extrusin de pelcula plstica
1 Abrir el archivo EXH_MVAR.MTW.
2 Seleccionar Stat > ANOVA > Balanced
MANOVA.
3 En Responses, poner Tear Gloss Opacity.
4 En Model, poner Extrusion | Additive.
5 Click Results. En Display of Results, seleccionar
Matrices (hypothesis, error, partial
correlations) y Eigen analysis.
6 Click OK en cada cuadro de dilogo.
129
Ejemplo
Criterion Statistic F Num Denom P
Wilks' 0.38186 7.554 3 14 0.003
SSCP Matrix for Extrusion
Tear Gloss Opacity
Tear 1.740 -1.505 0.8555
Gloss -1.505 1.301 -0.7395
Opacity 0.855 -0.739 0.4205
SSCP Matrix for Error
Tear Gloss Opacity
Tear 1.764 0.0200 -3.070
Gloss 0.020 2.6280 -0.552
Opacity -3.070 -0.5520 64.924
Partial Correlations for the Error SSCP Matrix
Eigenvector 1 2 3
Tear 0.6541 0.4315 0.0604
Gloss -0.3385 0.5163 0.0012
Opacity 0.0359 0.0302 -0.1209
130
Ejemplo:
Extrusin de pelcula plstica
Las matrices SSCP evalan la contribucin a la
variabilidad de manera similar a la suma de
cuadrados en la ANOVA univariada.

Las correlaciones parciales entre Tear y Gloss son
pequeas. Como la estructura de las correlaciones es
dbil, se pueden realizar anlisis univariados de
ANOVA para cada una de las respuestas.
131
VI.B.5 Anlisis de datos
por atributos
132
Anlisis de datos por atributos
Si los CTQs son variables continuas, se usa la
regresin, dependiendo de la naturaleza de la
caracterstica crtica para el cliente (CTSs) como ste
la expresa:

CTS HERRAMIENTA
Nominal (Verde, Rojo, azul) Regresin Logstica Nominal
Atributo (Pasa/No pasa) Regresin Logstica Binaria
Ordinal (1, 2, 3, 4, 5) Regresin Logstica Ordinal

133
Anlisis de datos por atributos
El anlisis de datos por atributos se organiza en
valores, categoras o grupos dicotmicos

Las decisiones incluyen: si / no, pasa / no pasa,
bueno / malo, pobre/justo/bueno/superior/excelente,
etc.

Entre los modelos no lineales de regresin usados se
tienen: regresin logstica, regresin logit y regresin
probit
134
Anlisis de datos por atributos
Regresin logstica
Relaciona variables independientes categricas a una
variable dependiente (Y). Minitab incluye los modelos
binario, ordinal y nominal

Regresin logit
Es subconjunto del modelo log-lineal. Tiene solo una
variable dependiente, usa determinaciones de
probabilidad o tasa de probabilidad
135
Anlisis de datos por atributos
Regresin probit
Es similar a la prueba de vida acelerada, la unidad se
somete a esfuerzo con la respuesta pasa/falla, bueno o
malo. Es una respuesta binaria en un tiempo de falla
futuro


136
Regresin logstica o binaria
En caso de informacin cualitativa es necesario
traducir las preferencias del cliente expresadas como
atributos a un intervalo de valores aceptables de
variables (Especificaciones).

137
Regresin logstica o binaria
Es similar a la regresin mltiple excepto que la
respuesta es binaria (si/no, bueno/malo, etc.) Sus
coeficientes se determinan por el mtodo de mxima
verosimilitud

Su funcin tiene forma de S, con valores mximos
de Cero y Uno.

Yi = 0, 1
138
Regresin logstica o binaria
La probabilidad de que el resultado est en cierta
categora es:



El mtodo de clculo del coeficiente b es diferente
que en la regresin lineal

Los coeficientes se determinan con la relacin sig.:

n n
B
X B X B X B e
evento no P
evento P
+ + + + = ....
) (
) (
2 2 1 1
0
139
Regresin logstica
Condiciones:
Hay solo dos resultados posibles
Hay solo un resultado por evento
Los resultados son independientes estadsticamente
Todos los predictores relevantes estn en el modelo
Es mutuamente exclusivo y colectivamente exhaustivo
Los tamaos de muestra son mayores que para la
regresin mltiple

Los efectos positivos se obtienen con b1>1 y los
negativos con b1 e 0 a 1
140
Regresin logstica

Relacin con ajuste pobre





Relacin con buen ajuste
141
Regresin logstica - Procedimiento
Definir el atributo a traducir (y)
Definir la variable apropiada para el atributo (x)
Definir el modelo matemtico a probar
Determinar los defectos que est dispuesto a
aceptar
Recolecte informacin de x vs y. Asigne 1 si falla
y 0 si es aceptable.
Analice la informacin mediante Regresin Logstica
Binaria

142
Regresin logstica- Procedimiento
143
Regresin logstica - Procedimiento






Observe el P-Value de Deviance en la Sesin, debe
de ser grande (P >0.10)
Obtenga los coeficientes del modelo (De la Sesin)
Coeficientes del modelo
P-Value de Deviance
144
Regresin logstica - Procedimiento
Construya el modelo de regresin para la
probabilidad de falla estar dado por :




Identifique el(los) valor(es) de x que le generarn
como mximo la cantidad de defectos que usted
est dispuesto a aceptar [4]


Donde :
b
0
, b
1
, ... = Coeficientes del modelo
P(Falla) =
b
0
+b
1
x
1
+....
e
1 + e
b
0
+b
1
x
1
+....
145
Ejemplo de riesgo de paro cardiaco
Logistic Regression Table
Odds 95% CI
Predictor Coef SE Coef Z P Ratio Lower Upper
Constant -1.98717 1.67930 -1.18 0.237
Fuma
Si -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90
Peso 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05







Para Fuma, el coeficiente negativo de -1.193 y la tasa de
posibilidades de 0.30, indica que quien fuma, tiende a tener una
tasa de pulso ms alta que los sujetos que no fuman. Si los
sujetos tienen el mismo peso, las posibilidades de que los
fumadores tengan un pulso bajo sea slo del 30% de las
posibilidades de que los no fumadores tengan un pulso bajo.

146
Regresin logstica ordinal
Cuando la respuesta CTS es de tipo ordinal (Varias
categoras de respuesta como totalmente de
acuerdo, de acuerdo, en desacuerdo y
totalmente en desacuerdo) y el Factor CTQ es de
naturaleza continua, entonces, para definir
Especificaciones, la herramienta a utilizar es la
Regresin Logstica Ordinal.

147
Regresin logstica ordinal -
Procedimiento
Defina la variable de respuesta a traducir (y
CTS)
Defina el CTQ (x) variable a relacionar con el
CTS
Defina el modelo matemtico a probar
Determine los defectos que est dispuesto a aceptar
en la categora de inters
Recolecte informacin de x vs y
Analice la informacin mediante Regresin Logstica
Ordinal
148
Regresin logstica ordinal -
Procedimiento
Stat > Regression > Ordinal Logistic Regression
Seleccione la respuesta (y)
Seleccione los trminos que estima tiene el modelo
[3]

Constantes y
Coeficientes
del modelo
149
Regresin logstica ordinal -
Procedimiento
Observe el P-Value de Deviance en la Sesin, debe
de ser grande (P >0.10)

Obtenga las constantes y coeficientes del modelo
(De la Sesin)

Construya los modelos de regresin para la
probabilidad acumulada por categora
150
Regresin logstica ordinal -
Procedimiento
e
1 + e
Donde :
K
i
= Constante de la categora i
b
1
, b
2
, ... = Coeficientes del modelo
acumulada
hasta categora
i
K
i
+b
1
x
1
+ b
2
x
2
....
K
i
+b
1
x
1
+ b
2
x
2
....
=
P
Constantes y
Coeficientes
del modelo
Identifique el(los) valor(es) de x que le generarn como mximo la
cantidad de defectos que usted est dispuesto a aceptar en la
categora de inters [4]
151
Regresin logstica ordinal -
Procedimiento
Una vez que se tienen establecidos los CTQs con los
que se medir el desempeo del producto, es
necesario indicar las Especificaciones de los mismos
Producto
(General)
Usuarios
Finales
Clientes
E
x
p
e
c
t
a
t
i
v
a
s

(
C
T
S

s
)

T
i
p
o

I
m
p
o
r
t
a
n
.

Producto
(Especfico)
P
a
r

m
e
t
r
o
s


d
e

D
i
s
e

o

(
D
P
s
)

M
a
t
r
i
z

d
e

D
i
s
e

o

C
T
Q
s

Especificaciones
LIE LSE Otra
152
Anlisis Logit
Usa razones para determinar que tanta posibilidad
tiene una observacin de pernecer a un grupo que a
otro.
Una posibilidad de 0.8 de estar en el grupo A se
puede expresar como una tasa de posibilidades de
4:1 ( que es p/(1-p)), cuyo logaritmo es el logit.


La probabilidad para un valor L est dado por la
ecuacin
153
Anlisis Logit - ejemplo
50 estudiantes tomaron un examen, donde solo 27 pasaron.
Cules son las posibilidades de pasar?
Posibilidades = P/(1-P) = 0.54/0.46 = 1.17 o 1.71:1

Un estudiante que estudia 80 horas tiene un 54.5% de pasar,
cules son las posibilidades?
Posibilidades = 0.545/(1-0.545) = 1.198 o 1.198:1

Logit = ln(p/(1-p)) = ln(1.189) = 0.1809 y despejando al
Exp(b1) = exp(0.1082) = 1.11 que es la tasa de pasar a otro nivel

154
Anlisis Probit
Es similar a las pruebas de vida acelerada y anlisis
de sobrevivencia. Un artculo sujeto a esfuerzo puede
fallar o sobrevivir. El modelo probit tiene un valor
esperado de 0 y una varianza de 1.

Requiere tamaos de muestra muy grandes para
diferenciarse del modelo logit


Los coeficientes b del modelo logit difieren del probit
en 1.814 con: bl = -1.1814 bp
155
VI.C.7 Pruebas de bondad de
ajuste
156
Bondad de ajuste
PRUEBAS DE BONDAD DE AJUSTE
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribucin particular planteada como hiptesis
Si el ajuste es razonablemente cercano, puede concluirse que s exite la forma de distribucin
planteada como hiptesis
Por ejemplo:
Ho: La distribucin poblacional es uniforme
Ha: La distribucin poblacional no es uniforme
Se usa el estadstico Chi-Cuadrado
Oi = Frecuencia de los eventos observados en los datos muestrales
Ei = Frecuencia de los eventos esperados si la hiptesis nula es correcta
Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
cumplir con este requisito.
K = Nmero de categoras o clases

=
K
i
Ei
Ei Oi
1
2
2
) (
_
157
Bondad de ajuste
Ejemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperara que se vendieran
12 botes / mes. La cantidad real que se vendi fue:
Ventas (Oi) Ventas (Ei)
Tipo de bote observadas esperadas
A 15 12
B 11 12
C 10 12
D 12 12
DISTR.CHI
Entonces el estadstico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020818
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3
Chi cuadrado de excel = 7.815
El estadstico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hiptesis nula
PRUEBA.CHI.INV
158
Prueba de Bondad de ajuste
para la distribucin de Poisson
1. Plantear la hiptesis nula y alterna
Ho: La poblacin tiene una distribucin de prob. De Poisson
Ha: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia observada fi y
calcular la media de ocurrencias
3. Calcular la frecuencia esperada de ocurrencias ei. Multiplicar el
tamao de muestra con la prob. de Poisson para cada valor de
la variable aleatoria. Si hay menos de 5 combinar las categoras

4. Calcular el estadstico de prueba

5. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel de
significancia

=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
159
Ejemplo:
Distribucin de Poisson =5
Ho: No. de clientes que llega en intervalos de 5 min. tiene una distribucin
de Poisson Ha: No se sigue una distribucin de Poisson
Clientes Frec. observada f(x) de Poisson 128*f(x) cantidad
esperada
0 2 0.0067 0.8576
1 8 0.0337 4.3136
2 10 0.0842 10.7776
3 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 6 0.0363 4.6464
10 o ms 0.0318 4.0704
160
Ejemplo:
Distribucin de Poisson =5
Combinando X=0,1 y X=9, 10 o ms para que la frecuencia observada sea
mayor a 5 y se pueda aplicar la distribucin Chi Cuadrada se tiene
Clientes Frec. Observada
(fi)
f(x) de Poisson 128*f(x)
frecuencia
esperada (ei)
0 o 1 10 0.0067+0.0337 5.1712
2 10 0.0842 10.7776
3 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 o ms 6 0.0363+0.0318 8.7168
161
Estadstico y conclusin
Con los datos anteriores se calcula el estadstico Chi cuadrada que
se compara con Chi Cuadrada de alfa para k-p-1 grados de
libertad (K categoras: 9, p parmetros a estimar: 1 media).




Ho se rechaza si o si p es mayor que alfa.

El valor de Chi Cuadrada calculado es de 10.9766 y el valor Chi
Cuadrada de alfa 0.05 con 2 gl. Es de 14.07 no se rechaza Ho
En este caso p = 0.14 > 0.05 por tanto no se rechaza Ho y se
concluye que los datos siguen una distribucin de Poisson

=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
162
Prueba de Bondad de ajuste
para la distribucin Normal
1. Plantear la hiptesis nula y alterna
Ho: La poblacin tiene una distribucin de prob. Normal
Ha: Caso contrario

2. Tomar una muestra aleatoria, calcular la media y la desviacin
estndar

3. Definir K intervalos de valores de forma que la frecuencia
esperada sea 5 cuando menos para cada uno (intervalos de
igual probabilidad). Anotar la frecuencia observada de los
valores de datos fi, en cada intervalo
163
Prueba de Bondad de ajuste
para la distribucin Normal
4. Calcular el nmero de ocurrencias esperado ei, para cada
intervalo de valores. Multiplicar el tamao de muestra por la
probabilidad de que una variable aleatoria est en el intervalo.

5. Calcular el estadstico de prueba

6. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel
de significancia

=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
164
Prueba de Bondad de ajuste
para la distribucin Normal
Ejemplo: datos de calificaciones: Media = 68.42; S = 10.41
Calificaciones
71 66 61 65 54 93
60 86 70 70 73 73
55 63 56 62 76 54
82 79 76 68 53 58
85 80 56 61 61 64
65 62 90 69 76 79
77 54 64 74 65 65
61 56 63 80 56 71
79 84
165
Prueba de Bondad de ajuste
para la distribucin Normal
Ho: la poblacin tiene una distribucin normal con media 68.42 y
S=10.41 Ha: Caso contrario

Para una muestra de 50 con una frecuencia mnima esperada de 5
se tiene el 10% al menos por cada celda

La primera celda correspondiente al 10% est en Z = -1.28 con
X = (Media - Z*S) = 55.10

Para el rea del 20%, Z = -0.84 y X = 59.68
y as sucesivamente


166
Prueba de Bondad de ajuste
para la distribucin Normal
Intervalo Frecuencia
observada (fi)
Frecuencia
esperada (ei)
Menos de
55.10
5 5
55.10 a 59.68 5 5
59.68 a 63.01 9 5
63.01 a 65.82 6 5
65.82 a 68.42 2 5
68.42 a 71.02 5 5
71.02 a 73.83 2 5
73.83 a 77.16 5 5
77.16 a 81.74 5 5
81.74 o ms 6 5
50 50
Se registran las
frecuencias de
los datos
tomados de las
calificaciones
167
Prueba de Bondad de ajuste
para la distribucin Normal
Se determina el estadstico Chi Cuadrado = 7.2




El Valor de Chi Cuadrado de alfa = 0.10 para k p 1 grados
de libertad. K = 10 categoras, p = 2 parmetros. Gl = 7. Chi
Cuadrado es 12.017

Como no se puede rechazar la hiptesis nula de
normalidad de las calificaciones

=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ s
168
Prueba de Bondad de ajuste
para la distribucin Multinomial
1. Enunciar la hiptesis nula y alternativa
Ho: La poblacin sigue una distribucin de probabilidad
multinomial con probabilidades especificadas para cada una de
las K categoras Ha: Caso contrario

2. Tomar una muestra aleatoria y anotar las frecuencias
observadas fi para cada categora

3. Suponiendo que Ho es cierta, determinar la frecuencia esperada
ei, en cada categora multiplicando la probabilidad de la
categora por el tamao de muestra


169
Prueba de Bondad de ajuste
para la distribucin Multinomial
4. Se determina el estadstico Chi Cuadrado de prueba




5. Regla de rechazo:

Si no se puede rechazar la hiptesis nula

Rechazar si el valor p es menor a alfa

Con alfa nivel de significancia y los grados de libertad son k-1

=
n
i
i
i i
e
e f
1
2
2
) (
_
2 2
o
_ _ >
170
Prueba de Bondad de ajuste
para la distribucin Multinomial
Ejemplo: El ao pasado la participacin de mercado para la
empresa A fue del 30%, 50% para la empresa B y 20% para la
empresa C. La empresa C hace una prueba con un nuevo
producto para estimar su impacto en las preferencias del
mercado.

Se tom una muestra de 200 clientes resultando preferencias de
compra de: 48 para A, 98 para B y 54 para C.

De acuerdo a las probabilidades esperadas, en los 200 clientes las
preferencias esperadas son: A=200*0.3=60, B=200*0.5=100,
C=200*0.2=40

171
Prueba de Bondad de ajuste
para la distribucin Multinomial
Datos para calcular el estadstico de prueba Chi Cuadrado
Categora Proporcin
hipottica
Frecuencia
observada

Frecuencia
esperada
Empresa A 0.3 48 60
Empresa B 0.5 98 100
Empresa C 0.2 54 40
172
Prueba de Bondad de ajuste
para la distribucin Multinomial
Chi Cuadrado calculado = 7.34

Chi cuadrado de alfa = 0.05 con k 1 = 2 grados de libertad = 2
es de 5.99. El valor p correspondiente es de 0.025.

Como 7.34 es mayor a 5.99 o el valor p de 0.025 es menor a alfa
de 0.05 se rechaza la hiptesis nula Ho y se concluye que el
nuevo producto modificar las preferencias del mercado
actuales

La participacin de la empresa C aumenta con el nuevo producto
173
Prueba de Bondad
de ajuste en Minitab
La columna C1 Observadas contiene las frecuencias observadas
y la C2 esperadas las frecuencias esperadas

Calc > Calculator > Store result in variable ChiCuadrada
Teclear en el cuadro de expresin sum((Observadas-
Esperadas)**2/Esperadas)

Calc > Probability distributions > Chi Square
Seleccionar Cummulative probability
Degrees of freedom 2
Input column ChiCuadrada; Optional Storage CumProb OK
Calc > Calculator > Store results in variable p
En el cuadro Expression teclear 1-CumProb
OK

174
Prueba de Bondad
de ajuste en Minitab
Ejemplo: investigacin de mercado
Observadas Esperadas ChiCuadrada CumProb p
48 60 7.34 0.974524 0.0254765
98 100
54 40
175
Prueba de Bondad
de ajuste en Excel
Ejemplo: investigacin de mercado

1. Calcular el estadstico Chi Cuadrada con =(A2-B2)^2/B2 y Suma
Chi cuadrada = 7.34
2. El valor P es =distr.chi(7.34, 2)

3. El estadstico Chi Cuadrada de alfa es:
=prueba.chi.inv(0.05,2) = 5.99

4. Como p es menor a alfa de 0.05 se rechaza la Ho


176
VI.C.8 Tablas de contingencia
Prueba Chi
2 (
_
2)

177
Para qu se utiliza?

1. Para probar si una serie de datos
observada, concuerda con el modelo (serie
esperada) de la informacin.

2. Para probar las diferencias entre las
proporciones de varios grupos (tabla de
contingencia).

_
2
Ho: No hay diferencia
Ha: Hay diferencia
Para todos los casos,
178
H
o
: La moneda es buena

H
a
: La moneda est cargada
Se lanza una moneda al aire 100 veces y que
obtenemos 63 guilas y 37 soles.

La proporcin de guilas y soles sucede por
casualidad? O, se concluye que la moneda est
cargada?
Ejemplo 1: Chi Cuadrada(_
2
)
179
_
2
c=
E
j = 1
g
Estadstico Chi Cuadrada


Observada Esperada
Aguilas 63 50 3.38
Soles 37 50 3.38
_
2
= 3.38 + 3.38
_
2
= 6.76
(f
o
- f
e
)
2
f
e ( f
o
) ( f
e
)
Ejemplo 1: Chi Cuadrada(_
2
)
f
e
(f
o
- f
e
)
2
180
Funcin de Distribucin Acumulada Chi
2
con 1 grado de
libertad (d.f)
H
o
: La moneda es buena.
H
a
: La moneda est cargada.

Para un 95% de confianza antes de concluir que la moneda est
cargada, se requiere que X
2
c
> X
2
Crtica
o que el valor de p sea s
0.05.

Como p s 0.05, se puede concluir -con un 95% de confianza -
que la moneda est cargada.

_2
c
P(_2
c
> x)
6.7600 p = 1 - 0.9907 = 0.0093

De tablas X
2
Crtica,

(0.05, 1)
= 3.8414
Ejemplo 1: Chi cuadrada
181
1. Posicionarse en una celda vaca

2. Accesar el men de funciones con Fx

3. Seleccionar STATISTICAL o ESTADSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad,
normalmente (n - 1) para un parmetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.


Clculo en Excel del estadstico Chi cuadrada
182
Tabla de Valores Crticos Seleccionados de Chi
2
o
df . 250 . 100 . 050 . 025 . 010 . 005 . 001
1 1. 323 2. 706 3. 841 5. 024 6. 635 7. 879 10. 828
2 2. 773 4. 605 5. 991 7. 378 9. 210 10. 597 13. 816
3 4. 108 6. 251 7. 815 9. 348 11. 345 12. 838 16. 266
4 5. 385 7. 779 9. 488 11. 143 13. 277 14. 860 18. 467
5 6. 626 9. 236 11. 070 12. 832 15. 086 16. 750 20. 515
6 7. 841 10. 645 12. 592 14. 449 16. 812 18. 548 22. 458
7 9. 037 12. 017 14. 067 16. 013 18. 475 20. 278 24. 322
8 10. 219 13. 362 15. 507 17. 535 20. 090 21. 955 26. 125
9 11. 389 14. 684 16. 919 19. 023 21. 666 23. 589 27. 877
10 12. 549 15. 987 18. 307 20. 483 23. 209 25. 188 29. 588
11 13. 701 17. 275 19. 675 21. 920 24. 725 26. 757 31. 264
12 14. 845 18. 549 21. 026 23. 337 26. 217 28. 300 32. 909
13 15. 984 19. 812 22. 362 24. 736 27. 688 29. 819 34. 528
14 17. 117 21. 064 23. 685 26. 119 29. 141 31. 319 36. 123
15 18. 245 22. 307 24. 996 27. 488 30. 578 32. 801 37. 697
16 19. 369 23. 542 26. 296 28. 845 32. 000 34. 267 39. 252
17 20. 489 24. 769 27. 587 30. 191 33. 409 35. 718 40. 790
18 21. 605 25. 989 28. 869 31. 526 34. 805 37. 156 43. 312
19 22. 718 27. 204 30. 144 32. 852 36. 191 38. 582 43. 820
20 23. 828 28. 412 31. 410 34. 170 37. 566 39. 997 45. 315
21 24. 935 29. 615 32. 671 35. 479 38. 932 41. 401 46. 797
22 26. 039 30. 813 33. 924 36. 781 40. 289 42. 796 48. 268
23 27. 141 32. 007 35. 172 38. 076 41. 638 44. 181 49. 728
24 28. 241 33. 196 36. 415 39. 364 42. 980 45. 558 51. 179
25 29. 339 34. 382 37. 652 40. 646 44. 314 46. 928 52. 620
26 30. 434 35. 563 38. 885 41. 923 45. 642 48. 290 54. 052
27 31. 528 36. 741 40. 113 43. 194 46. 963 49. 645 55. 476
28 32. 620 37. 916 41. 337 44. 461 48. 278 50. 993 56. 892
29 33. 711 39. 087 42. 557 45. 722 49. 588 52. 336 58. 302
30 34. 800 40. 256 43. 773 46. 979 50. 892 53. 672 59. 703
40 45. 616 51. 805 55. 758 59. 342 63. 691 66. 766 73. 402
50 56. 334 63. 167 67. 505 71. 420 76. 154 79. 490 86. 661
60 66. 981 74. 397 79. 082 83. 298 88. 379 91. 952 99. 607
70 77. 577 85. 527 90. 531 95. 023 100.425 104.215 112.317
80 88. 130 96. 578 101.879 106.629 112.329 116.321 124.839
90 98. 650 107.565 113.145 118.136 124.116 128.299 137.208
100 109.141 118.498 124.342 129.561 135.807 140.169 149.449
183
Tabla de contingencia
Una tabla de clasificacin de dos vas (filas y columnas) que
contiene frecuencias originales, se puede analizar para
determinar si las dos variables (clasificaciones) son
independientes o tienen una asociacin significativa.

La prueba Chi Cuadrada probar si hay dependencia entre las
dos clasificaciones.

Adems se puede calcular el coeficiente de contingencia
(correlacin) que en todo caso muestra la fuerza de la
dependencia
184
Tabla de contingencia
Para esta prueba se usa la prueba Chi Cuadrada donde:





Entre mayor sea su valor, mayor ser la diferencia de la
discrepancia entre frecuencias observadas y tericas. Esta
prueba es similar a la de bondad de ajuste.


185
Tabla de contingencia
Ejemplo: Cada una de las 15 celdas hace una contribucin al
estadstico Chi Cuadrado (una celda)







Asumiendo Alfa = 0.1 y Gl= (reng 1)*(Col 1) = 4*2 = 8 Chi-
Cuadrado de alfa = 20.09
Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de
igualdad de resultados entre negocios



186
Los valores observados (f
o
) son los siguientes:
Ho: No existen diferencias en los ndices de defectos de las dos mquinas.
Ha: Existen diferencias en los ndices de defectos de las dos mquinas.
Total 751 28

El ndice de defectos totales es 28 / 779 = 3.6%

mquina 1 f
o
= 517 f
o
= 17 Total = 534
Partes buenas
mquina 2 f
o
= 234 f
o
= 11 Total = 245
779

Partes defectuosas

Ejemplo 2: Chi
2
Para comparacin de dos
grupos; son las mismas proporciones?)
187
Clculo de los valores esperados

Basados en este ndice, los valores esperados (f
e
) seran:
mquina 1 f
o
= 751*534/779 f
o
= 28*534/779 Total = 534
Partes buenas
mquina 2 f
o
= 751*245/779 f
o
= 28*245/779 Total = 245
779

Partes defectuosas
mquina 1 530.53 3.47
Partes
buenas
mquina 2 233.47 1.53
Partes defectuosas
Ejemplo 2: Chi
2
Para comparacin de dos
grupos; son las mismas proporciones?)
188
Nota: Chi cuadrada no podr aplicarse en los casos donde los conteos seas menores a 5 en > 20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deber usarse Chi
2
.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categoras pueden ser de utilidad.
Prueba de chi cuadrada:


Los conteos esperados estn debajo de los conteos observados
Partes buenas Partes Defectuosas Total
1 532 2 534
530.53 3.47

2 232 3 235
233.47 1.53
Total 764 5 769

Chi
2
= 0.004 + 0.624 + 0.009 + 1.418 = 2.056
DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0
189
Tabla de Chi
2

Tabla de valores crticos seleccionados para Chi
2

o DF .250 .100 .050 .025 .010 .005 .001
1 1.323 2.706 3.841 5.024 6.635 7.879 10.828
2 2.773 4.605 5.991 7.378 9.210 10.597 13.816
3 4.108 6.251 7.815 9.348 11.345 12.838 16.266
4 5.385 7.779 9.488 11.143 13.277 14.860 18.467
5 6.626 9.236 11.070 12.832 15.086 16.750 20.515
6 7.841 10.645 12.592 14.449 16.812 18.548 22.458
7 9.037 12.017 14.067 16.013 18.475 20.278 24.322
8 10.219 13.362 15.507 17.535 20.090 21.955 26.125
9 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588
11 13.701 17.275 19.675 21.920 24.725 26.757 31.264
12 14.845 18.549 21.026 23.337 26.217 28.300 32.909
13 15.984 19.812 22.362 24.736 27.688 29.819 34.528
14 17.117 21.064 23.685 26.119 29.141 31.319 36.123
15 18.245 22.307 24.996 27.488 30.578 32.801 37.697
16 19.369 23.542 26.296 28.845 32.000 34.267 39.252
17 20.489 24.769 27.587 30.191 33.409 35.718 40.790
18 21.605 25.989 28.869 31.526 34.805 37.156 43.312
19 22.718 27.204 30.144 32.852 36.191 38.582 43.820
20 23.828 28.412 31.410 34.170 37.566 39.997 45.315
.
190
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reduccin de tiempo de ciclo.

Variacin en familias a probar
Operador a operador
H
o
: No existe diferencia en los ndices de defecto de los diferentes
operadores
H
a
: Existe diferencia en los ndices de defecto de los diferentes
operadores

Mquina a mquina
H
o
: No existe diferencia en los ndices de defecto de las diferentes
mquinas
H
a
: Existe diferencia en los ndices de defecto de las diferentes
mquinas

Tamao de la muestra:
5000 + total de oportunidades (172 piezas)
191
Los conteos esperados estn colocados debajo de los conteos observados
Con fugas Sin fugas Total
1 30 610 640
32.11 607.89

2 235 4217 4452
223.38 4228.62

3 3 253 256
12.84 243.16

4 18 334 352
17.66 334.34

Total 286 5414 5700

Chi
2
= 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +
0.000 = 8.734
DF= (4-1)(2-1) = 3; valor P = 0.033
Prueba de chi
2
(mquina a mquina)
192
Los conteos esperados estn colocados debajo de los conteos observados.
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036
208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Total 278 5102 5380

Chi
2
= 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000
Prueba de chi
2
(operador a operador)
193
Qu sucede si los grupos mltiples de variacin son estadsticamente significativos?
(en este caso, operador a operador y mquina a mquina)
Se utiliza un procedimiento denominado Coeficiente de Contingencia como clave
para determinar qu grupo de variacin debe investigarse primero.
Coeficiente de
Contingencia

x 100
Chi

Cuadrada
N
Chi
2
N CC

Mquina 8.734 5700 0.15

Operador 171.132 5380 3.18
Controlador Mayor

SI el tamao de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevar a la misma ruta que hubiera alcanzado con slo ver la
estadstica Chi
2
.

Sin embargo, si N tiene una variacin considerable, dependiendo del grupo de
variacin que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qu grupo debe investigarse primero.
194
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036
208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Mucho peor que
lo esperado
Mucho mejor que
lo esperado
Ahora que la informacin nos
ha llevado a investigar a los
grupos de operador a
operador. Qu debemos
hacer ahora?
Encontremos cul de los
operadores estaban fuera del
estndar.
Era alguno de ellos
notablemente peor (o mejor)
que el resto?
(Estos mismos operadores fueron quienes
tuvieron los nmeros ms grandes de chi
2
)
Qu sucede si los grupos mltiples de variacin son estadsticamente significativos?
(en este caso, operador a operador y mquina a mquina)
195
Operador a operador: = 0.000
Rechace
H
o
y acepte H
a

(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 estn fuera del estndar:
El operador 4 es notablemente peor que el resto,
El operador 5 es notablemente mejor que los dems

Cul es el prximo paso? Hable con todos los operadores para averiguar qu diferencias
pueden existen en sus tcnicas.

El operador 4 no tena experiencia en este tipo de trabajo y apenas se estaba acostumbrado a
soldar este producto en particular.

El operador 5 encontr un modo de mejor de hacer el ensamble, con lo cual consigui mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonmica. Se aadi
un colocador para ensamblar la parte en forma segura. (Esto tambin redujo el tiempo que
requeran los operadores para acostumbrarse a trabajar en esta forma)
196
Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos
X en un aeropuerto para detectar artculos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenan. Los resultados
se resumen a continuacin:
Inspectores
1 2 3

Radios detectados 27 25 22
Radios no detectados 3 5 8

Con un 95% de confianza, existe una diferencia entre los
inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
197
Ejercicios

1. Se quiere evaluar si hay preferencia por manejar en un
carril de una autopista dependiendo de la hora del da. Los
datos se resumen a continuacin:

Hora del da
Carril 1:00 3:00 5:00
Izquierdo 44 37 18
Central 28 50 72
Derecho 8 13 30

Con un 95% de confianza, existe una diferencia entre las
preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferente
Grados de libertad = (columnas - 1) ( filas -1)
198
Coeficiente de Contingencia
Coeficiente de contingencia es el grado de relacin o
dependencia de las clasificaciones en la tabla de contingencias
es:





Donde N es la frecuencia total y X es el estadstico Chi
Cuadrado calculado
2
2
2
N X
X
C
+
=
199
Coeficiente de Contingencia
Para los datos del ejemplo anterior se tiene:






El valor mximo de C se obtiene de:






38 . 0
393 22 . 66
22 . 66
2
2
2
2
2
2
=
+
=
+
=
N X
X
C
866 . 0
8
2 8 2
=

=
k
k
C Max
200
Correlacin de atributos
Para tablas de orden k * k, el coeficiente de correlacin, r, es :






Donde 0<= r <= 1






) 1 (
2

=
k N
X
r
201
VI.C.9 Pruebas de Hiptesis
no paramtricas
202
Pruebas no paramtricas
Las pruebas paramtricas asumen una distribucin para la
poblacin, tal como la Normal

Las pruebas no paramtricas no asumen una distribucin
especfica de la poblacin

Bajo los mismos tamaos de muestra la Potencia o probabilidad
de rechazar Ho cuando es falsa es mayor en las pruebas
paramtricas que en las no paramtricas

Una ventaja de las pruebas no paramtricas es que los
resultados de la prueba son ms robustos contra violacin de
los supuestos

203
Prueba de Hiptesis
Variable
Atributo
Tablas de
Contingencia de
Correlacin
No Normal
Normal
Varianza
Medianas
Variancia
Medias

Prueba-F
Homogeneidad
de la Variacin
de Levene
Homogeneidad
de la Variacin
de Bartlett
Correlacin
Prueba de signos
Wilcoxon
Mann-
Whitney
Kurskal-
Wallis
Prueba de Mood
Friedman
Pruebas de t
ANOVA
Correlacin
Regresin
Muestra-1
Muestra-2
Una va
Dos vas
Residuos
distribuidos
normalmente
204

Pruebas de Varianzas
Homogeneidad de la varianza de
Levene : Compara dos o ms
varianzas de muestras de la misma
poblacin.


Pruebas de Variancias

X
2
: Compara la variancia de una
muestra con una variancia de un
universo conocido.

Prueba F : Compara dos varianzas
de muestras.

Homogeneidad de la variancia de
Bartlett: Compara dos o ms
varianzas muestras de la misma
poblacin.


Datos Normales Datos No Normales
Resumen de pruebas de Hiptesis
205
Pruebas de la Mediana

Prueba de signos o Prueba Wilcoxon : Prueba
si la mediana de la muestra es igual a un valor
conocido o a un valor a alcanzar.
Prueba Mann-Whitney : Prueba si dos medianas
de muestras son iguales.
Prueba Kruskal-Wallis: Prueba si ms de dos
medianas de muestras son iguales. Asume que
todas las distribuciones tienen la misma forma.
Prueba de la mediana de Mood : Otra prueba
para ms de dos medianas. Prueba ms firme
para los valores atpicos contenidos en la
informacin.
Prueba Friedman : Prueba si las medianas de las
muestras, clasificadas bajo dos categoras, son
iguales.
Correlacin : Prueba la relacin lineal entre dos
variables.
Pruebas de los Promedios

Prueba t de 1 muestra : Prueba si el promedio
de la muestra es igual a un promedio
conocido o meta conocida.
Prueba t de 2 muestras : Prueba si los dos
promedios de las muestras son iguales.
ANOVA de un factor: Prueba si ms de dos
promedios de las muestras son iguales.
ANOVA de dos factores : Prueba si los
promedios de las muestras clasificadas
bajo dos categoras, son iguales.

Correlacin : Prueba la relacin lineal entre
dos variables.

Regresin : Define la relacin lineal entre una
variable dependiente y una independiente.
(Aqu la "normalidad" se aplica al valor
residual de la regresin)

Datos Normales Datos No Normales
Resumen de pruebas de Hiptesis
206
Revise y asegrese de que los datos no siguen una distribucin normal.

Desarrollar una Prueba de normalidad (para verificar realmente lo
anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

Desarrollar una Prueba de Corridas (para verificar que no existen
sucesos no aleatorios que puedan haber distorsionado la informacin)

Revisar la informacin para detectar errores (tipogrficos, etc.).
Investiguar los valores atpicos.

Una muestra pequea (n < 30) proveniente de un universo normal, se
mostrar algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:
- Raz cuadrada de todos los datos
- Logaritmo de todos los datos
- Cuadrado de todos los datos

Si la informacin es todava anormal, entonces usar las herramientas no
paramtricas.
Acciones a tomar con datos No Normales
207
Promedio : Es la media aritmtica de la informacin. Es la suma de todos
los datos, dividida entre el nmero de datos de referencia.

Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
ascendente (en caso de datos pares, obtener promedio).

Moda : Valor que se repite con ms frecuencia sobre el conjunto de datos.
Ejemplo:
Se cuestion a veinte personas sobre cunto tiempo les tomaba estar
listas para ir a trabajar, en las maanas. Sus respuestas (en minutos) se
muestran ms adelante. Cules son el promedio y la mediana para esta
muestra?

30, 37, 25, 35, 42, 35, 35, 47, 45, 60
39, 45, 30, 38, 35, 40, 44, 55, 47, 43


7B8. Definiciones
208
Un dibujo dice ms que mil palabras
El promedio puede estar influenciado considerablemente por los
valores atpicos porque, cuando se calcula un promedio, se incluyen los
valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las
observaciones, independientemente de los valores reales de los
valores atpicos, ya que es la que sencuentra en la posicin media de
los valores ordenados.

Promedio = 40.35 Mediana = 39.5


-------+---------+---------+---------+---------+---------+------ C1
Promedio
Mediana
28.0 35.0 42.0 49.0 56.0 63.0
209

Pruebas Alternativas comnmente usadas
Pruebas para datos No normales

Prueba de Corridas : Calcula la
probabilidad de que un X nmero de
puntos de referencia, est por encima o
por debajo del promedio aleatoriamente.

Prueba de signos, de 1 muestra :
Prueba la probabilidad de que la
mediana de la muestra, sea igual al valor
hipottico.

Prueba Mann-Whitney : Comprueba el
rango de dos muestras, por la diferencia
entre dos medianas del universo.

Prueba de la Mediana de Mood :
Prueba para ms de dos medianas del
universo. Ms robusta para los valores
atpicos o para los errores en la
informacin.



Analoga con datos normales

Prueba de Corridas (la misma
prueba para ambos tipos de
informacin)


Prueba t de una muestra




Prueba t de 2 muestras



ANOVA de un factor

Considere los siguientes datos (que se muestran aqu en orden cronolgico):
325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,
320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

Es importante tener los datos registrados en orden cronolgico.

Una representacin grfica de los datos se asemeja a esto:
0
100
200
300
400
500
600
Promedio
Primera
"corrida"
Segunda racha"
Nmero total de Rachas: 12
Nmero total de puntos > al promedio: 11
Nmero total de puntos < al promedio: 18
Racha: Un punto o una serie consecutiva de puntos que caen
en un lado del promedio.


Prueba de Rachas
Prueba de Rachas
Promedio K = 184.4483

Nmero de rachas observado = 12

Nmero de rachas esperado = 14.6552
=> No se rechaza Ho
11 observaciones por encima de K; 18 por
debajo
La prueba es significativa en p= 0.2860
No se puede rechazar Ho con valor alfa = 0.05
Este es el valor p
de las Prueba de
Corridas
Prueba de Rachas
H
o
: Los datos son aleatorios
H
a
:Los datos NO so aleatorios
Ya que p > 0.05, no podemos rechazar la hiptesis nula.
Los datos son aceptados, siendo aleatorios.
Promedio
212
Clculos de la Prueba de Rachas
El estadstico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2)
DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12; n1 = 11 n2 = 18

MediaG = 14.655 DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687
P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crtico de 0.05, no rechazndose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de
valores crticos para el nmero de Rachas G
213
Corrida con Minitab
Stat > Nonparametrics > Runs Test
Variable C1, Above and below the mean
P > 0.05
No rechazar
Ho
Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
214
Prueba de Signos de la Mediana
H
o
: La mediana de la muestra es igual a la mediana de la hiptesis
H
a
: Las medianas son diferentes
Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0
Ha: Valor de la mediana diferente de 115.0

N DEBAJO IGUAL ENCIMA VALOR P MEDIANA
29 12 0 17 0.4576 144.0
Ya que p >0.05, no se puede rechazar la hiptesis nula.
No se puede probar que la mediana real y la mediana hipottica son
diferentes.

En las pginas siguientes se muestra el detalle del clculo.
215
Clculos de la Prueba de Signos de la Mediana
Ejemplo: Con los datos del ejemplo anterior y ordenndo de menor a
mayor se tiene: n = 29, Mediana de Ho = 115

No. Valor Signo No. Valor Signo No. Valor Signo
1 0 - 11 110 - 21 220 +
2 50 - 12 110 - 22 240 +
3 56 - 13 120 + 23 290 +
4 72 - 14 140 + 24 309 +
5 80 - 15 144 + 25 320 +
6 80 - 16 145 + 26 325 +
7 80 - 17 150 + 27 400 +
8 99 - 18 180 + 28 500 +
9 101 - 19 201 + 29 507 +
10 110 - 20 210 +

Con la mediana en 144. Si el valor contra el cual se desea
probar es 115, entonces hay 12 valores por debajo de el (-) y 17
valores por arriba (+).

216
Clculos de la Prueba de Signos de la Mediana

El estadstico X es el el nmero de veces que ocurre el signo menos
frecuente, en este caso el 12 (-).

Cmo n > 25, se calcula el estadstico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5 \ n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierda
en forma similar P(Z2) 0-2288 para la cola derecha, por lo que la
probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de
valores crticos para la prueba de signo.


217
Prueba de Signos de la Mediana
Bueno, veamos una grfica de la informacin
100 200 300 400 0 500
Es esto correcto?144 podra ser igual a 115?
115 144
Despus de todo, tal vez
esto SEA lo correcto.
218
Corrida en Minitab
Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative Not equal








Como P > 0.05 no se rechaza Ho y la mediana es 115
Sign Test for Median: Signos
Sign test of median = 115.0 versus not = 115.0

N Below Equal Above P Median
Signos 29 12 0 17 0.4583 144.0
219
Prueba de Signos de la Mediana
Para observaciones pareadas
Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B
Ha: p<>0.5
Ama Limpiador
B
Casa A
1 10 7
2 7 5
3 8 7
4 5 2
5 7 6
6 9 6
Hay evidencia que indique
cierta preferencia de las amas
de casa por lo limpiadores?
220
Prueba de Signos de la Mediana
Producto
B
Familia A
1 - +
2 - +
3 + -
4 - +
5 0 0
6 - +
7 - +
8 + -
9 - +
10 - +
11 - +
Hay evidencia que indique
cierta preferencia por un
Producto A o B?
Media = 0.5*n
Desv. Estand.= 0.5*raiz(n)

Zc = (Y media) / Desv. Estnd.
Rechazar Ho si Zc ><Zalfa/2
221
Prueba de Signos de la Mediana
Como Zc < Zexcel no se rechaza Ho o
Como p value = 0.067 > 0.025
No hay evidencia suficiente de que los
Consumidores prefieran al producto B
Media = 0.5*11 = 5.5
Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

222
Prueba rango con signo de Wilconox
Es la alternativa no paramtrica de la prueba paramtrica de muestras
pareadas
Ejemplo: HO: Las poblaciones son idnticas Ha: Caso contrario
Trabaja
dor
Mtodo
1
Mtodo
2
Diferen
cias
Abs(difere
n.) Rango
Rango
c/signo
1 10.2 9.5 0.7 0.7 8 8
2 9.6 9.8 -0.2 0.2 2 -2
3 9.2 8.8 0.4 0.4 3.5 3.5
4 10.6 10.1 0.5 0.5 5.5 5.5
5 9.9 10.3 -0.4 0.4 3.5 -3.5
6 10.2 9.3 0.9 0.9 10 10
7 10.6 10.5 0.1 0.1 1 1
8 10 10 0 0 Eliminar
9 11.2 10.6 0.6 0.6 7 7
10 10.7 10.2 0.5 0.5 5.5 5.5
11 10.6 9.8 0.8 0.8 9 9
T = 44
223
Prueba rango con signo de Wilconox
Distribucin muestral T para poblaciones idnticas
Se aproxima a la distribucin normal para n >= 10




En este caso n = pares eliminando las que son iguales con dif. = 0 para el
trabajador 8.

o = raiz(10 x 11 x 21/6) = 19.62
Z = (T )/o = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los mtodos son diferentes



0 =
T

6
) 1 2 )( 1 ( + +
=
n n n
T
o
224
Prueba en Minitab para prueba de
mediana con Wilconox
File> Open worksheet > Exh_Stat
Stat > Nonparametrics > 1-Sample Wilconox
Variables C1 Test Median 77
Altenative Not equal
Achievement
77
88
85
74
75
62
80
70
83
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00
for Wilcoxon Estimated
for Wilcoxon Estimated
N Test Statistic P Median
Achievement 9 8 19.5 0.889 77.50

Ho: Mediana = 77 Ha: Mediana <> 77
Como P de 0.889 >> alfa de 0.05 no se rechaza Ho
225
Prueba de Mann-Whitney
Se llev a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, despus de diez minutos de
ejercicios aerbicos.

Los datos resultantes se muestran a continuacin.



Edad 40-44
C1
140
135
150
140
144
154
160
144
136
148

Edad 16-20
C2
130
166
128
126
140
136
132
128
124

Tuvieron diferencias
significativas las frecuencias de
pulso de ambos grupos?
226
Prueba de Mann-Whitney
Ordenando los datos y asignndoles el (rango) de su posicin relativa se tiene (promediando
posiciones para el caso de que sean iguales):
Edad 40-44
C1
(7) 135
(8.5) 136
(11) 140
(11) 140
(13.5) 144
(13.5) 144
(15) 148
(16) 150
(17) 154
(18) 160

n1 = 10
Ta = 130.5


Edad 16-20
C2
(1) 124
(2) 126
(3.5) 128
(3.5) 128
(5) 130
(6) 132
(8.5) 136
(11)140
(15)166


n2 = 9
Tb = 55.5

227
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idnticas
Ho: q1 = q2 Ha: q1 = q2 q1, q2 = Medianas de las poblaciones
Ordenando los datos y asignndoles su posicin relativa se tiene:
Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
Ua + Ub = n1 * n2

Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5
El menor de los dos es Ua.
Para alfa = 0.05 el valor de Uo = 25
Como Ua < 25 se rechaza la Hiptesis Ho de que las medianas son iguales.


Dado que p < 0.05, rechazamos la hiptesis nula. Estadsticamente
existe una diferencia significativa entre los dos grupos de edad.
228
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idnticas

Ua = 14.5 Ub = 79.5
Utilizando el estadstico Z y la distribucin normal se tiene:
45 12.24
Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
Con Ua y Ub se tiene:
Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor o = 0.05
El valor crtico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
Como Za > Zcrtico se rechaza la Hiptesis Ho de que las medianas son iguales.


Dado que p < 0.05, rechazamos la hiptesis nula. Estadsticamente
existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
4
0
-
4
4

a

o
s

d
e

e
d
a
d

16-20 aos de edad
Diferencias entre los encabezados de
los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada
"punto estimado". Este punto estimado es una aproximacin de la diferencia entre
las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
informacin), Minitab usa este punto estimado para calcular el valor p.
130 166 128 126 140 136 132 128 124
140 10 -26 12 14 0 4 8 12 16
135 5 -31 7 9 -5 -1 3 7 11
150 20 -16 22 24 10 14 18 22 26
140 10 -26 12 14 0 4 8 12 16
144 14 -22 16 18 4 8 12 16 20
154 24 -12 26 28 14 18 22 26 30
160 30 -6 32 34 20 24 28 32 36
144 14 -22 16 18 4 8 12 16 20
136 6 -30 8 10 -4 0 4 8 12
148 18 -18 20 22 8 12 16 20 24
230
Corrida en Minitab
Stat > Nonparametrics > Mann Whitney
First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal
Mann-Whitney Test and CI: C1, C2
N Median P>0.05
C1 10 144.00 Se rechaza Ho
C2 9 130.00
Point estimate for ETA1-ETA2 is 12.00
95.5 Percent CI for ETA1-ETA2 is (4.01,20.00)
W = 130.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143
The test is significant at 0.0140 (adjusted for ties)
231
Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignndoles el (rango) de su posicin relativa se tiene
(promediando posiciones para el caso de que sean iguales):
Zona 1
(15.5) 147
(17.5) 17.5
(9) 128
(19) 162
(12) 135
(10) 132
(22) 181
(13) 138



n1 = 8
Ta = 118


Zona 2
(17.5) 160
(14) 140
(21) 173
(4) 113
(1) 85
(7) 120
(25) 285
(5) 117
(11) 133
(6) 119

n2 = 10
Tb = 111.5

Zona 3
(24) 215
(8) 127
(2) 98
(15.5) 127
(23) 184
(3) 109
(20) 169




n3 = 7
Tc = 95.5


N = n1 + n2 + n3 = 25
232
Prueba de Kruskal Wallis
Ho: Las poblaciones A, B y C son iguales
Ha: Las poblaciones no son iguales
Ho: q1 = q2 = q3 Ha: q1 = q2 = q3 ; q1, q2, q3 = Medianas de las poblaciones

Calculando el valor del estadstico H se tiene:
H = [ 12 /( N* ( N + 1)) ] * [ Ta
2
/ n1 + Tb
2
/ n2 + Tc
2
/ n3 ] - 3 * ( N +1 )
H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadstico _
2
para o = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)
_
2
crtico = 5.991 (vlido siempre que las muestras tengan al menos 5 elementos)

Como H < _
2
crtico, no se rechaza la Hiptesis Ho: Afirmando que no hay
diferencia entre las poblaciones

233
Corrida en Minitab
Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK
Kruskal-Wallis Test: Datos versus Factor
Kruskal-Wallis Test on Datos
Factor N Median Ave Rank Z
Zona 1 7 138.0 14.7 0.98
Zona 2 10 126.5 11.1 -0.82
Zona 3 7 127.0 12.3 -0.10
Overall 24 12.5 P > 0.05
H = 1.08 DF = 2 P = 0.581 No se rechaza Ho
H = 1.09 DF = 2 P = 0.581 (adjusted for ties)
234
Prueba de Medianas de Mood
Realiza prueba de hiptesis de igualdad de medias en un diseo de una
va. La prueba es robusta contra Outliers y errores en datos y es
adecuada para anlisis preliminares

Determina si K grupos independientes han sido extraidas de la misma
poblacin con medianas iguales o poblaciones con formas similares

Con base en la gran mediana, anotar un signo positivo si la
observacin excede la mediana o un signo menos si es menor. Los
valores que coincidan se reparten en los grupos

Hacer una tabla de contingencia K x 2 con las frecuencias de signos
ms y menos en cada grupo K
235
Prueba de Medianas de Mood
Se determina el estadstico Chi Cuadrada con:





Probar Ho: Todas las medianas son iguales
Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para
0.05 y (reng 1)*(Col 1) grados de libertad


=
E
E O
2
2
) (
_
236
Corrida con Minitab
Se les da a 179 participantes una conferencia con
dibujos para ilustrar el tema. Despus se les da la
prueba OTIS que mide la habilidad intelectual. Los
participantes se clasificaron por nivel educativo 0-No
prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3 Ha: no todas las medianas son
iguales
File > Open Worksheet > Cartoon.mtw
Stat > Nonparametrics > Moods Median Test
Response Otis Factor ED Ok
237
Corrida con Minitab
Mood Median Test: Otis versus ED
Mood median test for Otis P>0.05
Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------
+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0
238
Diseos factoriales aleatorias
bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vas, es
una generalizacin de las pruebas pareadas con
signo. La aditividad es requerida para para estimar
los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo
Ha: Algunos tratamientos tienen efecto significativo


239
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados de salida:
Se muestra el estadstico de prueba con distribucin
Chi Cuadrada aproximada con gl = Tratamientos 1.

Si hay observaciones parecidas en uno o ms
bloques, se usa el rango promedio y se muestra el
estadstico corregido

La mediana estimada es la gran mediana ms el
efecto del tratamiento
240
Diseos factoriales aleatorias
bloqueados de Friedman
Ejemplo:
Se evala el efecto del tratamiento de una droga en
la actividad enzimtica con tres niveles, probado en
cuatro animales

Open the worksheet EXH_STAT.MTW.
Stat > Nonparametrics > Friedman.
Response, seleccionar EnzymeActivity.
En Treatment, seleccionar Therapy.
En Blocks, seleccionar Litter. Click OK.
241
Diseos factoriales aleatorias
bloqueados de Friedman
Datos:
EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4
242
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus Therapy
blocked by Litter
S = 2.38 DF = 2 P = 0.305 No rechazar Ho
S = 3.80 DF = 2 P = 0.150 (adjusted for ties)
Sum
of
Therapy N Est Median Ranks
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783
243
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
El estadstico de prueba S tiene un valor P de 0.305 sin ajustar
para observaciones en cero y 0.150 para el valor ajustado.

Por tanto no hay evidencia suficiente para rechazar Ho

Las medianas estimadas asociadas con los tratamientos son la
gran mediana ms los efectos estimados de los tratamientos.

El estadstico de prueba se determina con base a los rangos en
cada bloque y totales
244
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
245
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
246
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
247
Prueba de igualdad de
varianzas de Levene
Se usa para probar la hiptesis nula de que las varianzas de k
mltiples poblacionales son iguales

Las igualdad de varianzas en las muestras se denomina
homogeneidad de varianzas

La prueba de Levene es menos sensible que la prueba de
Bartlett o la prueba F cuando se apartan de la normalidad

La prueba de Bartlett tiene un mejor desempeo para la
distribucin normal o aproximadamente normal
248
Prueba de igualdad de
varianzas de Levene
Para dos muestras el procedimiento es como sigue:

Determinar la media

Calcular la desviacin de cada observacin respecto a la
media

Z es el cuadrado de las desviaciones respecto a la media

Aplicar la prueba t a las dos medias de los datos
249
Prueba de igualdad
de Varianzas-Minitab
Se estudian tamaos de papa
inyectando con bacterias y
sujetas a diferentes
temperaturas. Antes del
ANOVA se verifica la
igualdad de varianzas

Stat > ANOVA > Test for
equal variances
Response Rot
Factors Temp Oxigen
Confidence level 95%

Rot Temp Oxygen
13 10 2
11 10 2
3 10 2
10 10 6
4 10 6
7 10 6
15 10 10
2 10 10
7 10 10
26 16 2
19 16 2
24 16 2
15 16 6
22 16 6
18 16 6
20 16 10
24 16 10
8 16 10
250
Resultados
251
Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard deviations
Temp Oxygen N Lower StDev Upper
10 2 3 2.26029 5.29150 81.890
10 6 3 1.28146 3.00000 46.427
10 10 3 2.80104 6.55744 101.481
16 2 3 1.54013 3.60555 55.799
16 6 3 1.50012 3.51188 54.349
16 10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho
Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858
252
Prueba de la concordancia del
Coeficiente de Kendall
El coeficiente expresa el grado de asociacin entre las
calificaciones mltiples realizadas por un evaluador

Ho: Las variables son independientes
Ha: Las variables estn asociadas

Kendall usa la informacin relacionada con las calificaciones
relativas y es sensible a la seriedad de mala clasificacin

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9
Chi Cuadrada crtica = X
2
0.01,9 = 21.67
253
Prueba de la concordancia del
Coeficiente de Kendall
El Estadstico Chi Cuadrada calculado es:





Como Chi Cuadrada de alfa es menor que la calculada, los
cuatro jueces estn asociados significativamente. Constituyen
un panel uniforme. No quiere decir que estn en lo correcto,
solo que responden de manera uniforme a los estmulos
254
El coeficiente de correlacin de
rangos de Spearman (r
s
)
El coeficiente de correlacin es una medida de la asociacin que
requiere que ambas variables sean medidas en al menos una
escala ordinal de manera que las muestras u observaciones a
ser analizadas pueden ser clasificadas en rangos en dos series
ordenadas

Ho: Las variables son independientes
Ha: Las variables estn asociadas

Para el ejemplo anterior si N = 10, el coeficiente es:
N N
d
r
s

=

3
2
6
1
97 . 0 03 . 0 1
990
) 5 . 5 ( 6
1 = = =
s
r
255
Coeficiente de correlacin de
rangos para monotona de
preferencias
Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8 fabricantes

Preferencia

Precio
(rango)
Fab.
1 7 449.50 (1)
2 4 525.00 (5)
3 2 479.95 (3)
4 6 499.95 (4)
5 1 580.00 (8)
6 3 549.95 (7)
7 8 469.95 (2)
8 5 532.50 (6)


Di cuadrada
Rango
Di
6 36
-1 1
-1 1
2 4
-7 49
-4 16
6 36
-1 1
256
Coeficiente de correlacin de
rangos para monotona de
preferencias
Ho: No existe asociacin entre los rangos
Ha: Existe asociacin entre los rangos o es positiva o negativa

El coeficiente de correlacin de rangos de Spearman es:

Rs = 1 6*suma(di cuadrada) / (n(n cuadrada 1))

En este caso: Rs = 1 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores crticos del coeficiente de
correlacin del coeficiente de correlacin de rangos de Spearman

Rt = 0.686

Por tanto si hay asociacin significativa en las preferencias


257
Tabla de constantes
n Alfa=0.05 Alfa = 0.025
5 0.900 -
6 0.829 0.886
7 0.714 0.786
8 0.643 0.738
9 0.600 0.683
10 0.564 0.648
11 0.523 0.623
12 0.497 0.591
13 0.475 0.566
14 0.457 0.545
15 0.441 0.525
16 0.425 0.507
17 0.412 0.490
18 0.388 0.476
19 0.377 0.462
20 0.368 0.450
21 0.359 0.438
22 0.351 0.428
23 0.343 0.418
24 0.336 0.409
25 0.329 0.400
26 0.329 0.392
27 0.323 0.385
28 0.317 0.377
29 0.311 0.370
30 0.305 0.364
258
Corrida con Minitab
Para la corrida en Minitab primero se
deben determinar los rangos en
forma manual para las variables X
y Y.
Stat > Basic statistics > Correlation
Variables Preferencia Precio
Fabric
ante
Prefe-
rencia Precio
Preci
o
1 7 1 449
2 4 5 525
3 2 3 479
4 6 4 499
5 1 8 580
6 3 7 549
7 8 2 469
8 5 6 532
Correlations: Preferencia, Precio
Pearson correlation of
Preferencia and Precio = -0.714
P-Value = 0.047
259
Ejemplo con Minitab
Se estudia la relacin entre colgeno y
Proline en pacientes con cirrosis
Stat > Basic statistics > Correlation
Variables Colgeno Proline
Paciente Colgeno Proline
1 7.1 2.8
2 7.1 2.9
3 7.2 2.8
4 8.3 2.6
5 9.4 3.5
6 10.5 4.6
7 11.4 5
Correlations: Colageno, Proline
Pearson correlation of Colageno
and Proline = 0.935
P-Value = 0.002
260
Resumen de pruebas
no paramtricas
Prueba de signos de 1 muestra: Prueba la igualdad de la
mediana a un valor y determina el intervalo de confianza

Prueba de Wilconox de 1 muestra: Prueba la igualdad de la
mediana a un valor con rangos con signo y determina el
intervalo de confianza

Comparacin de dos medianas poblacionales de Mann Whitney:
Prueba la igualdad de las medianas y determina el intervalo de
confianza


261
Resumen de pruebas
no paramtricas

Comparacin de igualdad de medianas poblacionales de Kruskal
Wallis: Prueba la igualdad de las medianas en un diseo de una
va y determina el intervalo de confianza


Comparacin de medianas poblacionales de Mood: Prueba la
igualdad de medianas con un diseo de una va



262
263
264
Salidas de la Fase de Anlisis
Causas raz validadas

Gua de oportunidades de mejora

Potrebbero piacerti anche