Sei sulla pagina 1di 280

Programa de certificación

de Green Belts

IV. Seis Sigma - Análisis

P. Reyes / Octubre de 2007

1
QFD
FASE DE ANÁLISIS
Diagrama de
relaciones
Diagrama
Causa Efecto Diagrama de
Ishikawa
Diagrama
de Árbol
Definición
Y=X1 + X2+. .Xn

CTQs = Ys Medición Y,
Operatividad X1, X2, Xn
X's
Causas
Análisis del Modo y Efecto de potenciales
Falla (AMEF)

Llenar columnas del FMEA


Pruebas Hasta sol. Propuesta y
de
hipótesis
comprobar causas con
Diagrama Pruebas de Hipótesis
de Flujo
del X's vitales
proceso No ¿Causa Si Causas raíz
Raíz? validadas

2
Seis Sigma - Análisis
FMEA

Identificación de causas potenciales

A. Análisis exploratorio de datos

B. Pruebas de hipótesis
3
¿ Qué es el FMEA?
El Análisis de del Modo y Efectos de Falla es un grupo sistematizado de
actividades para:

 Reconocer y evaluar fallas potenciales y sus efectos.

 Identificar acciones que reduzcan o eliminen las


probabilidades de falla.

 Documentar los procesos con los hallazgos del análisis.

 Existe el estándar MIL-STD-1629, Procedure for Performing a Failure


Mode, Effects and Criticality Analysis
4
Tipos del FMEA
 AMEF de concepto (CFMEA)
 A nivel de sistema, subsistema y componente

 AMEF de diseño (DFMEA)

 AMEF de Proceso (PFMEA)

 AMEF de maquinaria (como aplicación del DFMEA)

5
Tipos de FMEAs
 FMEA de Diseño (AMEFD), su propósito es analizar como
afectan al sistema los modos de falla y minimizar los
efectos de falla en el sistema. Se usan antes de la
liberación de productos o servicios, para corregir las
deficiencias de diseño.

 FMEA de Proceso (AMEFP), su propósito es analizar como


afectan al proceso los modos de falla y minimizar los
efectos de falla en el proceso. Se usan durante la
planeación de calidad y como apoyo durante la producción
o prestación del servicio.

6
Salidas del FMEA de Proceso
 Una lista de modos potenciales de falla

 Una lista de Caracteríticas críticas y/o significativas

 Una lista de características relacionadas con la


seguridad del operador y con alto impacto

 Una lista de controles especiales recomendados para


las Características Especiales designadas y
consideradas en el Plan de control

7
Salidas del FMEA de Proceso
 Una lista de procesos o acciones de proceso para
reducir la Severidad, eliminar las causas de los modos
de falla del producto o reducir su tasa de ocurrencia, y
mejorar la tasa de Detección de defectos si no se
puede mejorar la capacidad del proceso

 Cambios recomendados a las hojas de proceso y


dibujos de ensamble

8
FMEA de Proceso - PFMEA

9
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______

Resultados de Acción
O Controles de D
Función S Causa(s)
Efecto (s) c Diseño o e R Responsable S O D R
del Producto/ Modos de Falla e Potencial(es) Acción Acción
Potencial (es) c Proceso t P y fecha límite e c e P
Paso del Potenciales v o Mecanismos Sugerida Adoptada
de falla u Actuales e N de Terminación v c t N
proceso . de falla
r c
Modelo del PFMEA – Paso 1
 Identificar todos los requerimientos funcionales dentro del
alcance

 Identificar los modos de falla correspondientes

 Identificar un conjunto de efectos asociados para cada modo de


falla

 Identificar la calificación de severidad para cada conjunto de


efectos que de prioridad el modo de falla

 De ser posible, tomar acciones para eliminar modos de falla sin


atender las “causas”

11
Modelo de PFMEA – Paso 1

 Modos de falla potenciales


 No funciona

 Funcionamiento parcial / Sobre función / Degradación en el

tiempo
 Funcionamiento intermitente

 Función no intencionada

 Los modos de falla se pueden categorizar como sigue:


 Manufactura: Dimensional fuera de tolerancia

 Ensamble: Falta de componentes

 Recibo de materiales: Aceptar partes no conformes

 Inspección/Prueba: Aceptar partes equivocadas

12
Modelo de PFMEA - Paso 1

 Efectos de las fallas potenciales (en usuario final)


 Ruido
 Operación errática
 Inoperable
 Inestable
 Apariencia mala
 Fugas
 Excesivo esfuerzo
 Retrabajos / reparaciones
 Insatisfacción del cliente

13
CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP

Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
/ ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades

Efecto en el cliente Efecto en Manufactura /Ensamble


Efecto
Calif.
Peligroso
sin aviso
Calificación de severidad muy alta cuando un modo potencial de
falla afecta la operación segura del producto y/o involucra un no
Puede exponer al peligro al operador (máquina o ensamble)
sin aviso 10
cumplimiento con alguna regulación gubernamental, sin aviso

Peligroso
con aviso
Calificación de severidad muy alta cuando un modo potencial de
falla afecta la operación segura del producto y/o involucra un no
Puede exponer al peligro al operador (máquina o ensamble)
sin aviso 9
cumplimiento con alguna regulación gubernamental, con aviso

Muy alto El producto / item es inoperable ( pérdida de la función


primaria)
El 100% del producto puede tener que ser desechado op
reparado con un tiempo o costo infinitamente mayor 8
Alto El producto / item es operable pero con un reducido nivel de
desempeño. Cliente muy insatisfecho
El producto tiene que ser seleccionado y un parte
desechada o reparada en un tiempo y costo muy alto 7
Modera
do
Producto / item operable, pero un item de confort/conveniencia
es inoperable. Cliente insatisfecho
Una parte del producto puede tener que ser desechado sin
selección o reparado con un tiempo y costo alto 6
Bajo Producto / item operable, pero un item de confort/conveniencia
son operables a niveles de desempeño bajos
El 100% del producto puede tener que ser retrabajado o
reparado fuera de línea pero no necesariamente va al àrea 5
de retrabajo .
Muy bajo No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 75% de los clientes
El producto puede tener que ser seleccionado, sin desecho,
y una parte retrabajada 4
Menor No se cumple con el ajuste, acabado o presenta ruidos y
rechinidos. Defecto notado por el 50% de los clientes
El producto puede tener que ser retrabajada, sin desecho,
en línea, pero fuera de la estación 3
Muy
menor
No se cumple con el ajuste, acabado o presenta ruidos, y
rechinidos. Defecto notado por clientes muy críticos (menos del
El producto puede tener que ser retrabajado, sin desecho
en la línea, en la estación 2
25%)
Ninguno Sin efecto perceptible Ligero inconveniente para la operación u operador, o sin
efecto 1
Modelo de PFMEA – Paso 2

 Paso 2 identificar:
 Las causas asociadas (primer nivel y raíz)

 Su tasa de ocurrencia

 La designación apropiada de la característica indicada


en ola columna de clasificación

 Acciones recomendadas para alta severidad y


criticalidad (S x O) así como la Seguridad del operador
(OS) y errores de proceso de alto impacto (HI)

15
Modelo de PFMEA – Paso 2

Causa/Mecanismo potencial de falla


 Describe la forma de cómo puede ocurrir la falla,
descrito en términos de algo que puede ser corregido o
controlado
 Se debe dar priorioridad a rangos de prioridad de 9 o
10

16
Efecto(s) Potencial(es) de falla
Evaluar 3 (tres) niveles de Efectos del Modo de Falla
• Efectos Locales
– Efectos en el Área Local
– Impactos Inmediatos

• Efectos Mayores Subsecuentes


– Entre Efectos Locales y Usuario Final

• Efectos Finales
– Efecto en el Usuario Final del producto o Servicio
17
CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP
Probabilidad Indices Posibles de ppk Calif.
falla
Muy alta: Fallas 100 por mil piezas < 0.55 10
persistentes
50 por mil piezas > 0.55 9

Alta: Fallas frecuentes 20 por mil piezas > 0.78 8

10 por mil piezas > 0.86 7

Moderada: Fallas 5 por mil piezas > 0.94 6


ocasionales
2 por mil piezas > 1.00 5

1 por mil piezas > 1.10 4

Baja : Relativamente pocas 0.5 por mil piezas > 1.20 3


fallas
0.1 por mil piezas > 1.30 2

Remota: La falla es < 0.01 por mil piezas > 1.67 1


improbable
CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP
Detecciòn Criterio Tipos de Métodos de seguridad de Rangos de Calif
Inspección Detección
A B C

Casi Certeza absoluta de no detección X No se puede detectar o no es verificada


imposible
10
Muy Los controles probablemente no X El control es logrado solamente con 9
remota detectarán verificaciones indirectas o al azar
Remota Los controles tienen poca X El control es logrado solamente con
oportunidad de detección
8
inspección visual
Muy baja Los controles tienen poca X El control es logrado solamente con
oportunidad de detección
7
doble inspección visual
Baja Los controles pueden detectar X X El control es logrado con métodos gráficos con
el CEP
6
Moderada Los controles pueden detectar X El control se basa en mediciones por variables después de que las
partes dejan la estación, o en dispositivos Pasa NO pasa realizado en 5
el 100% de las partes después de que las partes han dejado la
estación

Moderada Los controles tienen una buena X X Detección de error en operaciones subsiguientes, o medición

mente oportunidad para detectar


realizada en el ajuste y verificación de primera pieza ( solo para 4
causas de ajuste)
Alta
Alta Los controles tienen una buena X X Detección del error en la estación o detección del error en

oportunidad para detectar


operaciones subsiguientes por filtros multiples de aceptación: 3
suministro, instalación, verificación. No puede aceptar parte
discrepante

Muy Alta Controles casi seguros para X X


detectar
Detección del error en la estación (medición automática
con dispositivo de paro automático). No puede pasar la 2
parte discrepante

Muy Alta Controles seguros para detectar X No se pueden hacer partes discrepantes porque el item ha
pasado a prueba de errores dado el diseño del 1
proceso/producto

Tipos de inspección: A) A prueba de error B) Medición automatizada C) Inspección visual/manual


ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
S Causa(s)
Función Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Controles de Acción Acción
de Potencial (es) c t P y fecha límite e c e P
Potenciales v de los Mecanismos Diseño Actual Sugerida Adoptada
Artículo de falla u e N de Terminación v c t N
. de falla
r c

Factura Datos LOCAL:


incorrecta incorrectos Rehacer
la factura

Riesgo = Severidad x
MAXIMO PROXIMO Ocurrencia x Detección
Contabilidad 7 3 5 105
erronea

CON CLIENTE
Molestia

Causas probables a
Insatisfacción

atacar primero

20
Calcular RPN (Número de Prioridad de
Riesgo)

Producto de Severidad, Ocurrencia, y Detección

RPN / Gravedad usada para identificar principales CTQs

Severidad mayor o igual a 8


RPN mayor a 150

21
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
S Causa(s)
Función Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Controles de Acción Acción
de Potencial (es) c t P y fecha límite e c e P
Potenciales v de los Mecanismos Diseño Actual Sugerida Adoptada
Artículo de falla u e N de Terminación v c t N
. de falla
r c

Factura Datos LOCAL:


incorrecta incorrectos Rehacer
la factura

Riesgo = Severidad x
MAXIMO PROXIMO Ocurrencia x Detección
Contabilidad 7 3 5 105
erronea

CON CLIENTE
Molestia

Causas probables a
Insatisfacción

atacar primero
Planear Acciones

Requeridas para todos los CTQs

 Listar todas las acciones sugeridas, qué persona


es la responsable y fecha de terminación.
 Describir la acción adoptada y sus resultados.
 Recalcular número de prioridad de riesgo .

Reducir el riesgo general del diseño


23
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
Función S Causa(s) Controles de
Efecto (s) c e R Responsable S O D R
del componente Modos de Falla e Potencial(es) Diseño / Acción Acción
Potencial (es) c t P y fecha límite e c e P
/ Paso del Potenciales v o Mecanismos Prcoeso Sugerida Adoptada
de falla u e N de Terminación v c t N
proceso . de falla Actuales
r c

Factura correcta Datos LOCAL:


erroneos Rehacer la
factura

MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea

CON CLIENTE
Molestia
Insatisfacción Usar RPN para identificar
acciones futuras. Una vez que
se lleva a cabo la acción,
recalcular el RPN.

24
Ejemplo de AMEFP

25
Identificación de causas
potenciales

Tormenta de ideas
Diagrama de Ishikawa
Diagrama de Relaciones
Diagrama de Árbol
Verificación de causas raíz

26
Tormenta de ideas
 Técnica para generar ideas creativas cuando la mejor
solución no es obvia.

 Reunir a un equipo de trabajo (4 a 10 miembros) en


un lugar adecuado

 El problema a analizar debe estar siempre visible

 Generar y registrar en el diagrama de Ishikawa un


gran número de ideas, sin juzgarlas, ni criticarlas

 Motivar a que todos participen con la misma


oportunidad 27
Tormenta de ideas
 Permite obtener ideas de los participantes

28
Diagrama de Ishikawa
 Anotar el problema en el cuadro de la derecha

 Anotar en rotafolio las ideas sobre las posibles causas


asignándolas a las ramas correspondientes a:
 Medio ambiente

 Mediciones

 Materia Prima

 Maquinaria

 Personal y

 Métodos

o
 Las diferentes etapas del proceso de manufactura o
servicio
29
Diagrama de causa efecto
 Divide los problemas en partes más pequeñas

 Muestra las causas potenciales de manera gráfica

 También se llama diagrama de ishikawa o de las 4 o


6 M’s.

 Muestra como interactúan las diversas causas


 Sigue las reglas de la tormenta de ideas al generarlas

30
Diagrama de Ishikawa
Medio
ambiente Métodos Personal
Frecuencia Falta de
Rotación de
Clima personal
de visitas supervi
húmedo Falta de
ción
motivación
Posición de Ausentismo
Distancia de exhibidores
la agencia al
Elaboración ¿Qué
changarro de pedidos produce
bajas ventas
Clientes con Calidad del de
ventas bajas Seguimiento producto Tortillinas
Malos
semanal Tía Rosa?
Conocimiento
itinerarios
de los Tipo de
Descompostura mínimos por exhibidor
del camión ruta
repartidor

Maquinaría Medición Materiales


Diagrama de relaciones Perdida de mercado
debido a la
competencia
No hay flujo
efectivo de mat. Influencia de la Compra de material
Por falta de situación econ del para el desarrollo de
programación país nuevos productos por
de acuerdo parte inv..... Y desarrollo’’’
No hay coordinación
a pedidos entre marketing
Falta de operaciones
No hay control coordinación al fincar
de inv..... En proc. pedidos entre
Constantes
Falta de prog. De marketing y la op.
cancelaciones
la op. En base a No hay coordinación
de pedidos
los pedidos entre la operación y las unidades
de marketing
Programación del negocio
Las un. Reciben
deficiente
ordenes de dos
deptos diferentes
Capacidad
instalada Falta de coordinación
desconocida entre el enlace de compras
Altos Duplicidad Demasiados deptos
de cada unidad con compras
Falta de control de inventarios de funciones de inv..... Y desarrollo
corporativo
inventarios en
Compras
compras
aprovecha
Falta de com..... Entre
ofertas No hay com..... Entre
las dif. áreas de
las UN y la oper.
la empresa
Marketing no
Mala prog. De tiene en cuenta
ordenes de compra cap de p.

No hay com..... Entre compras


con la op. general
Influencia directa de
marketing sobre
compras
Falta de comunicación
entre las unidades
del negocio
¿Que nos puede provocar Variación de Velocidad
Durante el ciclo de cambio en la sección del Embobinadores?

13/0 2/1
Bandas de
Dancer transmisión
2/4 Taco generador 1/1 Causas a validar
del motor Empaques de arrastre

0/4 Poleas guías 0/3


Presión de aire de trabajo

1/2 Presión del 5/2


Drive principal
dancer

5/1 Mal guiado 4/1


Voltaje del motor

1/4 Sensor de velocidad


de línea 1/5Ejes principales
Entradas Causa
Salidas Efecto
1/4 Sensor
1/5Poleas de transmisión
circunferencial
¿Qué datos son necesarios para
identificar las cuasas raíz?
Diagrama de Interrrelaciones
Permite al equipo identificar y clasificar las relaciones
de causa y efecto que existe entre las variables

Means not Driver


clearly
defined
Plan not
In = 3 Out = 2 integrated
Communica-
tion issues In = 2 Out = 4
within the
group
In = 1 Out = 3 Fast new
product
introductions
stretch
resources
In = 1 Out = 2

No strong
commitment
to the group
In = 2 Out = 0

Capacity
may not
meet needs

Planning In = 5 Out = 1
approach not
standardized Outcome
In = 0 Out = 5

External Lack of
Driver factors impact time and
implemen- resources
tation
In = 5 Out = 0
In = 0 Out = 2
Diagrama de árbol o sistemático

Meta Medio
Meta Medio
Meta Medio
Segundo Tercer Cuarto
Primer nivel nivel nivel
nivel
Medios
Medios
Medios

Medios
o planes

Meta u
objetivo

Medios
o planes

35
Diagrama de Arbol- Aplicación Sistema SMED
¿Cómo? ¿Cuándo?
Filmar la preparación 5- 12 - Mar-04
Preparación
para el SMED
Analizar el video 10 y 17 –Mar-04

Describir las tareas 17- Mar-04

¿Objetivo? Separar las tareas 17- Mar-04


Fase 1: Separación
de la preparación Elaborar lista de chequeo 2- Mar-04
Implantar el interna de la externa
Sistema Realizar chequeo de
24- Mar-04
funciones
SMED
Producto DJ Analizar el transporte de
24- Mar-04
2702 herramientas y materiales
Analizar las funciones y
¿Qué? Fase 2: Conversión propósito de c/operación
12 - Abr- 04
de preparación
Convertir tareas de prepa-
interna en externa ración interna a externas
15 –Abr - 04
Elaboramos un
Diagrama de Arbol Realización de operaciones
5 –May -04
en paralelo.
para poder
analizar nuestro Fase 3: Refinamiento
Uso de sujeciones
problema siguiendo de todos los aspectos funcionales.
19– May -04

el sistema SMED. de la preparación.


Eliminación de ajustes 12- May -04
19
Selección de posibles causas
 El equipo discute la lista de
causas de alta prioridad y Causas

decide cuáles son las más 1. ________

importantes (5 a 7). 2. ________


3. ________
 El equipo se cuestiona lo 4. ________
siguiente: 5. ________
 ¿Es una causa? (¿no una
solución?)
 ¿Podemos hacer algo respecto a
la causa?
 ¿Estamos seguros que ésta
cambiará el efecto?
 ¿Estamos de acuerdo?
37
Verificación de posibles causas
 Para cada causa probable , el equipo deberá
por medio del diagrama 5Ws – 1H:
 Llevar a cabo una tormenta de ideas para
verificar la causa.
 Seleccionar la manera que:
 represente la causa de forma efectiva, y
 sea fácil y rápida de aplicar.

38
Calendario de las actividades

¿qué? ¿por qué? ¿cómo? ¿cuándo ¿dónde ¿quién?


? ?
1 1.1 Por variación de 1.1.1 Tomar dimensiones de ensamble entre Abril ’04 1804 J. R.
Tacogenerador voltaje durante el coples. Embob.
de motor ciclo de cambio 1.1.2 Verificar estado actual y
embobinador especificaciones de escobillas.
1.1.3 tomar valores de voltaje de salida
durante el ciclo de cambio.
2 Sensor 2.1 Por que nos 2.1.1 Tomar dimensiones de la distancia Abril ’04 1804 U. P.
circular y de genera una varión en entre poleas y sensores. Embob.
velocidad de la señal de referencia 2.1.2 Tomar valores de voltaje de salida de
linea. hacia el control de los sensores.
velocidad del motor 2.1.3 Verificar estado de rodamientos de
embobinador poleas.
3 Ejes 3.1 Por vibración 3.1.1 Tomar lecturas de vibración en Abril’04 1804 F. F.
principales de excesiva durante el alojamientos de rodamientos Embob.
transmisión. ciclo de cambio 3.1.2 Comparar valores de vibraciones con
lecturas anteriores.
3.1.3 Analizar valor lecturas de vibración
tomadas.

4 Poleas de 4.1 Puede generar 4.1.1 Verificar alineación, entre poleas de Abril’04 1804 J. R.
transmisión de vibración excesiva ejes principales y polea de transmisión del Embob. U. P.
ejes durante el ciclo de motor.
embobinadores cambio. 4.1.2 Tomar dimensiones de poleas(dientes
. de transmisión).
4.1.3 Tomar dimensiones de bandas (dientes
de transmisión)
4.1.4 Verificar valor de tensión de bandas. 39
Verificación de posibles causas
 Antes de invertir tiempo y dinero en la
implementación de una mejora para “contrarrestar”
una causa, asegurarse que la causa sea real.

 Estar completamente convencido que la causa es la


verdadera culpable del efecto indeseable.

40
IV A 1. Estudios Multivari

41
Estudios Multivari
 La carta multivari permite analizar la variación dentro
de la pieza, de pieza a pieza o de tiempo en tiempo

 Permite investigar la estabilidad de un proceso


consiste de líneas verticales u otro esquema en
función del tiempo. La longitud de la línea o del
esquema representa el rango de valores encontrados
en cada conjunto de muestras

42
Estudios Multivari
 La variación dentro de las muestras (cinco puntos en
cada línea). La variación de muestra a muestra como
posición vertical de las líneas.

E
S
P
E
S
O
R

Número de subgrupo 43
Estudios Multivari
 Ejemplo de parte metálica
Centro más grueso

44
Estudios Multivari
 Procedimiento de muestreo:
 Seleccionar el proceso y la característica a
investigar

 Seleccionar tamaño de muestra y frecuencia de


muestreo

 Registrar en una hoja la hora y valores para


conjunto de partes

45
Estudios Multivari
 Procedimiento de muestreo:
 Realizar la carta Multivari
 Unir los valores observados con una línea

 Analizar la carta para variación dentro de la parte,


de parte a parte y sobre el tiempo

 Puede ser necesario realizar estudios adicionales


alrededor del área de máxima variación aparente
 Después de la acción de mejora comprobar con
otro estudio Multivari
46
Cartas Multivari
 Su propósito fundamental es reducir el gran número de
causas posibles de variación, a un conjunto pequeño de
causas que realmente influyen en la variabilidad.

 Sirven para identificar el patrón principal de variación de


entre tres patrones principales:

 Temporal: Variación de hora a hora; turno a


turno; día a día; semana a semana; etc.

 Cíclico: Variación entre unidades de un mismo


proceso; variación entre grupos de unidades;
variación de lote a lote. 47
7A1. Cartas Multivari
 Posicional:
 Variaciones dentro de una misma unidad (ejemplo:
porosidad en un molde de metal) o a través de una sola
unidad con múltiples partes (circuito impreso).

 Variaciones por la localización dentro de un proceso que


produce múltiples unidades al mismo tiempo. Por
ejemplo las diferentes cavidades de un molde

 Variaciones de máquina a máquina; operador a


operador; ó planta a planta

48
Cartas Multivari
 Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el
proceso tres o más veces a cierto intervalo de tiempo, hasta que al
menos el 80% de la variación en el proceso se ha capturado.

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD
49
Cartas Multivari
 Ejemplo: (cont...)

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD

50
Cartas Multivari
 Ejemplo: (cont...)

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO

51
Cartas Multivari
 Ejemplo: Un proceso produce flecha cilíndricas, con
un diámetro especificado de 0.0250”  0.001”.

 Sin embargo un estudio de capacidad muestra un Cp


= 0.8 y una dispersión natural de 0.0025” (6  )
contra la permitida de 0.0002”.

 Se tiene pensado comprar un torno nuevo de


US$70,000 para tolerancia de  0.0008”, i.e. Cpk =
1.25. Se sugirió un estudio Multi Vari previo.
52
Cartas Multivari
 Se tomaron cuatro lecturas en cada flecha, dos a
cada lado. Estas muestran una disminución gradual
desde el lado izquierdo al lado derecho de las
flechas, además de excentricidad en cada lado de la
flecha.

 La variación cíclica, de una flecha a la siguiente, se


muestra mediante las líneas que concentran las
cuatro lecturas de cada flecha.

 También se muestra la variación temporal.


53
Cartas Multivari
8 AM 9 AM 10 AM 11 AM 12 AM
.0.2510”

0.2500”

0.2490”

Izquierda

Máximo
Derecha

Mínimo
Cartas Multivari
 Un análisis rápido revela que la mayor variación es temporal
con un cambio mayor entre las 10 AM y las 11 AM.

 A las 10 AM se para el equipo para el almuerzo y se arranca a


las 11 AM, con lecturas similares a las de las 8 AM. Conforme
pasa el tiempo las lecturas tienden a decrecer más y más, hasta
que se invierten a las 10 A.M. en forma drástica.

 Se investigó y se encontró que la temperatura tenía influencia


en la variación.

 La variación en temperatura era causada por que la cantidad de


refrigerante no era la adecuada, lo cual se notaba más cuando
se paraba el equipo y se volvía a arrancar. Se adicionó,
reduciendo la variación en 50% aproximadamente..
55
Cartas Multivari
 También se encontró que el acabado cónico era causado por
que la herramienta de corte estaba mal alineada. Se ajustó,
contribuyendo a otra reducción del 10% de la variabilidad.

 La excentricidad de las flechas se corrigió al cambiar un


rodamiento excéntrico por desgaste en el torno. Se instaló un
nuevo rodamiento eliminándose otro 30% de la variabilidad.

 La tabla siguiente muestra un resumen de los resultados.

56
Cartas Multivari
Tipo de % var. Causas de Acción % de variación
Variación Total Variación Correctiva Reducida
Temporal 50 Bajo nivel de Adicionar Casi 50
Tiempo a tiempo Refrigerante refrigerante
Dentro de 10 Ajuste no Ajuste de la Casi 10
la flecha no paralelo herramienta de
corte
Dentro de 30 Rodamiento Nuevo Casi 30
la flecha gastado rodamiento

Flecha a 5 -??? - -
flecha
57
Cartas Multivari
 Resultados:
 La variación total en la siguiente corrida de producción se
redujo de 0.0025” a 0.0004”

 El nuevo Cp fue de 0.002 / 0.0004 = 5.0

 Como beneficios se redujo a cero el desperdicio y no hubo


necesidad de adquirir una nueva máquina.

 Se observa que antes de cambiar equipo o máquinas, es


conveniente realizar un estudio de variabilidad para
identificar las fuentes de variación y tratar de eliminarlas.
58
Cartas Multivari
Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático.

Diámetro de Flecha
(0.150" +/- .002)

Variación
Variación de
de
sist. medición
proceso

Pieza a Dentro de Máquina a Turno a Tiempo a


Lote a lote
pieza la pieza máquina turno tiempo

Operador a
operador
Programa Máquina Accesorios

59
Cartas Multivari
Ejemplo (cont..):
• Al realizar la prueba de homogeneidad de varianza F, se
encontró que había una diferencia significante entre los
operadores.

Se Rechaza Ho: Oper1 = Oper2 = Oper3


• Para probar si existe diferencia significativa entre
medias de operadores se hacen las siguientes
comparaciones

Ho: Oper1 = Oper2 Ho: Oper1 = Oper3


Ho: Oper2 = Oper3 Ha: Oper1 Oper2 Oper3 60
Corrida en Minitab
 Se introducen los datos en varias columnas C1 a C3
incluyendo la respuesta (strenght) y los factores
(time y Metal)
SinterTime MetalType Strength
0.5 15 23
0.5 15 20
0.5 15 21
0.5 18 22
0.5 18 19
0.5 18 20
0.5 21 19
0.5 21 18 61
Corrida en Minitab
 Utilizar el achivo de ejemplo Sinter.mtw

 Opción: Stat > Quality Tools > Multivari charts

 Indicar la columna de respuesta y las columnas de


los factores

 En opciones se puede poner un título y conectar las


líneas

62
Resultados
Multi-Vari Chart for Strength by SinterTime - MetalType

SinterTime
0.5
23.5
1.0
2.0
22.5

21.5
Strength

20.5

19.5

18.5

17.5

15 18 21

MetalType

63
IV.A.2 Regresión lineal simple

64
Definiciones
Correlación
Establece si existe una relación entre las variables y
responde a la pregunta, ”¿Qué tan evidente es esta
relación?"

Regresión
Describe con más detalle la relación entre las variables.

Construye modelos de predicción a partir de información


experimental u otra fuente disponible.

Regresión lineal simple


Regresión lineal múltiple
Regresión no lineal cuadrática o cúbica

65
Correlación
Propósito: Estudiar la posible relación
entre dos variables.
Accidentes laborales

• • •
• • Correlación
• •
• • •
• • • • positiva,
• •
• •


posible
• • •
• • •

• •

Numero de órdenes urgentes

El 1er. paso es realizar una gráfica de la información.

66
Correlación de la información (R ) de las X y las Y
Correlación Positiva Correlación Negativa
25
Evidente 25
Evidente
20 20

15 15

10
Y

Y
10
5
5
0
0 5 10 15 20 25
Sin Correlación 0
0 5 10 15 20 25
X 25
R=1 20
X
R=-1
15

Correlación Y 10
Correlación
5

25
Positiva 0 Negativa
0 5 10 15 20 25 25
20

15
X
R=0 20

15
Y

10

Y
10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
R=>1 X
R=>-1
Correlaciones (Pearson)
Tabla de Correlación mínima

n 95% 99% n 95% 99%


de confianza de confianza de confianza de confianza
3 1.00 1.00 15 0.51 0.64
4 0.95 0.99 16 0.50 0.61
5 0.88 0.96 17 0.48 0.61
6 0.81 0.92 18 0.47 0.59
7 0.75 0.87 19 0.46 0.58
8 0.71 0.83 20 0.44 0.56
9 0.67 0.80 22 0.42 0.54
10 0.63 0.76 24 0.40 0.52
11 0.60 0.73 26 0.39 0.50
12 0.58 0.71 28 0.37 0.48
13 0.53 0.68 30 0.36 0.46
14 0.53 0.66

Para un 95% de confianza, con una muestra de 10,


el coeficiente (r) debe ser al menos .63
Correlación
• La correlación puede usarse para información de
atributos, variables normales y variables no normales.

• La correlación puede usarse con un “predictor” o


más para una respuesta dada.

• La correlación es una prueba fácil y rápida para


eliminar factores que no influyen en la predicción, para
una respuesta dada.

69
Análisis de Regresión
El análisis de regresión es un método
estandarizado para localizar la correlación entre dos
grupos de datos, y, quizá más importante, crear un
modelo de predicción.

Puede ser usado para analizar las relaciones entre:


• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí


70
Supuestos de la regresión lineal
Los principales supuestos que se hacen en el análisis de regresión
lineal son los siguientes:
 La relación entre las variables Y y X es lineal, o al menos bien
aproximada por una línea recta.
y   0  1 X  

 El término de error  tiene media cero.

 El término de error  tiene varianza constante 2.

 Los errores no están correlacionados.

 Los errores están normalmente distribuidos.


71
Modelo de regresión lineal
 Se aume que para cualquier valor de X el valor observado de Y
varia en forma aleatoria y tiene una distribución de probabilidad
normal

 El modelo general es:


Y = Valor medio de Yi para Xi + error aleatorio

y   0  1 X  
72
Regresión Lineal Simple
La línea de regresión se calcula por el método de mínimos cuadrados.
Un residuo es la diferencia entre un punto de referencia en particular (xi,
yi) y el modelo de predicción ( y = a + bx ). El modelo se define de tal
manera que la suma de los cuadrados de los residuales es un mínimo. La
suma residual de los cuadrados es llamada con frecuencia la suma de los
cuadrados de los errores (SSE) acerca de la línea de regresión

yi y = b0 + b1x
ei •


• •

a y b son

• • •
• • • • Estimados de




• 0 y 1

• • •
• • •

• •

xi
SSE = ei2 = yi - yi2
Gráfica de la Línea de Ajuste
Recta de regresión
Y=-.600.858+5738.89X
R2 = .895
600
Retención

500 Regresión
95% Intervalo
de confianza
95% Intervalo
400 de predicción

0.18 0.19 0.20


Altura del muelle

74
Interpretación de los Resultados

La ecuación de regresión (Y = -600.858 + 5738.89X) describe la


relación entre la variable predictora X y la respuesta de
predicción Y.
R2 (coef. de determinación) es el porcentaje de variación
explicado por la ecuación de regresión respecto a la variación total
en el modelo

El intervalo de confianza es una banda con un 95% de


confianza de encontrar la Y media estimada para cada valor de
X [Líneas rojas]

El intervalo de predicción es el grado de certidumbre de la


difusión de la Y estimada para puntos individuales X. En general,
95% de los puntos individuales (provenientes de la población sobre
la que se basa la línea de regresión), se encontrarán dentro de la
banda [Líneas azules]

75
Interpretación de los Resultados

• Los valores “p” de la constante (intersección en Y) y las variables


de predicción, se leen igual que en la prueba de hipótesis.
Ho: El factor no es significativo en la predicción de la respuesta.
Ha: El factor es significativo en la predicción de la respuesta.

• s es el “error estándar de la predicción” = desviación estándar del


error con respecto a la línea de regresión.

• R2 (ajustada) es el porcentaje de variación explicado por la


regresión, ajustado por el número de términos en el modelo y por
el número de puntos de información.

• El valor “p” para la regresión se usa para ver si el modelo completo


de regresión es significativo.
Ho: El modelo no es significativo en la predicción de la respuesta.
Ha: El modelo es significativo en la predicción de la respuesta.
Errores residuales
 Los errores se denominan frecuentemente residuales.
Podemos observar en la gráfica de regresión los errores
indicados por segmentos verticales.

77
Ejemplo
Considere el problema de predecir las ventas mensuales en
función del costo de publicidad. Calcular el coeficiente de
correlación, el de determinación y la recta.

MES Publicidad Ventas

1 1.2 101
2 0.8 92
3 1.0 110
4 1.3 120
5 0.7 90
6 0.8 82
7 1.0 93
8 0.6 75
9 0.9 91
10 1.1 105 78
Riesgos de la regresión
 Los modelos de regresión son válidos como ecuaciones de
interpolación sobre el rango de las variables utilizadas en el
modelo. No pueden ser válidas para extrapolación fuera de
este rango.

 Mientras que todos los puntos tienen igual peso en la


determinación de la recta, su pendiente está más influenciada
por los valores extremos de X.
1.
Y
*A

* *
* * * Sin A y B
* * * *

*B

X 79
Riesgos de la regresión
 Los outliers u observaciones aberrantes pueden distorsionar
seriamente el ajuste de mínimos cuadrados.

Y
*A *
* * *
**
* * *
** *
**
* * *
**
* *

 Si se encuentra que dos variables están relacionadas


fuertemente, no implica que la relación sea casual, se debe
investigar la relación causa – efecto entre ellas. Por ejemplo el
número de enfermos mentales vs. número de licencias
recibidas.
80
Ejercicio
Calcular la recta de predicción con sus bandas de confianza,
la correlación y la determinación para la respuesta de un Taxi,
los datos se muestran a continuación:

Distancia Tiempo
0.8 200
2.2 400
1.0 160
0.6 120
1.0 360
1.4 280
2.2 560
0.6 320
81
Regresión lineal múltiple

82
Regresión múltiple
 Cuando se usa más de una variable independiente para predecir
los valores de una variable dependiente, el proceso se llama
análisis de regresión múltiple, incluye el uso de ecuaciones
lineales.

Yu   0  1 X u1   2 X u 2  .......   k X uk   u

Se asume que los errores u tienen las características siguientes:


 Tienen media cero y varianza común 2.
 Son estadísticamente independientes.

 Están distribuidos en forma normal.

83
Multicolinealidad
 Una prueba fácil de probar si hay multicolinealidad entre dos
variables es que su coeficiente de correlación sea mayor a 0.7

 Los elementos de la diagonal principal de la matriz X’X se


denominan Factores de inflación de varianza (VIFs) y se usan
como un diagnóstico importante de multicolinealidad. Para el
componente j – ésimo se tiene:
1
VIF j 
1  R 2j

 Si es mayor a 10 implica que se tienen serios problemas de


multicolinealidad.

84
Corrida en Minitab
 Se introducen los datos en varias columnas C1 a C5
incluyendo la respuesta Y (heatflux) y las variables
predictoras X’s (North, South, East)
HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50
251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28

85
Corrida en Minitab
 Utilzar el archivo de ejemplo Exh_regr.mtw
 Opción: Stat > Regression > Regression
 Para regresión lineal indicar la columna de respuesta
Y (Score2) y X (Score1)

 En Regresión lienal en opciones se puede poner un


valor Xo para predecir la respuesta e intervalos. Las
gráficas se obtienen Stat > Regression > Regression
> Fitted line Plots

 Para regresión múltiple Y (heatflux) y las columnas


de los predictores (north, south, east)
86
Resultados de la regresión lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00 87
Resultados de la regresión lineal
Regression Plot
Score2 = 1.11771 + 0.217670 Score1

S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %

3.5
Score2

2.5

Regression
1.5 95% CI
95% PI

2 3 4 5 6 7 8 9

Score1

88
Resultados de la regresión Múltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
89
Resumen de la Regresión
• La regresión sólo puede utilizarse con información de variables
continuas.

• Los residuos deben distribuirse normalmente con media cero.

• Importancia práctica: (R2). Importancia estadística: (valores p)

• La regresión puede usarse con un “predictor” X o más,


para una respuesta dada

• Reduzca el modelo de regresión cuando sea posible,


sin perder mucha importancia práctica

90
IV.B Pruebas de hipótesis

91
IV.B. Pruebas de hipótesis
1. Conceptos fundamentales
2. Pruebas para medias, varianzas y proporciones

3. Pruebas pareadas de medias


4. Análisis de varianza (ANOVA)

5. Tablas de contingencia
6. Pruebas no paramétricas

92
IV.B.1 Conceptos
fundamentales

93
Análisis Estadístico
En CADA prueba estadística, se comparan algunos valores
observados a algunos esperados u otro valor observado
comparando estimaciones de parámetros (media, desviación
estándar, varianza)

Estas estimaciones de los VERDADEROS parámetros son obtenidos


usando una muestra de datos y calculando los ESTADÏSTICOS...

La capacidad para detectar un diferencia entre lo que es


observado y lo que es esperado depende del desarrollo de la
muestra de datos

Incrementando el tamaño de la muestra mejora la estimación y tu


confianza en las conclusiones estadísticas.
94
Conceptos fundamentales
 Hipótesis nula Ho
 Es la hipótesis o afirmación a ser probada

 Puede ser por ejemplo , , , = 5

 Sólo puede ser rechazada o no rechazada

 Hipótesis alterna Ha
 Es la hipótesis que se acepta como verdadera cuando se

rechaza Ho, es su complemento


 Puede ser por ejemplo  = 5 para prueba de dos colas

  < 5 para prueba de cola izquierda

  > 5 para prueba de cola derecha

 Esta hipótesis se acepta cuando se rechaza Ho

95
Conceptos fundamentales
 Ejemplos:
 Se está investigando si una semilla modificada
proporciona una mayor rendimiento por hectárea, la
hipótesis nula de dos colas asumirá que los
rendimientos no cambian Ho: Ya = Yb

 Se trata de probar si el promedio del proceso A es


mayor que el promedio del proceso B. La hipótesis
nula de cola derecha establecerá que el proceso A es
<= Proceso B. O sea Ho: A <= B.

96
Conceptos fundamentales
 Estadístico de prueba
 Para probar la hipótesis nula se calcula un estadístico
de prueba con la información de la muestra el cual se
compara a un valor crítico apropiado. De esta forma se
toma una decisión sobre rechazar o no rechazar la Ho

 Error tipo I (alfa = nivel de significancia, normal=.05)


 Se comete al rechazar la Ho cuando en realidad es
verdadera. También se denomina riesgo del productor

 Error tipo II (beta )


 Se comete cuando no se rechaza la hipótesis nula
siendo en realidad falsa. Es el riesgo del consumidor
97
Conceptos fundamentales
 Tipos de errores
 Se asume que un valor pequeño para  es deseable, sin

embargo esto incrementa el riesgo .


 Para un mismo tamaño de muestra n ambos varían

inversamente
 Incrementando el tamaño de muestra se pueden reducir ambos

riesgos.
Decisión realizada Ho en realidad es Ho en realidad es
Verdadera falsa
No hay evidencia para p = 1- p=
rechazar Ho Decisión correcta Error tipo II
Rechazar Ho p= p=1-
Error tipo I Decisión correcta
98
Conceptos fundamentales
 Pruebas de dos colas
 Si la Ho: , , , = cte. que un valor poblacional,
entonces el riesgo alfa se reparte en ambos extremos
de la distribución. Por ejemplo si Ho = 10 se tiene:

P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2

99
Conceptos fundamentales
 Pruebas de una cola
 Si la Ho: , , ,  >= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola izquierda de
la distribución. Por ejemplo si Ho: >= 10 y Ha: < 10
se tiene una prueba de cola izquierda:

P(Z <= - Zexcel ) = alfa

100
Conceptos fundamentales
 Pruebas de una cola
 Si la Ho: , , , <= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola derecha de
la distribución. Por ejemplo si Ho: <= 10 y Ha:  >
10 se tiene una prueba de cola derecha:

P(Z>= + Zexcel ) = alfa

101
Conceptos fundamentales
 Tamaño de muestra requerido
 Normalmente se determina el error alfa y beta deseado
y después se calcula el tamaño de muestra necesario
para obtener el intervalo de confianza.

 El tamaño de muestra (n) necesario para la prueba


de hipótesis depende de:
 El riesgo deseado tipo I alfa y tipo II Beta
 El valor mínimo a ser detectado entre las medias de la
población (Mu – Mu0)
 La variación en la característica que se mide (S o
sigma)
102
Conceptos fundamentales
 El Tamaño de muestra requerido en función del error
máximo E o Delta P intervalo proporcional esperado
se determina como sigue:

Z 2 / 2 2
n
E2
Z 2 / 2 ( p )(1  p )
n
( p ) 2 Z 2 / 2  2
n 
(X   )2
Z 2 / 2 (  )( 1   )
n 
( p   )2 103
Conceptos fundamentales
 Ejemplo:
 ¿Cuál es el tamaño de muestra mínimo que al 95% de
nivel de confianza (Z=1.96) confirma la significancia de
una corrida en la media mayor a 4 toneladas/hora (E),
si la desviación estándar (sigma) es de 20 toneladas?

n = (1.96^2)(20^2)/(4)^2 = 96

Obtener 96 valores de rendimiento por hora y determinar


el promedio, si se desvía por más de 4 toneladas, ya
ha ocurrido un cambio significativo al 95% de nivel de
confianza
104
Pruebas de Minitab
 Permite hacer las siguientes pruebas:
 Prueba z de una muestra
 Prueba t de una muestra
 Prueba t de dos muestras
 Prueba de 1 proporción
 Prueba de 2 proporciones

 ANOVA
 Diseños factoriales de dos niveles
 Diseños de Packett Burman

105
Estimación puntual
y por intervalo

106
7B2. Estimación puntual y por
intervalo
 Las medias o desviaciones estándar calculadas de una muestra
se denominan ESTADÍSTICOS, podrían ser consideradas como
un punto estimado de la media y desviación estándar real de
población o de los PARAMETROS.

 ¿Qué pasa si no deseamos una estimación puntual como media


basada en una muestra, qué otra cosa podríamos obtener como
margen, algún tipo de error?

“Un Intervalo de Confianza”

107
Intervalo de confianza

Error de estimación

P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2

Intervalo de confianza donde


se encuentra el parámetro con
un NC =1-
108
Estimación puntual y por
intervalo
 ¿Cómo obtenemos un intervalo de confianza?

Estimación puntual + error de estimación

 ¿De dónde viene el error de estimación?

Desv. estándar X multiplicador de nivel de confianza deseado Z/2

Por Ejemplo: Si la media de la muestra es 100 y la desviación


estándar es 10, el intervalo de confianza al 95% donde se
encuentra la media para una distribución normal es:

100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z0.025

109
Estimación puntual y por
intervalo
95% de Nivel de Confianza significa que sólo tenemos un 5% de
oportunidad de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos


que para un área de 0.025, corresponde a una Z de 1.960.
C. I. Multiplicador Z/2
99 2.576
95 1.960
90 1.645
85 1.439
80 1.282
Para tamaños de muestra >30, o  conocida usar la distribución Normal
Para muestras de menor tamaño, o  desconocida usar la distribución t
110
Estimación puntual y por
intervalo

 para .n 30  X  Z 
2 n

 para .n 30  X  t ; con n-1 gl.
2 n
( n  1) s 2 ( n  1) s 2
 2

2
2 
, n 1 1 , n 1
2 2

p (1  p )
  p  Z
2
n
111
Instrucciones con Minitab
Intervalo de confianza para la media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

En Options:

Indicar el Confidence level -- 90, 95 o 99%

OK

112
Instrucciones con Minitab
Intervalo de confianza para proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data


Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Seleccionar Use test and interval based in normal distribution

113
Para n grande el IC es pequeño

114
Ejemplo
 Dadas las siguientes resistencias a la tensión: 28.7,
27.9, 29.2 y 26.5 psi

Estimar la media puntual


X media = 28.08 con S = 1.02

Estimar el intervalo de confianza para un nivel de


confianza del 95% (t = 3.182 con n-1=3 grados de
libertad)
Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)

115
Ejemplos para la media con
Distribución normal Z

Z 1. El peso promedio de una muestra de 50 bultos de productos


Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo
de confianza al NC del 95% y al 99% donde se encuentra la media
del proceso (poblacional). Alfa = 1 - NC

2. Un intervalo de confianza del 90% para estimar la ganancia


promedio del peso de ratones de laboratorio oscila entre 0.93 y
1.73 onzas. ¿Cuál es el valor de Z?.

3. 100 latas de 16 onzas de salsa de tomate tienen una media de


Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de
confianza del 95%, las latas parecen estar llenas con 16 onzas?.

4. Una muestra de 16 soluciones tienen un peso promedio de 16.6


onzas con S = 3.63. Se rechaza la solución si el peso promedio de
todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90%
de nivel de confianza?.

116
Ejemplos para la media y varianza
con Distribución t

t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál


es el intervalo donde se encuentra la media y varianza del lote
para un 90% de nivel de confianza?. Grados libertad=20 -1 =19

6. Una muestra de 25 productos tienen un peso promedio de 23.87


grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de
confianza para la media y varianza a un nivel de confianza del
95 y del 98% del peso de productos del lote completo?.

7. Los pesos de 25 paquetes enviados a través de UPS tuvieron


una media de 3.7 libras y una desviación estándar de 1.2 libras.
Hallar el intervalo de confianza del 95% para estimar el peso
promedio y la varianza de todos los paquetes. Los pesos de los
paquetes se distribuyen normalmente.

117
Ejemplos para proporciones con
Distribución Z

Z 8. De 814 encuestados 562 contestaron en forma afirmativa.


¿Cuál es el intervalo de confianza para un 90% de nivel de
confianza?

9. En una encuesta a 673 tiendas, 521 reportaron problemas de


robo por los empleados ¿Se puede concluir con un 99% de nivel
de confianza que el 78% se encuentra en el intervalo de
confianza. ?

118
IV.B.2b Pruebas de hipótesis para
media, varianza y proporción

119
Elementos de una
Prueba de Hipótesis

Prueba Estadística- Procedimiento para decidir no rechazar Ho


aceptando Ha o rechazar Ho.

Hipótesis Nula (Ho) - Usualmente es una afirmación representando


una situación “status quo”. Generalmente deseamos rechazar la
hipótesis nula.

Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar


la hipótesis nula. Ha es lo que queremos probar.

120
Elementos de una
Prueba de Hipótesis

Estadístico de prueba: Calculado con datos de la muestra (Z, t, X2


or F).

Región de Rechazo Indica los valores de la prueba estadística para


que podamos rechazar la Hipótesis nula (Ho). Esta región esta
basada en un riesgo  deseado, normalmente 0.05 o 5%.

121
Pasos en la Prueba de Hipótesis
1. Definir el Problema - Problema Práctico

2. Señalar los Objetivos - Problema Estadístico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

122
Pasos en la Prueba de Hipótesis
5. Establecer las Hipótesis
- Hipótesis Nula (Ho) - Siempre tiene el signo =, , 

Ho : , 2 , , ,  parametrode la hipotesis

- Hipótesis Alterna (Ha) – Tiene signos , > o <.

Ha :  , 2 , , >,  parametro de la hipotesis

El signo de la hipótesis alterna indica el tipo de prueba a usar


123
Pasos en la Prueba de Hipótesis
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el
nivel de confianza NC = 1 - alfa

7. Establecer el tamaño de la muestra, >= 10.

8.Desarrollar el Plan de Muestreo

9.Seleccionar Muestras y Obtener Datos

10. Decidir la prueba estadística apropiada y calcular el


estadístico de prueba (Z, t, X2 or F) a partir de los datos.
124
Estadísticos para medias,
varianzas y proporciones
X 
Z  ;Una.media; n  30;   conocida
/ n
X 
t ;Una.media; n  30;   desconocida
S/ n
S12
F  2 ; DF  n1  1, n2  1; prueba.dos. var ianzas
S2
X1  X 2
t ; dos.medias;  ' s  desconocidas. pero. 
1 1
Sp / 
n1 n2
( n1  1) s12  ( n2  1) s22
Sp  ; DF  n1  n2  2
n1  n2  2
X1  X 2
t ; dos.medias;  ' s  desconocidas.diferentes
2 2
s s
1
 2
n1 n2
DF  formula.especial 125
Estadísticos para medias,
varianzas y proporciones
 Para el caso de muestras pareadas se calculan las
diferencias d individuales como sigue:

d
t ; Pares.de.medias; d i . para.cada. par
Sd / n
( n  1) S 2
X 2
 ; DF  ( n  1); prueba.una.v ar ianza
 2

(O  E ) 2
X 2
 ; DF  ( r  1)(c  1); bondad .ajuste
E

126
Pasos en la Prueba de Hipótesis
11. Obtener el estadístico correspondiente de tablas o Excel.

12.Determinar la probabilidad de que el estadístico de prueba


calculado ocurre al azar.

13.Comparar el estadístico calculado con el de tablas y ver si


cae en la región de rechazo o ver si la probabilidad es menor a
alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.

14.Con los resultados interprete una conclusión estadística


para la solución práctica.
127
Estadístico
Prueba de Hipótesis Calculado con
Pruebas de Hipótesis de dos colas: Datos de la muestra
Ho: a = b Región de Región de
Ha: a  b Rechazo Rechazo

-Z 0 Z
Pruebas de Hipótesis de cola derecha:
Ho: a  b
Ha: a > b Región de
Rechazo

0 Z
Pruebas de Hipótesis cola izquierda:
Ho: a  b
Ha: a < b Región de
Rechazo

-Z 0 Z
Prueba de hipótesis para la varianza
 Las varianzas de la población se ditribuyen de
acuerdo a la distribución Chi Cuadrada. Por tanto las
inferencias acerca de la varianza poblacional se
basarán en este estadístico

 La distribución Chi Cuadrada se utiliza en:


Caso I. Comparación de varianzas cuando la varianza de
la población es conocida

Caso II. Comparando frecuencias observadas y


esperadas de resultados de pruebas cuando no hay
una varianza de la población definida (datos por
atributos)
129
Prueba de hipótesis para la varianza
 Las pruebas de hipótesis para comparar una varianza
poblacional a un cierto valor constante 0, si la
población sigue la distribución normal es:

 Con el estadístico Chi Cuadrada con n-1 grados de


libertad

130
Prueba de hipótesis para la varianza

2.17

Ejemplo: ¿El material muestra una variación (sigma) en la


resistencia a la tensión menor o igual a 15 psi con 95% de
confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.

X^2c =(7)(8)^2/(15)^2 = 1.99


Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe
rechazar la hipótesis nula. Si hay decremento en la resistencia
131
Prueba de hipótesis para atributos
Ejemplo: Un supervisor quiere evaluar la habilidad de 3
inspectores para detectar radios en el equipaje en un
aeropuerto.
¿Hay diferencias significativas para un 95% de confianza?

Valores Inspector Inspector 2 Inspector 3 Total por


observados O 1 tratamiento
Radios 27 25 22 74
detectados
Radios no 3 5 8 16
detectados
Total de la 30 30 30 90
muestra
132
Prueba de hipótesis para atributos
Ho: p1 = p2 = p3
Ha: p1  p2  p3
Grados de libertad = (No. de columnas -1)*(No. renglones -1)
Las frecuencias esperadas son: (Total columna x Total renglón)

Valores Inspector Inspector 2 Inspector 3 Total por


esperados E 1 tratamiento
Radios 24.67 24.67 24.67 74
detectados
Radios no 5.33 5.33 5.33 16
detectados
Total de la 30 30 30 90
muestra
133
Prueba de hipótesis para atributos
El estadístico Chi Cuadrado en este caso es:

5.99

El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de


libertad es 5.99.
El estadístico Chi Cuadrada calculada es menor que Chi de alfa,
por lo que no se rechaza Ho y las habilidades son similares134
Ejemplo de Prueba de hipótesis para la media
Para una muestra grande (n>30)probar la hipótesis de una media u
1.) Ho: 
2.) Ha: 
3.) Calcular el estadístico de prueba
4.) Establecer la región de rechazo
Las regiones de rechazo para prueba de 2 colas: -Z y Z

Zcalc= s
n

Región de Región de
Rechazo Rechazo
0

-Z Z

Si el valor del estadístico de prueba cae en la región de rechazo


rechazaremos Ho de otra manera no podemos rechazar Ho.
Prueba de hipótesis de una población
para muestras grandes con Z
¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?
Probarlo a un 5% de nivel de significancia
Datos
Minoristas n 64 media mu = 2100
Precio prom. X 2251
Desv. Estándar s 812 (Alfa = 0.05
Paso 1. Establecimiento de hipótesis
Ho: uC = 2100 Se inicia con el planteamiento de la hipótesis nula
Ha: uC <> 2100 Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
X   HIPOTESIS.NULA 151 = > Zc = 1.48768473
Zc 
s
101.5 Error estándar
n
Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.( -0.025 ) 136
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene

P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2

Zexcel ( #¡REF! ) Zexcel ( -0.025 )


-1.95996398 1.959963985
Zc = 1.487684729
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para RECHAZAR Ho
Se concluye que el precio promedio no es diferente de $2,100
O Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor
que el valor de Alfa / 2 = 0.025, también nos da el criterio
para NO RECHAZAR la Ho
Paso 5. El Intervalo de confianza para la media poblacional (1-Alfa = 0.95 Porciento)
al nivel de confianza 1-Alfa

s
IC. para.estimar.  X  Z Error estándar
Z alfa/2
101.5
1.95996398
2 n
Intervalo de confianza 2251  198.936344
El intervalo de confianza incluye a la media de la hipótesis
por tanto no se rechaza la Ho. 2052.064 <=  <= ### ) 137
Prueba de hipótesis de una población
para muestras pequeñas con t
Se piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaña publicitaria
Probar esta afirmación a un nivel de significancia alfa de 1%
Se inicia con el planteamiento de la hipótesis Alterna
Datos
Semanas n 15 media mu = 5775
Ventas prom X 6012
Desv. Estándar s 977 (Alfa = 0.01 (1-Alfa = 0.99
(Alfa/2 = 0.005 (1-Alfa/2 = 0.995
Paso 1. Establecimiento de hipótesis

Ho: uC <= 5775


Ha: uV > 5775 Se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba tc

X   HIPOTESIS . NULA 237 = > tc = 0.93950568


tc 
s 252.2603153 Error estándar
NOTA:En excel poner 2alfa
n para obtener t de alfa
Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivo
Paso 3. Determinar la te de Excel o de tablas para Alfa 0.01

te ( 0.99 2.62449406 DIST.T.INV( 0.02 , gl. 14 )


Gl=14; 138
Paso 4. Comparando los valores tc calculado contra t excel se tiene

P(t >= + t excel ) = alfa

texcel ( 0.02 gl. 14)


2.62449406
tc = 0.939505684 Valor p para tc es igual a
P(tc) = 0.368130427
Como tc es menor que texcel, no cae en el área de rechazo, p > Alfa
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la publicidad no ha tenido efecto en las ventas
O Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 99 Porciento)

s
IC. para.estimar.  X  t Error estándar 252.260315
2 n Z alfa/2 2.62449406
Como el intervalo de confianza Intervalo de confianza 6012  662.0557002
contiene a la media Hipótesis no se rechaza Ho 5349.94 <= <=  6674.06 )
139
Instrucciones con Minitab para la
prueba de hipótesis de una media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

Proporcionar la Media de la hipótesis Test Mean

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Indicar el signo de la hipótesis alterna: Less Than, Not equal,


Greater than
OK

140
Prueba de hipótesis
para una proporción con Z
El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.
¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?
Se inicia con el planteamiento de la hipótesis nula
Datos
Clientes n 50 Proporción media = 0.5
30 gastaron p 0.6
menos de$10 (Alfa = 0.05 (1-Alfa = 0.95
(Alfa/2 = 0.025 (1-Alfa/2 = 0.975
Paso 1. Establecimiento de hipótesis

Ho :  c  0.5
Ha :  c  0.5 Se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc

p   HIPOTESIS. NULA 0.1 = > Zc = 1.41421356


Zc 
 HIP. NULA (1   HIP. NULA )
0.07071068 Error estándar
n

Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo

Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975

Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.( 0.975 ) 141


Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene

P(Z <= - Zexcel ) = alfa/2 P(Z>= Zexcel ) = alfa/2

Zexcel ( 0.025 ) Zexcel ( 0.975 )


-1.95996398 1.95996398

Zc = 1.41421356 Valor p para Zc es igual a


P(-Zc) = 0.07926984
Como Zc es menor que Zexcel, no cae en el área de rechazo, p > Alfa /2
y por tanto no hay suficiente evidencia para rechazar Ho y se concluye
que el porcentaje que compra menos de $10 no difiere del 50% de clientes
O Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Porciento)

p (1  p ) Error estándar 0.07071068


IC . para.estimar.  p  Z  Z alfa/2 1.41421356
2 n
Intervalo de confianza 0.6  0.1
Como la media de p = 0.6 se encuentra
dentro del intervalo, no se rechaza Ho ( 0.5 <=   0.7 )
142
Instrucciones con Minitab para la
prueba de hipótesis de una proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data

Number of trials = n tamaño de la muestra


Number of events = D éxitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Proportion Proporción de la hipótesis
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use test and interval based in normal distribution


OK
143
IV.B.2b Pruebas de hipótesis para
comparación de varianzas, medias, y
proporciones

144
Prueba de Hipótesis
 Supongamos que tenemos muestras de dos reactores que
producen el mismo artículo. Se desea ver si hay diferencia
significativa en el rendimiento de “Reactor a Reactor”.
Reactor A Reactor B
89.7 84.7 Estadísticas Descriptivas
81.4 86.1
84.5 83.2 Variable Reactor N Media Desv.Std
84.8 91.9
87.3 86.3 Rendimiento A 10 84.24 2.90
79.7 79.3 B 10 85.54 3.65
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5
Prueba de Hipótesis
Pregunta Práctica: Existe diferencia entre los reactores?

Pregunta estadística ¿La media del Reactor B (85.54) es significativamente


diferente de la media del Reactor A (84.24)? O, su diferencia se da por
casualidad en una variación de día a día.

 Ho: Hipótesis Estadística:  Ha: Hipótesis Alterna: Las


No existe diferencia entre los medias de los Reactores son
Reactores diferentes.

Ho:  a   b
Ha:  a   b

Se busca demostrar que los valores observados al parecer no


corresponden al mismo proceso, se trata de rechazar Ho.
146
Prueba de Hipótesis

 Hipótesis Estadística: No  Hipótesis Alterna: Cuando las


existe diferencia entre los medias de Reactores son
Reactores
diferentes. A esto se le llama
 Esto se llama Hipótesis Nula Hipótesis Alterna (Ha)
(Ho)

Debemos demostrar que los valores que observamos al parecer no


corresponden al mismo proceso, que la Ho debe estar equivocada

147
¿Qué representa esto?

Reactor A Reactor B

B B B B B BB BB B
A AA AAAA A A
80.0 82.5 85.0 87.5 90.0 92.5
¿Representan los reactores dos procesos diferentes?

¿Representan los reactores un proceso básico?


148
Prueba F de dos varianzas
 Si se toman dos muestras de dos poblaciones normales con
varianzas iguales, la razón de sus varianzas crea una
distribución muestral F. Las hipótesis son las siguientes:

 El estadístico F se muestra a continuación donde S1 se


acostumbra tomar como la mayor

149
Prueba F de dos varianzas

 Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de


confianza se puede concluir que hay menor variación?

Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2


Grados de libertad para Var1 = 8 y para var 2 = 6

Falfa = F(0.05, 8, 6) = 4.15


Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza Ho.
Hay evidencia suficiente para indicar que la variación ya se ha
reducido
150
Prueba de hipótesis de dos pob.
comparando varianzas con F
Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .
A un nivel de siginificancia del 5% ¿Qué se puede concluir?

Método 1 Método 2
No. De CDs n1 15 n2 17 Alfa/2 0.025
Desv. Estan. s1 5.4 X2 4.8
Varianza s12 29.16 s22 23.04

Paso 1. Establecimiento de hipótesis

Ho :  12   22
Ha :  12   22 Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba Fc


Grados de libertad
2
s 1.266 Numerador = n1 - 1 = 14
Fc  1
2 Denominador = n2 - 1 = 16
s
2

Tomamos a s12 como el mayor para comparar Fc contra Fexcel (1- Alfa/2)

Paso 3. Determinar la Fe de Excel o de tablas para Alfa/2 0.025

Fe (0.975) = 2.81701784 DIST.F.INV (0.025, 14,16)


151
Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene

f(F)

P(F>= + 2.81 ) = alfa/2

Fe(0.025) = 2.81701784

Fc = 1.266 Valor p para Fc es igual a


P(Fc) = 0.32259599
Como Fc es menor que Fexcel, no cae en el área de rechazo, p > Alfa / 2
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la varianza de los dos métodos de ensamble no difieren
significativamente
152
Instrucciones con Minitab para la
comparación de dos varianzas

Stat > Basic Statistics > 2-variances

Seleccionar samples in different columns o Summarized data


First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

OK

153
Prueba de hipótesis de dos pob.
Comparando dos medias con Z
Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacas
Las varianzas poblacionales son desconocidas
Determinar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10

Vacas vacaciones Vacas normales


Vacas n1 50 n2 50
Peso promedio X1 112 X2 105.7
Desv. Estándar s1 32.3 s2 28.7

Paso 1. Establecimiento de hipótesis

Ho :  VV   VN Como el planteamiento es que las vacas de vacaciones


Ha :  VV   VN ganan más peso, se inicia planeando la Ha

Paso 2. Cálculo del estadístico de prueba Zc

X1  X 2 6.3 = > Zc = 1.03099301


Zc 
s12 s 23
 6.110613717
n1 n 2

Tomamos a X1 como el mayor para comparar Zc contra Ze positiva

Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1

Ze (0.90) = 1.28155157 DIST.NORM.STAND.INV (0.90) 154


Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene

P(Z>= + 1.28) = 0.90

Ze (0.90)= 1.28
Zc = 1.03099301 Valor p para Zc es igual a
P(-Zc) = 0.149402368
p > Alfa
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia entre vacas de vacaciones y normales
Paso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:

s12 s 22
 X 1 X 2   = Error estándar 6.11061372
n1 n2 Z (alfa/2) = 1.64485363

( X 1  X 2 )  Z / 2 s X 1 X 2 = Intervalo de confianza
6.3 + - 10.05106514
La diferencia es del orden de cero,es decir ( -3.75107 < = u < = 16.3511 )
155
Prueba de dos medias
muestras pequeñas

Sigmas descono-
cidas e iguales

Sigmas desconocidas
y desiguales 156
Prueba de hipótesis de dos pob.
Comparando dos medias con t
Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendas
Las varianzas de las dos poblaciones son iguales pero desconocidas  1   2
2 2

Determinar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)


Tienda 1 Tienda 2
Semanas n1 12 n2 15
Ventas promedio X1 125.4 X2 117.2
Desv. Estandar s1 34.5 s2 21.5

Paso 1. Establecimiento de hipótesis

Ho :  T 1   T 2
Ha :  T 1   T 2 Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba tc

s12 (n1  1)  s 22 (n2  1) 19564.25 Sp2 = 782.57


s 
2

n1  n2  2
p
25

X1  X 2 8.2 = > tc = 0.75684444


tc 
s 2p s 3p 10.8344589

n1 n2
Tomamos a X1 como el mayor para comparar tc contra te positiva
Si se toma a X1 como la media menor se debe comparar Zc contra -Ze

Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005
Se tienen n1 + n2 - 2 grados de libertad o sean 25
te (0.01) = 2.78743581 DIST.T.INV (0.01, 25)
157
Asi es para dos colas
Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene

P(t<=-2.787 ) = alfa/2 P(t>=2.787 ) = alfa/2

te(0.01,25) = -2.787 te(0.01, 25) = 2.787


Valor p para tc es igual a
tc = 0.7568 P(tc) = 0.46025521
p > Alfa / 2
Como tc es menor que texcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia sig. En las ventas de las dos tiendas
Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
s 2p s 2p
 = Error estándar 10.8344589
n1 n2
s 2p s 2p = Intervalo de confianza (8.2 + - 2.787*10.83)
( X 1  X 2 )  t / 2 
n1 n2
( -21.98 <= u <= 38.38)
158
Se observa una diferencia positiva sin embargo el cero está incluido
Instrucciones con Minitab para la
comparación de dos medias

Stat > Basic Statistics > 2-Sample t

Seleccionar samples in different columns o Summarized data


First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2
Seleccionar o no seleccionar Assume equal variances de acuerdo a
los resultados de la prueba de igualdad de varianzas

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Difference (normalmente 0)
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
159
Prueba de hipótesis de dos pob.
Comparando dos proporciones con Z
Investigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los
bonos de ingresos.
Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.
Convertibles Ingresos
Bonos n1 312 n2 205 Alfa 0.1
Sobrevalorad X1 202 X2 102 1-Alfa 0.9
7.8
p1 0.647 p2 0.498 Fracción de las muestras
Paso 1. Establecimiento de hipótesis
Ho :  1   2  0....otra. forma....Ho :  1   2
Por tanto se trata de una prueba de cola derecha
Ha :  1   2 > 0..........................Ha :  1 >  2
Paso 2. Cálculo del estadístico de prueba Zc
p1  p 2 0.150 = > Zc = 3.393046759
Zc 
p1 (1  p1 ) p 2 (1  p 2 )
 0.04417119
n1 n2
Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)
Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa 0.9
Ze (0.9) = 1.28155157 DIST.NORM.STAND.INV (0.9)
160
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene

Zc = 3.39304676

P(Z>= + 1.28 ) = Alfa

Ze(0.9) = 1.281551566
Valor p para Zc es igual a
P(-Zc) = 0.00034946
p < Alfa
Como Zc es mayo que Zexcel, si cae en el área de rechazo,
y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha
Se concluye que la diferencia en conv. entre los bonos es significativa
Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
p1 (1  p1 ) p2 (1  p2 )
s p1 p 2   = Error estándar 0.044171193
n1 n2 Zexcel (para alfa/2) 1.644853627

( p1  p 2 )  Z  / 2 s p1 p 2 = Intervalo de confianza ( 0.150  0.07265515


Se observa difererencia positiva entre proporciones ( 0.077 <= PI <= 0.223
el cero no está incluido en el intervalo
161
Instrucciones con Minitab para la
prueba de hipótesis de dos proporciones

Stat > Basic Statistics > 2-Proportions

Seleccionar Summarized Data


Trials: Events:
First: No. de elementos de la 1ª. Muestra y D1 éxitos encontrados
Second: No. de elementos de la 2ª. Muestra y D2 éxitos encontrados

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Difference Normalmente 0
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use pooled estimate of p for test


OK
162
IV.B.3 Prueba de datos pareados

163
Prueba de hipótesis de dos pob.
Comparando datos pareados con t
Las muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación
estándar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.
Paso 1. Establecimiento de Hipótesis
Ho : 1   2
Ha : 1   2 Grados de libertad = No. de pares - 1
No. Pares de muestras n = 25
Paso 2. Se calcula el estadístico tc: Diferencia media = 45.2
Desv. Estándar de difs. = 21.6
Alfa 0.05
d gl = 24
tc  = 10.462963
sd
n
Paso 3. Se determina el valor crítico del estadístico t de Excel o tablas para Alfa / 2 0.025

t excel = 2.06389855 DISTR.T.INV(0.05, 24) Excel divide entre 2 colas


164
Paso 4. Comparando el estadístico tcalculado contra t excel (0.025, 24) se tiene:
tc = 10.462963

P(t<=-2.063 ) = alfa/2 P(t>=2.063 ) = alfa/2

te(0.025,24) = -2.063 te(0.025, 24) = 2.063


Valor p para tc es igual a
P(t > tc) = 0
p < Alfa / 2
Como tc es mayor que t excel, si cae en el área de rechazo,
y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Ha
se concluye que si hay diferencia significativa entre las medias
Paso 5. El intervalo de confianza para las diferencias en medias pareadas es
t alfa/2 = 2.063
Error estándar = 0.864
Dif. Promedio = 45.2
sd
I .C. para. d  d  t / 2 45.2 +- 0.864
n
Se observa diferencia positiva significativa entre diferencia de medias 43.4176 <= dm < =46.9824
165
Instrucciones con Minitab para la
comparación de dos medias pareadas

Stat > Basic Statistics > Paired t

Seleccionar samples in columns o Summarized data


First sample - Indicar la columna de datos de la muestra 1
Second sample - Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Mean (normalmente 0)
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK

166
Robustez
 Los procedimientos estadísticos se basan en
supuestos acerca de su comportamiento teórico.
Cuando los estadísticos obtenidos no son afectados
por desviaciones moderadas de su expectativa
teórica, se dice que son robustos.

167
Resumen

168
IV.B:4 ANOVA para un factor

169
Introducción
 Cuando es necesario comparar 2 o más medias poblacionales al
mismo tiempo, para lo cual se usa ANOVA.

 El método ANOVA tiene los siguientes supuestos:


 La varianza es la misma para todos los tratamientos del

factor en todos sus niveles


 Las mediciones indiviudales dentro de cada tratamiento se

distribuyen normalmente
 El término de error tiene un efecto distribuido normalmente

e independiente

170
Introducción
 Con el ANOVA las variaciones en la respuesta se dividen
en componentes que reflejan los efectos de una o más
variables independientes

 La variabilidad se representa como la suma de cuadrados


total que es la suma de cuadrados de las desviaciones de
mediciones individuales respecto a la gran media, se
divide en:
 Suma de cuadrados de las medias de los tratamientos

 Suma de cuadrados del residuo o error experimental

171
ANOVA – Prueba de hipótesis para
probar la igualdad de medias de
varias poblaciones para un factor
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)

Ho : 1   2  3  .........   a
Ha : A lg unas. ' s.son.diferentes
172
ANOVA - Condiciones
 Todas las poblaciones son normales

 Todas las poblaciones tiene la misma varianza

 Los errores son independientes con distribución


normal de media cero

 La varianza se mantiene constante para todos los


niveles del factor

173
ANOVA – Ejemplo de datos
Niveles del Factor Peso % de algodón y Resistencia de tela
Peso porc. Respuesta
de algodón Resistencia de la tela
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
174
ANOVA – Suma de
cuadrados total

Xij

Gran media

Xij
a b 2

SCT    ( Xij  X )
i 1 j 1
175
ANOVA – Suma de cuadrados de
renglones (a)-tratamientos
Media Trat. 1 Media Trat. a

a renglones
Gran media

Media trat. 2
SCTr   b( X i  X ) 2

i 1
176
ANOVA – Suma de cuadrados
del error
X2j X3j
X1j

Media X1.
Media X3.
Media X2.

Muestra 1 Muestra 2 Muestra 3

a b
SCE   (X ij  X i) 2

i 1 j 1 177
ANOVA – Suma de cuadrados
del error
X2j X3j
X1j

Media X1.
Media X3.
Media X2.

Muestra 1 Muestra 2 Muestra 3

SCE  SCT  SCTr


178
ANOVA – Grados de libertad:
Totales, Tratamientos, Error

gl.SCT  n  1
gl.SCTr  a  1
gl.SCE  (n  1)  (a  1)  n  a
179
ANOVA – Cuadrados medios:
Total, Tratamiento y Error

MCT  SCT /( n  1)
MCTr  SCTr /( a  1)
MCE  SCE /( n  a )

180
ANOVA – Cálculo del estadístico
Fc y Fexcel

MCTr
Fc 
MCE
Fexcel  FINVALFA, gl.SCTr , gl.SCE

181
Tabla final de ANOVA
TABLA DE ANOVA

FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F


CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME

Dentro de muestras (error) SCE n-a CME

Variación total SCT n-1 CMT

Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa
o si el valor p correspondiente a la Fc es menor al valor de alfa especificado

182
ANOVA – Toma de decisión

Distribución F Fexcel

Alfa

Zona de no rechazo de Ho Zona de rechazo


O de no aceptar Ha De Ho o aceptar Ha

Fc
183
ANOVA – Toma de decisión

Si Fc es mayor que Fexcel se rechaza Ho


Aceptando Ha donde las medias son diferentes

O si el valor de p correspondiente a Fc es
menor de Alfa se rechaza Ho

184
ANOVA – Identificar las medias
diferentes por Prueba de Tukey T
CME
T  q , a , n  a
b
Para diseños balanceado
(mismo número de columnas
en los tratamientos) el valor
de q se determina por medio
de la tabla en el libro de texto
185
ANOVA – Identificar las medias
diferentes por Prueba de Tukey T
Se calcula la diferencia Di entre cada par de Medias Xi’s:

D1 = X1 – X2 D2 = X1 – X3 D3 = X2 – X3 etc.

Cada una de las diferencias Di se comparan con el


valor de T, si lo exceden entonces la diferencia es
Significativa de otra forma se considera que las medias
Son iguales

186
ANOVA – Identificar las medias
diferentes por Prueba de Diferencia
Mínima Significativa DMS

2(CME ) F ,1,na
DMS 
b
Para diseños balanceados (los tratamientos
tienen igual no. De columnas), se calcula un
factor DMS contra el que se comparan las
diferencias Xi – Xi’. Significativas si lo exceden
187
Prueba DMS para Diseños no
balanceados
1 1
DMS j ,k     (CME ) F ,a 1,n  a
 b j bk 
Para diseños no balanceados (los
tratamientos tienen diferente no. De
columnas), se calcula un factor DMS
Para cada una de las diferencias Xi – Xi’
188
Ejemplo:
 Considerar un experimento de un factor (máquina)
con tres niveles (máquinas A, B, C). Los datos se
muestran a continuación y debe verificarse si existe
diferencia significativa a un alfa = 0.05

Máquinas Datos Su Prom.


ma

189
Ejemplo:

La tabla completa de ANOVA es la siguientes:


Fuentes Cuadrado
De variación medio
Máquinas

Como el valor calculado de F(33.2) excede el valor crítico de F, se


rechaza la Hipótesis nula Ho 190
Ejemplo:
 Con Minitab: Stat>ANOVA>One way unstacked
 Responses (in separate columns) A B C
 Interpretar los resultados

A B C

5 2 1
7 0 0
6 1 -2
7 -2 -3
6 2 0

191
Ejemplo:
One-way ANOVA: A, B, C
Source DF SS MS F P

Factor 2 137.20 68.60 33.19 0.000 Rechazo Ho


Error 12 24.80 2.07
Total 14 162.00
S = 1.438 R-Sq = 84.69% R-Sq(adj) = 82.14%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ---------+---------+---------+---------+
A 5 6.200 0.837 (-----*----)
B 5 0.600 1.673 (----*-----)
C 5 -0.800 1.643 (-----*----)
---------+---------+---------+---------+
0.0 2.5 5.0 7.5
Pooled StDev = 1.438

192
Corrida en Minitab
 Se introducen las respuestas en una columna C1
 Se introducen los subíndices de los renglones en una
columna C2 Durability Carpet
18.95 1
12.62 1
11.94 1
14.42 1
10.06 2
7.19 2
7.03 2
14.66 2
193
Corrida en Minitab
 Opción: stat>ANOVA – One Way (usar archivo
Exh_aov)
 En Response indicar la col. De Respuesta (Durability)

 En factors indicar la columna de subíndices (carpet)


 En comparisons (Tukey)

 Pedir gráfica de Box Plot of data y residuales Normal


Plot y vs fits y orden

 Si los datos estan en columnas pedir ANOVA – One


Way (unstacked) 194
Resultados
One-way ANOVA: Durability versus Carpet
Source DF SS MS F P
Carpet 1 45.1 45.1 3.97 0.093 -> No hay diferencia entre las medias
Error 6 68.1 11.3
Total 7 113.1
S = 3.368 R-Sq = 39.85% R-Sq(adj) = 29.82%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
1 4 14.483 3.157 (----------*-----------)
2 4 9.735 3.566 (-----------*-----------)
----+---------+---------+---------+-----
7.0 10.5 14.0 17.5
Pooled StDev = 3.368
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons among Levels of Carpet
Individual confidence level = 95.00%
Carpet = 1 subtracted from:
Carpet Lower Center Upper -+---------+---------+---------+--------
2 -10.574 -4.748 1.079 (-----------*----------)
-+---------+---------+---------+--------
-10.0 -5.0 0.0 5.0
195
IV.B.5 Uso de Prueba Chi2 (2)

196
¿Para qué se utiliza?

1. Para probar si una serie de datos


observada, concuerda con el modelo (serie
esperada) de la información.

2. Para probar las diferencias entre las


proporciones de varios grupos (tabla de
contingencia).
Para todos los casos, Ho: No hay diferencia
Ha: Hay diferencia

2
197
Ejemplo 1: Chi Cuadrada( 2 )

Se lanza una moneda al aire 100 veces y que


obtenemos 63 águilas y 37 soles.

¿La proporción de águilas y soles sucede por


casualidad? O, se concluye que la moneda está
“cargada”?

Ho: La moneda es buena

Ha: La moneda “está cargada”

198
Ejemplo 1: Chi Cuadrada( 2 )

Observada Esperada (fo - fe)2


( fo ) ( fe ) fe

Aguilas 63 50 3.38
Soles 37 50 3.38
 2 = 3.38 + 3.38
 2 = 6.76

Estadístico Chi Cuadrada


g (fo - fe)2
 2 c= 
j=1
fe

199
Ejemplo 1: Chi cuadrada
Función de Distribución Acumulada Chi2 con 1 grado de
libertad (d.f)
2c P(2c > x)
6.7600 p = 1 - 0.9907 = 0.0093

De tablas X2Crítica, (0.05, 1) = 3.8414

Ho: La moneda es buena.


Ha: La moneda está “cargada”.

Para un 95% de confianza antes de concluir que la moneda “está


cargada”, se requiere que X2c > X2Crítica o que el valor de p sea 
0.05.

Como p  0.05, se puede concluir -con un 95% de confianza -


que la moneda “está cargada”.
200
Cálculo en Excel del estadístico Chi cuadrada

1. Posicionarse en una celda vacía

2. Accesar el menú de funciones con Fx

3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad,


normalmente (n - 1) para un parámetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.

201
Tabla de contingencia
 Una tabla de clasificación de dos vías (filas y columnas) que
contiene frecuencias originales, se puede analizar para
determinar si las dos variables (clasificaciones) son
independientes o tienen una asociación significativa.

 La prueba Chi Cuadrada probará si hay dependencia entre las


dos clasificaciones.

 Además se puede calcular el coeficiente de contingencia


(correlación) que en todo caso muestra la fuerza de la
dependencia

202
Tabla de contingencia
 Para esta prueba se usa la prueba Chi Cuadrada donde:

 Entre mayor sea su valor, mayor será la diferencia de la


discrepancia entre frecuencias observadas y teóricas. Esta
prueba es similar a la de bondad de ajuste.

203
Tabla de contingencia
 Ejemplo: Cada una de las 15 celdas hace una contribución al
estadístico Chi Cuadrado (una celda)

 Asumiendo Alfa = 0.1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 Chi-


Cuadrado de alfa = 20.09
 Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de
igualdad de resultados entre negocios

204
Ejemplo 2: Chi2 Para comparación de dos
grupos; ¿son las mismas proporciones?)
Ho: No existen diferencias en los índices de defectos de las dos máquinas.
Ha: Existen diferencias en los índices de defectos de las dos máquinas.

Los valores observados (fo) son los siguientes:

Partes buenas Partes defectuosas

máquina 1 fo = 517 fo = 17 Total = 534

máquina 2 fo = 234 fo = 11 Total = 245


779
Total 751 28

El índice de defectos totales es 28 / 779 = 3.6%


Ejemplo 2: Chi2 Para comparación de dos
grupos; ¿son las mismas proporciones?)
Cálculo de los valores esperados

Partes buenas Partes defectuosas

máquina 1 fo = 751*534/779 fo = 28*534/779 Total = 534

máquina 2 fo = 751*245/779 fo = 28*245/779 Total = 245


779
Basados en este índice, los valores esperados (fe) serían:
Partes Partes defectuosas
buenas
máquina 1 530.53 3.47

máquina 2 233.47 1.53


Prueba de chi cuadrada:
Los conteos esperados están debajo de los conteos observados
Partes buenas Partes Defectuosas Total
1 532 2 534
530.53 3.47

2 232 3 235
233.47 1.53
Total 764 5 769

Chi2 = 0.004 + 0.624 + 0.009 + 1.418 = 2.056


DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0

Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en  20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deberá usarse Chi2.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categorías pueden ser de utilidad.
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reducción de tiempo de ciclo.

Variación en familias a probar


Operador a operador
Ho: No existe diferencia en los índices de defecto de los diferentes
operadores
Ha: Existe diferencia en los índices de defecto de los diferentes
operadores

Máquina a máquina
Ho: No existe diferencia en los índices de defecto de las diferentes
máquinas
Ha: Existe diferencia en los índices de defecto de las diferentes
máquinas

Tamaño de la muestra:
5000 + total de oportunidades (172 piezas)
Prueba de chi2 (máquina a máquina)
Los conteos esperados están colocados debajo de los conteos observados
Con fugas Sin fugas Total
1 30 610 640
32.11 607.89

2 235 4217 4452


223.38 4228.62

3 3 253 256
12.84 243.16

4 18 334 352
17.66 334.34

Total 286 5414 5700

Chi2 = 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +


0.000 = 8.734
DF= (4-1)(2-1) = 3; valor P = 0.033
Prueba de chi2 (operador a operador)
Los conteos esperados están colocados debajo de los conteos observados.
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036


208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Total 278 5102 5380

Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
(en este caso, operador a operador y máquina a máquina)

Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave


para determinar qué grupo de variación debe investigarse primero.

Coeficiente de Chi Cuadrada


x 100
Contingencia N
Chi2 N CC

Máquina 8.734 5700 0.15

Operador 171.132 5380 3.18


Controlador Mayor
SI el tamaño de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevará a la misma ruta que hubiera alcanzado con sólo ver la
estadística Chi2.

Sin embargo, si N tiene una variación considerable, dependiendo del grupo de


variación que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qué grupo debe investigarse primero.
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
(en este caso, operador a operador y máquina a máquina)
Ahora que la información nos
ha llevado a investigar a los Con gotera Sin gotera Total
grupos de operador a 1 6 122 128
operador. ¿Qué debemos 6.61 121.39
hacer ahora?
Encontremos cuál de los 2 1 127 128
operadores estaban fuera del 6.61 121.39
estándar.
¿Era alguno de ellos 3 200 3836 4036
notablemente peor (o mejor) 208.55 3827.45
que el resto?
Mucho peor que 4 54 202 256
lo esperado 13.23 242.77

Mucho mejor que 5 5 699 704


lo esperado 36.38 667.62

6 12 116 128
6.61 121.39
(Estos mismos operadores fueron quienes
tuvieron los números más grandes de chi2)
Operador a operador: = 0.000
Rechace
Ho y acepte Ha
(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 están fuera del estándar:


El operador 4 es notablemente peor que el resto,
El operador 5 es notablemente mejor que los demás

¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias
pueden existen en sus técnicas.

El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a


soldar este producto en particular.

El operador 5 encontró un modo de mejor de hacer el ensamble, con lo cual consiguió mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonómica. Se añadió
un colocador para ensamblar la parte en forma segura. (Esto también redujo el tiempo que
requerían los operadores para “acostumbrarse” a trabajar en esta forma)
Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos


X en un aeropuerto para detectar artículos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenían. Los resultados
se resumen a continuación:
Inspectores
1 2 3

Radios detectados 27 25 22
Radios no detectados 3 5 8

¿Con un 95% de confianza, existe una diferencia entre los


inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferente


Grados de libertad = (columnas - 1) ( filas -1)
Ejercicios

2. Se quiere evaluar si hay preferencia por manejar en un


carril de una autopista dependiendo de la hora del día. Los
datos se resumen a continuación:

Hora del día


Carril 1:00 3:00 5:00
Izquierdo 44 37 18
Central 28 50 72
Derecho 8 13 30

¿Con un 95% de confianza, existe una diferencia entre las


preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferente


Grados de libertad = (columnas - 1) ( filas -1)
IV.B.6 Pruebas de Hipótesis
no paramétricas

216
Pruebas no paramétricas
 Las pruebas paramétricas asumen una distribución para la
población, tal como la Normal

 Las pruebas no paramétricas no asumen una distribución


específica de la población

 Bajo los mismos tamaños de muestra la Potencia o probabilidad


de rechazar Ho cuando es falsa es mayor en las pruebas
paramétricas que en las no paramétricas

 Una ventaja de las pruebas no paramétricas es que los


resultados de la prueba son más robustos contra violación de
los supuestos

217
Prueba de Hipótesis

Variable Atributo

No Normal Tablas de
Contingencia de

Varianza Medianas
Correlación
Correlación
Homogeneidad
Prueba de signos
de la Variación
de Levene Wilcoxon
Normal
Mann-
Whitney Variancia Medias
Kurskal-
Wallis Pruebas de t
Prueba-F Muestra-1
Residuos
Prueba de Mood Muestra-2
Homogeneidad distribuidos
Friedman de la Variación ANOVA
de Bartlett Una vía normalmente
Dos vías
Correlación
Regresión
Resumen de pruebas de Hipótesis
Datos Normales Datos No Normales
Pruebas de Variancias
Pruebas de Varianzas
X2 : Compara la variancia de una Homogeneidad de la varianza de
muestra con una variancia de un Levene : Compara dos o más
universo conocido. varianzas de muestras de la misma
población.
Prueba F : Compara dos varianzas
de muestras.

Homogeneidad de la variancia de
Bartlett: Compara dos o más
varianzas muestras de la misma
población.

219
Resumen de pruebas de Hipótesis
Datos Normales Datos No Normales
Pruebas de los Promedios Pruebas de la Mediana

Prueba t de 1 muestra : Prueba si el promedio Prueba de signos o Prueba Wilcoxon : Prueba


de la muestra es igual a un promedio si la mediana de la muestra es igual a un valor
conocido o meta conocida. conocido o a un valor a alcanzar.
Prueba t de 2 muestras : Prueba si los dos Prueba Mann-Whitney : Prueba si dos medianas
promedios de las muestras son iguales. de muestras son iguales.
ANOVA de un factor: Prueba si más de dos Prueba Kruskal-Wallis: Prueba si más de dos
promedios de las muestras son iguales. medianas de muestras son iguales. Asume que
ANOVA de dos factores : Prueba si los todas las distribuciones tienen la misma forma.
promedios de las muestras clasificadas Prueba de la mediana de Mood : Otra prueba
bajo dos categorías, son iguales. para más de dos medianas. Prueba más firme
para los valores atípicos contenidos en la
Correlación : Prueba la relación lineal entre información.
dos variables. Prueba Friedman : Prueba si las medianas de las
muestras, clasificadas bajo dos categorías, son
Regresión : Define la relación lineal entre una iguales.
variable dependiente y una independiente. Correlación : Prueba la relación lineal entre dos
(Aquí la "normalidad" se aplica al valor variables.
residual de la regresión)
220
Acciones a tomar con datos No Normales
Revise y asegúrese de que los datos no siguen una distribución normal.

• Desarrollar una Prueba de normalidad (para verificar realmente lo


anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

• Desarrollar una Prueba de Corridas (para verificar que no existen


sucesos no aleatorios que puedan haber distorsionado la información)

• Revisar la información para detectar errores (tipográficos, etc.).


Investiguar los valores atípicos.

• Una muestra pequeña (n < 30) proveniente de un universo normal, se


mostrará algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:


- Raíz cuadrada de todos los datos
- Logaritmo de todos los datos
- Cuadrado de todos los datos

• Si la información es todavía anormal, entonces usar las herramientas no


paramétricas.
Definiciones
 Promedio : Es la media aritmética de la información. Es la suma de todos
los datos, dividida entre el número de datos de referencia.

 Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
ascendente (en caso de datos pares, obtener promedio).

 Moda : Valor que se repite con más frecuencia sobre el conjunto de datos.
Ejemplo:
Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar
listas para ir a trabajar, en las mañanas. Sus respuestas (en minutos) se
muestran más adelante. ¿Cuáles son el promedio y la mediana para esta
muestra?

30, 37, 25, 35, 42, 35, 35, 47, 45, 60


39, 45, 30, 38, 35, 40, 44, 55, 47, 43
Un dibujo dice más que mil palabras

Promedio
Mediana

28.0 35.0 42.0 49.0 56.0 63.0


-------+---------+---------+---------+---------+---------+------ C1

Promedio = 40.35 Mediana = 39.5

El promedio puede estar influenciado considerablemente por los


valores atípicos porque, cuando se calcula un promedio, se incluyen los
valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las


observaciones, independientemente de los valores reales de los
valores atípicos, ya que es la que sencuentra en la posición media de
los valores ordenados.
Pruebas Alternativas comúnmente usadas
Pruebas para datos No normales Analogía con datos normales

• Prueba de Corridas : Calcula la • Prueba de Corridas (la misma


probabilidad de que un X número de prueba para ambos tipos de
puntos de referencia, esté por encima o información)
por debajo del promedio aleatoriamente.

• Prueba de signos, de 1 muestra : • Prueba t de una muestra


Prueba la probabilidad de que la
mediana de la muestra, sea igual al valor
hipotético.

• Prueba Mann-Whitney : Comprueba el • Prueba t de 2 muestras


rango de dos muestras, por la diferencia
entre dos medianas del universo.

• Prueba de la Mediana de Mood : • ANOVA de un factor


Prueba para más de dos medianas del
universo. Más robusta para los valores
atípicos o para los errores en la
información.
Prueba de Rachas
Considere los siguientes datos (que se muestran aquí en orden cronológico):
325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,
320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

Es importante tener los datos registrados en orden cronológico.

Una representación gráfica de los datos se asemeja a esto:


600

500 Promedio
Primera 400

"corrida" 300

200

100

Segunda ”racha"

Racha: Un punto o una serie consecutiva de puntos que caen


en un lado del promedio.
Número total de Rachas: 12
Número total de puntos > al promedio: 11
Número total de puntos < al promedio: 18
Prueba de Rachas
Ho: Los datos son aleatorios
Ha:Los datos NO so aleatorios

Prueba de Rachas
Promedio K = 184.4483 Promedio

Número de rachas observado = 12

Número de rachas esperado = 14.6552


=> No se rechaza Ho Este es el valor p
de las Prueba de
11 observaciones por encima de K; 18 por Corridas
debajo
La prueba es significativa en p= 0.2860
No se puede rechazar Ho con valor alfa = 0.05

Ya que p > 0.05, no podemos rechazar la hipótesis nula.


Los datos son aceptados, siendo aleatorios.
Cálculos de la Prueba de Rachas
El estadístico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2)


DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12; n1 = 11n2 = 18

MediaG = 14.655 DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687


P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crítico de 0.05, no rechazándose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de


valores críticos para el número de Rachas G
Corrida con Minitab
 Stat > Nonparametrics > Runs Test
Variable C1, Above and below the mean

Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
P > 0.05
No rechazar
Ho 228
Prueba de Signos de la Mediana

Ho : La mediana de la muestra es igual a la mediana de la hipótesis


Ha : Las medianas son diferentes

Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0


Ha: Valor de la mediana diferente de 115.0

N DEBAJO IGUAL ENCIMA VALOR P MEDIANA


29 12 0 17 0.4576 144.0

Ya que p >0.05, no se puede rechazar la hipótesis nula.


No se puede probar que la mediana real y la mediana hipotética son
diferentes.

En las páginas siguientes se muestra el detalle del cálculo.


Cálculos de la Prueba de Signos de la Mediana

Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a


mayor se tiene: n = 29, Mediana de Ho = 115

No. Valor Signo No. Valor Signo No. Valor Signo


1 0 - 11 110 - 21 220 +
2 50 - 12 110 - 22 240 +
3 56 - 13 120 + 23 290 +
4 72 - 14 140 + 24 309 +
5 80 - 15 144 + 25 320 +
6 80 - 16 145 + 26 325 +
7 80 - 17 150 + 27 400 +
8 99 - 18 180 + 28 500 +
9 101 - 19 201 + 29 507 +
10 110 - 20 210 +

Con la mediana en 144. Si el valor contra el cual se desea


probar es 115, entonces hay 12 valores por debajo de el (-) y 17
valores por arriba (+).
Cálculos de la Prueba de Signos de la Mediana

El estadístico X es el el número de veces que ocurre el signo menos


frecuente, en este caso el 12 (-).

Cómo n  25, se calcula el estadístico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5  n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierda


en forma similar P(Z2) 0-2288 para la cola derecha, por lo que la
probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de


valores críticos para la prueba de signo.
Prueba de Signos de la Mediana

¿Es esto correcto?¿144 podría ser igual a 115?


Bueno, veamos una gráfica de la información

0 100 200 300 400 500

115 144
Después de todo, tal vez
esto SEA lo correcto.
Corrida en Minitab
 Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative Not equal
Sign Test for Median: Signos
Sign test of median = 115.0 versus not
= 115.0

N Below Equal Above


P Median
Signos 29 12 0 17
0.4583 144.0
Como P > 0.05 no se rechaza Ho y la mediana es 115

233
Prueba de Signos de la Mediana
Para observaciones pareadas

Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B


Ha: p<>0.5
Ama Limpiador
Casa A B
1 10 7
2 7 5
¿Hay evidencia que indique
cierta preferencia de las amas
3 8 7
de casa por lo limpiadores?
4 5 2
5 7 6
6 9 6 234
Prueba de Signos de la Mediana
Producto
Familia A B Media = 0.5*n
1 - + Desv. Estand.= 0.5*raiz(n)
2 - +
3 + - Zc = (Y – media) / Desv. Estánd.
4 - + Rechazar Ho si Zc ><Zalfa/2
5 0 0
6 - +
7 - + ¿Hay evidencia que indique
8 + - cierta preferencia por un
9 - + Producto A o B?
10 - +
11 - +
235
Prueba de Signos de la Mediana

Media = 0.5*11 = 5.5


Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 – 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

Como Zc < Zexcel no se rechaza Ho o


Como p value = 0.067 > 0.025
No hay evidencia suficiente de que los
Consumidores prefieran al producto B
236
Prueba rango con signo de Wilconox
 Es la alternativa no paramétrica de la prueba paramétrica de muestras
pareadas
 Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario
Trabaja Método Método Diferen Abs(difere Rango
dor 1 2 cias n.) Rango c/signo
1 10.2 9.5 0.7 0.7 8 8
2 9.6 9.8 -0.2 0.2 2 -2
3 9.2 8.8 0.4 0.4 3.5 3.5
4 10.6 10.1 0.5 0.5 5.5 5.5
5 9.9 10.3 -0.4 0.4 3.5 -3.5
6 10.2 9.3 0.9 0.9 10 10
7 10.6 10.5 0.1 0.1 1 1
8 10 10 0 0 Eliminar
9 11.2 10.6 0.6 0.6 7 7
10 10.7 10.2 0.5 0.5 5.5 5.5
11 10.6 9.8 0.8 0.8 9 9
T =237
44
Prueba rango con signo de Wilconox

Distribución muestral T para poblaciones idénticas


Se aproxima a la distribución normal para n >= 10

T 0 T 
n(n  1)( 2n  1)
6
En este caso n = pares eliminando las que son iguales con dif. = 0 para el
trabajador 8.

 = raiz(10 x 11 x 21/6) = 19.62


Z = (T – )/ = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los métodos son diferentes
238
Prueba en Minitab para prueba de
mediana con Wilconox
 File> Open worksheet > Exh_Stat
 Stat > Nonparametrics > 1-Sample Wilconox Achievement
Variables C1 Test Median 77 77
Altenative Not equal 88
85
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00 74
for Wilcoxon Estimated 75
for Wilcoxon Estimated
N Test Statistic P Median 62
Achievement 9 8 19.5 0.889 77.50 80
70
Ho: Mediana = 77 Ha: Mediana <> 77
Como P de 0.889 >> alfa de 0.05 no se rechaza Ho 83

239
Prueba de Mann-Whitney
Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, después de diez minutos de
ejercicios aeróbicos.

Los datos resultantes se muestran a continuación.

Edad 40-44 Edad 16-20


C1 C2
¿Tuvieron diferencias 140 130
significativas las frecuencias de 135 166
pulso de ambos grupos? 150 128
140 126
144 140
154 136
160 132
144 128
136 124
148
Prueba de Mann-Whitney
 Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando
posiciones para el caso de que sean iguales):
Edad 40-44 Edad 16-20
C1 C2
(7) 135 (1) 124
(8.5) 136 (2) 126
(11) 140 (3.5) 128
(11) 140 (3.5) 128
(13.5) 144 (5) 130
(13.5) 144 (6) 132
(15) 148 (8.5) 136
(16) 150 (11)140
(17) 154 (15)166
(18) 160

n1 = 10 n2 = 9
Ta = 130.5 Tb = 55.5
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas
Ho: 1 = 2 Ha: 1  2 1, 2 = Medianas de las poblaciones
Ordenando los datos y asignándoles su posición relativa se tiene:
Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
Ua + Ub = n1 * n2

Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5


El menor de los dos es Ua.
Para alfa = 0.05 el valor de Uo = 25
Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.

Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente


existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas

Ua = 14.5 Ub = 79.5
Utilizando el estadístico Z y la distribución normal se tiene:
45 12.24
Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
Con Ua y Ub se tiene:
Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor  = 0.05
El valor crítico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.

Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente


existe una diferencia significativa entre los dos grupos de edad.
Prueba de Mann-Whitney
16-20 años de edad
130 166 128 126 140 136 132 128 124
140 10 -26 12 14 0 4 8 12 16
40-44 años de

135 5 -31 7 9 -5 -1 3 7 11
150 20 -16 22 24 10 14 18 22 26
140 10 -26 12 14 0 4 8 12 16
144 14 -22 16 18 4 8 12 16 20
154 24 -12 26 28 14 18 22 26 30
160 30 -6 32 34 20 24 28 32 36
edad

144 14 -22 16 18 4 8 12 16 20
136 6 -30 8 10 -4 0 4 8 12
148 18 -18 20 22 8 12 16 20 24

Diferencias entre los encabezados de


los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada
"punto estimado". Este punto estimado es una aproximación de la diferencia entre
las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
información), Minitab usa este punto estimado para calcular el valor p.
Corrida en Minitab
 Stat > Nonparametrics > Mann Whitney
First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal

Mann-Whitney Test and CI: C1, C2


N Median P>0.05
C1 10 144.00 Se rechaza Ho
C2 9 130.00
Point estimate for ETA1-ETA2 is 12.00
95.5 Percent CI for ETA1-ETA2 is (4.01,20.00)
W = 130.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143
The test is significant at 0.0140 (adjusted for ties)
245
Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene
(promediando posiciones para el caso de que sean iguales):

Zona 1 Zona 2 Zona 3


(15.5) 147 (17.5) 160 (24) 215
(17.5) 17.5 (14) 140 (8) 127
(9) 128 (21) 173 (2) 98
(19) 162 (4) 113 (15.5) 127
(12) 135 (1) 85 (23) 184
(10) 132 (7) 120 (3) 109
(22) 181 (25) 285 (20) 169
(13) 138 (5) 117
(11) 133
(6) 119

n1 = 8 n2 = 10 n3 = 7 N = n1 + n2 + n3 = 25
Ta = 118 Tb = 111.5 Tc = 95.5
Prueba de Kruskal Wallis

Ho: Las poblaciones A, B y C son iguales


Ha: Las poblaciones no son iguales
Ho: 1 = 2 = 3 Ha: 1  2  3 ; 1, 2, 3 = Medianas de las poblaciones

Calculando el valor del estadístico H se tiene:


H = [ 12 /( N* ( N + 1)) ] * [ Ta2 / n1 + Tb2 / n2 + Tc2 / n3 ] - 3 * ( N +1 )
H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadístico 2 para  = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)


2 crítico = 5.991 (válido siempre que las muestras tengan al menos 5 elementos)

Como H < 2 crítico, no se rechaza la Hipótesis Ho: Afirmando que no hay


diferencia entre las poblaciones
Corrida en Minitab
 Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK

Kruskal-Wallis Test: Datos versus Factor


Kruskal-Wallis Test on Datos
Factor N Median Ave Rank Z
Zona 1 7 138.0 14.7 0.98
Zona 2 10 126.5 11.1 -0.82
Zona 3 7 127.0 12.3 -0.10
Overall 24 12.5 P > 0.05
H = 1.08 DF = 2 P = 0.581 No se rechaza Ho
H = 1.09 DF = 2 P = 0.581 (adjusted for ties)
248
Prueba de Medianas de Mood
 Realiza prueba de hipótesis de igualdad de medias en un diseño de una
vía. La prueba es robusta contra Outliers y errores en datos y es
adecuada para análisis preliminares

 Determina si K grupos independientes han sido extraidas de la misma


población con medianas iguales o poblaciones con formas similares

 Con base en la gran mediana, anotar un signo positivo si la


observación excede la mediana o un signo menos si es menor. Los
valores que coincidan se reparten en los grupos

 Hacer una tabla de contingencia K x 2 con las frecuencias de signos


más y menos en cada grupo K

249
Prueba de Medianas de Mood
 Se determina el estadístico Chi Cuadrada con:

(O  E ) 2
 
2

E
Probar Ho: Todas las medianas son iguales
Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para


0.05 y (reng – 1)*(Col – 1) grados de libertad

250
Corrida con Minitab
Se les da a 179 participantes una conferencia con
dibujos para ilustrar el tema. Después se les da la
prueba OTIS que mide la habilidad intelectual. Los
participantes se clasificaron por nivel educativo 0-No
prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3 Ha: no todas las medianas son


iguales
 File > Open Worksheet > Cartoon.mtw
 Stat > Nonparametrics > Mood’s Median Test
Response Otis Factor ED Ok
251
Corrida con Minitab
Mood Median Test: Otis versus ED
Mood median test for Otis P>0.05
Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------
+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0 252
Diseños factoriales aleatorias
bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vías, es
una generalización de las pruebas pareadas con
signo. La aditividad es requerida para para estimar
los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo


Ha: Algunos tratamientos tienen efecto significativo

253
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados de salida:
 Se muestra el estadístico de prueba con distribución

Chi Cuadrada aproximada con gl = Tratamientos – 1.

 Si hay observaciones parecidas en uno o más


bloques, se usa el rango promedio y se muestra el
estadístico corregido

 La mediana estimada es la gran mediana más el


efecto del tratamiento

254
Diseños factoriales aleatorias
bloqueados de Friedman
Ejemplo:
 Se evalúa el efecto del tratamiento de una droga en
la actividad enzimática con tres niveles, probado en
cuatro animales

 Open the worksheet EXH_STAT.MTW.


 Stat > Nonparametrics > Friedman.
Response, seleccionar EnzymeActivity.
En Treatment, seleccionar Therapy.
En Blocks, seleccionar Litter. Click OK.

255
Diseños factoriales aleatorias
bloqueados de Friedman
Datos: EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4 256
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus Therapy
blocked by Litter
S = 2.38 DF = 2 P = 0.305 No rechazar Ho

S = 3.80 DF = 2 P = 0.150 (adjusted for ties)


Sum
of
Therapy N Est Median Ranks
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783
257
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
 El estadístico de prueba S tiene un valor P de 0.305 sin ajustar
para observaciones en cero y 0.150 para el valor ajustado.

 Por tanto no hay evidencia suficiente para rechazar Ho

 Las medianas estimadas asociadas con los tratamientos son la


gran mediana más los efectos estimados de los tratamientos.

 El estadístico de prueba se determina con base a los rangos en


cada bloque y totales

258
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:

259
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:

260
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:

261
Prueba de igualdad de
varianzas de Levene
 Se usa para probar la hipótesis nula de que las varianzas de k
múltiples poblacionales son iguales

 Las igualdad de varianzas en las muestras se denomina


homogeneidad de varianzas

 La prueba de Levene es menos sensible que la prueba de


Bartlett o la prueba F cuando se apartan de la normalidad

 La prueba de Bartlett tiene un mejor desempeño para la


distribución normal o aproximadamente normal

262
Prueba de igualdad de
varianzas de Levene
Para dos muestras el procedimiento es como sigue:

 Determinar la media

 Calcular la desviación de cada observación respecto a la


media

 Z es el cuadrado de las desviaciones respecto a la media

 Aplicar la prueba t a las dos medias de los datos

263
Rot Temp Oxygen
13 10 2
Prueba de igualdad 11 10 2

de Varianzas-Minitab 3
10
10
10
2
6
4 10 6
Se estudian tamaños de papa 7 10 6
inyectando con bacterias y
15 10 10
sujetas a diferentes
2 10 10
temperaturas. Antes del
7 10 10
ANOVA se verifica la
igualdad de varianzas 26 16 2
19 16 2
24 16 2
 Stat > ANOVA > Test for
15 16 6
equal variances
22 16 6
Response Rot
18 16 6
Factors Temp Oxigen
20 16 10
Confidence level 95%
24 16 10
8 16 10
264
Resultados

265
Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard deviations
Temp Oxygen N Lower StDev Upper
10 2 3 2.26029 5.29150 81.890
10 6 3 1.28146 3.00000 46.427
10 10 3 2.80104 6.55744 101.481
16 2 3 1.54013 3.60555 55.799
16 6 3 1.50012 3.51188 54.349
16 10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho
Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858
266
Prueba de la concordancia del
Coeficiente de Kendall
 El coeficiente expresa el grado de asociación entre las
calificaciones múltiples realizadas por un evaluador

Ho: Las variables son independientes


Ha: Las variables están asociadas

 Kendall usa la información relacionada con las calificaciones


relativas y es sensible a la seriedad de mala clasificación

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9


Chi Cuadrada crítica = X2 0.01,9 = 21.67
267
Prueba de la concordancia del
Coeficiente de Kendall
 El Estadístico Chi Cuadrada calculado es:

 Como Chi Cuadrada de alfa es menor que la calculada, los


cuatro jueces están asociados significativamente. Constituyen
un panel uniforme. No quiere decir que estén en lo correcto,
solo que responden de manera uniforme a los estímulos

268
El coeficiente de correlación de
rangos de Spearman (rs)
 El coeficiente de correlación es una medida de la asociación que
requiere que ambas variables sean medidas en al menos una
escala ordinal de manera que las muestras u observaciones a
ser analizadas pueden ser clasificadas en rangos en dos series
ordenadas
6 d 2

Ho: Las variables son independientes


rs  1 
Ha: Las variables están asociadas
N3  N

 Para el ejemplo anterior si N = 10, el coeficiente es:

6(5.5)
rs  1   1  0.03  0.97
990
269
Coeficiente de correlación de
rangos para monotonía de
preferencias
Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8 fabricantes
Rango
Fab. Preferencia Precio
Di
(rango) Di cuadrada
1 7 449.50 (1) 6 36
2 4 525.00 (5) -1 1
3 2 479.95 (3) -1 1
4 6 499.95 (4) 2 4
5 1 580.00 (8) -7 49
6 3 549.95 (7) -4 16
7 8 469.95 (2) 6 36
8 5 532.50 (6) -1 1 270
Coeficiente de correlación de
rangos para monotonía de
preferencias
Ho: No existe asociación entre los rangos
Ha: Existe asociación entre los rangos o es positiva o negativa

El coeficiente de correlación de rangos de Spearman es:

Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1))

En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores críticos del coeficiente de


correlación del coeficiente de correlación de rangos de Spearman

Rt = 0.686

Por tanto si hay asociación significativa en las preferencias

271
Tabla de constantes
n Alfa=0.05 Alfa = 0.025
5 0.900 -
6 0.829 0.886
7 0.714 0.786
8 0.643 0.738
9 0.600 0.683
10 0.564 0.648
11 0.523 0.623
12 0.497 0.591
13 0.475 0.566
14 0.457 0.545
15 0.441 0.525
16 0.425 0.507
17 0.412 0.490
18 0.388 0.476
19 0.377 0.462
20 0.368 0.450
21 0.359 0.438
22 0.351 0.428
23 0.343 0.418
24 0.336 0.409
25 0.329 0.400
26 0.329 0.392
27 0.323 0.385
28 0.317 0.377
29 0.311 0.370
30 0.305 0.364 272
Corrida con Minitab
Para la corrida en Minitab primero se Fabric Prefe- Preci
deben determinar los rangos en ante rencia Precio o
forma manual para las variables X
y Y. 1 7 1 449
 Stat > Basic statistics > Correlation 2 4 5 525
Variables Preferencia Precio 3 2 3 479
Correlations: Preferencia, Precio 4 6 4 499
Pearson correlation of 5 1 8 580
Preferencia and Precio = -0.714 6 3 7 549
P-Value = 0.047 7 8 2 469
8 5 6 532
273
Ejemplo con Minitab
Se estudia la relación entre colágeno y
Proline en pacientes con cirrosis Paciente Colágeno Proline
 Stat > Basic statistics > Correlation
1 7.1 2.8
Variables Colágeno Proline
2 7.1 2.9
3 7.2 2.8
Correlations: Colageno, Proline
4 8.3 2.6
Pearson correlation of Colageno 5 9.4 3.5
and Proline = 0.935
6 10.5 4.6
P-Value = 0.002 7 11.4 5

274
Resumen de pruebas
no paramétricas
 Prueba de signos de 1 muestra: Prueba la igualdad de la
mediana a un valor y determina el intervalo de confianza

 Prueba de Wilconox de 1 muestra: Prueba la igualdad de la


mediana a un valor con rangos con signo y determina el
intervalo de confianza

 Comparación de dos medianas poblacionales de Mann Whitney:


Prueba la igualdad de las medianas y determina el intervalo de
confianza

275
Resumen de pruebas
no paramétricas

 Comparación de igualdad de medianas poblacionales de Kruskal


Wallis: Prueba la igualdad de las medianas en un diseño de una
vía y determina el intervalo de confianza

 Comparación de medianas poblacionales de Mood: Prueba la


igualdad de medianas con un diseño de una vía

276
277
278
Salidas de la Fase de Análisis
 Causas raíz validadas

 Guía de oportunidades de mejora

279
Resumen de la validación de las causas

# de
Causa Causas Resultados Causa
Raíz
1 Ensamble de ojillos, bloques y SI ES CAUSA RAIZ X
contrapesos no adecuados en
aspas.
2 Amortiguadores dañados. SI ES CAUSA RAIZ X
3 Desgaste de bujes en los
carretes. NO ES CAUSA RAIZ
4 Fabricación y reemplazo de NO ES CAUSA RAIZ
ejes y poleas no adecuados en
ensamble de aspas.
Desalineamiento de poleas y
SI ES CAUSA RAIZ X
5 bandas de transmisión de
aspas.
Método de Balanceo no
6 SI ES CAUSA RAIZ X
adecuado.
7 Desalineación de pinolas en NO ES CAUSA RAIZ
cuna.

Potrebbero piacerti anche