Sei sulla pagina 1di 94

Noviembre 2015

Ing. Rubn Daro Estrella, MBA


Cavaliere dellordine al Merito della Repubblica Italiana
Ingeniero de Sistemas, Administrador, Matemtico, Telogo y
Maestro
rubendarioestreooa@hotmail.com /
rubenestrella@atalayadecristo,org
Las hiptesis indican lo que estamos buscando o
tratando de probar y pueden definirse como
explicaciones tentativas del fenmeno investigado
formuladas a manera de proposiciones.

Las hiptesis no necesariamente son verdaderas,


pueden o no serlo, pueden o no comprobarse con
hechos. Son explicaciones tentativas, no los hechos
en s.

Dentro de la investigacin cientfica, las hiptesis son


proposiciones tentativas acerca de las relaciones entre
dos o ms variables y se apoyan en conocimientos
organizados y sistematizados.
Sampieri H., Roberto. "Metodologa de la Investigacin". McGraw Hill:
Segunda Edicin. 1998 BEST SELLER INTERNACIONAL.
Hiptesis nulas son, en cierto modo, el reverso de las
hiptesis de investigacin. Tambin constituyen
proposiciones acerca de la relacin entre variables;
que sirven solo para refutar o negar lo que afirma la
hiptesis de investigacin.

Hiptesis alternativas, como su nombre lo indica, son


posibilidades "alternas" ante las hiptesis de
investigacin y nula: Ofrece otra descripcin o
explicacin distintas a las que proporcionan estos
tipos de hiptesis.

Si la hiptesis de investigacin establece: "esta silla es


roja", y podran formularse una o ms hiptesis
alternativas: ""esta silla es azul", "esta silla es verde",
"esta silla es amarilla", etctera.
Hiptesis estadsticas son las transformaciones de las
hiptesis de investigacin, nulas y alternativas en
smbolos estadsticos. Se pueden formular solo
cuando los datos del estudio que se van a recolectar y
analizar para probar o rechazar las hiptesis son
cuantitativos (nmeros, porcentajes, promedios). Es
decir, el investigador traduce su hiptesis de
investigacin y su hiptesis nula (y cuando se
formulan hiptesis alternativas, tambin estas) en
trminos estadsticos.

En estadstica, una hiptesis es una afirmacin o


declaracin que se hace acerca de una propiedad de
una poblacin.
Componentes de una Prueba de Hiptesis.

Hiptesis nula (denotada por Ho) es una declaracin acerca del


valor de un parmetro de poblacin (como la media) y debe
contener la condicin de igualdad escrita con el smbolo =, o . (Al
efectuar realmente la prueba, operaremos bajo el supuesto de
que el parmetro es igual a algn valor especifico.) En el caso de
la media, la hiptesis nula se expresara en una de estas tres
posibles formas:
Ho: = algn valor
Ho: algn valor
Ho: algn valor
Por ejemplo, la hiptesis nula que corresponde a la creencia
comn de que la temperatura corporal media es 98.6F se
expresa como Ho:=98.6. Probamos la hiptesis nula
directamente en el sentido de que suponemos que es verdad y
llegamos a una conclusin que puede ser rechazar Ho o bien en
no rechazar Ho.
Nunca se puede aceptar la hiptesis nula como verdadera. El no
rechazo de la hiptesis nula solamente significa que la evidencia
muestral no es lo suficientemente fuerte como para llegar a su
rechazo.

Antes que se rechace la hiptesis nula, la media muestral debe


diferir significativamente de la media poblacional planteada como
hiptesis. Es decir, que la evidencia debe ser muy convincente y
concluyente. Una conclusin con base en un rechazo de la
hiptesis nula es ms significativa que una que termine en una
decisin de no rechazo.

Diferencia estadsticamente insignificante

En la diferencia entre el valor de la media poblacional bajo la


hiptesis y el valor de la media muestral que es lo
suficientemente pequea como para atribuirla a un error de
muestreo.

Hiptesis Alternativa (denotada por Ha) es la


declaracin que debe ser verdad si la hiptesis nula es
falsa. En el caso de la media, la hiptesis alternativa
se expresara en una de tres posibles formas:
Ha: algn valor
Ha: > algn valor
Ha: < algn valor

Obsrvese que Ha es lo contrario de Ho. Por ejemplo,


si Ho se da como =98.6, se sigue que la hiptesis
alternativa esta dada por Ha: 98.6.
Errores Tipo I y Tipo II.
Al probar una hiptesis nula, llegamos a una conclusin de
rechazarla o no rechazarla. Tales conclusiones a veces son
correctas y a veces equivocadas. Hay dos tipos de errores que
podemos cometer.

Error Tipo I.
El error de rechazar la hiptesis nula, dado que es verdadera.

La probabilidad de cometer un error tipo I es igual al nivel de


significancia, o valor en el que se prueba la hiptesis.

Error Tipo II.


Es no rechazar una hiptesis nula que es falsa. Usamos el
smbolo para representar la probabilidad de error tipo II.
Como controlar los errores tipo I y tipo II. Consideraciones
practicas que podran ser pertinentes:

1. Para cualquier fija, un aumento en el tamao de muestra n


hace que disminuya. Es decir, una muestra ms grande reduce
la posibilidad de cometer el error de no rechazar la hiptesis
nula, dado que en realidad es falsa.

2. Para cualquier tamao de muestra fijo n, una disminucin de


causar un incremento en . Por otra parte, un incremento en
causar una disminucin en .

3. Si queremos reducir tanto como , deberemos aumentar el


tamao de muestra.
Estadstica de Prueba.
Una estadstica de muestra o un valor basado en los datos de
una muestra. Se utiliza una estadstica de prueba para tomar la
decisin de rechazar o no la hiptesis nula.
Z = (X' - )/(/n)
Z = (X' - )/(s/n)
Regin critica.
El conjunto de todos los valores de la estadstica de prueba que
nos haran rechazar la hiptesis nula.

Valor critico.
El valor o valores que separan la regin critica de los valores de la
estadstica de prueba que no nos haran rechazar la hiptesis
nula. Los valores crticos dependen de la naturaleza de la
hiptesis nula, la distribucin de muestreo pertinente y el nivel
de significancia .
Las colas de una distribucin son las regiones extremas delimitadas por
valores crticos. Rechazamos la hiptesis nula Ho si nuestra estadstica
de prueba esta en la regin critica o rea de rechazo porque eso indica
una discrepancia significativa entre la hiptesis nula y los datos de la
muestra.

Algunas pruebas son de cola izquierda, con la regin critica situada en


la regin de extrema izquierda de la curva; otras podran ser de cola
derecha, con la regin critica en la regin de la extrema derecha bajo la
curva.

En las pruebas de dos colas, el nivel de significancia se divide


equitativamente entre las dos colas que constituyen la regin critica o
rea de rechazo. En las pruebas de cola derecha o izquierda, el rea de
la regin critica es .

Si examinamos la hiptesis nula Ho, deberemos poder deducir si una


prueba es de cola derecha, de cola izquierda o de dos colas. La cola
corresponder a la regin critica que contenga los valores que podran
contradecir significativamente la hiptesis nula.
Vale la pena destacar que tanto en la prueba de cola a la
izquierda como a la derecha el signo igual se coloca en la
hiptesis nula. Esto es porque la hiptesis nula se esta probando
a un valor especifico (como 5%) y el signo igual da a la hiptesis
nula un valor especifico para probarla.

Una prueba de cola a la izquierda tiene una zona de rechazo solo


en la cola izquierda y se da bajo la condicin de:
Ho: algn valor
Ha: < algn valor

Una prueba de cola a la derecha tiene una zona de rechazo solo


en la cola derecha y se da bajo la condicin de:
Ho: algn valor
Ha: > algn valor

Prueba de dos colas para


Hay cuatro pasos involucrados en una
prueba:
Paso 1: Plantear las hiptesis.
Paso 2: Con base en los resultados de la
muestra, calcular el valor del estadstico de
prueba Z.
Paso 3: Determinar la regla de decisin con
base en los valores crticos de Z.
Paso 4: Interpretacin y conclusiones.
Caso I.
Como gerente de compras de una gran empresa de
seguros usted debe decidir si actualizar o no los
computadores de la oficina. A usted se le ha dicho
que el costo promedio de los computadores es de
US$2,100. Una muestra de 64 minoristas revela un
precio promedio de US$2,251, con una desviacin
estndar de US$812. A un nivel de significancia del
5% parece que su informacin es correcta?
Datos:
Ho: =US$2,100
n=64 minoristas
X'=US$2,251 precio promedio (de los computadores) de la
muestra
s=US$812
=5%=0.05 (nivel de significancia)
Paso 1: Plantear las hiptesis.
El gerente de compra desea probar la hiptesis de que la media
poblacional es =US$2,100 bajo un nivel de significancia
=5%=0.05. Debido a que se plantea la hiptesis de que
=US$2,100, la hiptesis nula y la alternativa son:
Ho: = 2,100
Ha: 2,100
Paso 2: Con base en los resultados de la muestra,
calcular el valor del estadstico de
prueba Z.
Para probar la hiptesis, se calcula el estadstico de prueba Z, y
se compara con los valores crticos de Z.

Z = (X' - H)/(/n)
Z = (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional
bajo hiptesis nula

s/n es el error estndar de la distribucin


muestral

Ho: = 2,100
n=64 minoristas
X'=US$2,251
s=US$812
Z = (2,251 - 2,100)/(812/8)
Z = (151)/(101.5)
Z = 1.49
Paso 3: Determinar la regla de decisin con base
en los valores crticos de Z.

El nivel de significancia del 5% se divide en dos colas. El 95%


restante se divide por 2 para hallar el rea de 0.4750. En
la tabla Z esta rea de 0.4750 da los valores crticos de Z
de 1.96.

La Regla de Decisin es: "No se rechaza la hiptesis nula


s -1.96 Z 1.96. Se rechaza s Z < -1.96 o Z > 1.96.

Vale la pena destacar que las zonas de rechazo estn en


ambas colas. Si Z < -1.96 o Z > 1.96, se rechaza la
hiptesis nula.
Paso 4: Interpretacin y conclusiones.

El paso final en la prueba de hiptesis es donde cae el valor del


estadstico para la muestra y determinar si la hiptesis nula
debera rechazarse o no. El valor del estadstico para la muestra
es X'=US$2,251 produce una Z=1.49 ==> 1.49<1.96 y cae
dentro de la zona de no rechazo.

Interpretacin:

La diferencia entre el valor de la media poblacional bajo la


hiptesis nula de = 2,100 y el valor de la media muestral de
X'=US$2,251 es estadsticamente insignificante. Podra resultar
simplemente del error de muestreo. De hecho s =2,100; el
95% de todas las muestras de tamao n=64 producirn valores
de Z entre 1.96.
Caso II.
Un contrato de manejo laboral exige una produccin diaria de 50
unidades. Una muestra de 150 das revela una media de 47.3,
con una desviacin estndar de 5.7 unidades. Fije =5% y
determine si se cumple con la disposicin del contrato.

Caso III.
Un gerente de una empresa considera que los empleados gastan
un promedio de 50 minutos para llegar al trabajo. Se toma una
muestra de 70 empleados que se toman en promedio 47.2
minutos con una desviacin estndar de 18.9 minutos. Fije en
1% y pruebe la hiptesis.

TAREA: Ejercicios 1 al 16 Pgs. 204-205. Para entregar en la


prxima clase.
Caso I. Baskin-Robbins, la franquicia de helados,
afirma que el numero de tiendas que se abre se ha
incrementado por encima del promedio semanal de
10.4 experimentado en tiempo de escasez (The Wall
Street Journal, febrero de 1997). Existe alguna
evidencia para sustentar esta afirmacin si 50
semanas muestran una media de 12.5 y una
desviacin estndar de 0.66 tiendas? La gerencia esta
dispuesta a aceptar una probabilidad del 4% de
rechazo de la hiptesis nula si esta es cierta.
Datos:
N =50 semanas
X =12.5 tiendas de la muestra
S =0.66 tiendas
=4%=0.04 (nivel de significancia)
Caso I. Baskin-Robbins, la franquicia de helados, afirma que el
numero de tiendas que se abre se ha incrementado por encima
del promedio semanal de 10.4 experimentado en tiempo de
escasez (The Wall Street Journal, febrero de 1997). Existe
alguna evidencia para sustentar esta afirmacin si 50 semanas
muestran una media de 12.5 y una desviacin estndar de 0.66
tiendas? La gerencia esta dispuesta a aceptar una probabilidad
del 4% de rechazo de la hiptesis nula si esta es cierta.
Paso 1: Plantear las hiptesis.
La afirmacin de que el incremento es por encima del promedio
semanal de 10.4 sirve como hiptesis alternativa debido a que
>10.4 no contiene el signo igual.
Una prueba de cola a la derecha tiene una zona de rechazo solo
en la cola derecha y se da bajo la condicin de:
Ho: algn valor Ha: > algn valor
Ha: > 10.4 tiendas semanal
Ho: 10.4 tiendas semanal
Caso I. Baskin-Robbins, la franquicia de helados, afirma que el numero de tiendas
que se abre se ha incrementado por encima del promedio semanal de 10.4
experimentado en tiempo de escasez (The Wall Street Journal, febrero de 1997).
Existe alguna evidencia para sustentar esta afirmacin si 50 semanas muestran
una media de 12.5 y una desviacin estndar de 0.66 tiendas? La gerencia esta
dispuesta a aceptar una probabilidad del 4% de rechazo de la hiptesis nula si
esta es cierta.
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico
de prueba Z.
Para probar la hiptesis, se calcula el estadstico de prueba Z, y se compara
con los valores crticos de Z.
Z = (X' - H)/(/n)
Z = (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional bajo hiptesis nula
/n es el error estndar de la distribucin muestral
= (12.5 - 10.4)/(0.66/50)
= 2.1/0.093
= 22.5
Caso I. Baskin-Robbins, la franquicia de helados, afirma que el numero
de tiendas que se abre se ha incrementado por encima del promedio
semanal de 10.4 experimentado en tiempo de escasez (The Wall Street
Journal, febrero de 1997). Existe alguna evidencia para sustentar esta
afirmacin si 50 semanas muestran una media de 12.5 y una desviacin
estndar de 0.66 tiendas? La gerencia esta dispuesta a aceptar una
probabilidad del 4% de rechazo de la hiptesis nula si esta es cierta.
Paso 3: Determinar la regla de decisin con base en los valores crticos
de Z.

El nivel de significancia del 4%. El 50% se resta de 4% para hallar el rea


de 0.46. En la tabla Z esta rea de 0.46 da el valor critico de Z de 1.75.

La Regla de Decisin es: "No se rechaza la hiptesis nula s Z 1.75. Se


rechaza s Z>1.75.
Caso I. Baskin-Robbins, la franquicia de helados, afirma que el numero
de tiendas que se abre se ha incrementado por encima del promedio
semanal de 10.4 experimentado en tiempo de escasez (The Wall Street
Journal, febrero de 1997). Existe alguna evidencia para sustentar esta
afirmacin si 50 semanas muestran una media de 12.5 y una desviacin
estndar de 0.66 tiendas? La gerencia esta dispuesta a aceptar una
probabilidad del 4% de rechazo de la hiptesis nula si esta es cierta.
Paso 4: Interpretacin y conclusiones.
El paso final en la prueba de hiptesis es donde cae el valor del
estadstico para la muestra y determinar si la hiptesis nula debera
rechazarse o no. El valor del estadstico para la muestra produce una
Z=22.5 ==> 22.5>1.75 y cae dentro de la zona de rechazo o regin
critica.

Interpretacin:
La hiptesis nula se rechaza ya que en tiempo de escasez no se abren
mas de 10.4 tiendas semanal
Caso II.
Segn Wall Street Journal (mayo 12 de 1997)
muchas compaas de ropa deportiva estn
tratando de comercializar sus productos entre
los mas jvenes. El articulo sugiri que la
edad promedio de los consumidores haba
cado por debajo de la media de 34.4 aos
que caracterizo los comienzo de la dcada. Si
una muestra de 1000 clientes reporta una
media de 33.2 aos y una desviacin de 9.4,
qu se concluye a un nivel de significancia de
4%?
Caso III
Un distribuidor de bebidas plantea la hiptesis
de que las ventas por mes promedian
US$12,000. Diez meses seleccionados como
muestra reportan una media de US$11,277 y
una desviacin estndar de US$3,772. Si se
utiliza un valor del 5%. Que puede concluir
acerca de la impresin que tienen el
distribuidor sobre las condiciones del negocio?

Ejercicios 33 al 40 Pgs. 215-216.


El Mtodo de valor P para probar hiptesis.
Dado una hiptesis nula y datos de muestra, el valor p
refleja la verosimilitud de obtener los valores de
muestra en cuestin suponiendo que la hiptesis nula
realmente es verdad.

Valor P (o valor de probabilidad) es la probabilidad de


obtener un valor de la estadstica de prueba que ser al
menos tan extremo como se obtiene a partir de los
datos de muestra, suponiendo que la hiptesis es
verdad.

Valor P es el nivel ms bajo de significancia (valor


mnimo) al cual se puede rechazar la hiptesis nula. Es
el rea en la cola que est ms all del valor del
estadstico para la muestra.
El Mtodo de valor P para probar hiptesis.

Algunos criterios de decisin basados exclusivamente


en el valor P:

- Rechazar la hiptesis nula si el valor P es menor que el


nivel de significancia, o igual a l.

- No rechazar la hiptesis nula si el valor P es mayor


que el nivel de significancia.
Caso I. A comienzo de los aos 90 Sony Corporation
introdujo su Play Station de 32 bits en el mercado de los
juegos de video. La gerencia esperaba que el nuevo
producto incrementara las ventas mensuales en Estados
Unidos por encima de los US$283,000,000 que Sony
haba experimentado en la dcada anterior. Una
muestra de 40 meses reporto una media de
US$297,000,000. Se asume una desviacin estndar de
US$97,000,000. Pruebe la hiptesis nula a un nivel de
significancia del 1%. Calcule e interprete el valor p.
Datos:
n=40 meses
X'=US$297,000,000 ventas de la muestra
s=US$97,000,000
=1%=0.01 (nivel de significancia)
Caso I. A comienzo de los aos 90 Sony Corporation introdujo su
Play Station de 32 bits en el mercado de los juegos de video. La
gerencia esperaba que el nuevo producto incrementara las ventas
mensuales en Estados Unidos por encima de los US$283,000,000
que Sony haba experimentado en la dcada anterior. Una muestra
de 40 meses reporto una media de US$297,000,000. Se asume una
desviacin estndar de US$97,000,000. Pruebe la hiptesis nula a
un nivel de significancia del 1%. Calcule e interprete el valor p.
Paso 1: Plantear las hiptesis.
La afirmacin de que el nuevo producto incrementara las ventas por
encima de US$283,000,000 sirve como hiptesis alternativa
debido a que > US$283,000,000 no contiene el signo igual.
Una prueba de cola a la derecha tiene una zona de rechazo solo en
la cola derecha y se da bajo la condicin de:
Ho: algn valor Ha: > algn valor
Ha: > US$283,000,000 (ventas mensuales)
Ho: US$283,000,000 (ventas mensuales)
Caso I. A comienzo de los aos 90 Sony Corporation introdujo su Play Station de 32 bits
en el mercado de los juegos de video. La gerencia esperaba que el nuevo producto
incrementara las ventas mensuales en Estados Unidos por encima de los US$283,000,000
que Sony haba experimentado en la dcada anterior. Una muestra de 40 meses reporto
una media de US$297,000,000. Se asume una desviacin estndar de US$97,000,000.
Pruebe la hiptesis nula a un nivel de significancia del 1%. Calcule e interprete el valor p.
Paso 2: Con base en los resultados de la muestra, calcular el valor del estadstico de
prueba Z. Para probar la hiptesis, se calcula el estadstico de prueba Z, y se compara con
los valores crticos de Z. Z = (X' - H)/(/n)
Z = (X' - H)/(s/n)
Ho: US$283,000,000 (ventas mensuales)
n=40 meses
X'=US$297,000,000 ventas de la muestra
s=US$97,000,000
=1%=0.01 (nivel de significancia)
Z = (297,000,000 -
283,000,000)/(97,000,000/40)
Z = 14,000,000/15,337,047.42 = 0.91
Caso I. A comienzo de los aos 90 Sony Corporation introdujo su Play Station de 32 bits
en el mercado de los juegos de video. La gerencia esperaba que el nuevo producto
incrementara las ventas mensuales en Estados Unidos por encima de los US$283,000,000
que Sony haba experimentado en la dcada anterior. Una muestra de 40 meses reporto
una media de US$297,000,000. Se asume una desviacin estndar de US$97,000,000.
Pruebe la hiptesis nula a un nivel de significancia del 1%. Calcule e interprete el valor p.
El valor Z para el nivel de insignificancia de 1% se obtiene en la tabla
despus de restar 0.5-0.01= 0.49, el cual corresponde a 2.33
Paso 3: Determinar la regla de decisin con base en los valores crticos
de Z.
En la tabla Z el valor Z de 0.91 tiene el rea de 0.3186. Por lo tanto el:
valor P = 0.5 - 0.3186 = 0.1814

La Regla de Decisin es:


- Rechazar la hiptesis nula si el valor P es menor que el nivel de
significancia, o igual a l.
- No rechazar la hiptesis nula si el valor P es mayor que el nivel de
significancia.
Caso I. A comienzo de los aos 90 Sony Corporation introdujo su
Play Station de 32 bits en el mercado de los juegos de video. La
gerencia esperaba que el nuevo producto incrementara las ventas
mensuales en Estados Unidos por encima de los US$283,000,000
que Sony haba experimentado en la dcada anterior. Una muestra
de 40 meses reporto una media de US$297,000,000. Se asume una
desviacin estndar de US$97,000,000. Pruebe la hiptesis nula a
un nivel de significancia del 1%. Calcule e interprete el valor p.
Paso 4: Interpretacin y conclusiones.

El paso final en la prueba de hiptesis es donde cae el valor del


estadstico para la muestra y determinar si la hiptesis nula debera
rechazarse o no. Como el valor de significancia es menor que
0.1814 para la muestra de Z=0.91 cae en la zona de no rechazo.

Interpretacin: La hiptesis nula no se rechaza.


Caso II.
En el verano de 1997, el Congreso de USA aprob un presupuesto
federal que contena varias partidas para reducciones de impuestos.
Los analistas afirmaron que ahorrara al contribuyente promedio
US$800.00 dlares. Una muestra de 500 contribuyentes demostr
una reduccin promedio en los impuestos de US$785.10 con una
desviacin estndar de US$277.70. Pruebe la hiptesis a un nivel
de significancia del 5%. Calcule e Interprete el valor p.
Datos:
n= 500 contribuyentes
X'=US$785.10
s=US$277.70
=5%=0.05 (nivel de significancia)
Paso 1: Plantear las hiptesis.
Ho: = US$800.00
Ha: US$800.00
Caso II.
En el verano de 1997, el Congreso de USA aprob un presupuesto
federal que contena varias partidas para reducciones de impuestos.
Los analistas afirmaron que ahorrara al contribuyente promedio
US$800.00 dlares. Una muestra de 500 contribuyentes demostr
una reduccin promedio en los impuestos de US$785.10 con una
desviacin estndar de US$277.70. Pruebe la hiptesis a un nivel
de significancia del 5%. Calcule e Interprete el valor p.
Paso 2: Con base en los resultados de la muestra, calcular el valor
del estadstico de prueba Z.
Z = (X' - H)/(/n)
Z = (X' - H)/(s/n)
= (785.10 800.00)/(277.70/500)
= -14.9/12.42
= - 1.20
Caso II. En el verano de 1997, el Congreso de USA aprob un
presupuesto federal que contena varias partidas para reducciones de
impuestos. Los analistas afirmaron que ahorrara al contribuyente
promedio US$800.00 dlares. Una muestra de 500 contribuyentes
demostr una reduccin promedio en los impuestos de US$785.10 con
una desviacin estndar de US$277.70. Pruebe la hiptesis a un nivel
de significancia del 5%. Calcule e Interprete el valor p.
El valor Z para el nivel de insignificancia de 5% se divide entre dos. Se
obtiene en la tabla el valor de Z = 1.96.
Paso 3: Determinar la regla de decisin con base en los valores crticos
de Z.
En la tabla Z, el valor Z de 1.20 tiene el rea de 0.3849. Por lo tanto el:
0.5 - 0.3849 = 0.1151
valor P = 2 * 0.1151 = 0.2302
La Regla de Decisin es:
- Rechazar la hiptesis nula si el valor P es menor que el nivel de
significancia, o igual a l.
- No rechazar la hiptesis nula si el valor P es mayor que el nivel de
significancia.
Caso II. En el verano de 1997, el Congreso de USA aprob un
presupuesto federal que contena varias partidas para reducciones
de impuestos. Los analistas afirmaron que ahorrara al
contribuyente promedio US$800.00 dlares. Una muestra de 500
contribuyentes demostr una reduccin promedio en los impuestos
de US$785.10 con una desviacin estndar de US$277.70. Pruebe
la hiptesis a un nivel de significancia del 5%. Calcule e Interprete
el valor p.
Paso 4: Interpretacin y conclusiones.

El paso final en la prueba de hiptesis es donde cae el valor del


estadstico para la muestra y determinar si la hiptesis nula debera
rechazarse o no. Como el valor de significancia es menor que
0.2302 para la muestra de Z = -1.20 cae en la zona de no rechazo.

Interpretacin:

La hiptesis nula no se rechaza.


En secciones anteriores determinamos (1) el estimado
puntual, (2) intervalo de confianza y (3) determinamos
el tamao de la muestra para medias y proporciones,
en esta seccin los aplicaremos a la varianza de
poblacin o desviacin estndar de poblacin .

Muchas situaciones reales, como el control de calidad


en un proceso de fabricacin, requiere estimar valores
de varianzas o desviaciones estndar de poblacin.
Adems de fabricar productos cuyas mediciones
producen una media deseada, el fabricante debe
elaborar productos con una calidad uniforme que no
abarquen toda la gama desde extremadamente buenos
hasta extremadamente deficientes. Dado que tal
uniformidad a menudo se puede medir por la varianza
o la desviacin estndar, estas se convierten en
estadsticas vitales para mantener la calidad de los
productos.
En una poblacin distribuida normalmente con
varianza , seleccionamos aleatoriamente muestras
independientes de tamao n y calculamos la varianza
de muestras s para cada muestra. La estadstica de
muestra =(n-1)s/ tiene una distribucin llamada
distribucin Chi cuadrada.
=(n-1)s/

n = tamao de muestra
s= varianza de muestra
= varianza de poblacin

La distribucin Chi cuadrada esta determinada por el


numero de grados de libertad, por el momento
usaremos n-1 grados de libertad.
Propiedades de la Distribucin de la estadstica Chi
cuadrada.

1.- La Distribucin Chi cuadrada no es simtrica, a


diferencia de las distribuciones normal y t Student (A
medida que aumenta el nmero de grados de libertad,
la distribucin se vuelve ms simtrica).

2.- Los valores de Chi cuadrada pueden ser cero o


positivos, pero no pueden ser negativos.

3.- La distribucin Chi cuadrada es diferente para cada


nmero de grados de libertad, que es gl=n-1. A
medida que aumenta el numero de grados de libertad,
la distribucin Chi cuadrada se acerca a una
distribucin normal.
Caso I.
Usando la tabla H Distribucin Chi-cuadrado.
Encuentre los valores crticos de que determinan
regiones crticas que contienen un rea de 0.025 en
cada cola. Suponga que el tamao de muestra
pertinente es de 10, de modo que el nmero de grados
de libertad es 10-1=9

Solucin: El valor crtico de la derecha (=19.023) se


obtiene directamente localizando 9 en la columna de
grados de libertad de la izquierda y 0.025 en la fila
superior. El valor crtico de =2.700 de la izquierda
tambin corresponde a 9 en la columna de grados de
libertad, pero es preciso localizar 0.975 (que se
obtiene de restar 0.025 a 1) en la fila superior porque
los valores de esa fila siempre son reas a la derecha
del valor critico.
Al obtener valores crticos de Chi cuadrada de la Tabla
H Distribucin Chi-cuadrado, obsrvese que los
nmeros de grados de libertad son enteros
consecutivos del 1 al 30, seguidos de 40, 50, 60, 70,
80, 90 y 100. Si no se encuentra en la tabla un
nmero de grados de libertad (digamos 52), por lo
regular puede usarse el valor crtico ms cercano. Por
ejemplo, si el nmero de grados de libertad es 52,
remtase a la tabla y use 50 grados de libertad. (Si el
nmero de grados de libertad esta exactamente a la
mitad entre dos valores de la tabla, como 55,
simplemente calcule la media de los dos valores de .)
Para nmeros de grados de libertad mayores que 100,
use la ecuacin siguiente:
=1/2 [Z+(2k-
1)]

donde k es el numero de grados de libertad.


Caso II.
Encuentre los valores crticos L y R que
corresponden al grado de confianza y tamao
de muestra dados.

1. 95%; n=26 2. 99%; n=17


3. 90%; n=60 4. 95%; n=50
Estimadores de .

Dado que las varianzas de muestras s (que se


obtienen con la formula s=[(x-x')]/(n-1)) tienden a
centrarse alrededor del valor de la varianza de la
poblacin , decimos que s es un estimador no
predispuesto de . Es decir, las varianzas de
muestras s no tienden a sobreestimar
sistemticamente ; en vez de ello, tienden a
centrarse en el valor de mismo. Adems, los
valores s tienden a producir errores ms pequeos al
estar mas cerca de que otras medidas de variacin.
Por estas razones, el valor s es el mejor valor
individual (o estimado puntual) de las diversas
estadsticas que podramos usar para estimar .
La varianza de muestra s es el mejor estimado
puntual de la variacin de la poblacin .

Dado que s es el mejor estimado puntual de , sera


natural esperar que s sea el mejor estimado puntual
de , pero no sucede as, porque s es un estimador
predispuesto de . Por otra parte, si el tamao de
muestra es grande, la predisposicin es tan pequea
que podemos usar s como un estimado
razonablemente bueno de .

Aunque s es el mejor estimado puntual de , no


tenemos una indicacin de lo bueno que es realmente.
Para compensar esta deficiencia, deducimos un
estimado de intervalo (o intervalo de confianza) que es
ms revelador.
Intervalo de confianza (o estimado de intervalo) para la varianza
de poblacin .
Despeje: =(n-1)s/
=(n-1)s/
El intervalo de confianza es:
(n-1)s/R < < (n-
1)s/L
El intervalo de confianza para la desviacin estndar se obtiene
calculando la raz cuadrada de cada componente anterior:

[(n-1)s/R] < < [(n-


1)s/L]

Con un rea total de dividida equitativamente entre las dos


colas de una distribucin Chi cuadrada, L denota el valor critico
de cola izquierda y R denota el valor critico de cola derecha.
Los limites de intervalos de confianza para y se
deben redondear aplicando la regla de redondeo
siguiente:

1. Si usa el conjunto de datos original para construir


un intervalo de confianza, redondee los limites del
intervalo de confianza a una posicin decimal ms que
las empleadas en el conjunto de datos original.

2. Si desconoce el conjunto de datos original y slo


usa las estadsticas resumidas (n,s), redondee los
limites del intervalo de confianza al mismo nmero de
posiciones decimales que se usan para la desviacin
estndar o varianza de muestra.
Caso I.
La Panificadora Pepin produce bizcochos que se empacan en
cajas cuyos rtulos dicen contienen 12 bizcochos con un total de
42 onzas. Si la variacin entre los bizcochos es demasiado
grande, algunas cajas pesaran menos de lo debido (engaando a
los clientes) y otras pesaran ms (reduciendo las utilidades). El
supervisor de control de calidad determino que puede evitar
problemas si los bizcochos tienen una media de 3.50 onzas y
una desviacin estndar de 0.06 onzas o menos. Se seleccionan
aleatoriamente doce bizcochos de la lnea de produccin y se
pesan, con los resultados que se dan aqu (en onzas). Construya
un intervalo de confianza del 95% para y un intervalo de
confianza del 95% para , y luego determine si el supervisor de
control de calidad est en problemas.
3.43 3.37 3.58 3.50 3.68 3.61
3.42 3.52 3.66 3.50 3.36 3.42
s=[(x-x')]/(n-1))
X X-X' (X-X')^2
3.43 -0.074 0.005
3.37 -0.134 0.018 Descriptive statistics
3.58 0.076 0.006
3.5 -0.004 0.000
3.68 0.176 0.031 X
3.61 0.106 0.011
3.42 -0.084 0.007
count 12
3.52 0.016 0.000 mean 3.5042
3.66 0.156 0.024
3.5 -0.004 0.000
sample variance 0.0119
3.36 -0.144 0.021 sample standard deviation
0.1091
3.42 -0.084 0.007
42.05 0.131
MEDIA VARIANZA 0.012
3.504 DESVIACION 0.109
f(Chisq)

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Chisq
3.82 21.92

Chi-square distribution
df = 11
P(lower)
P(upper) Chi-square
.9750 .0250 21.92
.0250 .9750 3.82
Solucin:
Con base en los datos de muestra, la media de
X'=3.504 parece excelente porque esta muy
cerca del valor deseado. Los puntajes dados
tienen una desviacin estndar de s=0.109, que
podra parecer mayor que el valor deseado de
0.06 o menos. Procedamos a obtener el
intervalo de confianza para .
Con una muestra de 12 puntajes tenemos 11 grados de libertad. Con un
grado de confianza del 95%, dividimos =0.05 equitativamente entre las dos
colas de la distribucin y nos remitimos a los valores de 0.975 y 0.025 en
la fila superior.
Los valores crticos de son L=3.816 y R=21.920. Utilizando estos
valores crticos junto con la desviacin estndar de muestra s=0.109 y el
tamao de muestra de 12 construimos el intervalo de confianza del 95%
evaluando lo siguiente:

(n-1)s/R < < (n-1)s/L


(12-1)(0.109)/21.920 < < (12-1)(0.109)/(3.816)
0.006 < < 0.034

Si sacamos la raz cuadrada de cada parte (antes de redondear) obtenemos:


0.077 < < 0.185

Con base en el intervalo de confianza del 95% para , parece que la


desviacin estndar es mayor que el valor deseado de 0.06 o menos, as que
el supervisor de control de calidad est en problemas y deber tomar
medidas correctivas para hacer que el peso de los bizcochos sea ms
uniforme.
El intervalo de confianza de 0.077 < < 0.185 tambin puede
expresarse como (0.077,0.185), pero el formato de =sE no
puede usarse porque el intervalo de confianza no tiene a s en su
centro.
Caso II.
Un recipiente anticongelante para automvil supuestamente
contiene 3,785 ml del liquido. Consciente de que las
fluctuaciones son inevitables, la gerente de control de calidad
quiere estar muy segura de que la desviacin estndar sea de
menos de 30 ml; De lo contrario, algunos recipientes se
desbordaran, mientras que otros no tendrn suficiente
anticongelantes. Ella selecciona aleatoriamente una muestra, con
los resultados que se dan aqu. Utilice estos resultados para
construir el intervalo de confianza del 99% para el verdadero
valor de . Sugiere este intervalo de confianza que las
fluctuaciones estn en un nivel aceptable?

3,761 3,861 3,769 3,772 3,675 3,861


3,888 3,819 3,788 3,800 3,720 3,748
3,753 3,821 3,811 3,740 3,740 3,839
N X X-X' (X-X')^2
1 3,761.00 -26.00 676.00
2 3,861.00 74.00 5,476.00
3 3,769.00 -18.00 324.00
4 3,772.00 -15.00 225.00
5 3,675.00 -112.00 12,544.00 Descriptive statistics
6 3,861.00 74.00 5,476.00
7 3,888.00 101.00 10,201.00
8 3,819.00 32.00 1,024.00 X
9 3,788.00 1.00 1.00 count 18
10 3,800.00 13.00 169.00
mean 3,787.0000
11 3,720.00 -67.00 4,489.00
12 3,748.00 -39.00 1,521.00 sample variance
3,066.8235
13 3,753.00 -34.00 1,156.00 sample standard55.3789
deviation
14 3,821.00 34.00 1,156.00 minimum 3675
15 3,811.00 24.00 576.00
maximum 3888
16 3,740.00 -47.00 2,209.00
17 3,740.00 -47.00 2,209.00 range 213
18 3,839.00 52.00 2,704.00
MEDIA 3,787.00 VARIANZA 3,066.82
DESVIACION 55.38
Con una muestra de 18 puntajes tenemos 17 grados de libertad. Con
un grado de confianza del 99%, dividimos =0.01 equitativamente
entre las dos colas de la distribucin y nos remitimos a los valores
de 0.995 y 0.005 en la fila superior.
Los valores crticos de son L=5.697 y R=35.718. Utilizando
estos valores crticos junto con la desviacin estndar de muestra
s=55.38 y el tamao de muestra de 18 construimos el intervalo de
confianza del 99% evaluando lo siguiente:
(n-1)s/R < < (n-1)s/L
(18-1)(55.38)/35.718 < < (18-1)(55.38)/(5.697)
1,459.66 < < 9,151.48

Si sacamos la raz cuadrada de cada parte (antes de redondear)


obtenemos:
38.21 < < 95.6
Con base en el intervalo de confianza del 99% para , parece que la
desviacin estndar es mayor que el valor deseado de 30 ml, y
algunos recipientes se desbordaran, as que el supervisor de control
de calidad est en problemas y deber tomar medidas correctivas.
En la practica, surgen muchas situaciones en las
cuales simplemente no es posible hacer de forma
segura ningn supuesto sobre el valor de un
parmetro o sobre la forma de la distribucin
poblacional. Mas bien se deben utilizar otras pruebas
que no dependan de un solo tipo de distribucin o de
valores de parmetros especficos. Estas pruebas se
denominan Pruebas no paramtricas o libres de
distribucin.

Pruebas no paramtricas.
Son procedimientos estadsticos que pueden
utilizarse para contrastar hiptesis cuando no son
posibles los supuestos respecto a los parmetros o a
las distribuciones poblacionales.
Experimento multinomial.
Es un experimento que satisface las siguientes condiciones.

1. El nmero de ensayos es fijo.


2. Los ensayos son independientes.
3. Todos los resultados de ensayos individuales se deben
clasificar en una y slo una de varias categoras distintas.
4. Las probabilidades de las diferentes categoras se mantienen
constantes para cada ensayo.

Distribucin Chi-cuadrado

Las dos aplicaciones ms comunes de Chi-cuadrado son:


1. Pruebas de bondad de ajuste.
2. Pruebas de independencia.
Prueba de bondad de ajuste.

Sirve para probar la hiptesis de que una distribucin de


frecuencia observada se ajusta a (o concuerda con) alguna
distribucin propuesta.

Medidas sobre que tan cerca se ajustan los datos muestrales


observados a una forma de distribucin particular planteada
como hiptesis. Si el ajuste es razonablemente cercano, puede
concluirse que si existe la forma de distribucin planteada como
hiptesis.

Por ejemplo, se puede plantear la hiptesis que la distribucin


poblacional es normal y que todos los valores posibles tienen la
misma probabilidad de ocurrir. Las hiptesis que se probaran
son:

Ho: La distribucin poblacional es normal.


Ha: La distribucin poblacional no es normal.
Prueba de bondad de ajuste.

Si existe una gran diferencia entre lo que


realmente se observa en la muestra y lo que se
esperara observar si la hiptesis nula fuera
correcta, en tal caso es menos probable que la
hiptesis nula sea verdadera. Es decir, la
hiptesis nula debe rechazarse cuando las
observaciones obtenidas en la muestra
difieren mucho del patrn que se espera que
ocurra si la distribucin planteada como
hiptesis si se presenta.
En las pruebas de bondad de ajuste usaremos la
siguiente notacin:

Oi representa la frecuencia observada de un resultado.

Ei representa la frecuencia esperada de un resultado.

k representa el nmero de diferentes categoras o


resultados.

n representa el nmero de ensayos total.

La prueba Chi-cuadrado tiene k-m-1 grados de


libertad, en donde m es el nmero de parmetros a
estimar.
En muchos casos, podemos determinar una frecuencia
esperada multiplicando la probabilidad p de una
categora por el nmero de ensayos distintos n:

E = np

Por ejemplo, si probamos la aseveracin de que un


dado es equitativo lanzndolo 60 veces, tendremos n
= 60 (porque hay 60 ensayos) y p = 1/6 (porque un
dado es equitativo s los seis posibles resultados son
igualmente probables, con la misma probabilidad de
1/6). Por tanto, la frecuencia esperada para cada
categora o celda es:
E = np
E = 60(1/6) = 10
Supuestos.

Los supuestos siguientes aplican cuando probamos una hiptesis


de que la proporcin de poblacin para cada una de las k
categoras (de un experimento multinomial) es la que se asegura.

1. Los datos constituyen una muestra aleatoria.


2. Los datos de muestra consisten en conteos de frecuencia para
las k diferentes categoras.
3. Para cada una de las k categoras, la frecuencia esperada es
por lo menos 5.
La prueba de Chi-cuadrado de bondad de ajuste es confiable solo
si todo Ei es por lo menos 5.

Estadstica de prueba para pruebas de bondad del ajuste en


experimentos multinomiales.
= [(Oi-Ei)^2/Ei]
Valores Crticos.
1. Los valores crticos se encuentran en la tabla de Chi-cuadrado
usando k-1 grados de libertad, donde k es el nmero de
categoras.

2. Las pruebas de hiptesis de bondad del ajuste siempre son de


cola derecha.

La forma de la estadstica de prueba es tal que una


concordancia cercana entre los valores observados y los
esperados produce un valor pequeo de . Un valor grande de
indica una fuerte discrepancia entre los valores observados y
los esperados. Por tanto, un valor significativamente alto de
har que se rechace la hiptesis nula de que no hay diferencia
entre las frecuencias observadas y esperadas. Entonces, la
prueba es de cola derecha porque el valor crtico y la regin
crtica se encuentran a la extrema derecha de la distribucin.
A diferencia de pruebas de hiptesis previas en las que
tenamos que determinar si la prueba era de cola izquierda, de
cola derecha o de dos colas, todas estas pruebas de bondad del
ajuste son de cola derecha.
Caso I.
Jennifer Calcao gerente de crdito del BHD, en la
torre Principal en Santo Domingo, trata de seguir una
poltica de extender un 60% de sus crditos a
empresas comerciales, un 10% a personas naturales y
un 30% a prestatarios extranjeros.
Para determinar si la poltica se estaba siguiendo, Jos
Rondn, vicepresidente de mercadeo, selecciona 85
crditos que se aprobaron recientemente. Encuentra
que 62 de tales crditos se otorgaron a negocios, 10 a
personas naturales, y 13 a prestatarios extranjeros.
Al nivel del 10%, parece que el patrn de cartera
deseado se preserva? Pruebe la hiptesis de que:
Ho: Se mantuvo el patrn deseado: 60% son crditos
comerciales, 10% son prestamos personales y 30% son
crditos extranjeros.
Ha: El patrn deseado no se mantuvo.
Tabla de Tipo de
Crdito

Tipo de Credito Oi p Ei=n*p

Comercial 62.00 0.60 51.00

Personal 10.00 0.10 8.50

Extranjero 13.00 0.30 25.50

Total = n 85.00 85.00


Tabla de Tipo de
Crdito

Tipo de Credito Oi p Ei=n*p

Comercial 62.00 0.60 51.00

Personal 10.00 0.10 8.50

Extranjero 13.00 0.30 25.50

Total = n 85.00 85.00


Tipo de Credito p Oi Ei =np (Oi-Ei) (Oi-Ei)^2 (Oi-Ei)^2/Ei
Comercial 0.60 62.00 51.00 11.00 121.00 2.37
Personal 0.10 10.00 8.50 1.50 2.25 0.26
Extranjero 0.30 13.00 25.50 -12.50 156.25 6.13
Total 1.00 85,00 85,00 CHI-CUADRADA 8.76
Estadstica de prueba para pruebas de bondad del ajuste en
experimentos multinomiales.
El valor es = [(Oi-Ei)/Ei]
=[(62-51)/51]+[(10-8.5)/8.5]+[(13-25.5)/25.5] = 8.76

Valores Crticos.
1. Los valores crticos se encuentran en la tabla de Chi-cuadrado
usando k-1 grados de libertad, donde k es el numero de categoras.
2. Las pruebas de hiptesis de bondad del ajuste siempre son de
cola derecha.

Con un = 10% y k = 3 categoras de crdito (comerciales,


privados y extranjeros), existen k-m-1= 3-0-1=2 grados de
libertad, el valor critico es
0.10, 2 = 4.605
Regla de decisin: "No rechazar la hiptesis nula 4.605.
Rechazar s la hiptesis nula > 4.605.
f(Chisq)

0 1 2 3 4 5 6 7 8 9 10
Chisq
4.61
I PLANTIAMIENTO DE HIPOTES
Goodness of Fit Test HO: SE MANTUVO EL PATRON DESEADO: 60%
COMERCIAL - 10% PERSONAL - 30%
EXTRANJERO
HA: NO SE MANTUVO EL PATRON DESEADO
observed expected O - E (O - E) / E % of chisq
II ESTADISTICA DE PRUEBA - CHI CUADRADA
62 51.000 11.000 2.373 27.07 CHI C. = 8.76
10 8.500 1.500 0.265 3.02
13 25.500 -12.500 6.127 69.91 III REGLA DE DECISION.
SE ACEPTA SI CHI ES MENOR QUE
85 85.000 0.000 8.765 100.00 4.61
SE RECHAZA SI CHI ES MAYOR QUE 4.61
chi-
SE RECHAZA LA HO
8.76square
1df IV INTERPRETACION
.0031p-value NO SE ESTA CUMPLIENDO CON LA POLITICA DE
CREDITO DEL BANCO
Caso II. Prueba de normalidad.

Las especificaciones para la produccin de tanques de aire


utilizados en inmersin requieren que los tanques se llenen a una
presin de 600 libras por pulgadas cuadradas (psi). Se permite una
desviacin de 10 psi. Las especificaciones de seguridad permiten
una distribucin normal en los niveles de llenado. Usted acaba de
ser contratado por Aqua Lung, un importante fabricante de equipos
de inmersin. Su primera tarea es determinar si los niveles de
llenado se ajustan a una distribucin normal. Aqua Lung esta
seguro de que media de 600 psi y la desviacin estndar de 10 psi
prevalecen. En este esfuerzo se miden n=1000 tanques y se halla
la distribucin presentada en la siguiente tabla.
Sus hiptesis son:
Ho: Los niveles de llenado estn distribuidos normalmente.
Ha: Los niveles de llenado no estn distribuidos normalmente.
Frecuencia Probabilidades Frecuencias
PSI Real Oi pi Esperadas Ei O-E (O-E)^2 [(O-E)^2]/E
0 y por debajo de 580 20
580 y por debajo de 590 142
590 y por debajo de 600 310
600 y por debajo de 610 370
610 y por debajo de 620 128
6200 y por encma 30
Totales 1000
Determine la probabilidad para cada clase
mediante la formula Z y complete la tabla de
probabilidades y frecuencias esperadas.
X => viene dado por cada valor del rango de
los PSI.
Media = 600 psi
Desviacin = 10 psi
Por ejemplo Z = (580 600) / 10 = - 2
P(z=2) = 0.4772
P(z<2) = P(por debajo de 580)= 0.5 0.4772
= 0.0228
Frecuencia Probabilidades Frecuencias
PSI Real Oi pi Esperadas Ei O-E (O-E)^2 [(O-E)^2]/E
0 y por debajo de 580 20 0.0228 22.80 -2.80 7.84 0.344
580 y por debajo de 590 142 0.1359 135.90 6.10 37.21 0.274
590 y por debajo de 600 310 0.3413 341.30 -31.30 979.69 2.870
600 y por debajo de 610 370 0.3413 341.30 28.70 823.69 2.413
610 y por debajo de 620 128 0.1359 135.90 -7.90 62.41 0.459
620 y por encma 30 0.0228 22.80 7.20 51.84 2.274
Totales 1000 1 CHI CUADRADA 8.634
Goodness of Fit Test

observe expecte
d d O - E (O - E) / E % of chisq
20 22.800 -2.800 0.344 3.98
142 135.900 6.100 0.274 3.17
310 341.300 -31.300 2.870 33.24
370 341.300 28.700 2.413 27.95
128 135.900 -7.900 0.459 5.32
30 22.800 7.200 2.274 26.33
1000 1000.000 0.000 8.634 100.00

chi-
8.63square
5df
Valor Critico. Se desea probar la hiptesis al nivel del 5%.
Debido a que tanto la media poblacional como la desviacin
estndar son dadas y no tienen que estimarse, m = 0. Existe k =
6 clases en la tabla de frecuencias, de manera que los grados de
libertad son k-1=5. Se encuentra que el valor critico es 0.05,5
=11.070
Regla de decisin: "No rechazar la hiptesis nula si es menor
que 11.070. Rechazar la hiptesis nula si es mayor que
11.070"

Determine el valor = [(Oi-Ei)/Ei]


Interpretacin: La hiptesis nula se acepta. Las diferencias entre
lo que se observo y lo que se espera observar si los contenidos
estuvieran distribuidos normalmente con una media de 600 y una
desviacin estndar de 10 pueden atribuirse al error de
muestreo.

Si la media poblacional y la desviacin estndar no fueran


conocidas, se hubieran tenido que estimar de los datos
muestrales de la tabla. Entonces m=2, y los grados de libertad
serian k-2-1 o 6-2-1=3.
f(Chisq)

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Goodness
Chisq of Fit Test
11.07

I PLANTIAMIENTO DE HIPOTES
HO: LOS NIVELES DE LLENADO ESTAN
observexpecte (O - E) / % of DISTRIBUIDO NORMALMENTE
ed d O-E E chisq HA: LOS NIVELES DE LLENADO ESTAN
DISTRIBUIDO NORMALMENTE
20 22.800 -2.800 0.344 3.98
142 135.900 6.100 0.274 3.17 II ESTADISTICA DE PRUEBA - CHI CUADRADA
310 341.300 -31.300 2.870 33.24 CHI C. = 8.63
370 341.300 28.700 2.413 27.95
III REGLA DE DECISION.
128 135.900 -7.900 0.459 5.32 SE ACEPTA SI CHI ES MENOR QUE 11.07
30 22.800 7.200 2.274 26.33 SE RECHAZA SI CHI ES MAYOR QUE 11.07
1000.00
1000 0 0.000 8.634 100.00 SE ACEPTA LA HO

IV INTERPRETACION
chi- LOS NIVELES DE LLENADOS ESTAN
8.63square DISTRIBUIDOS NORMALMENTE
Tablas de contingencia. Una prueba de independencia.

Tabla de Contingencia o tabla de frecuencia bidireccional.


Es una tabla en la que las frecuencias corresponden a dos
variables. (Se utiliza una variable para clasificar las filas y otra
para clasificar las columnas).
Las tablas contingencias son aquellas que sirven para
comparar dos variables.

Prueba de independencia.
Una prueba de independencia prueba la hiptesis nula de
que la variable de fila y la variable de columna de una tabla de
contingencia no estn relacionadas. (La hiptesis nula es la
declaracin de que las variables de fila y de columna son
independientes.)
Es muy importante reconocer que, en este contexto, la
palabra contingencia se refiere a dependencia, pero slo se trata
de una dependencia estadstica y no puede usarse para
establecer un vnculo directo de causa y efecto entre las dos
variables en cuestin.
Supuestos.
Al probar la hiptesis nula de independencia entre las variables
de fila y de columna de una tabla de contingencia, aplican los
supuestos siguientes (Obsrvese que estos supuestos no exigen
que la poblacin padre tenga una distribucin normal ni alguna
otra distribucin especifica.)

1. Los datos de muestra se escogen aleatoriamente.


2. La hiptesis nula Ho es la declaracin de que las variables de
fila y de columna son independientes; la hipotesis alternativa Ha
es la declaracion de que las variables de fila y de columna son
dependientes.
3. Para cada celda de la tabla de contingencia, la frecuencia
esperada E es de por lo menos 5.

Estadstica de prueba para prueba de independencia.

= [(Oi-Ei)^2/Ei]
Valores crticos.
1. Los valores crticos se encuentran en la tabla usando:
grados de libertad = (r-1)(c-1)
2. Las pruebas de independencia con tablas de contingencia solo
implican regiones criticas de cola derecha.
Frecuencia esperada para una tabla de contingencia.
Frecuencia esperada (E)= [(Total de fila)*(Total de columna)]/Gran
Total

La estadstica de prueba nos permite medir el grado de discrepancia


entre las frecuencias observadas y las que esperaramos en teora si
las dos variables son independientes. Valores pequeos de la
estadstica de prueba indican coincidencia entre las frecuencias
observadas y las frecuencias esperadas con variables de fila y de
columna independientes. Los valores grandes de la estadstica de
prueba estn a la derecha de la distribucin Chi-cuadrada y
reflejan diferencias significativas entre las frecuencias observadas y
las esperadas. En muestreos grandes repetidos, la distribucin
de la estadstica de prueba se puede aproximar con la distribucin
Chi-cuadrada, siempre que todas las frecuencias esperadas sean de
por lo menos 5.
Caso I.
Santo Domingo Motors desea determinar si existe
alguna relacin entre el ingreso de los clientes y la
importancia que dan al precio de los automviles de
lujo. Los gerentes de la compaa desean probar la
hiptesis de que:

Ho: Ingreso e importancia del precio son


independientes.

Ha: Ingreso e importancia del precio no son


independientes.

Los clientes estn agrupados en tres niveles de


ingreso y se les pide asignar un nivel de significancia
para poner precio a la decisin de compra. Los
resultados se muestran en la siguiente tabla de
contingencia.
Atributo b: Ingresos
Atributo a: Nivel de Importancia Bajo Medio Alto Total
Grande 83 62 37 182
Frecuencia Esperada
Moderado 52 71 49 172
Frecuencia Esperada
Poco 63 58 63 184
Frecuencia Esperada
Totales 198 191 149 538
Atributo b: Ingresos
Atributo a: Nivel de Importancia Bajo Medio Alto Total
Grande 83 62 37 182
Frecuencia Esperada 66.98 64.61 50.41
Moderado 52 71 49 172
Frecuencia Esperada 63.30 61.06 47.64
Poco 63 58 63 184
Frecuencia Esperada 67.72 65.32 50.96
Totales 198 191 149 538
(Oi-Ei)^2/Ei Atributo b:
Ingreso
Atributo a: s

Nivel de Importancia Bajo Medio Alto Total

Grande 3.83 0.11 3.57 7.50

Moderado 2.02 1.62 0.04 3.67

Poco 0.33 0.82 2.85 3.99

Totales 6.18 2.54 6.45 15.17


Atributo b: Ingre sos
Oi-E i Oi-E i Oi-E i
Atributo a : N ive l de Importa ncia Ba jo Me dio Alto
Gra nde 16.02 -2.61 -13.41
Mode ra do -11.30 9.94 1.36
P oco -4.72 -7.32 12.04

Atributo b: Ingre sos


(Oi-Ei)^2/ Ei (Oi-Ei)^2/ Ei (Oi-Ei)^2/ Ei
Atributo a : N ive l de Importa ncia Ba jo Me dio Alto
Gra nde 3.83 0.11 3.57
Mode ra do 2.02 1.62 0.04
P oco 0.33 0.82 2.85
T OT ALE S 6.18 2.54 6.45
CHI CUADRADO 15.17
Chi-square Contingency Table Test for Independence

Bajo Medio Alto Total


Grande 83 62 37 182
Moderad
o 52 71 49 172
Poco 63 58 63 184
Total 198 191 149 538

15.17chi-square
4df
.0044p-value
Chi-square Contingency Table Test for Independence

Bajo Medio Alto Total


Grande Observed 83 62 37 182
Expected 66.98 64.61 50.41 182.00
O- E 16.02 -2.61 -13.41 0.00
(O - E) / E 3.83 0.11 3.57 7.50
Moderado Observed 52 71 49 172
Expected 63.30 61.06 47.64 172.00
O- E -11.30 9.94 1.36 0.00
(O - E) / E 2.02 1.62 0.04 3.67
Poco Observed 63 58 63 184
Expected 67.72 65.32 50.96 184.00
O- E -4.72 -7.32 12.04 0.00
(O - E) / E 0.33 0.82 2.85 3.99
Total Observed 198 191 149 538
Expected 198.00 191.00 149.00 538.00
O- E 0.00 0.00 0.00 0.00
(O - E) / E 6.18 2.54 6.45 15.17

15.17 chi-square
4 df
.0044 p-value
El valor = [(Oi-Ei)/Ei]
Valores crticos.
1. Los valores crticos se encuentran en la tabla usando: grados de
libertad = (r-1)(c-1)
2. Las pruebas de independencia con tablas de contingencia solo
implican regiones criticas de cola derecha.
Si se determina en 1%, y con (f-1)(c-1) = (3-1)(3-1) = 4 grados de
libertad 0.01,4 = 13.277.

Regla de decisin: "No rechazar la hipotesis nula si es menor que


13.277. Rechazar la hiptesis nula si es mayor que 13.277"

Interpretacin. La hiptesis nula se rechaza. Existe solo 1% de


probabilidad de que si no existe relacin entre ingreso y significancia
del precio, las diferencias entre Oi y Ei serian lo suficientemente
grandes como para producir un Chi-cuadrado ms grande que 13.277.
Existe evidencia de una relacin entre el ingreso de los clientes y la
importancia dada al precio de un auto de lujo.
Chi-square Contingency Table Test for Independence

Bajo Medio Alto Total


Grande 83 62 37 182
Modera
do 52 71 49 172
f(Chisq) Poco 63 58 63 184
Total 198 191 149 538

chi-
15.17square
4df
.0044p-value

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Chisq
13.28
Caso V. En un anlisis de segmentacin de mercado para
tres cervezas, el grupo de investigacin encargado ha
planteado la duda de si las preferencias para las tres
cervezas son diferentes entre los consumidores hombres
y mujeres. Si la preferencia de las cervezas fuera
independiente del sexo del consumidor, se iniciara una
campaa publicitaria para todas las cervezas. Sin
embargo, si la preferencia depende del sexo del
consumidor, se ajustarn los promociones para tener en
cuenta los distintos mercados metas. Pruebe el supuesto
a un nivel de significancia de un 5%.
Los datos de la tabla constituyen las frecuencias
observadas para las seis clases o categoras.
CERVEZA PREFERIDA
SEXO LIGERA CLARA OSCURA
HOMBRE 20 40 20
MUJER 30 30 10