Sei sulla pagina 1di 39

1 INTRODUCCIN

Es evidente que un conocimiento previo por parte del investigador de las caractersticas de la realidad de la poblacin mejora o debe mejorar los resultados inferenciales que se pueden obtener de la obtencin de una muestra; parece claro que si bien el mtodo de seleccin aleatoria conlleva los mejores resultados, quiz el adecuar la manera de extraer la muestra a las posibles distintas naturalezas de las poblaciones puede mejorar el rendimiento, aunque slo fuere a nivel de costos. No es por tanto lo mismo intentar conocer la altura media de los habitantes de un pas, que el nmero de errores en una gran contabilidad, dado que la naturaleza de su universo y por tanto el comportamiento poblacional son distintos. Es por ello, que para distintas "naturalezas" del problema han de plantearse distintas soluciones, si bien todas, o casi todas, pasan por la aleatoriedad; de ah que se establezcan diversas "tcnicas" o "mtodos" de muestreo, de los que brevemente enumeramos algunos.

El objetivo de la estadstica inferencial es obtener la informacin acerca de una poblacin, partiendo de la informacin que contiene una muestra. El proceso que se sigue para seleccionar una muestra se denomina Muestreo.

Las ventajas que nos brinde el muestreo son: Los operativos son menores. Posibilita analizar un mayor nmero de variables. Permite controlar las variables en estudio.

Prueba de hiptesis para diferencia de proporcin


El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fabrica de llantas quera determinar la proporcin de llantas que se reventaban antes de 10,000 millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica particular. El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta para que muy pocas se revienten antes de las 10,000 millas. Si ms de un 8% de las llantas se revientan antes de las 10,000 millas, se llegara a concluir que el proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar como sigue:

Ho: p .08 (funciona correctamente) H1: p > .08 (no funciona correctamente)

Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaos n 1 y n 2, para observar una caracterstica o cualidad, se puede comparar el comportamiento de dicha caracterstica en las poblaciones a travs de la diferencia de proporciones.

(3.14)

CASOS
Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin particular. La proporcin de una poblacin Las hiptesis se enuncian de manera similar al caso de la media. Ho: p = p0 H1: p p0 En caso de que la muestra sea grande n>30, el estadgrafo de prueba es:
se distribuye normal estndar.

Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o unilateral ), lo cual puedes fcilmente hacerlo auxilindote de la tabla 4.4.1. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias:
Ho: p1 = p2 p1 - p2 = 0

H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente. El estadgrafo de prueba para el caso de muestras independientes:
donde

Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. Est de ms que te diga que este estadgrafo se distribuye normal estndar. La regla de decisin se determina de manera similar a los casos ya vistos anteriormente. El objetivo de la prueba es comparar estas dos proporciones, como estimadores H1: p1 p2 Recuerda que la H1 tambin puede plantearse de forma unilateral. Si la Ho es cierta entonces b - c =0 y el estadgrafo de prueba es:

Se seleccion una muestra aleatoria de 100 hombres y 100 mujeres de un departamento de Colombia; se hall que de los hombres 60 estaban a favor de una ley de divorcio y de las mujeres 55 estaban a favor de dicha ley. Con base en sta informacin, pruebe que la proporcin de hombres que favorece sta ley es mayor que la proporcin de mujeres. Asuma un nivel de confianza del 99 por ciento. Solucin H0 : H1 : H= H> M M

Se utiliza la expresin 3.14

Por la hiptesis alternativa se trabaja a una cola superior. En la tabla de la distribucin normal con una confiabilidad del 99 por ciento, el valor de Z es 2,33. La estadstica de trabajo est en la zona de no rechazo de la hiptesis nula (figura 3.19), es decir, con una seguridad del 99 por ciento se concluye que no hay diferencia en la proporcin de hombres y mujeres que favorecen la ley de divorcio.

POBLACIN FINITA

(se conoce N) o el muestro es sin reposicin.


2 NZ PQ n= 2 2 ( N 1) E + Z PQ

Donde: P=Proporcin de xito; que se conoce por estudios anteriores o similares. Q=(1-P). Proporcin de fracaso. Z=Valor que se obtiene de la distribucin normal, para un nivel de significacin a. Generalmente se toma: Z=1.96 para un nivel de significancia del 5%. Z=2.575 para un nivel de significancia del 1%. E=Error de estimacin. Valor que lo determina el investigador. Se sugiere valores en torno al 5%. N= Nmero de los elementos de la poblacin.

Nota: Si no se conoce P, se puede adoptar las siguientes decisiones: i) ii) Tomar una muestra piloto y calcular el valor de P. Considerar el valor de P=0.5, lo cual dar el nmero de elementos de la muestra el mayor posible.

Ejemplos N 004

Se van a realizar un gran y desconocido nmero de ensayos para calibrar la resistencia media a la rotura de un determinado azulejo en una partida de 10 000,000 unidades. Si deseamos cometer un error inferior a 10 kg/cm 2, y por ensayos anteriores conocemos que la varianza en la rotura ha sido de 40 (kg/cm 2)2, Qu nmero de ensayos hemos de realizar si hemos decidido trabajar con un nivel de confianza del 95%?

Si suponemos un gran nmero de ensayos, suponemos, tambin, que el tamao muestral es grande, por lo que podemos establecer normalidad. Los datos serian los siguientes: =95%, E2=10 kg/cm2 ,2=40(kg/cm2)2.

2 2 Z Utilizando la frmula siguiente: n = , tenemos: E2

n=

(1.96 2 )(40) = 15.36 15 muestras de azulejos. 10

Ejemplo N 005

Para conocer la valoracin en forma de porcentaje de aceptacin hacia un determinado profesor decidimos encuestar a un determinado nmero de sus 100 alumnos. Calcular dicho nmero, si el error que estamos dispuestos a admitir es del ms menos 3% y trabajamos con un nivel de confianza del 95%.

Tenemos los siguientes datos: N=100, E=3%, =95%, p=0.5. q=1-p=0.5

Utilizando la frmula tenemos:

n=

2 NZ PQ (100)(1.96) 2 (0.5)(0.5) = = 91.51 91 Alumnos. 2 ( N 1) E 2 + Z PQ (100 1)(0.03) 2 + (1.96) 2 (0.5)(0.5)

Ejemplo N 006

Para conocer la valoracin en forma de porcentaje de aceptacin hacia un determinado profesor decidimos encuestar a un determinado nmero de sus 100 alumnos. Calcular dicho nmero, si el error que estamos dispuestos a admitir es del ms menos 3% y trabajamos con un nivel de confianza del 95%.

El tamao de la poblacin es pequeo con =100, =3%, =95%, p=0,5

q=1-p=0.5.

Utilizando la frmula tenemos:

2 NZ PQ (100)(1.96) 2 (0.5)(0.5) n= = = 91.51 91 alumnos. 2 ( N 1) E 2 + Z PQ (100 1)(0.03) 2 + (1.96) 2 (0.5)(0.5)

Poblacin infinito:
Es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el conteo. Son poblaciones infinitas porque hipotticamente no existe lmite en cuanto al nmero de observaciones que cada uno de ellos puede generar. Cuando no se conoce el tamao N de la poblacin o ste es infinito:

n=

2 2 Z E2

Ejemplos: La cantidad de estrellas en el universo, Una poblacion de hormigas, Cantidad de granos de arena en una playa--- Se les denomina infinito puesto que superan una cantidad netamente medible o son casi imposible de medir

Tipos de distribucin

Hiptesis Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : H1 : 1= 1 2 H0 : 2 H1 : 112 2=k k

- Prueba de hiptesis a una cola superior H0 : H1 : 1= 1> 2 H0 : 2 H1 : 112 k 2>k

- Prueba de hiptesis a una cola inferior H0 : 1= 2 H0 : 12 k

H1 :

1<

2 H1 :

1-

2<k

Niveles de Significacin.
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuesto a correr el riesgo de cometern error de tipo I, se llama nivel de significacin. Esta probabilidad, denota a menudo por se, suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra eleccin. En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al disear una regla de decisin, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel de significacin 0,05, lo cual quiere decir que tal hiptesis tiene una probabilidad 0,05 de ser falsa. Prueba de Uno y Dos Extremos. Cuando estudiamos ambos valores estadsticos es decir, ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de una y dos colas. Con frecuencia no obstante, estaremos interesados tan slo en valores extremos a un lado de la media (o sea, en uno de los extremos de la distribucin), tal como sucede cuando se contrasta la hiptesis de que un proceso es mejor que otro (lo cual no es lo mismo que contrastar si un proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o de un extremo.

En tales situaciones, la regin crtica es una regin situada a un lado de la distribucin, con rea igual al nivel de significacin

Ejemplos
Ejemplo: Se plant cierto experimento en 24 parcelas para probar el efecto de la presencia o ausencia de K en el rendimiento de palma. Peso medio del racimo (Kg.)
n 1 2 3 4 5 6 7 8 9 10 11 12 Suma a 20.0 24.0 21.0 22.0 23.0 24.0 22.5 22.0 21.5 20.0 22.0 24.0 266 b 24.0 28.0 25.0 25.0 27.0 27.5 28.0 26.0 26.0 24.5 26.5 28.5 316 26.33 a2 400.00 576.00 441.00 484.00 529.00 576.00 506.25 484.00 462.25 400.00 484.00 576.00 5918.5 b2 576.00 784.00 625.00 625.00 729.00 756.25 784.00 576.00 676.00 600.25 702.25 812.25 8346

Promedio 22.16

s2a = 5918.5 - (266)2/12 = 2.02 11 s2b = 8346 - (316)2/12 = 2.24 11 Se busca en la tabla de t de student con 2 (n-1) grados de libertad o sea 22, y se encuentra que el valor tabular es de 2.074 al 95% de probabilidad, el cual es menor que la t calculada y por lo tanto se declara la prueba significativa. Conclusin: La diferencia entre promedios observados es atribuible al efecto de tratamiento (K), por haberse conseguido un resultado significativo. 3.-Caso de igual nmero de observaciones y varianzas heterogneas.

Ejemplo: Se plant cierto experimento en 24 parcelas con dos clases de semillas: semilla mezclada y semilla DxP seleccionada. Se desea saber si el rendimiento observado por la semilla seleccionada difiere a la otra. Produccin de palma: TM/ha/ao Para ver la tabla seleccione la opcin "Descargar" del men superior

s2a = 1748.61 - (144.5)2/12 = 0.78 11 s2b = 4001.14 - (216.2)2/12 = 9.63 11 Consultando la tabla de t con n-1 grados de libertad (11) se encuentra un valor de 2.201, por lo tanto, la diferencia se declara significativa. Conclusin: El rendimiento observado por las plantas de semilla seleccionada fue significativamente superior a las otras. 4.-Caso de diferente nmero de observaciones y varianzas homogneas

Ejemplo: Se tom una rea de terreno distribuida en 22 parcelas y a 13 de ellas se les aplic un fertilizante nitrogenado para medir el efecto del N en el crecimiento. rea foliar de la hoja # 17 en m2 Para ver la tabla seleccione la opcin "Descargar" del men superior

s2a = 968.93 - (112.1)2/13 = 0.19 12 s2b = 390.84 - (59.2)2/9 = 0.18 8 s2c = 12(0.19) + 8(0.18) = 0.19 20 Consultando la tabla de t con n-1 grados de libertad (11) se encuentra un valor de 2.201, por lo tanto, la diferencia se declara significativa. Conclusin: El rendimiento observado por las plantas de semilla seleccionada fue significativamente superior a las otras. Ejemplo: Se tom una rea de terreno distribuida en 22 parcelas y a 13 de ellas se les aplic un fertilizante nitrogenado para medir el efecto del N en el crecimiento. rea foliar de la hoja # 17 en m2 Para ver la tabla seleccione la opcin "Descargar" del men superior

s2a = 968.93 - (112.1)2/13 = 0.19 12 s2b = 390.84 - (59.2)2/9 = 0.18 8 s2c = 12(0.19) + 8(0.18) = 0.19 20

Consultando la tabla con (na-1) + (nb-1) o sea (20) grados de libertad, se obtiene el valor tabular de 2.086, el cual es menor que la t calculada, por lo tanto la diferencia se declara significativa. Conclusin: La diferencia detectada en estas dos muestras es atribuible a la aplicacin del fertilizante nitrogenado. 5.- Caso de diferente nmero de observaciones y varianzas heterogneas .

En este caso, la tc es comparada con la tg (t generada), que a diferencia de los casos anteriores, hay que calcularla.

Donde: ta y tb son los valores de la tabla con n-1 grados de libertad para a y b respectivamente Ejemplo: Se tomaron 2 muestras de palma comercial de orgenes diferentes y se midi el porcentaje de almendra en el racimo en ambas muestras, el objeto es probar si las muestras son diferentes genticamente o no. Porcentaje de almendra Para ver la tabla seleccione la opcin "Descargar" del men superior s2a = 225.02 - (53)2/14 = 1.88 13

s2b = 192.26 - (43.80)2/10 = 0.05 9

En este caso la t generada (tg), reemplaza la t de la tabla y como la tc es menor que la tg, la diferencia se declara No significativa. Conclusin: La diferencia observada entre promedios es atribuible nicamente a errores de muestreo o variabilidad natural, y no a diferencias genticas. 6.-Caso de muestras pareadas(de variables dependientes) En este caso, se asume que las muestras han sido distribuidas por pares.

Ejemplo: Se tomaron 12 foliolos de palma joven y a cada uno se le trat la mitad con Benlate para medir la inhibicin del crecimiento de hongos. Magnitud del dano Sin Con n Benlate Benlate D = X - Y D2 Para ver la tabla seleccione la opcin "Descargar" del men superior

Consultando la tabla con n-1 grados de libertad se obtiene el valor tabular de 2.201, por lo tanto, la diferencia se declara significativa. Conclusin: De la prueba se desprende que el tratamiento con benlate redujo significativamente la incidencia de hongos. Utilidad de las hiptesis: El uso y formulacin correcta de las hiptesis le permiten al investigador poner a prueba aspectos de la realidad, disminuyendo la distorsin que pudieran producir sus propios deseos o gustos. Pueden ser sometidas a prueba y demostrarse como probablemente correctas o incorrectas sin que interfieran los valores o creencias del individuo.

Prueba de hiptesis para la proporcin poblacional


Afirmacin acerca de los parmetros de la poblacin. Etapas Bsicas en Pruebas de Hiptesis. Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) en parmetro poblacional. Despus de recolectar una muestra aleatoria, se compara la estadstica muestral, as como la media (x), con el parmetro hipottico, se compara con una supuesta media poblacional (). Despus se acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el resultado muestral resulta muy poco probable cuando la hiptesis es cierta. Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0) es el valor hipottico del parmetro que se compra con el resultado muestral resulta muy poco probable cuando la hiptesis es cierta. Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hiptesis nula solamente si el resultado muestral es tan diferente del valor hipottico que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos. Etapa 3.- Elegir la estadstica de prueba. La estadstica de prueba puede ser la estadstica muestral (el estimador no segado del parmetro que se prueba) o una versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor hipottico de una media poblacional, se toma la media de una muestra aleatoria de esa distribucin normal, entonces es comn que se transforme la media en un valor z el cual, a su vez, sirve como estadstica de prueba. Consecuencias de las Decisiones en Pruebas de Hiptesis. Decisiones Posibles Situaciones Posibles La hiptesis nula La

es verdadera

hiptesis nula es falsa

Aceptar la Hiptesis Nula Se acepta correctamente Error tipo II Rechazar la Hiptesis Nula Error tipo I Se rechaza correctamente

Etapa 4.- Establecer el valor o valores crticos de la estadstica de prueba. Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica de prueba que se van a utilizar, se produce a establecer el o los valores crticos de estadstica de prueba. Puede haber uno o ms de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos. Etapa 5.- Determinar el valor real de la estadstica de prueba. Por ejemplo, al probar un valor hipottico de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crtico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z. Etapa 6.- Tomar la decisin. Se compara el valor observado de la estadstica muestral con el valor (o valores) crticos de la estadstica de prueba. Despus se acepta o se rechaza la hiptesis nula. Si se rechaza sta, se acepta la alternativa; a su vez, esta decisin tendr efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estndar de desempeo o cul de dos estrategias de mercadotecnia utilizar. La distribucin apropiada de la prueba estadstica se divide en dos regiones: una regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el proceso funciona correctamente. Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis nula no se puede rechazar) de la regin de rechazo. A hora bien el valor crtico depende del tamao de la regin de rechazo. PASOS DE LA PRUEBA DE HIPTESIS Expresar la hiptesis nula

Expresar la hiptesis alternativa Especificar el nivel de significanca

Determinar el tamao de la muestra Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Determinar la prueba estadstica. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. Determinar la decisin estadstica. Expresar la decisin estadstica en trminos del problema. CONCEPTOS BSICOS PARA EL PROCEDIMIENTO DE PRUEBAS DE HIPTESIS. Hiptesis Estadstica: Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la poblacin aplicada. Tales hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas. Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones. Hiptesis Nula. En muchos casos formulamos una hiptesis estadstica con el nico propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que la moneda es buena (o sea p = 0,5, donde p es la probabilidad de cara). Analgicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales hiptesis se suelen llamar hiptesis nula y se denotan por Ho. Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer una hiptesis nula. La hiptesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos.

Por ejemplo, supongamos que un investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo de natacin, stos sern mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hiptesis toma al azar una muestra de jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo recibi. Una hiptesis nula es importante por varias razones: Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin. El hecho de contar con una hiptesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al azar. No toda investigacin precisa de formular hiptesis nula. Recordemos que la hiptesis nula es aquella por la cual indicamos que la informacin a obtener es contraria a la hiptesis de trabajo. Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema flucta, por tanto, debe rechazarse como tal. Otro ejemplo: Hiptesis: el aprendizaje de los nios se relaciona directamente con su edad. Hiptesis Alternativa. Toda hiptesis que difiere de una dada se llamar una hiptesis alternativa. Por ejemplo: Si una hiptesis es p = 0,5, hiptesis alternativa podran ser p = 0,7, p " 0,5 p > 0,5. Una hiptesis alternativa a la hiptesis nula se denotar por H1. Al responder a un problema, es muy conveniente proponer otras hiptesis en que aparezcan variables independientes distintas de las primeras que formulamos. Por tanto, para no perder tiempo en bsquedas intiles, es necesario hallar diferentes hiptesis alternativas como respuesta a un mismo problema y elegir entre ellas cules y en qu orden vamos a tratar su comprobacin. Las hiptesis, naturalmente, sern diferentes segn el tipo de investigacin que se est realizando. En los estudios exploratorios, a veces, el objetivo de la

investigacin podr ser simplemente el de obtener los mnimos conocimientos que permitan formular una hiptesis. Tambin es aceptable que, en este caso, resulten poco precisas, como cuando afirmamos que "existe algn tipo de problema social en tal grupo", o que los planetas poseen algn tipo de atmsfera, sin especificar de qu elementos est compuesto. Los trabajos de ndole descriptiva generalmente presentan hiptesis del tipo "todos los X poseen, en alguna medida, las caracterstica Y". Por ejemplo, podemos decir que todas las naciones poseen algn comercio internacional, y dedicarnos a describir, cuantificando, las relaciones comerciales entre ellas. Tambin podemos hacer afirmaciones del tipo "X pertenece al tipo Y", como cuando decimos que una tecnologa es capital - intensiva. En estos casos, describimos, clasificndolo, el objeto de nuestro inters, incluyndolo en un tipo ideal complejo de orden superior. Por ltimo, podemos construir hiptesis del tipo "X produce (o afecta) a Y", donde estaremos en presencia de una relacin entre variables. Errores de tipo I y de tipo II. Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I. Por otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos que se cometi un error de tipo II. En ambos casos, se ha producido un juicio errneo. Para que las reglas de decisin (o no contraste de hiptesis) sean buenos, deben disearse de modo que minimicen los errores de la decisin; y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un intento de disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo. En la prctica, un tipo de error puede ser ms grave que el otro, y debe alcanzarse un compromiso que disminuya el error ms grave. La nica forma de disminuir ambos a la vez es aumentar el tamao de la muestra que no siempre es posible. Niveles de Significacin. Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuesto a correr el riesgo de cometern error de tipo I, se llama nivel de significacin. Esta probabilidad, denota a menudo por se, suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra eleccin.

En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al disear una regla de decisin, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel de significacin 0,05, lo cual quiere decir que tal hiptesis tiene una probabilidad 0,05 de ser falsa. Prueba de Uno y Dos Extremos. Cuando estudiamos ambos valores estadsticos es decir, ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de una y dos colas. Con frecuencia no obstante, estaremos interesados tan slo en valores extremos a un lado de la media (o sea, en uno de los extremos de la distribucin), tal como sucede cuando se contrasta la hiptesis de que un proceso es mejor que otro (lo cual no es lo mismo que contrastar si un proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o de un extremo. En tales situaciones, la regin crtica es una regin situada a un lado de la distribucin, con rea igual al nivel de significacin. Curva Caracterstica Operativa Y Curva De Potencia Podemos limitar un error de tipo I eligiendo adecuadamente el nivel de significancia. Es posible evitar el riesgo de cometer el error tipo II simplemente no aceptando nunca la hiptesis, pero en muchas aplicaciones prcticas esto es inviable. En tales casos, se suele recurrir a curvas caractersticas de operacin o curvas de potencia que son grficos que muestran las probabilidades de error de tipo II bajo diversas hiptesis. Proporcionan indicaciones de hasta que punto un test dado nos permitir evitar un error de tipo II; es decir, nos indicarn la potencia de un test a la hora de prevenir decisiones errneas. Son tiles en el diseo de experimentos por que sugieren entre otras cosas el tamao de muestra a manejar. Pruebas de hiptesis para la media y proporciones Debido a la dificultad de explicar este tema se enfocar un problema basado en un estudio en una fbrica de llantas. En este problema la fbrica de llantas tiene dos turnos de operarios, turno de da y turno mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas:

1.- Es la duracin promedio de las llantas producidas en el turno de da igual a 25 000 millas? 2.- Es la duracin promedio de las llantas producidas en el turno mixto menor de 25 000 millas? 3.- Se revienta ms de un 8% de las llantas producidas por el turno de da antes de las 10 000 millas? Prueba De Hiptesis Para La Media En la fbrica de llantas la hiptesis nula y alternativa para el problema se plantearon como sigue: Ho: = 25 000 H1: 25 000

Si se considera la desviacin estndar las llantas producidas en el turno de da, entonces, con base en el teorema de limite central, la distribucin en el muestreo de la media seguira la distribucin normal, y la prueba estadstica que esta basada en la diferencia entre la media hipottica se encontrara como sigue: de la muestra y la media

Para ver el grfico seleccione la opcin "Descargar" del men superior Si el tamao de la regin de rechazo se estableciera en 5% entonces se podran determinar los valores crticos de la distribucin. Dado que la regin de rechazo esta dividida en las dos colas de la distribucin, el 5% se divide en dos partes iguales de 2.5%. Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en unidades de desviacin. Una regin de rechazo de 0.25 en cada cola de la distribucin normal, da por resultado un rea de .475 entre la media hipottica y el valor crtico. Si se busca est rea en la distribucin normal, se encuentra que los valores crticos que dividen las regiones de rechazo y no rechazo son + 1.96 y - 1.96

Por tanto, la regla para decisin sera: Rechazar Ho si Z > + 1.96 O si Z < - 1.96 De lo contrario, no rechazar Ho No obstante, en la mayor parte de los casos se desconoce la desviacin estndar de la poblacin. La desviacin estndar se estima al calcular S, la desviacin estndar de la muestra. Si se supone que la poblacin es normal la distribucin en el muestreo de la media seguira una distribucin t con n-1 grados de libertad. En la prctica, se a encontrado que siempre y cuando el tamao de la muestra no sea muy pequeo y la poblacin no este muy sesgada, la distribucin t da una buena aproximacin a la distribucin de muestra de la media. La prueba estadstica para determinar la diferencia entre la media de la muestra y la media de la poblacin cuando se utiliza la desviacin estndar S de la muestra, se expresa con:

Para una muestra de 100, si se selecciona un nivel de significanca de .05, los valores crticos de la distribucin t con 100-1= 99 grados de libertad se puede obtener como se indica en la siguiente tabla: Para ver el grfico seleccione la opcin "Descargar" del men superior Como esta prueba de dos colas, la regin de rechazo de .05 se vuelve a dividir en dos partes iguales de .025 cada una. Con el uso de las tablas para t, los valores crticos son 1.984 y +1.984. la regla para la decisin es: Rechazar Ho si O si - 1.984 >+1.984

De lo contrario, no rechazar Ho

Los resultados de la muestra para el turno de da fueron

=25 430 millas,

=4 000 millas y = 100. Puesto que se esta probando si la media es diferente a 25 000 millas, se tiene con la ecuacin Para ver el grfico seleccione la opcin "Descargar" del men superior Dado que = 1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho. Por ello, la de cisin de no rechazar la hiptesis nula Ho. En conclusin es que la duracin promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de tipo II, este enunciado se puede redactar como "no hay pruebas de que la duracin promedio de las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de da". Prueba De Hiptesis Para Proporciones El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fabrica de llantas quera determinar la proporcin de llantas que se reventaban antes de 10,000 millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica particular. El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta para que muy pocas se revienten antes de las 10,000 millas. Si ms de un 8% de las llantas se revientan antes de las 10,000 millas, se llegara a concluir que el proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar como sigue:

Ho: p .08 (funciona correctamente) H1: p > .08 (no funciona correctamente)

La prueba estadstica se puede expresar en trminos de la proporcin de xitos como sigue: En donde Para ver el grfico seleccione la opcin "Descargar" del men superior p = proporcin de xitos de la hiptesis nula Ahora se determinar si el proceso funciona correctamente para las llantas producidas para el turno de da. Los resultados del turno de da ndican que cinco llantas en una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de significanca de .05, las regiones de rechazo y no rechazo se estableceran como a continuacin se muestra: Para ver el grfico seleccione la opcin "Descargar" del men superior Y la regla de decisin sera: Rechazar Ho si > + 1.645; de lo contrario no rechazar Ho. Con los datos que se tienen, = = .05

Y entonces,

= -1.107

Z -1.107 < + 1.645; por tanto no rechazar Ho. La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin de rechazo. Se llegara a la conclusin de que no hay pruebas de que

ms del 8% de las llantas producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha encontrado ninguna prueba de que ocurra un nmero excesivo de reventones en las llantas producidas en el turno de da. http://cosmech.tripod.com/index.htm Pruebas de Hiptesis Una hiptesis estadstica es una suposicin hecha con respecto a la funcin de distribucin de una variable aleatoria. Para establecer la verdad o falsedad de una hiptesis estadstica con certeza total, ser necesario examinar toda la poblacin. En la mayora de las situaciones reales no es posible o practico efectuar este examen, y el camino mas aconsejable es tomar una muestra aleatoria de la poblacin y en base a ella, decidir si la hiptesis es verdadera o falsa. En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de significacin y se declara falsa si la probabilidad calculada es menor que el valor tabular. La prueba a realizar depender del tamao de las muestras, de la homogeneidad de las varianzas y de la dependencia o no de las variables. Si las muestras a probar involucran a ms de 30 observaciones, se aplicar la prueba de Z, si las muestras a evaluar involucran un nmero de observaciones menor o igual que 30 se emplea la prueba de t de student. La frmula de clculo depende de si las varianzas son homogneas o heterogneas, si el nmero de observaciones es igual o diferente, o si son variables dependientes. Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se divide por la menor, este resultado es un estimado de la F de Fisher. Luego se busca en la tabla de F usando como numerador los grados de libertad (n-1) de la varianza mayor y como denominador (n-1) de la varianza menor para encontrar la F de Fisher tabular. Si la F estimada es menor que la F tabular se declara que las varianzas son homogneas. Si por el contrario, se declaran las varianzas heterogneas. Cuando son variables dependientes (el valor de una depende del valor de la otra), se emplea la tcnica de pruebas pareadas. Como en general estas pruebas se aplican a dos muestras, se denominarn a y b para referirse a ellas, as entenderemos por: na al nmero de elementos de la muestra a nb al nmero de elementos de la muestra b

xb al promedio de la muestra b s2a la varianza de la muestra a Y as sucesivamente Entonces se pueden distinguir 6 casos a saber: Caso de muestras grandes (n>30)

Caso de na = nb y s2a = s2b Caso de na = nb y s2a <> s2b Caso de na <> nb y s2a = s2b Caso de na <> nb y s2a <> s2b Caso de variables dependientes 1.-Cuando las muestras a probar involucran a ms de 30 observaciones.

Ejemplo: La altura promedio de 50 palmas que tomaron parte de un ensayo es de 78 cm. con una desviacin estndar de 2.5 cm.; mientras que otras 50 palmas que no forman parte del ensayo tienen media y desviacin estndar igual a 77.3 y 2.8 cm.

Se desea probar la hiptesis de que las palmas que participan en el ensayo son ms altas que las otras. Consultando el valor z de la tabla a 95% de probabilidad se tiene que es 1.96, por lo consiguiente, el valor z calculado no fue mayor al valor de la tabla y entonces se declara la prueba no significativa. Conclusin: Las alturas promedio de los 2 grupos de palmas son iguales y la pequea diferencia observada en favor al primer grupo se debe al azar.

2.-Caso de nmero igual de observaciones y varianzas homogneas.

Ejemplo: Se plant cierto experimento en 24 parcelas para probar el efecto de la presencia o ausencia de K en el rendimiento de palma. Peso medio del racimo (Kg.) n 1 2 3 4 5 6 7 8 9 10 11 12 Suma a 20.0 24.0 21.0 22.0 23.0 24.0 22.5 22.0 21.5 20.0 22.0 24.0 266 b 24.0 28.0 25.0 25.0 27.0 27.5 28.0 26.0 26.0 24.5 26.5 28.5 316 26.33 a2 400.00 576.00 441.00 484.00 529.00 576.00 506.25 484.00 462.25 400.00 484.00 576.00 5918.5 b2 576.00 784.00 625.00 625.00 729.00 756.25 784.00 576.00 676.00 600.25 702.25 812.25 8346

Promed 22.16 io

s2a = 5918.5 - (266)2/12 = 2.02 11 s2b = 8346 - (316)2/12 = 2.24 11 Se busca en la tabla de t de student con 2 (n-1) grados de libertad o sea 22, y se encuentra que el valor tabular es de 2.074 al 95% de probabilidad, el cual es menor que la t calculada y por lo tanto se declara la prueba significativa. Conclusin: La diferencia entre promedios observados es atribuible al efecto de tratamiento (K), por haberse conseguido un resultado significativo. 3.-Caso de igual nmero de observaciones y varianzas heterogneas.

Ejemplo: Se plant cierto experimento en 24 parcelas con dos clases de semillas: semilla mezclada y semilla DxP seleccionada. Se desea saber si el rendimiento observado por la semilla seleccionada difiere a la otra. Produccin de palma: TM/ha/ao Para ver la tabla seleccione la opcin "Descargar" del men superior

s2a = 1748.61 - (144.5)2/12 = 0.78 11 s2b = 4001.14 - (216.2)2/12 = 9.63 11

Consultando la tabla de t con n-1 grados de libertad (11) se encuentra un valor de 2.201, por lo tanto, la diferencia se declara significativa. Conclusin: El rendimiento observado por las plantas de semilla seleccionada fue significativamente superior a las otras. 4.-Caso de diferente nmero de observaciones y varianzas homogneas

Ejemplo: Se tom una rea de terreno distribuida en 22 parcelas y a 13 de ellas se les aplic un fertilizante nitrogenado para medir el efecto del N en el crecimiento. rea foliar de la hoja # 17 en m2 Para ver la tabla seleccione la opcin "Descargar" del men superior

s2a = 968.93 - (112.1)2/13 = 0.19 12 s2b = 390.84 - (59.2)2/9 = 0.18 8 s2c = 12(0.19) + 8(0.18) = 0.19 20 Consultando la tabla de t con n-1 grados de libertad (11) se encuentra un valor de 2.201, por lo tanto, la diferencia se declara significativa. Conclusin: El rendimiento observado por las plantas de semilla seleccionada fue significativamente superior a las otras. Ejemplo: Se tom una rea de terreno distribuida en 22 parcelas y a 13 de ellas se les aplic un fertilizante nitrogenado para medir el efecto del N en el crecimiento. rea foliar de la hoja # 17 en m2

Para ver la tabla seleccione la opcin "Descargar" del men superior

s2a = 968.93 - (112.1)2/13 = 0.19 12 s2b = 390.84 - (59.2)2/9 = 0.18 8 s2c = 12(0.19) + 8(0.18) = 0.19 20 Consultando la tabla con (na-1) + (nb-1) o sea (20) grados de libertad, se obtiene el valor tabular de 2.086, el cual es menor que la t calculada, por lo tanto la diferencia se declara significativa. Conclusin: La diferencia detectada en estas dos muestras es atribuible a la aplicacin del fertilizante nitrogenado. 5.- Caso de diferente nmero de observaciones y varianzas heterogneas.

En este caso, la tc es comparada con la tg (t generada), que a diferencia de los casos anteriores, hay que calcularla.

Donde: ta y tb son los valores de la tabla con n-1 grados de libertad para a y b respectivamente Ejemplo: Se tomaron 2 muestras de palma comercial de orgenes diferentes y se midi el porcentaje de almendra en el racimo en ambas muestras, el objeto es probar si las muestras son diferentes genticamente o no. Porcentaje de almendra

Para ver la tabla seleccione la opcin "Descargar" del men superior s2a = 225.02 - (53)2/14 = 1.88 13

s2b = 192.26 - (43.80)2/10 = 0.05 9

En este caso la t generada (tg), reemplaza la t de la tabla y como la tc es menor que la tg, la diferencia se declara No significativa. Conclusin: La diferencia observada entre promedios es atribuible nicamente a errores de muestreo o variabilidad natural, y no a diferencias genticas. 6.-Caso de muestras pareadas (de variables dependientes) En este caso, se asume que las muestras han sido distribuidas por pares.

Ejemplo: Se tomaron 12 foliolos de palma joven y a cada uno se le trat la mitad con Benlate para medir la inhibicin del crecimiento de hongos. Magnitud del dano Sin Con n Benlate Benlate D = X - Y D2 Para ver la tabla seleccione la opcin "Descargar" del men superior

Consultando la tabla con n-1 grados de libertad se obtiene el valor tabular de 2.201, por lo tanto, la diferencia se declara significativa. Conclusin: De la prueba se desprende que el tratamiento con benlate redujo significativamente la incidencia de hongos. Utilidad de las hiptesis: El uso y formulacin correcta de las hiptesis le permiten al investigador poner a prueba aspectos de la realidad, disminuyendo la distorsin que pudieran producir sus propios deseos o gustos. Pueden ser sometidas a prueba y demostrarse como probablemente correctas o incorrectas sin que interfieran los valores o creencias del individuo.

Las pruebas de hiptesis a partir de proporciones


se realizan casi en la misma forma utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin particular. La proporcin de una poblacin Las hiptesis se enuncian de manera similar al caso de la media. Ho: p = p0 H1: p p0 En caso de que la muestra sea grande n>30, el estadgrafo de prueba es:
se distribuye normal estndar.

Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o unilateral ), lo cual puedes fcilmente hacerlo auxilindote de la tabla 4.4.1. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones

La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias:
Ho: p1 = p2 p1 - p2 = 0

H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente. El estadgrafo de prueba para el caso de muestras independientes:
donde

Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. Est de ms que te diga que este estadgrafo se distribuye normal estndar. La regla de decisin se determina de manera similar a los casos ya vistos anteriormente. El objetivo de la prueba es comparar estas dos proporciones, como estimadores H1: p1 p2 Recuerda que la H1 tambin puede plantearse de forma unilateral. Si la Ho es cierta entonces b - c =0 y el estadgrafo de prueba es:

Prueba De Hiptesis Para Proporciones


El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fabrica de llantas quera determinar la proporcin de llantas que se reventaban antes de 10,000 millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica particular. El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta para que muy pocas se revienten antes de las 10,000 millas. Si ms de un 8% de las llantas se revientan antes de las 10,000 millas, se llegara a concluir que el proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar como sigue: Ho: p .08 (funciona correctamente) H1: p > .08 (no funciona correctamente) La prueba estadstica se puede expresar en trminos de la proporcin de xitos como sigue: En donde p = proporcin de xitos de la hiptesis nula Ahora se determinar si el proceso funciona correctamente para las llantas producidas para el turno de da. Los resultados del turno de da ndican que cinco llantas en una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de significanca de .05, las regiones de rechazo y no rechazo se estableceran como a continuacin se muestra: Y la regla de decisin sera: Rechazar Ho si > + 1.645; de lo contrario no rechazar Ho. Con los datos que se tienen, = = .05 Y entonces,

= = = = 1.107 Z 1.107 < + 1.645; por tanto no rechazar Ho. La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin de rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de las llantas producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha encontrado ninguna prueba de que ocurra un nmero excesivo de reventones en las llantas producidas en el turno de da. Pruebas de hiptesis a partir de proporciones. Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin particular. La proporcin de una poblacin Las hiptesis se enuncian de manera similar al caso de la media. Ho: p = p0 H1: p p0 En caso de que la muestra sea grande n>30, el estadgrafo de prueba es: se distribuye normal estndar. Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o unilateral ), lo cual puedes fcilmente hacerlo auxilindote de la tabla 4.4.1. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias: Ho: p1 = p2 p1 - p2 = 0

H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente. El estadgrafo de prueba para el caso de muestras independientes: Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. Est de ms que te diga que este estadgrafo se distribuye normal estndar. La regla de decisin se determina de manera similar a los casos ya vistos anteriormente. El objetivo de la prueba es comparar estas dos proporciones, como estimadores H1: p1 p2 Recuerda que la H1 tambin puede plantearse de forma unilateral.

DIFERENCIA DE PROPORCIONES

El estadstico de prueba que permite contrastar

frente a

a partir de dos muestras aleatorias

independientes es

siendo p la estimacin de

obtenida del total de observaciones.

Si se consideran las proporciones como medias y se aplica la prueba t utilizada para comparar medias poblacionales los resultado

no son fiables ya que la estimacin del error tpico que realiza el programa no coincide con la del estadstico de prueba. Par

resolver el problema con el programa SPSS se deber cruzar la variable analizada con la que define los grupos (obtener la tabla d contingencia) y realizar el contraste de independencia Chi-cuadrado.

El estadstico de prueba Chi-cuadrado se define:

y presenta una distribucin Chi-cuadrad

con (I-1)(J-1) grados de libertad. Las Eij se calculan multiplicando las frecuencias marginales y dividendo el producto por n. Esta

Eij son estimaciones de las frecuencias absolutas que cabra esperar en cada casilla bajo el supuesto de que la proporcin de xito es la obtenida a partir del total de observaciones muestrales sin considerar diferencias entre los dos grupos.

La secuencia es:

Analizar

Estadsticos Descriptivos

Tablas de contingencia

En el cuadro de dilogo se indica la variable que se quiere contrastar (filas), la variable que define los dos grupos (columnas) y s selecciona la opcin Chi-cuadrado en Estadsticos.

EJEMPLO

Con referencia a la encuesta Enctrans.sav se quiere comprobar si la proporcin de alumnos con vehculo difiere significativament entre los grupos definidos segn el gnero.

La hiptesis nula del contraste es poblacional de mujeres con vehculo.

; siendo

la proporcin poblacional de hombres con vehculo y

la proporci

Con la secuencia Analizar > Estadsticos Descriptivos > Tablas de contingencia se accede al cuadro de dilogo donde se indica qu

la variable a contrastar es Vehculo y que la variable de agrupacin es el Gnero, y se selecciona la opcin Chi-cuadrado e Estadsticos. Al aceptar se obtiene el siguiente cuadro de resultados.

Si es cierto que la proporcin de propietarios de vehculo es la misma en los dos grupos,

, la estimacin de

es

proporcin de propietarios de vehculo para el total de alumnos de la muestra, es decir, 39/114=0,3421. La frecuencia esperada d

hombres con vehculo se obtendr multiplicando esta proporcin por el total de hombres en la muestra, o sea, 0,342154=18,5;

de la misma forma se obtendr la frecuencia esperada de mujeres con vehculo: 0,342160=20,5 (vese que estas frecuencia esperadas coinciden con las que cabra esperar en el caso de que las variables Gnero y Vehculo fueran independientes).

El estadstico Chi-cuadrado toma el valor 0,998 y el nivel de significacin crtico es 0,318, por lo tanto no se rechaza la hiptes propietarios de vehculos.

nula para los niveles de significacin habituales y se puede aceptar que no hay diferencia entre la proporcin de hombres y mujere