Sei sulla pagina 1di 11

TEMA 9 EL ANLISIS BSICO DE LA INFORMACIN EN LA INVESTIGACION DE MERCADOS

9.1. Anlisis Descriptivo de la Informacin 9.2. La Tabulacin Cruzada 9.3. Contraste de Hiptesis

9.1. Anlisis Descriptivo de la Informacin

Tratamientos Descriptivos: Distribucin de Frecuencias (variables categricas o mixtas) Medidas de tendencia central (todas) Media (categricas y mixtas) Mediana (categricas y mixtas) Moda (todas) Dispersin (todas) Mximo y Mnimo Rango y Recorrido Intercuartlico Desviacin Tpica y Varianza Percentiles Coeficiente de variacin (Desviacin tpica/media=%) Caracterizacin de la distribucin (variables numricas o mixtas) Kurtosis Skewness

9.1. Anlisis Descriptivo de la Informacin: Distribucin de Frecuencias

La distribucin de frecuencias se realiza sobre valores discretos de una variable, puede ser una categrica o nominal o bien una variable mixta, e incluso una variable numrica, que ha sido recodificada en intervalos. En este caso nos da el nmero de apariciones de un suceso, el % sobre el total de respuestas y el % sobre el total de la muestra

9.1. Anlisis Descriptivo de la Informacin: Distribucin de Frecuencias

Tambin nos puede ofrecer resultados en forma grfica, como una grfica de barras o de tarta. En este caso, se debe tener en cuenta qu se representa y si la pregunta es de respuesta nica o mltiple

9.1. Anlisis Descriptivo de la Informacin: Medidas de Tendencia Central

La moda nos proporciona el valor ms repetido, la mediana aquel que tras ordenar las respuestas deja la mitad a cada lado, y la media un valor representativo del conjunto de las respuestas. Se deben interpretar con cuidado atendiendo a los valores de dispersin y a la forma de la distribucin.

9.1. Anlisis Descriptivo de la Informacin: Medidas de Dispersin

Las medidas de dispersin nos dan una idea sobre las diferencias obtenidas en la medicin de la variable o en las respuestas de los entrevistados. El rango es la diferencia entre mximo y mnimo, mientras que la varianza y desviacin tpica son medidas de diferencias con respecto a la media. Especialmente tiles en el caso de distribuciones normales.

9.1. Anlisis Descriptivo de la Informacin: Caracterizacin de la forma de una distribucin


Son un conjunto de medidas que nos indican la forma que adopta la distribucin, nos pueden mostrar si los datos se encuentran concentrados o bien presentan configuraciones especiales Skewness o simetra nos indica si la distribucin se agrupa ms a los extremos de la misma o por el centro Kurtosis, nos indica el nivel de apuntamiento i afilamiento de una distribucin, en relacin con una normal, es decir si los datos estn muy concentrados en torno al valor central Ambos ndices dependen del programa con que se han obtenido

9.2. La Tabulacin Cruzada o Tablas de Contingencia

La tabulacin cruzada nos ofrece la combinacin de las frecuencias de dos variables categricas, aportando tanto la coincidencia de casos como los porcentajes por columnas, debindose en cada caso comparar con los porcentajes presentados para el total de la muestra. Se puede apreciar que esta tabla presenta un contraste de hiptesis con el resultado de que no existe asociacin

9.2. La Tabulacin Cruzada o Tablas de Contingencia

La tabulacin cruzada tambin se puede presentar de forma grfica, aunque siempre con valores discretos, con lo que las variables numricas o de escala, tienen que ser transformadas en intervalos.

9.2. La Tabulacin Cruzada o Tablas de Contingencia

La tabulacin cruzada se puede llevar a cabo con preguntas de respuesta mltiple, lo que complica su posterior interpretacin, al calcular los porcentajes verticales sobre el nmero de casos (entre parntesis) y no sobre el nmero de respuestas (cifra debajo de la columna Frec.) de respuestas.

9.2. La Tabulacin Cruzada o Tablas de Contingencia de Medias

De la misma forma, se pueden obtener tablas de contingencia con los valores medios de otras variables, como se presenta al lado, se han presentado los valores para el conjunto de la muestra en cada uno de los 5 tems, y luego los mismo valores medios para el caso de los fumadores y de los no fumadores

9.2. Contraste de Hiptesis: Test de de Pearson para una tabla cruzada

Permite identificar la dependencia entre dos variables, sin afirmar cul de ellas es la causa y cul el efecto. La hiptesis nula es la independencia de las variables. Se calcula el valor de la y se compara con el de la distribucin, para los mismos grados de libertad, se busca una significatividad asociada menor de 0,01 0,05 para rechazar la hiptesis nula

Precauciones: se debe elegir el nivel de confianza que marca la P asociada, para aceptar o rechazar la hiptesis nula. La celdas de la tabla de contingencia deben contar con al menos 5 elementos en cada una de ellas. El tamao de la muestra aumenta el valor de la lo que puede hacer significativas relaciones que no lo sean solo por emplear muestras grandes.

9.2. Contraste de Hiptesis: Otros contrastes de hiptesis basados de de Pearson


Ratio de Probabilidad (likelihood ratio): estadstico semejante al de de Pearson, con similar interpretacin, para datos categricos. Asociacin Lineal (o test de Mantel Haenszel): utilizado de forma similar a los anteriores pero especialmente cuando se trabaja con datos ordinales. Se interpreta como los anteriores. Phi: es una modificacin de la de Pearson y se utiliza para medir la asociacin entre dos variables en el caso de tablas de 2x2, oscila entre valores de 0 para inexistencia de relacin y 1 en el caso opuesto. V de Cramer: modificacin de la Phi para tablas tablas cuadradas de otros tamaos. Se interpreta igual que Phi. Coeficiente de Contingencia: coeficiente similar a los anteriores que se puede aplicar a cualquier tipo de tabla, toma valores entre 0 y 1 con los mismos criterios que en el caso anterior.

9.2. Contraste de Hiptesis: Pruebas de reduccin del Error


Se basan en la posibilidad de predecir los valores de una variable a partir del conocimiento de los valores de otra, se centran en el nmero de casos que quedan bien clasificados en este proceso. Lambda: estadstico utilizado en tablas de contingencia para predecir los valores de una dimensin en funcin de la otra. Toma valores entre 0 para la inexistencia de relaciones y 1 para la prediccin perfecta. Tau de Goodman y Kruskal: estadstico muy similar al anterior, que se calcula a partir de la capacidad de una variable para predecir los valores de la otra, sus valores tienen el mismo rango e interpretacin que la Lambda. Coeficiente de Incertidumbre: presenta la disminucin de la incertidumbre al predecir una variable a partir de sus valores o contando con la participacin de una segunda variable. Sus valores oscilan en el mismo rango que los anteriores y su interpretacin es similar.

9.3. Contraste de Hiptesis: Finalidad de los contrastes de hiptesis


Entre las principales finalidades de un contraste de hiptesis podemos encontrar: Observar si la variable estudiada se comporta aleatoriamente Existencia o ausencia de autocovariacin Observar si la media de la muestra analizada pertenece a la media de la poblacin objeto de estudio Observar si la poblacin obtenida en la muestra es la misma que la existente en la poblacin Observar la adecuacin de los datos obtenidos en la muestra con las distribuciones conocidas (normal, binomial...) Observar si los valores obtenidos de una muestra siguen unos patrones esperados o no ocurre dicha situacin Se puede diferenciar entre pruebas paramtricas (las realizadas con variables medidas en escala de ratio o de intervalo) y no paramtricas (las que se aplican con escalas ordinales o con escalas nominales

9.3. Contraste de Hiptesis: Cuadro director de Contrastes de Hiptesis


Contrastes de Hiptesis

Pruebas paramtricas

Pruebas no paramtricas

Una muestra
Test Z Test t

Dos muestras

Una muestra

Dos muestras

Muestras independientes
Test t para dos grupos Test F

Test binomial Test chicuadrado Test de rachas Test Test t para Kolmogorovpareado Smirnov

Muestras pareadas

Muestras independientes
Test Kolmogorov- Smirnov Test de la mediana Test de MannWhitney Test de rachas Test de Moses

Muestras pareadas
Test del signo Test de McNemar Test de Wilcoxon

9.3. Contraste de Hiptesis: Contrastes de hiptesis para Una Muestra


Test Z: Test basado en la distribucin normal, compara si los estadsticos obtenidos de una muestra son los de la poblacin (la hiptesis nula es que la media de la muestra no difiere de la de la poblacin). Test t: Test basado en la distribucin de Student que compara la media de la muestra y su desviacin tpica, con la media de la poblacin de la que se ha extrado la muestra. Test Binomial: Prueba no paramtrica, aplicable sobre variables dicotmicas para saber si una variable proviene de una poblacin binomial con una probabilidad determinada de ocurrencia de un suceso. Test : Prueba no paramtrica que se suele aplicar con variables de tipo nominal planteando la hiptesis nula de que la muestra proviene de una poblacin con una distribucin con unas determinadas proporciones de individuos en base a los valores de la variable categrica.

9.3. Contraste de Hiptesis: Test T para la Media de una Muestra


La hiptesis nula a contrastar es que no existe diferencia entre la media de la variable X y la de la poblacin analizada que toma el valor 2,2 el cual debe ser conocido con antelacin. Como se puede observar, para rechazar la hiptesis nula, deberamos encontrar un valor de p asociado menor a 0,05 (para un nivel de confianza del 95%) o de 0,01 (para el 99%), como la p, toma un valor de 0,1154 no se puede rechazar la hiptesis nula

9.3. Contraste de Hiptesis: Contrastes de hiptesis para Dos Muestras Independientes


Test t: prueba paramtrica para contrastar si la media de dos poblaciones independientes son iguales (o presentan una razn) Test f (o F de Barlett Box): prueba paramtrica, similar a la anterior, en la que se contrasta el mismo tipo de hiptesis pero en relacin a las varianzas (es una versin simple del ANOVA). Test de Kolmogorov-Smirnov: prueba no paramtrica para contrastar si dos muestras provienen de la misma poblacin (se usa con variables que al menos sean ordinales) Test de la Mediana: prueba no paramtrica usada para contrastar si dos o ms muestras independientes pertenecen a poblaciones con la misma mediana Test de Rachas de Wald-Wolfowitz: prueba no paramtrica usada con variables ordinales para comprobar si dos muestras proceden de la misma poblacin U de Mann-Whitney: prueba no paramtrica semejante a la t, que se aplica sobre variables medidas en escala ordinal.

9.3. Contraste de Hiptesis: Test para la Media de dos Muestras Independientes


La hiptesis nula a contrastar es que la media de las dos muestras (X e Y) que tienen diferente nmero de casos son iguales. Se puede apreciar la media para ambas variables (muestras), como se observa, la hiptesis nula es que ambas tienen la misma media. Al calcular la t de Student, dado que la significacin asociada es mayor de 0,05, no se puede rechazar la hiptesis nula

10

9.3. Contraste de Hiptesis: Contrastes de hiptesis para Dos Muestras Emparejadas o Relacionadas
Test t: prueba paramtrica para contrastar si la media de dos poblaciones relacionadas son iguales. Prueba de McNemar: prueba no paramtrica que se aplica sobre dos variables dicotmicas relacionadas, para comprobar si las dos muestras relacionadas provienen de una poblacin con la misma distribucin. Prueba de los Signos: prueba no paramtrica para contrastar si dos variables equivalentes de una misma muestra tienen la misma distribucin (se usa con variables al menos ordinales). El procedimiento se basa en la diferencia entre las dos variables (signo), buscando que la mitad de las diferencias sea positiva y la otra mitad sea negativa. Prueba de Wilcoxon: prueba no paramtrica para muestras relacionadas para contrastar si dos variables tienen la misma distribucin, teniendo en cuenta las magnitudes de las diferencias entre pares (para cada observacin). Se aplica sobre variables al menos ordinales y en lugar de los signos tiene en cuenta las magnitudes.

9.3. Contraste de Hiptesis: Test para la Media de dos Muestras Relacionadas


La hiptesis nula a contrastar es que la media de las dos variables (X e Y) de la misma muestra que miden una informacin equivalente o similar, es la misma. El nmero de observaciones debe ser en este caso igual, como se aprecia, la significacin asociada es menor de 0,05, por lo que se debe rechazar la hiptesis nula de igualdad de las medias.

11

Potrebbero piacerti anche