Contenido 6 PDF

1
Menú
2
INTRODUCCIÓN
En el presente contenido de estudio, se presentarán las técnicas matemáticas y estadísticas que sirven para procesar,
evaluar e interpretar datos; para así, conseguir con base a su agrupación, información comprensible y verosímil, para
lograr una adecuada toma de decisiones.
La objetividad es la cualidad más importante al momento de analizar e interpretar los resultados estadísticos obtenidos
de la investigación de mercados. Es la aspiración más alta del investigador para lograr una mayor cercanía con la
realidad que describe al objeto.
Para lo anterior, es necesario que la información, los datos y los referentes, estén analizados de la mejor forma, para
que los resultados obtenidos fruto del análisis, sean correctamente presentados. De igual manera, en este contenido de
estudio aprenderá a analizar las respuestas obtenidas en los instrumentos de recolección de información y conocerá la
forma de presentar los resultados de una investigación de mercados.
Actividad de Aprendizaje:
Emplear técnicas matemáticas y estadísticas para procesar, evaluar e interpretar datos que nos permitan generar
información válida para la toma de decisiones.
Menú
3
ESTRUCTURA DE CONTENIDOS
INTRODUCCIÓN ............................................................................................................. 2
ESTRUCTURA DE CONTENIDOS ................................................................................. 3
MAPA DE CONTENIDOS ............................................................................................... 5
ÍNDICE DE FIGURAS ..................................................................................................... 6
ÍNDICE DE TABLAS ....................................................................................................... 7
DESARROLLO DE CONTENIDOS ................................................................................. 8
1. PROCESAMIENTO DE DATOS ............................................................................... 8

1.1. Validación y Edición ........................................................................................ 9
1.2. Codificación................................................................................................... 10
1.3. Introducción de datos. ................................................................................... 14
1.4. Tabulación de los Resultados ....................................................................... 16
1.5. Representación Gráfica de Datos ................................................................. 21
1.6. Estadísticas Descriptivas. ............................................................................. 22
2. ANÁLISIS DE DATOS............................................................................................. 23
2.1. Tipos de Análisis. ................................................................................... 23
2.1.1. Análisis univariado .................................................................................. 24
2.1.2. Análisis bivariable ................................................................................... 28
2.1.3. Análisis multivariado de datos ................................................................ 28
3. TIPOS DE COEFICIENTES DE CORRELACIÓN ................................................... 32
Menú
4
3.1. Coeficiente Epsilon. ...................................................................................... 33

3.2. Coeficiente Rho de Spearman. ..................................................................... 34
3.3. Coeficiente R de Pearson. ............................................................................ 36
4. EVALUACIÓN DE DIFERENCIAS Y CAMBIOS ..................................................... 37
4.1. Pruebas de Hipótesis. ................................................................................... 40
4.2. Contraste de Hipótesis .................................................................................. 45
5. TEORÍA DEL MUESTREO ..................................................................................... 51
5.1. Muestra Representativa ................................................................................ 52
5.2. Curva de Gauss ............................................................................................ 55
GLOSARIO .................................................................................................................... 58
BIBLIOGRAFÍA.............................................................................................................. 60
WEB GRÁFIA ................................................................................................................ 61
IMÁGENES.................................................................................................................... 63
CRÉDITOS .................................................................................................................... 64
Menú
5
MAPA DE CONTENIDOS
Menú
6
ÍNDICE DE FIGURAS
Figura 1. Comprobación antes de proceder a tabular los datos .......................................................................................... 15

Figura 2. Opciones para establecer la base para porcentajes............................................................................................. 19
Figura 3. Áreas de la estadística ......................................................................................................................................... 22
Figura 4. Medidas estadísticas ............................................................................................................................................ 24
Figura 5.Comparación de los Coeficientes .......................................................................................................................... 32
Figura 6. Conceptos de Significado Estadístico .................................................................................................................. 38
Figura 7. Media.................................................................................................................................................................... 43
Menú
7
ÍNDICE DE TABLAS
Tabla 1. Ejemplo de codificación ......................................................................................................................................... 11

Tabla 2. Ejemplo de categorías de respuesta ..................................................................................................................... 13
Tabla 3. Ejemplo de tabla de frecuencia ............................................................................................................................. 16
Tabla 4. Ejemplo de tabulación simple o cruzada. .............................................................................................................. 18
Tabla 5. Ejemplo de tabulación cruzada .............................................................................................................................. 20
Tabla 6. Ejemplo de medidas de tendencia central ............................................................................................................. 26
Tabla 7. Ejemplo Coeficiente Epsilon. ................................................................................................................................. 33
Tabla 8. Ejemplo Coeficiente Rho de Spearman. ................................................................................................................ 35
Tabla 9. Ejemplo 2 Coeficiente Rho de Spearman. ............................................................................................................. 35
Tabla 10. Ecuaciones de la media ....................................................................................................................................... 44
Menú
8
DESARROLLO DE CONTENIDOS
1. PROCESAMIENTO DE DATOS
El procesamiento de datos, es un proceso sistémico de producción de bienes y

servicios, el cual corresponde a la fase de transformación de la materia prima en
producto terminado; por ejemplo: Tela, botones, hilos, entretela (Materia Prima)
son sometidos a un proceso de patronaje, corte, confección y ensamble
(Transformación) para producir Camisas (Producto Terminado), así mismo, los
datos obtenidos en la Investigación de Mercados (Materia Prima), son sometidos a
un tratamiento matemático y estadístico (Transformación).
Imagen 1. Procesamiento de datos
Aunque el objetivo difiere de convertir al aprendiz de la especialización en Investigación de Mercado en un estadígrafo,

es muy importante que tenga claridad y entendimiento de los distintos pasos que la estadística proporciona para el
procesamiento y análisis de los datos obtenidos en la investigación de mercados.
De esta manera, se explicará de forma simple y comprensible suministrando bibliografía en donde puede ser ampliada
detalladamente paso a paso; es de suma importancia tener en cuenta que el proceso de transformación que deben
atravesar los datos para convertirse en información es el siguiente:
Menú
9
1.1. Validación y Edición
Hace referencia a la verificación de cada uno de los cuestionarios empleados para recolectar la información,
comprobando que se haya diligenciado de manera adecuada, sin fraudes del entrevistador y ceñido a las instrucciones
fundamentales; para cuando sea difícil establecer esta validez, se incluye en el encabezamiento del cuestionario la
identificación y datos del entrevistado con el fin de confrontar directamente o por teléfono la validez de la entrevista. El
objetivo es asegurar que la entrevista se haya administrado de manera correcta y completa; por su parte la edición
consiste en revisar y corregir los errores que haya podido cometer el entrevistador.
Para llevar a cabo esta validación se establecen los siguientes cuestionamientos:
Figura 1. Validación y edición de cuestionarios

Fuente: Propia.
Menú
10
1.2. Codificación
La codificación, consiste en agrupar las respuestas de determinada pregunta y

asignarles un código numérico. Se codifican tanto las preguntas cerradas como las
abiertas, siendo más dispendiosa la codificación de las segundas.
La codificación facilita la introducción de los datos o respuestas en el ordenador y

su posterior tratamiento informático – estadístico, disminuye el tiempo de introducción
de datos y los errores en el tecleo de los datos de entrada, además facilita las
órdenes de recuento dadas al ordenador.
Imagen 2. Agrupación de
respuestas abiertas y
 Codificación de las Preguntas Abiertas cerradas.
Las preguntas abiertas se codifican una vez se conocen todas las respuestas de los entrevistados, o al menos las
principales tendencias de respuestas en una muestra de los cuestionarios aplicados.
Según el portal web www.tecnicasdeestudio.org, el procedimiento de codificación de preguntas abiertas, consiste en

hallar y nombrar a los modelos generales de respuestas (generales o comunes), enumerar estos modelos y darles un
valor numérico, para que así éstos se consideren categorías de respuesta.
Para cerrar las preguntas abiertas, se sugiere el siguiente procedimiento, basado parcialmente en Rojas (1981)
1. “Leer las respuestas en todos los cuestionarios a la pregunta abierta o semi - abierta en cuestión.
2. Establecer clases de respuestas a la vista del juicio formado en la etapa anterior. La lista de clases no debe ser ni tan amplia
que el número de respuestas que se incluya en cada una carezca de significación, pero tampoco tan pequeño que reste
riqueza a la información.
3. Asignar un código a cada una de las clases de preguntas establecidas.”
Menú
11
Ejemplo:
¿Por qué piensa que no va a comprar lavadora en los dos próximos años?
Las respuestas han sido:
A. Es demasiado grande para ponerlo en mi casa.

B. No tengo dinero para comprarlo.
C. Tiene un aspecto muy feo.
D. No me gusta el color y cuesta mucho.
E. He oído que es poco fiable.
F. Somos sólo dos, por ahora no nos hace falta.
G. Estoy esperando a que bajen de precio.
H. Su uso es muy difícil.
I. No lo sé realmente.
Tabla 1. Ejemplo de codificación

Fuente: Propia.
Menú
12
 Preguntas Cerradas
Las preguntas “cerradas” son fáciles de codificar y preparar para su análisis, estas preguntas requieren de un menor
esfuerzo por parte de los entrevistados. Éstos no tienen que escribir o verbalizar pensamientos, sino simplemente
seleccionar la alternativa que describa mejor su respuesta.
Responder a un cuestionario con preguntas cerradas toma menos tiempo que contestar a uno con preguntas abiertas;
la principal desventaja de las preguntas “cerradas” está en que limitan las respuestas de la muestra y en ocasiones,
ninguna de las categorías describen con exactitud lo que las personas tienen en mente (no siempre se captura lo que
pasa por las cabezas de los sujetos).
Según Hernández Sampieri (2010), “Para poder formular preguntas “cerradas” es necesario anticipar las posibles
alternativas de respuesta”, de no ser así es muy difícil codificarlas.
De igual forma, el investigador tiene que asegurarse que los sujetos administran, conocen y comprenden las
categorías de respuesta. Por ejemplo, si preguntamos: ¿qué marca de detergente suele comprar?, se debe determinar
las opciones de respuesta y que los entrevistados las comprendan; pero si preguntamos sobre las razones y motivos que
provocan esa preferencia, determinar dichas opciones es algo más complejo.
Menú
13
Ejemplo:
Si en dos cuestionarios aparecen respectivamente las siguientes preguntas:
Tabla 2. Ejemplo de categorías de respuesta

Fuente: Propia.
Estos serían dos casos de preguntas codificadas, la dinámica consiste en que cuando el encuestado conteste,
solamente habrá que introducir en el ordenador el número que corresponda a la respuesta elegida.
- Si el encuestado usa ARIEL, se deberá introducir el número 2. Si el encuestado contesta que tiene 28 años, se
deberá introducir el número 3.
Menú
14
1.3. Introducción de datos.
Es el proceso de transformar los datos de una forma que puedan ser leídos por la computadora; para ello se requiere de
un dispositivo de introducción de datos y un medio de almacenamiento.
Esta introducción de datos se puede realizar mediante varios medios:
 Introducción inteligente o dirigida.
Imagen 3. Introducción de datos de manera inteligente.
Menú
15
Mediante dispositivos automáticos con capacidad para efectuar comprobaciones lógicas o su conexión a
computadoras que puedan realizar dicha revisión.
Para las autoras Larisa Santa Cruz y Azul Arévalo, en su Blogger (2011)
En Ciencias de la Computación, el término agente inteligente puede ser usado para referirse a un agente de software que tiene algo de
inteligencia, independientemente de si no es un agente racional por definición de Russell y Norvig. Por ejemplo, programas autónomos
utilizados para asistencia de un operador o de minería de datos (a veces denominado robots) son también llamados <agentes inteligentes>.
Para realizar la última comprobación antes de proceder a tabular los datos, se puede realizar las rutinas de identificación
de errores y los reportes marginales:
Figura 2. Comprobación antes de proceder a tabular los datos

Fuente: Propia.
Menú
16
Ejemplo de Tabla de Frecuencia:
Tabla 3. Ejemplo de tabla de frecuencia

Fuente: Propia. SENA
1.4. Tabulación de los Resultados
La tabulación de los resultados, consiste en clasificar y agrupar la información de todos los cuestionarios para convertirlos
en datos homogéneos que luego serán objeto de análisis.
Menú
17
El Proceso para realizar la tabulación de datos, se lleva a cabo después de codificadas las respuestas, introduciendo
los datos en un programa de ordenador que admita los datos (respuestas del cuestionario), los almacene de forma
sistemática, los archive en un soporte informático y los deje listos para realizar con ellos todas las operaciones que
puedan resultar de interés (cálculos de diferentes medidas estadísticas).
 Tipos de Tabulaciones
Las tabulaciones se pueden realizar de dos formas: una pregunta por pregunta (tabulación simple) o de dos o más
preguntas a la vez (tabulación cruzada).
Ejemplo:
Si a una empresa le interesa saber, cuántas personas adquieren sus productos, tabulará la pregunta del cuestionario
que haga referencia al tema de forma individual; pero si lo que desea saber es cuántas de ellas son hombres y cuántas
mujeres, realizará una tabulación cruzada.
Menú
18
Tabla 4. Ejemplo de tabulación simple o cruzada.

Fuente: Propia.
Menú
19
 Tabulaciones Simples o Reportes Marginales
La tabulación simple, indica el número de entrevistados que dieron respuesta a cada una de las preguntas del
cuestionario. Es el primer resumen que tiene el analista de la investigación sobre los resultados de la encuesta y en él se
indica, además de la frecuencia, el porcentaje de personas que respondieron a cada pregunta y el tipo de respuesta que
proporcionaron.
Para establecer la base para porcentajes existen tres opciones:
Figura 3. Opciones para establecer la base para porcentajes

Menú
20
 Tabulaciones cruzadas
Este tipo de tabulaciones, se basa en el cruce de una pregunta con todas las respuestas, y de cada una de las
respuestas con las preguntas que se encuentran en el cuestionario; esta es una herramienta de análisis muy fuerte.
Ejemplo:
Tabla 5. Ejemplo de tabulación cruzada

Menú
21
1.5. Representación Gráfica de Datos
Es la mejor forma de presentar los comportamientos obtenidos con las respuestas dadas por el entrevistado.
Se pueden utilizar distintas formas de representación, entre ellas: Líneas, Torta (Pay), Barras, hoy en día contenidas
en todos los programas de cálculo más importantes.
Imagen 2. Tipos de representación gráfica de datos.
Menú
22
1.6. Estadísticas Descriptivas
La Estadística es la forma de realizar inferencias y sacar conclusiones con base a datos imperfectos, puesto que aun
cuando se tiene información útil a veces ésta no muestra la historia completa. Por tal razón, se ve la necesidad de
establecer algunos métodos que ayudan a extraer información a partir de los datos observados, para así entender de
mejor manera las situaciones que estos representan.
 Áreas de la Estadística
La estadística se puede dividir en tres áreas que determinarán la viabilidad de la investigación, entre ellas se puede
encontrar:
Figura 4. Áreas de la estadística

Fuente: Propia.
Menú
23
2. ANÁLISIS DE DATOS
Al llevar a cabo adecuadamente los procesos de análisis y evaluación de los datos obtenidos, se mejora la eficiencia de
las empresas, ya que estos permiten extraer información útil que facilita la formulación de conclusiones y así mismo la
toma de decisiones direccionadas a el logro de resultados que aumenten la producción, además permite determinar en
qué momento resulta adecuado introducir un nuevo producto en el mercado.
Imagen 3. Evaluación y análisis de datos.
2.1. Tipos de Análisis.
Después de tabular los datos, se someten a diversas técnicas de evaluación y análisis, con el fin de obtener de los datos
numéricos contenidos en las tablas, medidas estadísticas representativas de las mismas y determinar la validez de estas
para el conjunto de la población objeto de estudio.
Menú
24
Existen diversas formas de realizar el análisis:
2.1.1. Análisis univariado
Este tipo de análisis se realiza para las tabulaciones simples, las cuales se refieren a una sola característica; consiste
en obtener el conjunto de respuestas dadas a una pregunta, reflejadas en una tabla simple, para ello se deben tener en
cuenta las siguientes medidas estadísticas:
Figura 5. Medidas estadísticas

Menú
25
Ejemplo:
La empresa Mundo de Moda, que presta sus servicios en dos ciudades del país (A y B), ha facturado en el
primer semestre del año las siguientes cantidades en pesos.
Zona A: 5700, 6000, 9000, 10000, 10000 Y 10000.

Zona B: 7000, 7000, 7000, 9528, 10000 Y 10000
A partir de estos datos, se calculan las medidas de tendencia central (moda, mediana y media aritmética) y la
varianza y desviación típica como medidas de dispersión.
Menú
26
Tabla 6. Ejemplo de medidas de tendencia central

Fuente: Propia.
Para la Zona A:
- Moda: 10000, ya que es la facturación que más se repite. Al ser impar el número de elementos, la mediana se obtiene
de los dos valores que ocupan la posición central.
Este valor deja por encima y por debajo el mismo número de facturaciones, 3.
- Mediana: 9500 (9000 más 10000 dividido en 2)
- Media aritmética: 8450
Menú
27
- Varianza: 35123500
- Desviación típica: 18741665
Para la Zona B:
- Moda: 10000, ya que es la facturación que más se repite. Al ser impar el número de elementos, la mediana se obtiene
de los dos valores que ocupan la posición central.
Este valor deja por encima y por debajo el mismo número de facturaciones, 3.
- Mediana: 8264
- Media aritmética: 8421
- Varianza: 2041555
- Desviación típica: 14288299
ANÁLISIS:
Se puede observar que la moda es igual en las dos zonas, que la mediana y la facturación media son un poco
mayores en la zona A y que la variabilidad es menor en la zona B.
Menú
28
2.1.2. Análisis bivariable
Se realiza con base a la tabulación cruzada referida a dos características de una población y puede medir la relación
existente entre estas. Este tipo de análisis, trata de asociar datos como hábitos, formas de consumo, cantidades, lugares,
frecuencia de compra, población de estudio, características socioeconómicas, culturales y ambientales, entre otras.
De igual manera, consiste en obtener del conjunto de respuestas dadas a dos preguntas, reflejadas en una tabla
cruzada, coeficientes que señalen el grado y la forma de asociación entre dos características denominadas coeficientes
de correlación.
2.1.3. Análisis multivariado de datos
Grupo de procedimientos estadísticos que permiten analizar de manera simultánea datos múltiples de cada individuo u
objeto que se estudia. Los análisis multivariados son extensiones de los procedimientos estadísticos univariados y
bivariados, algunas técnicas que se consideran son:
Menú
29
 Análisis de Regresión Múltiple.

 Análisis Discriminatorio Múltiple.
 Análisis Grupal.
 Análisis Factorial.
 Mapas Perceptuales.
 Análisis Conjunto.
 Análisis de regresión múltiple
Extensión de la regresión bivariada, se utiliza cuando se desea examinar la relación entre dos o más variables
métricas para predicción (Independientes) y una variable métrica independiente (Criterio). Permite estimar los efectos
sobre las ventas o la participación del mercado de las diversas variables de la mezcla de mercadeo. Las conclusiones
que se obtienen al aplicar esta técnica influyen, por ejemplo, en las estrategias publicitarias.
 Análisis discriminatorio múltiple
Es similar al análisis de regresión múltiple, sin embargo existen diferencias significativas por cuanto en el análisis de
regresión múltiple las variables dependientes deben ser métricas, en tanto en el discriminatorio pueden ser de naturaleza
nominal o categórica.
Ejemplo:
La variable dependiente puede ser el nivel de uso de un aparato o servicio: Se puede asignar el código 1 al entrevistado
que emplee el producto o servicio y el 2 al que no lo use. Las variables independientes pueden incluir diversas
mediciones métricas como edad, ingreso, escolaridad, etc. Los objetivos del análisis discriminatorio son:
Menú
30
 Determinar si las diferencias estadísticamente significativas entre los perfiles de calificación

discriminatoria promedio de dos o más grupos ( En este caso Usuarios y no Usuarios)
 Establecer un modelo para clasificar a los individuos u objetos en grupos con base en los valores de las
variables independientes.
 Establecer hasta qué grado se explica la diferencia entre los perfiles de calificación promedio de dos o
más grupos mediante cada variable independiente.
 Análisis Grupal
Conjunto de técnicas para identificar objetos o personas similares en cuantas ciertas variables o mediciones. El objetivo
del análisis grupal es clasificar los objetos o personas en diversos grupos mutuamente exclusivos y exhaustivos, de
manera que las personas incluidas en el grupo tengan el máximo de semejanza entre ellas. Los grupos deben ser de alta
homogeneidad interna (dentro del grupo) y de alta heterogeneidad externa (entre grupos).
 Análisis factorial
Su objetivo es simplificar los datos. Condensa la información contenida en un gran número de medidas métricas (por
ejemplo, escalas de calificación) en un número de medidas más pequeñas, llamadas factores. Al igual que en el análisis
grupal, no se emplea una variable dependiente.
 Mapas perceptuales
Se refiere a los métodos para analizar, entender y representar en forma sintética las percepciones del consumidor.
Producen un dibujo de un mercado. Muestran cómo son percibidos en facetas o atributos tales como reputación, precio,
calidad, entre otros. Además muestran como varios productos o servicios compiten en la mente del consumidor y
sugieren como pueden ser posicionados para maximizar su preferencia y su venta. Algunas aplicaciones son para:
Menú
31
 Descripción de mercados y segmentación

 Identificar debilidades y fortalezas de un producto o servicio
 Seguimiento a cambios en las percepciones de un consumidor.
 Identificación de diferencias entre grupos
 Análisis conjunto
Es un procedimiento multivariado popular en mercadotecnia para determinar qué características y precio debe tener un
producto o servicio nuevo.
Menú
32
3. TIPOS DE COEFICIENTES DE CORRELACIÓN
Existen diversos tipos de coeficientes de correlación, para los cuales se debe tener en cuenta el tipo de escala utilizada.
Figura 6.Comparación de los Coeficientes

Fuente: Propia.
Menú
33
3.1. Coeficiente Epsilon.
Este tipo de coeficiente, consiste en realizar la inspección y la lectura de una tabla cruzada que no sea muy extensa y
esté expresada en porcentajes, para deducir si existe relación entre dos características de la población y el signo de
dicha relación.
Se calcula para cada fila de la tabla de porcentajes verificables, la diferencia entre las columnas de la tabla dos a dos.
De la siguiente manera:
Dada la siguiente tabla que relaciona la edad con la preferencia de tres marcas A, B y C
Tabla 7. Ejemplo Coeficiente Epsilon.

Fuente: Propia.
Menú
34
Los valores de Epsilon para cada fila son:
- Epilson de la fila 1: 24,24 – 21,87: 2,37

- Épsilon de la fila 2: 60,61 – 62,5: 1,86
- Épsilon de la fila 3: 15,38 – 15,15: 0,23
ANÁLISIS:
Se puede ver que las diferencias entre los porcentajes calculados para las dos franjas de edad son muy pequeñas, por
ello se considera que hay una correlación insignificante en la muestra, lo que nos indica que la preferencia de marca no
depende de la edad.
3.2. Coeficiente Rho de Spearman.
Sirve para analizar la asociación entre dos características de la población medidas con escalas ordinales.
Ejemplo:
Supongamos que cinco personas han obtenido las siguientes puntuaciones respecto a su nivel de estudios y a la
influencia que tienen en ellos la publicidad, medidas en escalas ordinales:
Menú
35
Tabla 8. Ejemplo Coeficiente Rho de Spearman.

Fuente: Propia.
Estas puntuaciones se pueden ordenar por rangos. La más elevada será rango 1 y así sucesivamente, de la siguiente
forma:
Tabla 9. Ejemplo 2 Coeficiente Rho de Spearman.

Fuente: Propia.
Menú
36
ANÁLISIS:
El coeficiente Rho de Spearman es un número comprendido entre -1 y 1. Si el coeficiente es positivo indica una
correlación entre las dos características de la población positiva o directa; pero si es negativa indica una correlación entre
las dos de forma negativa.
3.3. Coeficiente R de Pearson.
Sirve para analizar la asociación entre dos características de la población medidas con escalas de intervalo o de razón.
Es un número comprendido entre 1 y -1 y se interpreta igual que el coeficiente Rho de Spearman tanto en lo que
respecta al signo como al grado de asociación.
Ejemplo:
El coeficiente de correlación R es la raíz cuadrada del coeficiente de determinación R2.
Imagen 6. Ecuación Coeficiente R de Pearson
Menú
37
4. EVALUACIÓN DE DIFERENCIAS Y CAMBIOS
Es conveniente determinar si es importante o no, tener en cuenta las diferencias entre las distintas mediciones a la hora
de tomar decisiones de gerencia, para este fin se deben probar las hipótesis estadísticas.
Este tipo de pruebas permite determinar con más precisión, las respuestas reales, ya que en la mayoría de los casos
no es posible responder con total certeza a preguntas como por ejemplo:
- En una prueba reciente de concepto de producto, el 19.8% de las personas encuestadas indicó una alta
probabilidad de comprar el producto nuevo que habían evaluado. ¿Estos resultados son buenos? ¿Son mejores
que los obtenidos el último año para un producto similar? ¿Qué sugieren en término de la introducción de
productos?
- En un estudio de segmentación, se encuentra que las personas con ingresos superiores a 30.000 dólares al año o
más, asisten en promedio 6.2 veces al mes a restaurantes de comida rápida y las personas con ingresos de
30.000 dólares o menos al año un promedio de 6.7 veces. ¿Cómo determinar si se trata de una diferencia real y es
significativa?
 Significado Estadístico
Las inferencias estadísticas, generalizan los resultados obtenidos de una muestra como características de la población.
Una señal fundamental de éstas, es que es posible que las cifras difieran en sentido matemático, aunque no sean
significativamente distintas en sentido estadístico.
Menú
38
Ejemplo:
- Se pide a las personas que beben normalmente refrescos de cola, que prueben dos bebidas de cola a ciegas e
indiquen cuál prefieren.
Los resultados indican que el 51%, se inclinan por un producto y el 49% restante por el otro. Existe una diferencia
matemática en los resultados, pero al parecer es de poca importancia. Quizá la diferencia se encuentre dentro del
nivel de precisión de nuestra capacidad para medir las preferencias de sabor y carece de significado estadístico.
Las diferencias se evalúan mediante tres conceptos distintos:
Figura 7. Conceptos de Significado Estadístico

Fuente: Propia.
Menú
39
 Diferencias matemáticas
Por lógica, cuando las cifras no son iguales, son distintas. Sin embargo, esto no sugiere que la diferencia sea importante
o que tenga significado estadístico.
 Significado estadístico
Si determinada diferencia es suficientemente grande y es poco probable que se deba al azar o a un error de muestreo, se
dice que tiene significado estadístico.
 Diferencias importantes desde el punto de vista gerencial
Si los resultados o cifras, difieren en tal grado que la diferencia es importante desde la perspectiva gerencial, se puede
argumentar que se trata de una diferencia importante. Por ejemplo:
- Las respuestas diferentes desde los consumidores ante dos empaques distintos en una prueba de mercado,
pueden tener significado estadístico, pero ser tan pequeña que tenga poco o ningún significado práctico o
gerencial.
Según McDaniel and Gates “Existen distintos métodos, para probar el significado estadístico, que pueden ser consultados
en la dirección”
Menú
40
4.1. Pruebas de Hipótesis.
Al momento de tomar una decisión existe la posibilidad de aceptar o rechazar una proposición es lo que se conoce como
hipótesis, y al procedimiento que conduce a la toma de decisiones sobre una hipótesis en particular recibe el nombre de
prueba de hipótesis.
Una hipótesis es verdadera cuando la información contenida en la muestra aleatoria de población es consistente con la
hipótesis y es falsa cuando la información es inconsistente con la hipótesis.
 Tipos de errores:
Las pruebas de hipótesis están expuestas a dos tipos generales de errores, llamados comúnmente error Tipo I y error
Tipo II, definidos así:
- Error Tipo I: Se presenta cuando el investigador rechaza la hipótesis nula siendo ésta verdadera, quizá porque las
diferencias que observa entre los valores de la muestra y de la población se deben a un error de muestreo. La
probabilidad de cometer un error tipo I se llama nivel Alfa. A la inversa, 1-∞ es la probabilidad de efectuar una
decisión correcta de no rechazar la hipótesis nula, cuando es verdadera
- Error Tipo II: Se presenta en los casos en que el investigador no rechaza la hipótesis nula cuando es falsa. El
error Tipo II se llama error Beta. El error 1-β refleja la posibilidad de decidir correctamente el rechazo de la
hipótesis nula cuando es falsa.
Menú
41
 Calidad del ajuste.
Hace referencia a que el investigador pueda detectar si el patrón de frecuencia observado corresponde o se ajusta al
patrón esperado.
Los datos recopilados se analizan mediante conteos de frecuencia de un solo sentido y tabulaciones cruzadas. Se
realiza utilizando la prueba de la chi cuadrada (X2).
 Hipótesis en torno a una media.
Con frecuencia en los estudios de investigación de mercados es necesario efectuar inferencias sobre la media población
de datos obtenidos de la media muestral.
En muchos casos, no es probable que se conozca la desviación estándar de la población, de esta manera se debe
estimar cuando se trata de estudios previos, la desviación estándar de la muestra. Según el teorema del límite central se
plantea que en tanto el tamaño de la muestra, n sea mayor de 30, se puede sustituir la desviación aplicándose la prueba
z.
La prueba estadística que permite probar una hipótesis en torno a una media única se llama la “prueba de la Z” y se
aplica cuando la muestra es suficientemente grande (n≥30). Para muestras menores (n<30), se debe aplicar la prueba de
la t, con n-1 grados de libertad (n=tamaño de la muestra). Mario Orlando Suárez Ibujes aplicaciones en un ejemplo,
Ejemplo:
Un gerente vende libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por
semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada
Menú
42
al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Se utiliza un nivel
de confianza de 99% para aclarar esta cuestión.
Datos:
( = 40
n=8
S=2
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: ( = 40
H1: ( > 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
Menú
43
Figura 8. Media
Fuente: Suárez Ibujes, Mario Orlando.
H0 es aceptada, ya que prueba (2,83) es menor que tabla (3,499), por lo que no es acertado pensar que están realizando un
número de visitas promedio superior a 40. En Excel
Menú
44
Tabla 10. Ecuaciones de la media

Fuente: Propia.
 Hipótesis en torno a dos medias
Para tratar dos medias de la población se debe partir del hecho que no se conoce la media o desviación estándar de
cualquier población. De tal manera que se debe seleccionar una muestra de cada población y se determina cada media
de la muestra. El propósito es probar si es razonable llegar a la conclusión de que las dos medias de la población son
iguales y que por lo tanto que las poblaciones tienen una media en común.
Por ejemplo: Un supervisor desea saber si el número promedio de unidades producidas durante un turno de día es
distinto del número medio que se produce durante el turno de la tarde. En este caso, se debe seleccionar muestras
aleatorias de la las dos poblaciones, calcular las medias de muestra y determinar si es razonable que ambas sean
iguales.
Menú
45
Se utiliza cuando se desean probar las diferencias entre grupos. Se utiliza la prueba de la Z.
 Hipótesis sobre proporciones
Este tipo de hipótesis se utiliza cuando se estudian fenómenos que se expresan como porcentajes. Por ejemplo: en
mercadotecnia se estudia que proporción de entrevistados “prefieren la marca A” en comparación con los que “prefieren
la marca B” se examina si la diferencia entre las proporciones es mayor de lo esperado debido a un error de muestreo.
4.2. Contraste de Hipótesis
Se trata de analizar los resultados obtenidos de las muestras, para así señalarlos como válidos para toda la población a
través de los contrastes de hipótesis.
Mediante ellos se determina la probabilidad, es decir, si los resultados obtenidos de las muestras son también los
resultados de la población o son al azar.
Menú
46
 Operaciones de los Contrastes de Hipótesis
Una prueba de una hipótesis se lleva a cabo por medio de un procedimiento sistemático de seis pasos, que tiene por
objetivo, hacer un juicio respecto a la diferencia entre la estadística de muestra y el valor planteado del parámetro.
- PASO 1: Formular la hipótesis nula H0 y la hipótesis alternativa H1
La hipótesis nula (H0) hace referencia a un valor específico del parámetro de población, no a una estadística de muestra.
La hipótesis alternativa (H1) son todas las hipótesis que difieran de la hipótesis nula.
Menú
47
- PASO 2: Seleccionar el nivel de significación
El nivel de significación consiste en rechazar la hipótesis nula cuando es verdadera.
Ejemplo: Cuando una hipótesis es verdadera, el nivel de significación probablemente no la aceptará, quedando así por
fuera del área de aceptación.
De esta forma el nivel de significación es (1-a), lo que indica la aceptación de la hipótesis planteada que es verdadera en
una población.
Menú
48
- PASO 3: Elegir la Estadística de Prueba
Se le conoce también con el nombre de Estadística Muestral.
Ejemplo: Al momento de probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria
de la distribución normal, la cual se transforma la media en un valor z, el cual sirve como estadística de prueba.
Menú
49
- PASO 4: Establecer los valores críticos de la estadística de prueba
Para poder establecer este valor es necesario determinar si se va a realizar una prueba de uno o dos extremos, ya que
pueden existir uno o más valores.
- PASO 5: Determinar el valor real de la estadística de prueba.
Para llevar a cabo este paso se debe probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y
se determina el valor de la media muestral.
Menú
50
- PASO 6: Tomar la Decisión
En este último paso se lleva a cabo la comparación entre el valor observado de la estadística muestral con los valores
críticos de la estadística de prueba. Luego se acepta o rechaza la hipótesis nula.
Menú
51
5. TEORÍA DEL MUESTREO
Reconocer las características poblacionales desconocidas, es clave para la estadística, esta acción se realiza a través de
la información resultante de una muestra representativa.
Menú
52
Ejemplo:
Se desean estudiar los valores sociales de una población de 5000 habitantes aproximadamente; resulta difícil poder
analizar los valores sociales de todos ellos, por ello, la estadística presenta una herramienta llamada muestra para
extraer un conjunto de población que represente a la globalidad y sobre la muestra realizar el estudio.
5.1. Muestra Representativa
Una Muestra Representativa contiene las características relevantes de la población conservando las mismas
proporciones.
Los estadísticos recogen datos de una muestra y emplean esta información para hacer referencias sobre la población
que está representada por ella.
En consecuencia muestra y población son conceptos relativos.
Menú
53
Imagen 4. Muestreo y Muestras Representativas
El muestreo probalístico, es el procedimiento empleado para obtener una o varias muestras de una población, se lleva
a cabo después de que se indica un marco muestral representativo de la población, allí se seleccionan los elementos de
los diversos diseños de la muestra. Normalmente, se pueden tener variaciones de una muestra a otra.
Imagen 5. Muestreos Probabilísticos.
Menú
54
Menú
55
5.2. Curva de Gauss
Cuando de un universo se extraen varias muestras del mismo tamaño, se observa que las desviaciones que presentan
las mismas tienden a agruparse alrededor de los valores reales del universo.
Al representar estas desviaciones en los ejes de las coordenadas, se obtiene una curva llamada de Gauss que es vista
mediante una desviación normal, la cual indica que son más frecuentes las observaciones próximas a la media
(promedio) y más escasas las que se alejan de ella.
Esta distribución de las medias de diferentes muestras, tiene su propia desviación típica a la que se llama error
estándar, que será mayor a medida que se aleja de la media (valor central).
Los valores de la distribución normal se hayan comprendidos así:
a) 68,3% = +/- , una (1) desviación típica

b) 95,5% = +/- , dos (2) desviaciones típicas
c) 99,7% = +/-, tres (3) desviaciones típicas
Por consiguiente el error estándar es el cociente entre la desviación típica de la muestra y la raíz cuadrada del número
de unidades de la muestra.
En caso de utilizar porcentaje, la fórmula es la misma:
Desviación típica de p = Raíz cuadrada de p x q/n
Donde p= Porcentaje en el que se produce el fenómeno

q = porcentaje complementario (100-p)
n = Tamaño de la muestra.
Menú
56
La muestra debe tener un tamaño con el mínimo de unidades posibles, para que se reduzca el costo de la
investigación, pero a la vez debe ser suficientemente amplio para que el error de muestreo tenga un valor admisible.
En las investigaciones comerciales se acepta un error de muestreo entre +/- 3 y +/- 10.
Es de considerar que entre mayor sea el grado de homogeneidad, será mayor el número de unidades muestrales que
tiendan a reducirse.
Si las unidades poblacionales son heterogéneas, las unidades muestreadas serán mayores.
Para calcular el tamaño de la muestra, se utilizan las tablas calculadas por el Harvard College a partir de las siguientes
fórmulas dependiendo del grado (coeficiente) de confiabilidad y el tipo de universo:
a) Poblaciones infinitas y coeficiente de confiabilidad del 99,7%,

n= 9 p.q/ error del muestreo al cuadrado
p y q son las proporciones complementarias de que se dé el fenómeno
b) Poblaciones infinitas y coeficiente de confiabilidad del 95,5%,

n= 4 p.q/ error del muestreo al cuadrado
c) Poblaciones finitas y coeficiente de confiabilidad del 99,7%,

n= 9 p.q/ desviación típica al cuadrado (N-1) +9 p.q
d) Poblaciones finitas y coeficiente de confiabilidad del 95,5%,

n= 4 p.q/ desviación típica al cuadrado (N-1) +4 p.q
Menú
57
EJEMPLOS:
a) Poblaciones infinitas y coeficiente de confiabilidad del 99,7%,

p= 20
q= 80
Límite de error en porcentaje= 3%
Cruzando en la tabla la fila de límite de error en porcentaje con la columna de valores posibles de p y q encontramos que
n= 1.600 unidades muestrales
b) Poblaciones infinitas y coeficiente de confiabilidad del 95,5%,

p= 20
q= 80
Límite de error en porcentaje= 3%
Cruzando en la tabla la fila de límite de error en porcentaje con la columna de valores posibles de p y q encontramos que
n= 711 unidades muestrales
c) Poblaciones finitas y coeficiente de confiabilidad del 99,7%,

Amplitud del universo: 50.000 unidades estadísticas
p = q = 50
error muestral en porcentaje= +/- 3 %
d) Poblaciones finitas y coeficiente de confiabilidad del 95,5%,
Amplitud del universo: 50.000 unidades estadísticas
p = q = 50
error muestral en porcentaje= +/- 3 %
Menú
58
GLOSARIO
Alternativas de Acción: Son posibles actuaciones para resolver un problema o aprovechar una oportunidad. Son
distintas formas de utilizar los recursos de la empresa durante un período de tiempo determinado.
Banco de Datos: Conjunto de datos almacenados en ficheros informatizados, a los que se puede acceder con gran
rapidez para actualizar, modificar, consultar o analizar su contenido / Sinónimo de base datos.
Codificación: Proceso de asignar a cada uno de los tipos de respuestas del cuestionario o del documento de
observación, un digito o número que representará a dicha respuesta en un soporte informático.
Cuestionario: Instrumento que se utiliza para obtener información primaria mediante comunicación. Se materializa en
una lista de preguntas.
Dato Primario: Es aquel que se obtiene de modo específico para la investigación a efectuar.
Dato Secundario: Dato que ya está disponible, que se ha obtenido en estudios anteriores y que sirve para los fines de la
investigación que se va a realizar.
Encuesta: Técnica que utilizando un cuestionario sirve para obtener información mediante comunicación a través de
entrevista personal, telefónica o por correo.
Entrevista: Forma de comunicación personal entre dos o más personas mediante el sostenimiento de una conversación.
Estadístico: Una medida resumen calculada sobre la muestra
Hipótesis: Es una proposición no probada pero probable sobre la realidad.
Menú
59
Hipótesis Nula: Hipótesis que niega que se den ciertas propiedades en la población. Formulada de igual forma, se
somete al contraste de hipótesis.
Muestra: Subconjunto de elementos de una población de la que se quiere obtener información.
Población: Total de sujetos o unidades de análisis de interés en el estudio
Parámetro: Una medida resumen calculada sobre la población
Unidad Muestral: Elemento de la población del cual se obtienen datos. Pueden ser individuos, hogares, organizaciones,
objetos, acontecimientos, etc.
Menú
60
BIBLIOGRAFÍA
Dirección de Marketing y Ventas (I) Cultural de Ediciones S.A. Edición 1998 ISBN:84-8055-218-2 (Tomo I) Madrid España
Menú
61
WEB GRÁFIA
Tipos de Técnicas Multivariantes. Recuperado de:

http://www.virtual.unal.edu.co/cursos/sedes/manizales/4010059/html/Modulo%20Estadistica/tiposmulti.htm. Consultado el:
11 de Julio 2014.
Técnicas Numéricas Recuperado de: http://www.monografias.com/trabajos89/ejercicios-resueltos-prueba-

hipotesis/ejercicios-resueltos-prueba-hipotesis.shtml#ixzz357vV6uTi . Consultado el: 11 de Julio 2014.
Ing. Rafael José Cuevas Mijangos. ITESCAM. Matemáticas para la Toma de Decisiones. Recuperado de:
file:///C:/Users/Administrador/Downloads/131469066-apuntesAD%20(1).pdf. Consultado el: 11 de Julio 2014.
Oportunidad de Negocios en Línea - Un portal de Caja de Herramientas. (2006) Presentación de los Resultados.
Recuperado de: http://www.negociosgt.com/main.php?id=96&show_item=1&id_area=123. Consultado el: 11 de Julio
2014.
Presentación de los Resultados. Recuperado de:

https://www.aiu.edu/publications/student/spanish/Investigaci%C3%B3n%20de%20Mercado.html. Consultado el: 11 de
Julio 2014.
Presentación de los Resultados. Recuperado de:

http://www.gestiopolis.com/recursos/documentos/fulldocs/mar/inffininvmkt.htm. Consultado el: 11 de Julio 2014.
Investigación de Mercados Contemporánea. McDaniel and Gates. 4ª Edición.International Thomson Editores

Recuperado de:
http://www.academia.edu/1746451/Organizacion_Clasificacion_e_Interpretacion_de_los_Datos_como_Guia_para_el_Ing
eniero_Industrial. Consultado el: 11 de Julio 2014.
Menú
62
Introducción inteligente de datos. Recuperado de: http://es.wikipedia.org/wiki/Agente_inteligente_(inteligencia_artificial) .

Consultado el: 11 de Julio 2014.
Los Test Estadísticos. Recuperado de: http://scientific-european-federation-osteopaths.org/es/test-estadisticos.

Consultado el: 11 de Julio 2014.
Menú
63
IMÁGENES
Imagen 1. Procesamiento de datos. Recuperado de: http://www.gtek-sc.com/author/admin/. Consultado el 05 de Junio

2014.
Imagen 2. Agrupación de respuestas abiertas y cerradas. Tomada de: SENA.
Imagen 3. Introducción de datos de manera inteligente Tomada de: SENA.
Imagen 4. Tipos de representación gráfica de datos. Recuperado de: http://ecuamaestro.blogspot.com/2012/10/chartgo-

graficos-estadisticos-en-linea.html Consultado el 05 de Junio 2014.
Imagen 5. Evaluación y análisis de datos. Recuperado de: http://www.csigsac.com/joomla16/index.php/12-novedades/30-

analisis-de-datos. Consultado el 05 de Junio 2014.
Imagen 6. Muestreo y muestras representativas. Recuperado de: http://aldanalisis.blogspot.com/2013/03/muestreo-y-

muestras-representativas.html. Consultado el 05 de Junio 2014.
Imagen 7. Muestreos probabilísticos. Recuperado de: http://personal.ua.es/es/francisco-

frances/materiales/tema3/seleccin_de_los_casos_muestreos_probabilsticos.html. Consultado el 05 de Junio 2014.
Menú
64
CRÉDITOS
Líder Equipo Tecno pedagógico

Gabriel Rincón Saldarriaga
Centro de Comercio
Regional Antioquia
Expertos Temáticos
Samuel Enrique Cardona
Juan Pablo Henao Velásquez
Miguel Alfonso Herrera Álvarez
Iván Darío Ocampo Restrepo
Centro de Comercio
Regional Antioquia
Línea de Producción
Centro de la Tecnología del Diseño y la Productividad Empresarial
SENA - Girardot
Regional Cundinamarca
Líder de Línea
Julián Andrés Mora Gómez
Asesora Pedagógica
Leidy Diana Cuéllar Serna
Menú
65
Equipo de Edición
Ana María Beltrán Hurtado
Beatriz Helena Duque
Andrea del Pilar Rodríguez Salazar
Equipo de Diseño
Lina Marcela García López
Liam Pamela Hermida
Dalys Ortegón Caicedo
Nazly María Victoria Díaz Vera
Yisell Noraya Buitrago
Equipo de Programación
Luis Fernando Amórtegui García
Edilson Laverde Molina
Charles Richar Torres Moreno
Carlos Andrés Orjuela Lasso
Sergio Alejandro Camacho
Menú

Contenido 6 PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Contenido 6 PDF

Caricato da

Copyright:

Formati disponibili

1

1. PROCESAMIENTO DE DATOS ............................................................................... 8

3.1. Coeficiente Epsilon. ...................................................................................... 33

Figura 1. Comprobación antes de proceder a tabular los datos .......................................................................................... 15

Tabla 1. Ejemplo de codificación ......................................................................................................................................... 11

El procesamiento de datos, es un proceso sistémico de producción de bienes y

Imagen 1. Procesamiento de datos

Aunque el objetivo difiere de convertir al aprendiz de la especialización en Investigación de Mercado en un estadígrafo,

1.1. Validación y Edición

Para llevar a cabo esta validación se establecen los siguientes cuestionamientos:

Figura 1. Validación y edición de cuestionarios

La codificación, consiste en agrupar las respuestas de determinada pregunta y

La codificación facilita la introducción de los datos o respuestas en el ordenador y

Según el portal web www.tecnicasdeestudio.org, el procedimiento de codificación de preguntas abiertas, consiste en

3. Asignar un código a cada una de las clases de preguntas establecidas.”

Las respuestas han sido:

A. Es demasiado grande para ponerlo en mi casa.

Tabla 1. Ejemplo de codificación

Si en dos cuestionarios aparecen respectivamente las siguientes preguntas:

Tabla 2. Ejemplo de categorías de respuesta

1.3. Introducción de datos.

Esta introducción de datos se puede realizar mediante varios medios:

 Introducción inteligente o dirigida.

Imagen 3. Introducción de datos de manera inteligente.

Figura 2. Comprobación antes de proceder a tabular los datos

Ejemplo de Tabla de Frecuencia:

Tabla 3. Ejemplo de tabla de frecuencia

1.4. Tabulación de los Resultados

Tabla 4. Ejemplo de tabulación simple o cruzada.

 Tabulaciones Simples o Reportes Marginales

Para establecer la base para porcentajes existen tres opciones:

Figura 3. Opciones para establecer la base para porcentajes

Tabla 5. Ejemplo de tabulación cruzada

1.5. Representación Gráfica de Datos

Imagen 2. Tipos de representación gráfica de datos.

1.6. Estadísticas Descriptivas

Figura 4. Áreas de la estadística

Imagen 3. Evaluación y análisis de datos.

2.1. Tipos de Análisis.

Existen diversas formas de realizar el análisis:

2.1.1. Análisis univariado

Figura 5. Medidas estadísticas

Zona A: 5700, 6000, 9000, 10000, 10000 Y 10000.

Tabla 6. Ejemplo de medidas de tendencia central

- Mediana: 9500 (9000 más 10000 dividido en 2)

- Media aritmética: 8450

- Desviación típica: 18741665

- Media aritmética: 8421

- Desviación típica: 14288299

2.1.2. Análisis bivariable

2.1.3. Análisis multivariado de datos

 Análisis de Regresión Múltiple.

 Análisis de regresión múltiple

 Análisis discriminatorio múltiple

 Determinar si las diferencias estadísticamente significativas entre los perfiles de calificación

 Descripción de mercados y segmentación

3. TIPOS DE COEFICIENTES DE CORRELACIÓN

Figura 6.Comparación de los Coeficientes

3.1. Coeficiente Epsilon.

Tabla 7. Ejemplo Coeficiente Epsilon.

Los valores de Epsilon para cada fila son:

- Epilson de la fila 1: 24,24 – 21,87: 2,37

3.2. Coeficiente Rho de Spearman.