Sei sulla pagina 1di 105

Dra.

Elizabeth Mendoza Crdenas

Aplicando la estadstica en las


ciencias sociales

Libro desarrollado para facilitar el aprendizaje de la estadstica


aplicada en las ciencias sociales

Universidad Autnoma de Nuevo Len


Facultad de Trabajo Social y Desarrollo Humano

La medicin es el ama de llaves de la enseanza. Sin medicin no


puede haber evaluacin. Sin evaluacin, es imposible la
retroalimentacin. Sin retroalimentacin, no puede tenerse una
idea precisa de los resultados alcanzados. Sin conocer estos
resultados, tampoco es posible una mejora sistemtica en el
aprendizaje.
Parnell, citado en Mehrens y Lehmann, 1982, p19.

Propsito
La estadstica ha llegado a ocupar un amplio escenario en el desarrollo de la ciencia y la
tecnologa, pero tambin en las ms diversas esferas de la vida cotidiana, incluidas la cultura y el
deporte. En esta perspectiva podemos decir que es una disciplina que lleg para expandirse y para
incorporarse a la cultura en la sociedad del conocimiento y la informacin. Un aspecto importante en
la prctica de los profesionales en T.S. y D.S. la constituye el proceso de investigacin, donde juegan un
importante papel los procedimientos Estadsticos, ya que proporcionan al egresado, instrumentos para
tomar decisiones cuando prevalecen condiciones de incertidumbre
La metodologa estadstica nos dota de una serie de principios, procedimientos, tcnicas y
mtodos para realizar cuatro tareas fundamentales en la investigacin:
1. Obtener datos pertinentes de manera rpida y a costos bajos;
2. Una vez obtenidos los datos, proporciona los mtodos para su organizacin y
procesamiento, a fin de obtener de ellos la informacin requerida;
3. Proporciona los principios y mtodos para que las conclusiones emanadas o acciones a
seguir sean el producto de procesos de induccin vlidos, que se obtengan de interpretaciones
adecuadas de los resultados; y
4. Proporciona los principios y lineamientos para comunicar apropiadamente los resultados,
conclusiones y recomendaciones, ya sea en el marco de un reporte, una presentacin oral o un artculo
cientfico.
As, los mtodos y tcnicas de la estadstica ayudan a la realizacin de mltiples tareas en las
organizaciones productivas y sociales, tanto en las instituciones pblicas como en las privadas; son la
base para la realizacin de investigaciones que permiten el sustento de la toma de decisiones en las
instituciones u organizaciones de los ms diversos giros.
Pretendemos, por tanto, que el estudiante de la Licenciatura en T. S. y D.H., se familiarice con
las nociones de Estadstica de mayor aplicacin en el Trabajo Social, con un doble objetivo: que sepa
analizar e interpretar la informacin estadstica, los argumentos relacionados con los datos o los
fenmenos estocsticos que pueden encontrar en diversos contextos, y que desarrolle su capacidad de
crtica hacia las informaciones de tipo estadstico procedentes de cualquier fuente.

Elementos de Competencia
1. Elaborar un reporte de Anlisis Descriptivo que facilite la adecuada
interpretacin de los resultados obtenidos de algn caso prctico (real o
hipottico) presentado en el aula, utilizando los procedimientos, tcnicas
y mtodos de estadstica descriptiva
2. Estimar parmetros poblacionales de las variables analizadas en el reporte
de Anlisis Descriptivo del caso prctico (real o hipottico) presentado en
el aula, para que las conclusiones emanadas o acciones a seguir sean el
producto de procesos de induccin vlidos, basados en adecuadas
interpretaciones de los resultados
3. Determinar el tamao de una muestra que represente a una determinada
poblacin, con la exactitud y confianza que el estudiante en el papel de
investigador determine.
Metodologa del curso
Esta asignatura ha de entenderse como una herramienta para el trabajador social, y por tanto
debe sustentarse, fundamentalmente, en la resolucin de casos prcticos. Por tanto, plantearemos una
metodologa que procure la participacin del alumnado en la resolucin de esos casos, ya sea
individualmente o de forma colectiva.
Sesiones de Clase
Los estudiantes tienen la obligacin de asistir a todas las sesiones de clase presencial. En este
programa no se permiten las ausencias. En el caso excepcional de que no pueda evitarse la ausencia,
se exigir que el estudiante realice un trabajo/experiencia de compensacin igual y pertinente que
ser definido por el profesor As tambin, el estudiante que no pueda asistir a una sesin de clase, es
el o la responsable de negociar con el instructor la realizacin de un trabajo escrito extraordinario
dedicado a recuperar la instruccin perdida. El instructor disear este trabajo asignado de forma que
cumpla con los objetivos y el contenido de la sesin de clase perdida. En correspondencia con ello, se
fijar una fecha lmite para la entrega del trabajo terminado.
Competencia No 1
Al finalizar esta unidad de aprendizaje el estudiante debe ser capaz de elaborar un reporte de
Anlisis Descriptivo que facilite la adecuada interpretacin de los resultados obtenidos de algn caso
prctico (real o hipottico) presentado en el aula, utilizando los procedimientos, tcnicas y
mtodos de estadstica descriptiva
Contenidos
1.1 Introduccin al curso de estadstica y conceptos bsicos
1.2 Distribucin de frecuencias y tcnicas de representacin grfica
1.3 Medidas de tendencia central

1.4 Medidas de dispersin


1.5 La curva normal y la desviacin estndar
Las Actividades de aprendizaje que deben ser cubiertas por el alumno son:
Presentaciones por parte del profesor en el aula
Resolucin de problemas de forma individual y por equipo
Elaboracin de Tablas de Distribucin de Frecuencias y Porcentajes en el cuaderno o
pizarrn y usando SPSS
Elaborar reportes grficos utilizando Tablas de Distribucin de Frecuencias y
Porcentajes en el cuaderno o pizarrn y usando SPSS
Uso de sistemas electrnicos de informacin
Consulta y anlisis de libros, artculos y publicaciones en lnea
Uso del paquete SPSS como apoyo tecnolgico

Propsito del curso ........................................................................................................................................


Introduccin ....................................................................................................................................................
Importancia de la Estadstica para el profesional en Trabajo Social y Desarrollo Humano .......................
Definicin de Estadstica. ........................................................................................................................
Fases de la Estadstica .............................................................................................................................
Funciones de la estadstica .....................................................................................................................
Conceptos bsicos...................................................................................................................................
Niveles de Medicin....................................................................................................................................
Trminos para recordar ..............................................................................................................................
Distribucin de frecuencias y tcnicas de representacin grfica..................................................................
Ordenamiento y Clasificacin de datos ......................................................................................................
Qu es Distribucin de Frecuencias? ....................................................................................................
Partes de una Tabla.................................................................................................................................
Estado civil de los afiliados al INSEN .............................................................................................................
Reglas para formar una tabla de Distribucin de Frecuencias ...............................................................
Tcnicas de Representacin Grfica de Datos ................................................................................................
Partes de una Grfica ..................................................................................................................................
Regla de los 3/4 .......................................................................................................................................
Regla de los ..............................................................................................................................................
Diagrama de barras compuestas ................................................................................................................
Grafica Circular............................................................................................................................................
Histograma y Polgono de Frecuencias .......................................................................................................
Trminos para recordar ..............................................................................................................................
Medidas de tendencia central .......................................................................................................................
Que es un promedio? ............................................................................................................................
La Moda (Mo)..........................................................................................................................................
Propiedades de la moda .........................................................................................................................
Desventajas de la moda ..........................................................................................................................
Determinar la Moda de una lista de datos ............................................................................................
Cmo determinar la Moda en distribuciones de frecuencias de datos agrupados ...............................
Representacin Grfica ...........................................................................................................................
La Mediana (Mdn) ...................................................................................................................................
Propiedades de la mediana.....................................................................................................................
La Media aritmtica ( ) .......................................................................................................................
Propiedades de la media aritmtica .......................................................................................................
Desventajas de la media aritmtica ........................................................................................................
Obtencin de la media para una lista de datos ......................................................................................
Obtencin de la media para distribuciones de frecuencia .....................................................................
Medidas de dispersin ...........................................................................................................................
Cundo nos pueden ayudar estos estadgrafos, para qu sirven? .......................................................
Clculo del Rango ....................................................................................................................................
Clculo de Rango, Varianza y Desviacin estndar para Listas de datos ................................................
Curva Normal y Desviacin estndar ......................................................................................................
Trabajos citados .............................................................................................................................................

Introduccin
Importancia de la Estadstica para el profesional en Trabajo Social y Desarrollo Humano
En la actualidad se ha incorporado la estadstica, en forma generalizada, al currculo de
matemticas de la enseanza primaria y secundaria y de las diferentes especialidades universitarias en
la mayora de pases desarrollados. En Mxico algunos conceptos estadsticos se estudian desde
el nivel secundario, pero falta mucho por hacer en este rubro. Las razones de este inters hacia la
enseanza de la estadstica han sido repetidamente sealadas por diversos autores, desde
comienzos de la dcada de los ochenta. Por ejemplo en Holmes (1980) encontramos las
siguientes:
La estadstica es una parte de la educacin general deseable para los futuros ciudadanos
adultos, quienes precisan adquirir la capacidad de lectura e interpretacin de tablas y grficos
estadsticos que con frecuencia aparecen en los medios informativos. Para orientarse en el mundo
actual, ligado por las telecomunicaciones e interdependiente social, econmica y polticamente, es
preciso interpretar una amplia gama de informacin sobre los temas ms variados.
Es til para la vida posterior, ya que en muchas profesiones se precisan unos conocimientos
bsicos del tema. La estadstica es indispensable en el estudio los fenmenos complejos,
en los que hay que comenzar por definir el objeto de estudio, y las variables
relevantes, tomar datos de las mismas, interpretarlos y analizarlos.
Su estudio ayuda al desarrollo personal, fomentando un
razonamiento crtico, basado en la valoracin de la evidencia
objetiva; hemos de ser capaces de usar los datos cuantitativos para
controlar nuestros juicios e interpretar los de los dems; es importante adquirir
un sentido de los mtodos y razonamientos que permiten transformar estos
datos para resolver problemas de decisin y efectuar predicciones (Ottaviani,
1998).
Ayuda a comprender otros temas del currculum, donde con frecuencia aparecen grficos,
resmenes o conceptos estadsticos.
El trabajo social y las ciencias de la educacin utilizan la base metodolgica de la estadstica
para los procesos de investigacin aplicada, no slo para monitorear programas en sistemas educativos
sino para cualquier asunto relacionado con la evaluacin y toma de decisiones. Las ciencias biolgicas y
las disciplinas emergentes, como el desarrollo sustentable, o agroecosistemas, medio ambiente,
cambio global y ecologa, consideran a la metodologa estadstica como fundamental para la
generacin del conocimiento y para el diseo e implantacin de estrategias de intervencin. Hay una
gran cantidad de estudios e investigaciones en estas disciplinas que sin la metodologa estadstica
seran impensables.
Definicin de Estadstica
"Ciencia que se ocupa del estudio de fenmenos de tipo genrico, normalmente complejos y

enmarcados en un universo variable, mediante el empleo de modelos de reduccin de la informacin y

de anlisis de validacin de los resultados en trminos de representatividad".


Fases de la Estadstica
La recopilacin de informacin. La informacin puede ser numrica, alfabtica o simblica
Organizacin de la informacin recabada
Anlisis e interpretacin de los resultados
Presentacin de los resultados

Recopilacin
de informacin
(numrica o
alfabtica)

Organizacin
de la
informacin
recabada

Anlisis e
interpretacin
de los
resultados

Presentacin
de los
resultados

Funciones de la estadstica
Se puede hacer una distincin entre las dos funciones del mtodo
estadstico: las tcnicas de estadsticas descriptivas y las tcnicas
estadsticas inferenciales. El propsito principal de la estadstica
descriptiva es presentar la informacin en forma cmoda, utilizable y
comprensible. Por otra parte, la estadstica inferencial se ocupa de hacer deducciones acerca de la
poblacin de estudio basndose en la o las muestras tomadas de ella.
Conceptos bsicos
Variable. Es cualquier caracterstica de una persona, medio ambiente o situacin experimental
que pueda cambiar de persona a persona, de un medio ambiente a otro medio ambiente o de una
situacin experimental a otra.
Ejemplos: sexo del entrevistado, estado civil actual del entrevistado, edad del entrevistado,
etctera, etctera.
Variable Independiente en un experimento. Es una variable controlada sistemticamente por
el investigador. Por lo general, en una investigacin el cientfico se interesa por el efecto que tiene una
variable A sobre alguna o ms variables. Ejemplo: El investigador desea saber cmo el alcohol afecta la
memoria. Para averiguarlo, es posible que el investigador vare los niveles de alcohol para
posteriormente medir la cantidad de recuerdos que maneja el sujeto de estudio.
La variable que controla el investigador es el nivel de alcohol y es a la que llamaremos la
variable independiente
Variable Dependiente en un experimento. Es la variable que mide el investigador para
determinar el efecto de la variable independiente
Ejemplos: Del ejemplo anterior, la cantidad de recuerdos que maneja el sujeto de estudio, es

la que llamaremos la variable dependiente


Datos. Son todos aquellos nmeros o medidas obtenidos como resultado de observaciones. Si
bien pueden ser recuentos (datos de frecuencias) tales como el nmero de personas que se dice que
votaron por Felipe Caldern, son considerados tambin como datos cada una de las respuestas
obtenidas a las preguntas de un cuestionario, cdula de entrevista o cualquier instrumento de
recopilacin de la informacin (datos).
Ejemplos : una tcnica utilizada cotidianamente para obtener datos es la que empleamos
cuando estamos socializando, imaginemos que hoy es el gran da en que estamos en posicin de
convivir con aquella persona que nos interesa, aunque sta ni idea tenga de que existimos, qu cosas
nos interesara saber de esa persona?, Pues bien cada pregunta que nos hagamos es una variable
porque de un individuo a otro puede cambiar la respuesta, pero cada respuesta que nos d la persona a
la que cuestionamos es un dato.
Entonces hagamos la distincin entre variable y dato:
VARIABLE

DATO

Cmo te llamas?

Pancho Lpez

A que te dedicas?

Administro mi cyber caf

Cul es tu platillo preferido?

Garza asada

Estas casado?

Pero para nada!

Qu marca es tu auto?

Transam

Cmo es la pareja de tus sueos?

Como t

Poblacin o Universo. Es el conjunto completo de individuos objetos o medidas que poseen


por lo menos una caracterstica comn observable
Ejemplos:
Todos los estudiantes inscritos en el cuarto semestre de la Fac. de Trabajo Social y Desarrollo
Humano de la U.A.N.L.
Los grupos de pandillas de Fomerrey 872
Parmetro. Es el nmero resultante de la manipulacin de los datos de una poblacin, que de
acuerdo con ciertos procedimientos especficos se cuantifica una caracterstica de la poblacin.
Ejemplo: Si pudiramos medir la altura de todos los mexicanos adultos y con esos datos
calculamos la estatura media, estaramos calculando un parmetro
Muestra. Es un subconjunto de la poblacin o universo.
Muestra aleatoria. Es un subconjunto de la poblacin o universo seleccionado en forma tal que
cada miembro de la poblacin tenga la misma oportunidad de ser elegido para formar parte de la
muestra.
Estadgrafo o Estadstica. Es el nmero resultante de la manipulacin de los datos de una
muestra de acuerdo con ciertos procedimientos especficos. Para estimar el parmetro referente a una
poblacin usamos generalmente un estadgrafo que se calcula a partir de una muestra.
Indicador Social. Es una medida de resumen, de preferencia estadstica, referida a la cantidad

o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar las
unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables o atributos que se estn analizando.
Por ejemplo, la tasa de analfabetismo y el acceso al agua potable son indicadores sociales
simples, ya que se refieren a atributos que se puede constatar su presencia o nivel calidad en forma
simple y emprica. Diferente es el caso de un indicador como clase social o prestigio que requieren un
marco conceptual ms complejo al ser un constructo terico ambos y no tiene una equivalencia
emprica concreta. En la composicin de indicadores se debe tener conceptualmente claro lo que
buscamos y no requieren un gran desarrollo matemtico o estadstico.
Por ejemplo: viviendas de un pueblo que no tienen agua potable y expresado en porcentajes.
Argumento: El 59% de las casas del pueblo X no tienen agua potable instalada y hay que traerla
manualmente. Otro ndice seria que no tienen electricidad. Reuniendo varios ndices tenemos un
indicador, por ejemplo de pobreza. Ordenando varios indicadores como uno de pobreza, otro de

analfabetismo, otro de esperanza de vida, tenemos una escala de prioridades a resolver o simplemente
describir. Podemos tomar acciones sobre el analfabetismo enseando a leer y sobre la pobreza
instalando el agua y la electricidad, pero no podemos tomar acciones sobre la esperanza de vida, que
es un valor nominal o ms bien un objetivo a mejorar, por esto los ndices deben ser homogneos con
relacin al propsito de la accin.
La secuencia o la vida de un indicador comienza seleccionando uno o varios que representen a
nuestro entender lo que se quiere investigar. Se ha seleccionado Esperanza de vida al nacer,

Analfabetismo y Nivel de vida (Producto Interno Bruto) y con estos tres indicadores tenemos uno de
Desarrollo Humano para comparar naciones.
Proceso para introducir un indicador: Metodologa en las ciencias sociales.

Seleccionando un tpico.

Definiendo el problema.

Revisando la literatura.

Formulando una hiptesis.

Seleccionando un mtodo de investigacin.


-Seleccionando un programa estadstico.
-Seleccionando los indicadores e ndices.
-Recopilando datos secundarios (censales)

Analizando los resultados.

Presentando los resultados.


Normalmente en los trabajos de proyectos de desarrollo se utilizan hasta 100 ndices, que ya

estn en las estadsticas del censo y con los cuales se construyen 10 o 20 indicadores, que han de ser
ordenados finalmente por Prioridades sociales, precisando de una encuesta para este fin.
Los ndices de desarrollo humano y las escalas de prioridades de la calidad de vida, se han

elaborado a nivel mundial por las Naciones Unidas: ndice de Desarrollo Humano, comprenden la
Esperanza de Vida, Tasa de Alfabetizacin, Tasa de Enseanza y Producto Interno Bruto. Los
indicadores de objetivos de desarrollo han catalogado 12 prioridades con sus estadsticas para todos
los pases. El primero es la pobreza y, consecuentemente, el hambre.
El tema de las prioridades sociales como una aplicacin de la metodologa para la poltica
social, establece qu acciones se ejecutarn primero y cuales siguen despus; de acuerdo con un orden
que se preestablece, preguntando a los usuarios o clientes de un plan de desarrollo sobre qu temas
deben ser los primeros en atenderse o asignar ayudas.
Estas prioridades se establecen con los indicadores sociales de desarrollo, tales como: el ndice
de pobreza, medido, por ejemplo, con el coeficiente de Engel o el coste de la canasta bsica o el nivel
de economa autosuficiente. Una vez seleccionada una lista de indicadores necesaria para establecer
los ndices que definen cada indicador. En el ejemplo anterior, el ndice de pobreza pudiera ser
definido por el costo de la alimentacin dividido por los ingresos familiares, esto es, el coeficiente de
Engel. Tambin el porcentaje de hogares sin electricidad o agua permiten medir la pobreza. En este
proceso, se puede proceder con otro indicador, como el nivel de educacin o las facilidades de
asistencia mdica. As terminamos la escala de indicadores que han sido definidos y compuestos con
ndices o porcentajes o promedios, o cualquier medidor. Son sumamente tiles para planificar
objetivos a corto y medio plazo sobre la calidad de vida de la poblacin.
Prioridades sociales cualitativas para reas (indicadores) que se consideran interconectadas y
que vienen estudindose en la ltima dcada.

Costo de/y acceso al cuidado de la salud.

Viviendas y personas sin hogar.

Economa autosuficiente.

Violencia.

Abusos de sustancias y otras adicciones.

Discriminacin.

Mayores.

Jvenes.

Estrs, ansiedad y depresin.

Falta de tiempo para s mismo y para los otros.


El ms sealado es el tema de la salud, le sigue vivienda y as sucesivamente. Adems, puede

hacerse algn comentario sobre la evolucin del desarrollo en la poblacin ya que existen otras
encuestas durante la ltima dcada. Tambin se pueden tener observaciones de tipo sociolgico sobre
los cambios en la cultura de la poblacin dado que sta y las necesidades definen las prioridades,
opinin cierta en un anlisis funcionalista.
Las viviendas y las personas sin hogar son prioritarias, sin embargo aparecen de manera distinta
en 1995. En ese momento, por ejemplo, no se meda el nmero de personas sin hogar. Los temas

relacionados con salud han sido redefinidos y elevaron su prioridad al primer lugar en 2004. Los dos
ltimos Estrs... y Falta de tiempo... aparecen por primera vez y son indicadores cualitativos. El
indicador Economa... ha sido tambin redefinido. Mayores y Jvenes son fluctuantes, en tanto
Transporte y Desempleo no figuran. Aparecen nuevos indicadores y dejan de usarse otros.
Otras encuestas no gubernamentales, del peridico local y fundaciones, coinciden en
prioridades dentro del rango de las diez posiciones, pero con diferencias. Esta cuestin es interesante.
Niveles de Medicin
Es de suma importancia conocer el nivel de medicin de cada una de las variables con las
cuales estamos trabajando, pues de acuerdo a su forma o nivel de medicin son los procedimientos
estadsticos que podemos emplear. Antes de conocer los tres niveles de medicin es importante tener
claro el significado de la palabra medir, pues generalmente pensamos que una medicin nos va a
significar un valor numrico y no es cierto en todos los casos. Cuando preguntamos a alguien cmo es
el lugar que visit, toda la informacin que nos proporciona para describir el paisaje son medidas que
tomo a travs de las observaciones que realizo utilizando sus cinco sentidos o bien algn instrumento
de medicin. Pues bien podemos entonces definir:
Medir: Es asignar un valor a un fenmeno observado. Los tres Niveles de Medicin son
NOMINAL, ORDINAL Y CARDINAL los cuales vamos a definir y ejemplificar a continuacin.
Nominal. Es asignar un valor a un fenmeno observado utilizando para ello etiquetas que no
indican por si mismas ningn orden jerrquico o distancia entre la posible gama de respuestas.
Algunos ejemplos son: sexo, estado civil, nombre, lugar de origen,...
Ordinal. Es asignar un valor a un fenmeno observado utilizando para ello etiquetas que nos
indican un orden jerrquico pero no distancia.
Algunos ejemplos son: escolaridad, frecuencia con que asistes a los conciertos del auditorio
coca cola, puesto, que tanto te gusta estudiar estadstica,...
Cardinal Es asignar un valor a un fenmeno observado utilizando para ello cantidades
numricas que indican por si mismas un orden jerrquico y distancia.
Algunos ejemplos son: edad, nmero de hijos, ingresos, temperatura,...
Este nivel de medicin se divide en dos categoras, intervalar y de razn, aunque para fines
estadsticos ambos se trataran de igual forma
Intervalar En este caso, el cero es un valor arbitrario, por ejemplo, cuando observamos que la
temperatura ambiental esta en cero grados sabemos que esto nos indica que hace fro y no que haya
ausencia de temperatura. Es un valor arbitrario porque a alguien se le ocurri que cuando se congela el
agua era cero grados centgrados
Razn En este caso, el cero indica ausencia, por ejemplo, cuando alguien nos dice que tiene
cero hermanos, significa que carece de ellos.

Trminos para recordar

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Distribucin de frecuencias y tcnicas de representacin grfica
Ordenamiento y Clasificacin de Datos
Qu es Distribucin de Frecuencias? A la ordenacin sistemtica de los datos y colocar frente
a l el nmero de veces que apareci como respuesta a la variable es lo que conocemos como
distribucin de frecuencias.
Becas a estudiantes de la
UANL
rea acadmica

Admn. de
empresas
Educacin

400

Humanidades

150

Ciencias Soc.

250

Ciencias

200
Total = n =

50

1050

Tcnicas de seduccin
empleada por los
universitarios
Tcnicas

Embriagar a la
chica
Falsa promesa de
matrimonio
Amor fingido

76

Amenaza de
terminar
Total = n =

17

26
76

Respuestas de los
adolescentes
entrevistados
Frecuencia con
que eres
impuntual
Frecuentemente

55

Ocasionalmente

87

Nunca

23
n

165

195

Partes de una Tabla

TITULO DE LA TABLA: Es una breve descripcin


del tema que se est tratando, el cual tiene como
propsito ubicar al pblico sobre el asunto que se desea
abordar.

NOMBRE DE LA VARIABLE: Es la caracterstica que


ocupa nuestra atencin en el presente anlisis.

TIPO DE OCURRENCIA: Se debe informar al lector que tipo de cantidad se est manejando,
por ejemplo si estamos hablando de la asistencia a un concierto en el auditorio coca cola de
Monterrey, podemos manejarlo de alguna de las siguientes formas:
Frecuencia de asistentes
Porcentaje de asistentes
Proporcin de asistentes

VALORES: Es toda la gama de datos que se obtuvieron como respuesta a la variable

FRECUENCIA, PORCENTAJE O PROPORCION: La frecuencia se denota con f e indica la

cantidad de veces que apareci cada uno de los datos de la variable


Las proporciones las denotamos con el smbolo P e indican la porcin con que aparece cada
uno de los datos de la variable cuando la poblacin o muestra de estudio se estandariza a 1
Por frmula: P = f/N
f indica frecuencia

N indica el tamao de la poblacin.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
El porcentaje se denota con el smbolo % e indica la cantidad de veces que aparece cada uno de los
datos de la variable cuando la poblacin o muestra de estudio se estandariza a 100
Por frmula: % = f/N x 100

f indica frecuencia

%=P x 100

N indica el tamao de la poblacin

P es la proporcin.

Ejemplo de una Tabla de Distribucin de Frecuencias (f) y Porcentaje (%)

Reglas para formar una tabla de Distribucin de Frecuencias


Imaginemos que acaba de aceptar el puesto de director de una escuela su responsabilidad es
preparar un nuevo plan de estudios que estimule sus capacidades intelectuales y para ello empieza por
evaluar las capacidades de su cuerpo estudiantil utilizando una muestra de 110 estudiantes, y del test
que aplica encuentra los siguientes valores de coeficiente intelectual:
CI
154
133
116
128
85
100
105
150
118
97
110

CI
131
119
103
93
108
100
111
130
104
135
113

CI
122
115
103
90
108
114
127
87
127
108
112

CI
100
117
121
105
136
123
108
89
94
139
82

CI
113
110
109
118
115
126
106
108
115
133
114

CI
119
104
147
134
117
119
91
137
101
107
112

CI
121
125
103
89
110
122
123
124
125
115
113

CI
128
85
113
143
80
102
132
96
129
83
142

CI
112
120
107
108
111
100
97
111
131
109
145

CI
93
135
98
142
127
106
110
101
110
116
123

Podemos observar que esta informacin no tiene ni pies ni cabeza, por ello organizarla es
importante a fin de que adquiera algn sentido, al realizar esta tarea estamos generando una
distribucin de frecuencias de los CI de los 110 estudiantes elegidos al azar. Primero tememos que
encontrar el CI ms alto a fin de saber dnde vamos a empezar y el ms bajo para conocer el punto

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
final de nuestro trabajo. En este ejemplo el CI ms alto es 154 y el ms bajo es 80, entonces la
distribucin de frecuencias de los CI de los 110 estudiantes elegidos al azar queda como sigue:
Distribucin de frecuencias de los CI
CI
154
150
147
145
143
142
139
137
136
135
134
133
132
131
130

f
1
1
1
1
1
2
1
1
1
2
1
2
1
2
1

CI
129
128
127
126
125
124
123
122
121
120
119
118
117
116
115

f
1
2
3
1
2
1
3
2
2
1
3
2
2
2
4

CI
114
113
112
111
110
109
108
107
106
105
104
103
102
101
100

f
2
4
3
3
5
2
6
2
2
2
2
3
1
2
4

CI
98
97
96
94
93
91
90
89
87
85
83
82
80

f
1
2
1
1
2
1
1
2
1
2
1
1
1

Como podr observar los datos estn muy dispersos y no existe una tendencia visual clara del
comportamiento de los mismos. En estas condiciones se acostumbra agrupar los datos en intervalos de
clase, para obtener una distribucin de frecuencias de datos agrupados.
Regla para formar una tabla de Distribucin de Frecuencias de Datos Agrupados
Los intervalos de clase (IC) no deben ser tan amplios que se pierda la discriminacin
proporcionada por nuestra medida original, ni tan pequeos que se desvirte el objetivo que se busca
con la agrupacin. En las ciencias sociales es aceptado agrupar los datos utilizando entre 5 y 20
intervalos de clase
Procedimiento:
Paso 1.

Decidir el nmero de IC con que se quiere

trabajar (para este ejemplo manejaremos 15 IC)


Paso 2.

Calcular la diferencia entre el valor ms alto y el

ms bajo de los datos originales y sumar 1 para obtener la


cantidad de datos o datos potenciales. Para el ejemplo: 154
80 + 1 =75
Paso 3.

Dividir este nmero entre 15(para este ejemplo

manejaremos 15 IC) para obtener el nmero de datos o


datos potenciales en cada IC. . Para el ejemplo: 75/5=5. A la
amplitud de cada IC la designaremos con el smbolo i. En
este ejemplo i=5
Paso 4.

Se considera el valor ms bajo de los datos

originales como el lmite inferior del primer IC. Sumar i-1


para obtener el lmite superior del primer IC. En nuestro caso
el primer IC es 80-84

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Paso 5.

El siguiente intervalo de clase comienza en el entero siguiente al extremo superior del


primer intervalo de clase. En este ejemplo es 85. Se reproducen las mismas etapas indicadas
en el paso 4 para obtener el lmite superior del segundo intervalo de clase. Repita este
procedimiento para formar cada uno de los siguientes intervalos de clase, hasta que todos
los datos queden incluidos en sus apropiados intervalos de clase

Paso 6.

Asigne cada uno de los datos obtenidos a sus apropiados intervalos de clase.

Paso 7.

La distribucin de frecuencias de datos agrupados se muestra en la siguiente tabla


Lmites reales de un intervalo de clase: Los verdaderos lmites se encuentran a la mitad
del camino entre el lmite superior de un IC y el lmite inferior del IC contiguo superior. Por
frmula tenemos:

Lmite real inferior (LRI)= (Lmite inferior + Lmite superior del IC contiguo inferior)/2
LRI

LI LS
2

Lmite real superior (LRS)= (Lmite inferior del IC contiguo superior + Lmite superior)/2
LRS

LI LS
2

Frecuencia acumulada: Para poder


calcular este tipo de frecuencias hay que
tener en cuenta que la variable estadstica ha
de ser cardinal u ordinal. En otro caso no
tiene mucho sentido el clculo de esta
frecuencia. La frecuencia acumulada de un
valor de la variable, es el nmero de veces
que ha aparecido en la muestra un valor
menor o igual que el de la variable y lo
representaremos por fa. Anlogamente se
define el Porcentaje Acumulado y lo vamos a
denotar por c% como la frecuencia
acumulada dividida entre n por 100
Punto Medio

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Los Puntos Medios, como su nombre lo dice se encuentran a la mitad del camino entre el lmite
superior y el lmite inferior de un IC, sin importar si utilizamos los lmites aparentes o los verdaderos.
Por frmula tenemos:
Punto Medio (x) = (Lmite inferior + Lmite superior)/2
Punto Medio (x) = (Lmite real inferior + Lmite real superior)/2
Tcnicas de Representacin Grfica de Datos
Partes de una Grfica

Ttulo de la grf ica


90
80
70
60
50
40
30
20
10
0

Parejas
Solteros
Solteras

1er conc. 2do conc. 3er conc. 4to conc.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
1.

TITULO DE LA GRAFICA

Es una breve descripcin del tema que se esta tratando, el cual tiene como propsito ubicar al
publico sobre el asunto que se desea abordar.
2.

TIPO DE OCURRENCIA

Se debe informar al lector que tipo de cantidad se est manejando, por ejemplo si estamos
hablando de la asistencia a un concierto en el auditorio coca cola de Monterrey, podemos manejarlo
de alguna de las siguientes formas:
Frecuencia de asistentes
Porcentaje de asistentes
Proporcin de asistentes
3.

ESCALA

4.

SIMBOLOGIA

Representa los grupos que nos interesan comparar respecto a una caracterstica en particular
estas son las variables independientes
5.

CARACTERSTICA QUE ESTAMOS MIDIENDO

A la caracterstica que se esta midiendo, se le conoce como variable dependiente


6.

MARCO

De preferencia debe enmarcarse la grfica a fin de dar una mejor presentacin, sin embargo
esto es opcional.
Regla de los 3/4
Como es bien sabido las grficas pueden ser empleadas para confundir al lector cuando se
manipulan intencionalmente los ejes o cuando se omite en el eje Y la frecuencia cero, es por ello que
para evitar una anarqua en la tcnica de representacin grfica, es necesario adoptar un convenio
para minimizar la posibilidad de interpretaciones errneas. La mayora de los estadsticos en que la
altura del eje Y debe ser aproximadamente 0.75 de la longitud del eje X, siendo aceptable que esta
proporcin oscile entre 0.7 y 0.8.
Siempre que un grfico lleve ejes coordenados debemos emplear la regla de los . A
continuacin veremos algunos ejemplos de representaciones grficas.
Las grficas que a continuacin vamos a manejar, son empleadas para representar variables
cuyo nivel de medicin es NOMINAL u ORDINAL.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Diagrama de barras

Regla de los
Estado civil de los afiliados al INSEN

Se elige en forma arbitraria un valor para


el eje X, tomando en cuenta la cantidad
de divisiones en que debe seccionarse
ste con el fin de colocar las barras.

60
50
40
30
20
10
0

Si X= a 10 cm., el valor de Y se obtiene


de la siguiente operacin:
Ymin=.7X Ymin=.7 (10 cm)=7 cm.
Yideal=.75 Yideal=.75(10 cm) =7.5 cm.
Ymax=.8X Ymax=.8(10 cm)=8 cm.

Estado Civil

Esto significa que el valor del eje Y puede tener cualquier longitud entre 7 y 8 cm. inclusive.
o

El eje X debe ser dividido en partes iguales, cada seccin es utilizada por una barra

Todas las barras deben tener el mismo ancho

Las barras van separadas entre s, ya que los valores que toman (soltero, casado,...) no indican
continuidad y la separacin entre ellas debe ser de igual tamao

Ninguna de las barras debe recargarse sobre el eje Y

Diagrama de barras compuestas

Distribucin de asistentes al Auditorio Coca Cola


90
80
70
60
50
40
30
20
10
0

Parejas
Solteros
Solteras

1er conc.

2do conc.

3er conc.

4to conc.

El eje X debe ser dividido en partes iguales, cada seccin es utilizada por el grupo de
comparacin

Todas las barras deben tener el mismo ancho

Las barras de cada grupo de comparacin van unidas entre s.

Los grupos de comparacin son separados entre s y la separacin entre ellas debe ser de igual
tamao

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
o

Ninguna de las barras debe recargarse sobre el eje Y

Asistentes al auditorio Coca Cola


100
90
80
70
60

Parejas

Frec. 50
40

Solteros

30
20

Solteras

10
0
1er conc.

2do conc.

3er conc.

4to conc.

En los dos ejemplos anteriores debe aplicarse la regla de los

Regla de los
Se elige en forma arbitraria un valor para el eje X, tomando en cuenta la cantidad de divisiones
en que debe seccionarse ste con el fin de colocar las barras.
Si X= a 20 cm., el valor de Y se obtiene de la siguiente operacin:
Ymin=.7X Ymin=.7 (20 cm)=14 cm.
Yideal=.75 Yideal=.75 (20 cm)=15 cm.
Ymax=.8X Ymax=.8(20 cm) =16 cm
Esto significa que el valor del eje Y puede tener cualquier longitud entre 14 cm. y 16 cm.
inclusive.
Grafica Circular
La grfica que a continuacin vamos a manejar, es empleada para representar variables cuyo
nivel de medicin es NOMINAL u ORDINAL preferentemente, sin embargo con variables CARDINALES
tambin pueden emplearse.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Estado civil de los integrantes del INSEN


Divorciado
8%
Soltero
11%

Casado
25%

Viudo
56%

Recordemos que la operacin que nos permite encontrar la abertura de los ngulos que
deseamos manejar esta dada por la siguiente frmula:
Angulo= P x 360=f/N x 360

Estado civil de los afiliados al INSEN


Estado civil

ngulo

Soltero

22

.11

11

40

Casado

50

.25

25

90

Viudo

112

.56

56

20|

Divorciado

16

.08

29

Total

(N)

f =200

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Histograma y Polgono de Frecuencias


Distribucin de porcentajes, su Histograma y Polgono
Intervalo de clase
Lmite Lmite
inferior superior

Intervalo de clase
c%

Lmite Lmite Punto fa


real
real
Medio
inferior superior
X

Porcentaje
%

150

154

149.5

154.5

152

110

100

145

149

144.5

149.5

147

108

98

140

144

139.5

144.5

142

106

96

135

139

134.5

139.5

137

103

94

130

134

129.5

134.5

132

98

89

125

129

124.5

129.5

127

91

83

120

124

119.5

124.5

122

82

75

115

119

13

114.5

119.5

117

73

66

12

110

114

17

109.5

114.5

112

60

55

15

105

109

14

104.5

109.5

107

43

39

13

100

104

12

99.5

104.5

102

29

26

11

95

99

94.5

99.5

97

17

15

90

94

89.5

94.5

92

13

12

85

89

84.5

89.5

87

80

84

79.5

84.5

82

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Histograma

Coeficiente Intelectual de los


estudiantes
20
15
Frec. 10
5
0
1
Calificacin de CI

Polgono de Porcentajes

15
2

14
2

13
2

12
2

11
2

10
2

92

82

18
16
14
12
10
8
6
4
2
0

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Distribucin de Frecuencias de datos agrupados y su Ojiva
Lmite Lmite
inferior superior

Lmite Lmite Punto fa


real
real
Medio
inferior superior
X

150

154

149.5

154.5

152

110

145

149

144.5

149.5

147

108

140

144

139.5

144.5

142

106

135

139

134.5

139.5

137

103

130

134

129.5

134.5

132

98

125

129

124.5

129.5

127

91

120

124

119.5

124.5

122

82

115

119

13

114.5

119.5

117

73

110

114

17

109.5

114.5

112

60

105

109

14

104.5

109.5

107

43

100

104

12

99.5

104.5

102

29

95

99

94.5

99.5

97

17

90

94

89.5

94.5

92

13

85

89

84.5

89.5

87

80

84

79.5

84.5

82

La caracterstica de las ojivas es que son curvas que nunca bajan, siempre van en ascenso o por
lo menos permanecen constantes.
Grfica de la Ojiva de la distribucin de frecuencias del ejemplo

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Trminos para recordar
Diagrama de barras
Diagrama de barras
compuestas

Histograma
Intervalo de Clase

Proporcin
Punto Medio

Ojiva
Distribucin de
Frecuencias

Regla de los
Polgono
Tabla

Frecuencia

Grafica Circular

Porcentaje

Porcentaje acumulado

Tcnicas de
Representacin grfica

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Medidas de tendencia central


Son otra forma de describir datos numricos, las medidas de tendencia central,
comnmente conocidas como promedios. Estos promedios son la media aritmtica, la mediana, y la
moda
Qu es un promedio?
A menudo necesitamos un solo nmero para representar una serie de datos. Este nico
nmero puede ser considerado como tpico de todos los datos.
La palabra promedio es usada frecuentemente en nuestro lenguaje diario, normalmente
nos referimos a la media aritmtica, pero podra referirse a cualquiera de los promedios. Un
trmino ms preciso que promedio es una medida de tendencia central.
La Moda (Mo)
La moda es la medida de tendencia central especialmente til para describir mediciones
de tipo ordinal y nominal.
Definicin:
Es el valor (dato o respuesta) que aparece con mayor frecuencia en una lista de datos o
distribucin de frecuencias

Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal y cardinal).
La moda tiene la ventaja de no ser afectada por valores extremos.
Puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cual
es el valor representativo de la serie de datos?

Determinar la Moda de una lista de datos


Ejemplos:
Obtenga la moda para cada uno de los siguientes conjuntos de medidas
a). 20, 18, 15, 20, 18, 13, 15, 15, 15, 20
b). 12, 18, 15, 14, 17, 18, 11, 18, 14, 12, 18
c). 129, 15, 15, 15,14, 13,13, 11

El nivel de medicin de

estos datos es Cardinal

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Solucin:
Para el inciso (a) el dato que aparece ms frecuentemente es el nmero 15, por lo
tanto el promedio segn la Mo es 15
Para el inciso (b) el dato que aparece ms frecuentemente es el nmero 18, por lo
tanto el promedio segn la Mo es 18
Para el inciso (c) el dato que aparece ms frecuentemente es el nmero 15, por lo
tanto el promedio segn la Mo es 15
Obtenga la moda para cada una de las siguientes tablas de distribuciones de frecuencias
( d)
rea
acadmica

(e)

Tcnicas de
seduccin

(f)

(g)

Frecuencia con
que eres
impuntual

Clase Social
f

Admn. de
empresas

400

Embriagar a
la chica

76

Frecuentemente

55

Alta

Educacin

50

Falsa promesa de
matrimonio

26

Ocasionalmente

87

Media

49

Humanidades

150

Amor fingido

76

Nunca

23

Baja

46

Ciencias Soc.

250

Amenaza de
terminar

17

Marginal

12

Ciencias

200

Solucin:
Para el inciso (d) el rea acadmica (dato) que aparece ms frecuentemente es
Admn. de empresas, por lo tanto el rea acadmica promedio segn la Mo es
Admn. de empresas

El nivel de medicin de
estos datos es:

Para el inciso (e) los datos que aparecen ms frecuentemente son

Nominal y Ordinal

Embriagar a la chica y Amor fingido, por lo tanto las Tcnicas de seduccin


promedio segn la Mo son Embriagar a la chica y Fingir amor en este ejemplo
hay dos modas y ambas deben ser consideradas como promedio.
Para el inciso (f) el dato que aparece ms frecuentemente es Ocasionalmente, por lo tanto
en promedio segn la Mo los entrevistados son ocasionalmente impuntuales
Para el inciso (g) el dato que aparece ms frecuentemente es la clase social Media, por lo
tanto la Clase Social promedio segn la Mo es la Clase Media

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Cmo determinar la Moda en distribuciones de frecuencias de datos agrupados


Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada por el
punto medio del intervalo que contenga la frecuencia de clase ms grande. Si hay dos intervalos
contiguos con frecuencia mxima la moda ser la media aritmtica de los dos puntos medios. Si hay
dos o ms intervalos no contiguos con frecuencia de clase mxima habr dos o ms modas que sern
los puntos medios de dichos intervalos.
Obtenga la moda de las siguiente tablas de distribucin de frecuencias

(h)
I. C.

95 - 99

97

90 - 94

92

85 - 89

12

87

80 - 84

15

82

75 -79

12

77

70 -74

72

65 - 69

67

60 - 64

62

Solucin:
Para el inciso (h) el intervalo de clase que aparece ms frecuentemente es (80 84), el punto medio
(x) de ese intervalo es (80+84)/2=82, por lo tanto el promedio segn la Mo es 82
Ejemplo: Calcular las modas de las siguientes distribuciones de frecuencia
I. C.

hay dos modas

95 - 99

97

(Bimodal)

90 - 94

92

85 - 89

87

80 - 84

75 -79

I. C.

95 - 99

90 - 94

85 - 89

82

80 - 84

77

75 -79

70 -74

72

70 -74

65 - 69

67

Moda=(67+62)/2

65 - 69

60 - 64

62

Moda = 65

60 - 64

Moda= 87

Representacin Grfica
Polgono de Frecuencias Distribucin Bimodal

8-

No hay moda

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

La Mediana (Mdn)
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, el
valor central que puede dar una mejor descripcin de los datos, es el obtenido mediante la
l
medida de tendencia central llamada mediana.
l
Definicin:
Es el dato que aparece al centro de una lista de datos o distribucin de frecuencias siempre y
cuando stos (los datos) estn ordenados en forma ascendente o descendente
Propiedades de la mediana
Hay slo una mediana en una serie de datos.
No es afectada por los valores extremos ( altos o bajos )
Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se
encuentra en el intervalo abierto.
Puede ser calculada en distribuciones con escala cardinal, y ordinal.
Ejemplo:
Obtenga la mediana para cada uno de los siguientes conjuntos de medidas
a. 20, 18, 15, 18, 13, 15, 15, 15, 20
b. 12, 18, 15, 14, 17, 18, 11, 18, 14, 12
c. 129, 15, 15, 15,14, 13, 13, 12, 11

Solucin: Debido a que los datos se encuentran desordenados en los incisos a y b, lo


primero por hacer es ordenar los datos como sigue:
a. 13, 15, 15, 15, 15, 18, 18, 20, 20
b. 11, 12, 12, 14, 14, 15, 17, 18, 18, 18
Una vez ordenados los datos debemos localizar la posicin del centro de la distribucin de
frecuencias o lista de datos, para ello contamos con las siguientes frmulas:

Cuando N es impar

Cuando N es par

El centro de la distribucin se localiza en:

La Distribucin de f cuenta con dos lugares al


centro y se localizan en:

N 1
2

Centro 1

Centro 2

N
2

N
1
2

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
En el inciso (a), cuyos datos aparecen en los cuadros de abajo, N=9, el dato que aparece al
centro de la lista, en la 5 posicin es el nmero 15, por lo tanto el promedio segn la Mdn es 15
En el inciso (b) N=10, aparecen al centro de la lista los nmeros 14 y 15, ocupando los
lugares 5 y 6 en estos casos el valor de la mediana es el punto medio entre ambos valores, por lo
tanto el promedio segn la Mdn es (14+15)/2, o sea, Mdn=14.5
En el inciso (c) N=9, el dato que aparece al centro de la lista es el nmero 15, por lo tanto el
promedio segn la Mdn es 15

a). x
20

b).
Mdn = 15

c). x

18

129

20

18

Mdn = (14+15)/2

15

18

18

Mdn =14.5

15

18

17

Mdn = 14
5 posicin

15

5 posicin

14

15

14

6 posicin

13

15

14

13

15

12

12

13

12

11

15

5 posicin

15

11

Obtenga la mediana para cada una de las siguientes distribuciones de frecuencias

(d)
rea
acadmica

(e)

Tcnicas de
seduccin

(f )

Frecuencia con
que eres
impuntual

Admn. de
empresas

400

Embriagar a la
chica

76

Frecuentemente

55

Educacin

50

Falsa promesa
de matrimonio

26

Ocasionalmente

87

Humanidades
Ciencias
Sociales
Ciencias

150

76

Nunca

23

17

Total

N=165

250
200

Amor fingido
Amenaza de
terminar

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Solucin: Debido a que los datos en los incisos d y e, no se pueden ordenar debido a que se
trata de valores NOMINALES el promedio Mediana es imposible de obtener.
En el inciso (f) el valor de N es 165, como es un valor impar solo existe un lugar al centro y se
localiza utilizando la formula

N 1

165 1
2

= 83, utilizando la fa podemos localizar ese punto como

se ve a continuacin
Frecuencia con
que eres
impuntual
Frecuentemente

fa

55

165
Hasta aqu ya se han ocupado
110 lugares, por lo tanto ya se ocupo

Ocasionalmente

87

el lugar 83. El dato que ocupa la

110

posicin del centro es Ocasionalmente

La Mdn sabemos que la


localizamos cuando al utilizar la
fa llegamos al lugar indicado en
la formula en forma exacta o
cuando nos pasamos por
primera vez.

Hasta aqu solo se han ocupado

Nunca

23

23 lugares, todava no se ha ocupado

23

el lugar 83

Total

N=165

En el inciso (f) N=165, el dato que aparece al centro de la distribucin de frecuencias, en la 83


posicin es Ocasionalmente, por lo tanto se puede decir que en promedio segn la Mdn la poblacin
entrevistada es impuntual en forma ocasional
Obtenga la mediana para cada una de las siguientes distribuciones de frecuencias
(g)
I. C.
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Total

f
5
9
12
15
12
9
4
3
N=69

(h)
I. C.
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Total

f
38
52
43
7
10
15
8
7
N=180

Solucin (g)
En el inciso (g) el valor de N es 69, como es un valor impar solo existe un lugar al centro y se
localiza utilizando la frmula

N 1
2

ve a continuacin

69 1
2

35, utilizando la fa podemos localizar ese punto como se

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
fa

I. C.

95 - 99

tanto la Mdn es un valor que oscila entre 79.5 y

90 - 94

84.5 que son los lmites reales del intervalo de

85 - 89

12

80 - 84

15

43

de frecuencias

75 -79

12

28

28 es la fa dentro de la frmula

70 -74

16

65 - 69

60 - 64

Total

Aqu nos pasamos por primera vez de 35, por lo

clase que se encuentra al centro de la distribucin

N=69

Para obtener la mediana de las distribuciones de frecuencia de datos agrupados en intervalos


de clase, se debe utilizar la siguiente formula:

i(
Mdn LRI

f a )

Nota:
La frmula se aplica utilizando el intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados
Donde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=79.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=69
fa

es la frecuencia acumulada del intervalo de clase contiguo inferior. Para ste ejemplo fa

= 28
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=15
El procedimiento queda como sigue:

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Paso 1.

N/2 = 69/2 =34.5

Paso 2.

N/2- fa = 34.5-28= 6.5

Paso 3.

i(N/2- fa) = 5 (6.5) = 32.5

i(

f a )

Paso 4.

= 32.5/15 = 2.167

i(
Mdn LRI

Paso 5.

f a )

= 79.5 + 2.167 = 81.67


Mdn = 81.67

Solucin (h)
En el inciso (h) el valor de N es 180, como es un valor par existen dos lugares al centro y se
localizan utilizando las formulas:
Centro 1= N =
2

Centro 2= N
2

180
2

1=

= 90

90 + 1= 91

Con la ayuda de la fa podemos localizar esos puntos como se ve a continuacin


I. C.

95 - 99

38

fa

Aqu nos pasamos por primera vez de 91, el centro que nos faltaba encontrar, por lo tanto la Mdn
es un valor que oscila entre 89.5 y 94.5 que son los lmites reales del intervalo de clase que se

90 - 94

52

142

encuentra en uno de los centros de la distribucin de frecuencias


Aqu llegamos a uno de los centros, la posicin 90, por lo tanto la Mdn es un valor que oscila entre
84.5 y 89.5 que son los lmites reales del intervalo de clase que se encuentra en uno de los

85 - 89

43

90

80 - 84

47

75 -79

10

40

70 -74

15

30

65 - 69

15

60 - 64

Total

centros de la distribucin de frecuencias

fa
fa

N=180

Para obtener la mediana de las distribuciones de frecuencia de datos agrupados en intervalos


de clase, se debe utilizar la siguiente formula:

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

i(
Mdn LRI

f a )

Nota:
La frmula se aplica utilizando el intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados, en este caso como los centros caen en diferentes intervalos de clase
se elige uno de ellos, cualesquiera, el resultado de la Mdn es el mismo, y si observamos con
detenimiento el nico valor que puede tener la Mdn en esta situacin es el valor del LMITE REAL
que es comn a ambos intervalos de clase.
A fin de demostrarlo calcularemos la Mdn en ambos intervalos
Clculo de la Mediana utilizando el intervalo de clase ( 85 89 )
Donde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=84.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=180
fa

Es la frecuencia acumulada del intervalo de clase contiguo inferior.


Para ste ejemplo fa = 47

f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de


datos agrupados. Para ste ejemplo f=43
El procedimiento queda como sigue:
Paso 1.

N/2 = 180/2 =90

Paso 2.

N/2- fa = 90-47= 43

Paso 3.

i(N/2- fa) = 5 (43) = 215

i(
Paso 4.

f a )

= 215/43 = 5

i(
Paso 5.

Mdn LRI

f a )

= 84.5 + 5 = 89.5

Mdn = 89.5

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Clculo de la Mediana utilizando el intervalo de clase (90 94)


Dnde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=89.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=180
fa

es la frecuencia acumulada del intervalo de clase contiguo inferior. Para ste ejemplo fa

= 90
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=52
El procedimiento queda como sigue:
Paso 1. N/2 = 180/2 =90
Paso 2. N/2- fa = 90-90= 0
Paso 3. i(N/2- fa) = 5 (0) = 0

i(
Paso 4.

f a )

= 0/52 = 0

i(
Paso 5. Mdn LRI

f a )

= 89.5 + 0 = 89.5
Mdn = 89.5

La Media aritmtica ( )
La medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente
abreviada como media
Definicin
Es el punto de equilibrio de una lista de datos o distribucin de frecuencias.
Propiedades de la media aritmtica
Puede ser calculada en distribuciones con escala cardinal

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Todos los valores son incluidos en el cmputo de la media.
Una serie de datos solo tiene una media
Es una medida muy til para comparar dos o ms poblaciones
Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor
respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el
punto de balance de una serie de datos
Desventajas de la media aritmtica
Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media
no es el promedio apropiado para representar la serie de datos.
No se puede determinar si en una distribucin de frecuencias hay intervalos de clase
abiertos.
Obtencin de la media para una lista de datos
La media aritmtica de una lista de datos se calcula de la siguiente manera:

x
n

Donde

Simboliza la media de la muestra


x

Es la suma de todos los valores de la muestra

n es el nmero de valores que tiene la muestra


Ejemplo:
OBTENGA LA MEDIA PARA CADA UNO DE LOS SIGUIENTES CONJUNTOS DE MEDIDAS
a. 10, 8, 6, 0, 8, 3, 2, 5, 8, 0
b. 15, 19, 13, 15, 13, 17, 15, 17,11
c. 119, 5, 5, 5, 4, 3, 3, 1
Solucin:
Los incisos a, b y c son listas de datos por lo que se aplica la frmula X x
n

x se refiere al dato y n a la cantidad de datos

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
X

x = (119+ 5+ 5+ 5+ 4+ 3+ 3+ 1) / 8 = 145 / 8 = 18.125

= (10+ 8+ 6+ 0+ 8+ 3+ 2+ 5+ 8+ 0)/10 = 50/10 = 5

= (15+ 19+ 13+ 15+ 13+ 17+ 15+ 17+11) / 9 = 135 / 9 = 15

La media de la muestra, o cualquier otra medida basada en los datos de la muestra se le


denomina: estadstico o estadgrafo.

La media de la muestra y la media de la poblacin se calculan de la misma manera pero


tienen diferente notacin:

Donde:

x
N

simboliza la media de la poblacin


N simboliza el tamao de la poblacin, es decir, el nmero total de observaciones en la
poblacin.
La media de la poblacin, o cualquier otra medida basada en los datos de la poblacin se le
denomina: parmetro.
Obtencin de la media para distribuciones de frecuencia
Frecuentemente los datos estn agrupados y presentados en forma de distribucin de
frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales.
Por consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en
base al punto medio de la distribucin de frecuencias.

La media aritmtica de una muestra de datos organizados en una distribucin de


frecuencias se calcula de la siguiente manera:

Dnde:

fx
n

Simboliza la media de la muestra

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
x

Es la marca de clase punto medio

Es la frecuencia de clase la frecuencia del intervalo de clase

fx

Es la suma de los productos de f por x

Es la suma de las frecuencias

Ejemplos:
Obtenga la media para cada una de las siguientes tablas de distribuciones de frecuencias
(d)

(e)

rea acadmica

Tcnicas de
seduccin
Embriagar a la
chica
Falsa promesa
de matrimonio
Amor fingido

f
Admn. de
empresas
Educacin

400
50

Humanidades

(f )

76

Frecuencia con que


eres impuntual
Frecuentemente

26

Ocasionalmente

87

76

Nunca

23

f
55

150
Ciencias Soc.

Amenaza de
terminar

250

17

Ciencias
200

Solucin:
En los incisos d y e se trata de valores NOMINALES y el inciso f maneja valores ORDINALES,
como puede observarse, ste tipo de valores no se pueden sumar por lo cual el promedio Media es
imposible de obtener.
Obtenga la media para cada una de las siguientes tablas de distribuciones de frecuencias
(g)

Cuntos
hermanos
tienes?
6
5
4
3
2
1
0

(h)

I. C.

5
9
12
15
12
9
4

95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64

5
9
12
15
12
9
4
3

Solucin: Los incisos g y h son distribuciones de frecuencias por lo que se aplica la frmula

fx

X
n

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Cuantos hnos.
tienes?
6
5
4
3
2
1
0
Totales

fx

5
30
9
45
12
48
15
45
12
24
9
9
4
0
N= 66 fx=201

= fx = 201/66 = 3.05
N

Basndonos en este resultado podemos concluir entonces que en promedio segn lo indica la
media, la poblacin entrevistada cuenta con 3 hermanos.
Calificaciones
I. C.
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Totales

f
5
9
12
15
12
9
4
3
N= 69

PM

x
97
92
87
82
77
72
67
62

fx
485
828
1044
1230
924
648
268
186
fx=5613

= fx = 5613 / 69 = 81.35
N

Basndonos en este resultado podemos concluir entonces que la poblacin entrevistada segn
lo indica la media obtuvo en promedio una calificacin de 81.35.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Tipo de curvas y Posicin de la Moda, Mediana y Media

Curva Normal
Leptocrtica

Mo
Mdn

Mesocrtica

Platicrtica

Mo
Mdn

Mo
Mdn

Curva Bimodal
Silla de montar

Curva U

Mo
Mo Mdn Mo

Mdn

Mo

Curva Sesgada
Sesgo Positivo

Mdn

Sesgo Negativo

Mdn

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Cuando seleccionar la Moda, la Mediana o la Media como el promedio ms adecuado

NIVEL DE
MEDICION
MEDIDA DE
TENDENCIA
CENTRAL

MODA
Mo
MEDIANA
Mdn
MEDIA

N OMINAL

Siempre

ORDINAL

CARDIN AL

Cuando la distribucin de Cuando la distribucin de frecuencias o


frecuencias o lista de datos sea lista de datos sea bimodal

bimodal
Debido a que los datos
nominales no se pueden
ordenar
el
promedio
Mediana no se
puede
obtener
Debido a que los datos
nominales no se pueden
sumar el promedio Media
no se puede obtener

Cuando la distribucin de frecuencias o


Cuando la distribucin de lista de datos sea unimodal y sesgada <
frecuencias o lista de datos sea

unimodal

Mdn >

Cuando la distribucin de frecuencias o


Debido a que los datos no se
lista de datos sea unimodal y normal <
pueden sumar el promedio
Mdn >
Media no se puede obtener

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Medidas de dispersin

Las medidas de dispersin en conjunto con las medidas de tendencia central son de
gran ayuda para entender mejor cmo se comporta una variable dentro de una poblacin, y
es de mayor envergadura cuando las utilizamos para comparar una variable en dos o ms
poblaciones distintas.
Cundo nos pueden ayudar estos estadgrafos, para qu sirven?

Pues bien, imagine que usted es un millonario y despilfarrador extranjero que visita
por primera vez nuestro pas, llega a la ciudad de Acapulco. Y aunque todo lo que
experimenta en este viaje le gusta, su clima es lo que ms le cautiv. Ahora imagine que
alguien le comenta que el desierto de Sonora tiene en promedio los mismos grados de
temperatura que la ciudad de Acapulco. Si usted no tuviera conocimientos de estadstica y
siendo extranjero, podra pensar que ambas regiones tienen el mismo clima y como tiene
mucho $$$, lo ms probable es que con el equipaje con que lleg a Acapulco, (que es el
adecuado para esa ciudad) se dirija al desierto de Sonora.
Si esto ocurriera, Qu pasara?, Lo ms seguro es que se afectara su salud al
experimentar tantos cambios tan bruscos de temperatura y sin la proteccin adecuada.
Como puede verse en las grficas de abajo, en Acapulco las temperaturas oscilan entre 28C
y 32C, mientras que en el desierto de Sonora la fluctuacin va de los 0C a los 60C

Acapulco

Desierto de Sonora

28C

32C

=30C

0C

60C

= 30C

Las medidas de dispersin indican precisamente, como su nombre lo dice, que tan
dispersos, valga la redundancia, o que tan compactos son los valores que se manejan. Esto
significa que entre mayor sea el resultado obtenido mayor es tambin la dispersin de los
datos

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Rango
El Rango es el estadgrafo ms sencillo de obtener y de entender, lo que hace es medir la distancia que
existe entre el valor ms alto y el ms bajo de un conjunto de datos

Clculo del Rango


R =Max-Min

Considerando las grficas de temperatura, podemos observar que para Acapulco el rango de
temperatura es:
R =Max-Min = 32-28 = 4C
Mientras que para el desierto de Sonora el rango es:
R =Max-Min = 60-0 = 60C
Como se puede observar, el rango es mayor cuando los datos estn ms dispersos. Esta es la
idea central en la interpretacin de cualquiera de las medidas de dispersin que se calcule.
Existen muchos diferentes estadgrafos utilizados para medir la dispersin de los datos, pero en
este curso solo vamos a manejar el clculo de Rango, Varianza y Desviacin estndar.

Varianza y Desviacin estndar para Distribuciones de Frecuencias de datos simples


La desviacin estndar es un ndice numrico de la dispersin de un conjunto de datos (o
poblacin). Mientras mayor es la desviacin estndar, mayor es la dispersin de la poblacin La
desviacin estndar nos dice cunto tienden a alejarse los puntajes del promedio. De hecho
especficamente la desviacin estndar es "el promedio de lejana de los puntajes respecto del
promedio".
Al igual que la desviacin estndar, la varianza es un ndice numrico de la dispersin de una
distribucin o poblacin. Mientras mayor es la varianza, mayor es la dispersin. La varianza es un
promedio elevado al cuadrado de las desviaciones individuales de cada observacin con respecto a
la media de una distribucin. Como promedio al cuadrado, la varianza en realidad slo es una
variacin de la desviacin estndar. Por lo tanto, se representa con el smbolo 2 , lo que
representa la desviacin estndar, pero elevada al cuadrado.
La desviacin estndar, y no la varianza, es la medida de dispersin de uso ms generalizado en
estadstica. No slo porque el valor de la desviacin estndar, para cualquier distribucin
determinada, siempre es mucho menor que para la varianza, sino por encima de todo porque es ms
conveniente para llevar a cabo operaciones matemticas.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
La desviacin estndar es entre las medidas de dispersin lo que la media es entre las medidas
de tendencia central: ambas tienden a reinar en sus dominios. En conjunto, ambos indicadores
suelen proporcionar una buena descripcin de distribuciones de datos cuando estas distribuciones
son simtricas, como por ejemplo, las distribuciones normales.
Clculo de Rango, Varianza y Desviacin estndar para Listas de datos
Varianza = s 2

x2
2

N
x 2
2

Desviacin estndar = s
Ejemplo:
x
20
20
18
18
15
15
15
15
13
x=149

En este ejemplo para obtener el Rango se resta


a 20 (Max) el nmero 13 (Min)
R = 20-13=7 R = 7
Clculo de la varianza y la desviacin estndar

x
400
400
324
324
225
225
225
225
169
2
x =2517
N=9

s2
2

s=

2517
16.562 279.67 274.23 5.44
9
2

s = 5.44

x 2
2
=
N

= x = 149 / 9 =

16.56

s = 2.33

x2
2

5.44 = 2.33

Clculo de Rango, Varianza y Desviacin estndar para Distribuciones de Frecuencias


Varianza = s 2

fx 2
2

N
fx 2
2

Desviacin estndar = s

Cuantos
hermanos
tienes ?

6
5
4
3
2
1
0
Totales

(fx)(x)
f

fx
fx

5
9
12
15
12
9
4

180
225
192
135
24
9
0

N=66 fx=201

fx =765

= fx = 201/66 = 3.05
N

30
45
48
45
24
9
0
2

Rango = R = 6-0 = 6

s2
s2 = 2.3

fx 2
2
= (765 / 66) 3.05 2 = 11.6 9.3 = 2.3
N
fx 2
2
=
N

2.3 = 1.51

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Varianza y Desviacin estndar para Distribuciones de Frecuencias de datos agrupados


Clculo de Rango, Varianza y Desviacin estndar para Distribuciones de Frecuencias de datos
agrupados
Calificaciones
I. C.

95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Totales

5
9
12
15
12
9
4
3
N= 69

PM

x
97
92
87
82
77
72
67
62

= fx = 5613 / 69 = 81.35
N

(fx)(x)

fx
485
828
1044
1230
924
648
268
186
fx=5613

fx
47045
76176
90828
100860
71148
46656
17956
11532
2
fx = 462201

Rango = R = LRSmax- LRImin=99.5 59.5 = 40


Tambin puede obtenerse as :
Rango = R = LSmax- LImin=99 60+1 = 40

s2

fx 2
2
= (462201 / 69) 81.35
N

6698.6 6617.8= 80.7


s2 = 80.7

fx 2
2
= 80.7 = 8.99
N

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
Curva Normal y Desviacin estndar
Como dijimos anteriormente, una calificacin carece de significado por s misma. A fin de que lo
adquieran, es necesario compararlas con la distribucin de calificaciones de algn grupo de
referencia. Ciertamente, las calificaciones obtenidas a partir de cualquier escala, llegan a tener
mayor significado cuando se las compara con un grupo de referencia de personas u objetos.
As, si nos dijeran que un escalador poblano a la edad de 8 aos escal sin ayuda de un adulto el
volcn Cuexcomate, quedaramos sorprendidos o no, segn sean nuestros conocimientos acerca del
volcn Cuexcomate. Todos tenemos la idea de cmo es un volcn, tal vez ya hayan visitado alguno y
a sabiendas de que la mayora de los volcanes tienen alturas superiores a 1000 metros, que tan
extraordinario puede considerarse el logro de nuestro annimo escalador poblano, cuando nos
enteremos que el volcn Cuexcomate ubicado en la ciudad de Puebla es considerado el ms
pequeo del mundo ya que su altura es de13 m
En esta unidad veremos que la transformacin a valores z proporciona un medio preciso para
interpretar cualquier valor de una variable cuando se trata de valores normalmente distribuidos.
La desviacin estndar es un indicador en extremo valioso con muchas aplicaciones. Por
ejemplo, los estadsticos saben que cuando un conjunto de datos se distribuye de manera normal,
el 68% de las observaciones de la distribucin tiene un valor que se encuentra a menos de una
desviacin estndar de la media. Tambin saben que el 96% de todas las observaciones tiene un
valor no es mayor a la media ms o menos dos desviaciones estndar (la Figura siguiente ilustra esta
informacin).

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2

Entre las distribuciones continuas la ms importante es la llamada distribucin normal.


Fue introducida por Carl Friedrich Gauss a principios del siglo XIX en su estudio de los errores de
medida. Desde entonces se ha utilizado como modelo en multitud de variables (peso, altura,
calificaciones...), en cuya distribucin los valores ms usuales se agrupan en torno a uno central y los
valores extremos son escasos.
Interpretacin de la calificacin obtenida en un examen de estadstica
Imagine que en el examen de estadstica usted obtuvo una calificacin de 97. Tal vez quiera
presumir a alguien lo brillante que usted es. Pero resulta
que se alguien dice:, Seguramente tu profesor es barco y
cualquiera saca buen promedio.
Para mostrar su superioridad con respecto al grupo,
pudiera desear hacerle saber a esa amiga el porcentaje de compaeros
con calificaciones inferiores.
A continuacin se indica, paso a paso, el procedimiento requerido para eliminar toda dificultad
acerca de la interpretacin de las calificaciones de estadstica.

Aplicando la estadstica en las ciencias sociales


Competencia 1
Unidad2
1. Determnese la media y la desviacin estndar correspondiente a la prueba.

PM

Calificaciones
I. C.

95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Totales

5
9
12
15
12
9
4
3
N= 69

x
97
92
87
82
77
72
67
62

Rango = R = 99 - 60 = 39

(fx)(x)

fx
485
828
1044
1230
924
648
268
186
fx=5613

fx
47045
76176
90828
100860
71148
46656
17956
11532
2
fx = 462201

s2

fx 2
2
= (462201 / 69) 81.35
N

6698.6 6617.8= 80.7


s2 = 80.7

fx 2
2
= 80.7 = 8.99
N

= fx = 5613 / 69 = 81.35
N

2. Transfrmese la calificacin que se desea interpretar en un dato z, usando la siguiente


frmula:

MUESTRA

POBLACIN

calificaci n media
desviacin _ std

xx
s

Si interesa interpretar una calificacin de 97, y se sabe que la media y la desviacin estndar
son 81 y 9, respectivamente, se obtendr que

97 81
1.78
9

3. Bsquese en la columna C de la tabla de la calificacin z, el valor correspondiente a 1.78 y se


encontrar el nmero .0375. Esto significa que solamente el 3.75 % de las personas en el grupo de
comparacin tendrn calificaciones superiores que 97. La columna B indica la probabilidad de
encontrarnos calificaciones entre la media (81) y 97 o sea 42.25%.

El mtodo resulta fcil.


3.75%

1.78 SD

63

72

81

90

99

Aplicando la estadstica en las ciencias sociales


Competencia 2
Competencia No 2
Al finalizar esta unidad de aprendizaje el estudiante debe ser capaz de Estimar
parmetros poblacionales de las variables analizadas en el reporte de Anlisis Descriptivo
del caso prctico (real o hipottico) presentado en el aula, para que las conclusiones
emanadas o acciones a seguir sean el producto de procesos de induccin vlidos, basados
en adecuadas interpretaciones de los resultados
Contenidos
2.1 Introduccin a la estadstica inferencial
2.1.1

Por qu usar muestras

2.1.2

Mtodos de muestreo

2.1.2.1

Muestreo aleatorio

2.1.2.2

Muestreo no aleatorio

2.1.3

Error de muestreo

2.2 Estimacin de parmetros poblacionales


2.2.1

Concepto de Distribucin muestral de Medias

2.2.2

Error estndar de la media

2.2.3

Intervalos de confianza

2.2.4

Estimacin de proporciones

Las Actividades de aprendizaje que deben ser cubiertas por el alumno son:
Presentaciones por parte del profesor en el aula
Resolucin de problemas de forma individual y por equipo
Realizar bsquedas en Internet para localizar algunos reportes en lnea de
investigaciones sociales que utilizaron Muestreo aleatorio y no aleatorio
Consulta y anlisis de libros y publicaciones
Uso del paquete SPSS como apoyo tecnolgico

45

Aplicando la estadstica en las ciencias sociales


Competencia 2
Por qu se toman las muestras?

Hasta ahora, todos los procedimientos y tcnicas que hemos


estudiado se refieren a la rama de la estadstica descriptiva, la cual nos ha
permitido tener un conocimiento claro de las caractersticas bsicas de una
poblacin y as estar en capacidad de presentar un informe cmodo, til y
comprensible.
Debido a que generalmente no es posible estudiar las poblaciones
completamente, ya sea porque sta es muy grande, por causas econmicas, falta de
personal, o para una mayor rapidez en el acopio y presentacin de los datos, lo que se
suele hacer es obtener los datos, de tan slo una muestra de la poblacin.
No podemos estudiar todos los coches que salen de una cadena de produccin para
determinar su calidad, ni es posible probar un medicamento en todas las personas, ni
podemos costearnos preguntar a todos los mexicanos sobre una cuestin cualquiera (salvo
en votaciones, o en el censo, siendo estos los pocos casos en que un estudio comprende a
toda la poblacin).
Como repercusin, deberemos resignarnos a utilizar muestras, que sean capaces de
revelarnos algo acerca de la poblacin de las que han sido extradas. En esta unidad
hablaremos de la forma de elegirlas, y las condiciones que han de verificar.
Idea bsica (descripcin cualitativa)
Si conocemos una fraccin de algo podremos conocer con determinada
exactitud ese algo?
La respuesta es: No.
o

Una parte de algo es una fraccin que ha sido tomada de acuerdo con una cierta
regla o criterio, que no siendo un criterio cientfico no necesariamente representa la
totalidad de ese algo.

La nica forma de evitar que al seleccionar una parte de algo se caiga en una
eleccin no representativa, es hacindolo de forma cientfica. Siendo el algo
desconocido, esta eleccin debe hacerse de manera aleatoria. Una muestra es
una parte de algo, tomada aleatoriamente, con lo que se garantiza que es
representativa de ese algo. Esto no slo se acepta en la ciencia, sino que provee
de una teora que permite cuantificar la representatividad.

Tomemos como ejemplo una imagen, la cual slo se deja ver a travs un rea
pequea (la cantidad de rea descubierta es la misma en las dos primeras imgenes)

46

Aplicando la estadstica en las ciencias sociales


Competencia 2

Si la lgica que utilizaras para descubrir el tema de la


imagen es la de observar el centro de la misma, podras
observar que parece ser un ave, pero igual puede ser un gallo,
un guila o un pajarito de los que vemos todos los das en las
calles por donde pasamos. Esta es una seleccin no aleatoria
(una parte) de la poblacin a observar.

En esta segunda imagen


el rea descubierta es al azar (a
la suerte) y podrs notar que la seleccin nos brinda una
idea bastante ms clara de la imagen a observar
En ambos casos conforme crece el rea visible la
informacin nos va dando una mejor idea de la imagen
completa, pero slo en el segundo caso la imagen es
representativa al haberse elegido reas en forma aleatoria.

Este ejemplo es en extremo simple y enfatiza la


diferencia entre una parte y una muestra, con la intencin
deliberada de dar una mejor idea de lo que tratamos de explicar.
Afirmacin
De las observaciones anteriores podemos afirmar lo
siguiente: "Una parte de algo no significa que sea una
muestra que represente vlidamente a ese algo"

La Estadstica inferencial se ocupa de de hacer


deducciones acerca de la poblacin de estudio basndose en la informacin obtenida de la
(o las) muestra(s) tomada(s) de ella, as como de la toma de decisiones.
Por ejemplo, cuando se pretende conocer de antemano los resultados de unas
elecciones, se suelen hacer encuestas sobre intencin de voto, a una muestra de
ciudadanos. Se trata en este caso, de extrapolar para toda la poblacin, los resultados
derivados de la encuesta. La Estadstica Inferencial nos ayuda en este caso, aunque
siempre existir una probabilidad de equivocarse, y un margen de error en los resultados
obtenidos.

En otras ocasiones, lo que se pretende es tomar decisiones, ya sea a partir de la


estimacin o de la contrastacin de un test, y aqu tambin la estadstica inferencial nos lo
47

Aplicando la estadstica en las ciencias sociales


Competencia 2
permite, siempre con un margen controlado de error. En los prximos argumentos iremos
aclarando todos estos aspectos.
Mtodos de muestreo
Existen bsicamente dos tipos de muestreo, los aleatorios y los no aleatorios.
El primer mtodo se caracteriza principalmente porque todos los miembros de la
muestra han sido elegidos al azar, esto significa que cada miembro de la poblacin tuvo
igual oportunidad de formar parte de la muestra. Este tipo de muestreo, que es el ms
consistente, es al mismo tiempo el que resulta ms costoso, y el que utilizaremos siempre
en el desarrollo de los prximos temas.
El segundo mtodo carece del grado de representatividad del primero, pero permite
un gran ahorro en los costos. Se eligen los elementos, en funcin de que sean
representativos, segn la experta opinin del investigador. Es el mtodo que generalmente
utilizan las empresas privadas aun y cuando presenta el inconveniente de que la precisin
de los resultados no es muy grande y es difcil medir el error de muestreo.
Mtodos de muestreo no aleatorios

Muestreo por accidente


Es el ms usual y el que menos difiere con nuestros diarios procedimientos de

muestreo, ya que el investigador incluye solo aquellos casos que le convienen y excluye los
inconvenientes. Por ejemplo, se seleccionan para la muestra nicamente los estudiantes del
maestro investigador.

Muestreo por cuota


En este procedimiento de muestreo, las diversas caractersticas de una poblacin

que interesen en la investigacin, tales como edad, sexo, clase social o escolaridad,... son
muestreadas de acuerdo al porcentaje que ocupan en la poblacin. Por ejemplo,
supongamos que se nos pidiera obtener una muestra de estudiantes de la U.A.N.L. donde
se sabe que la poblacin de universitarios esta compuesta en un 42% de hombres y un 58%
de mujeres. Utilizando este mtodo de muestreo, se da a los entrevistadores una cuota de
estudiantes para localizar, de manera tal que en la muestra un 42% sean hombres y un 58%
se componga de mujeres.

Muestreo intencional o de juicio


Este tipo de muestreo involucra el sentido comn o sano juicio del investigador para

seleccionar la muestra que represente a la poblacin de estudio. Por ejemplo, para obtener
una muestra de juicio que refleje los motivos por los cuales los automovilistas se vuelven
agresivos al conducir, podemos, a nivel intuitivo escoger la muestra seleccionando a un
grupo de ecotaxistas debido a que este grupo de automovilistas parecen reflejar la mayora
de los sntomas de agresividad.
48

Aplicando la estadstica en las ciencias sociales


Competencia 2
Tipos de muestreo aleatorios
Su utilizacin es muy sencilla, una vez que todos los elementos de la poblacin han
Nota:
sido identificados y numerados ( y ste es seguramente su mayor
inconveniente). A partir de aqu, decidido el tamao n de la muestra, los
elementos que la compongan se han de elegir aleatoriamente entre los
N de la poblacin.

Muestreo Simple
Si queremos elegir una muestra formada por 40 elementos de una poblacin de 600

y contamos con urnas o algo que se le asemeje, iremos tomando


dgitos aleatorios de tres en tres. Si la cifra considerada es menor
de 600, ya tendremos elegido un elemento de la muestra. Siguiendo
este proceso e ignorando las cifras superiores a 600, podemos

elegir los 40 elementos que compondrn la muestra.


El mtodo ms adecuado para la eleccin en nuestro caso, es la utilizacin de tablas
de nmeros aleatorios.
Para elegir una muestra formada por 40 elementos de una poblacin de 600 y
contamos con tablas de nmeros aleatorios (las cuales se encuentran en los libros de
estadstica), elegimos una columna de nmeros de la tabla y consideramos slo los tres
ltimos dgitos del nmero impreso (esto porque el nmero 600 esta compuesto por tres
dgitos), si la cifra es menor o igual de 600, ya tendremos elegido un elemento de la
muestra. Este proceso es repite hasta que se elijan los n elementos que compondrn la
muestra.

Muestreo Sistemtico
Es anlogo al anterior, aunque resulta ms cmoda la eleccin de los elementos. Si

hemos de elegir 40 elementos de un grupo de 600, se comienza por calcular el cociente

600
40 , este resultado nos indica que se pueden formar con los 600 elementos de la
poblacin 40 grupos de 15 elementos cada uno. Se elige un elemento de salida entre los 15
primeros, y suponiendo que sea el k-simo, el resto de los elementos sern los k-simos de
cada grupo. En concreto, si el elemento de partida es el nmero 6, los

restantes sern los

que tengan los nmeros:


15+6, (2)15+6, (3)15+6, (4)15+6, (5)15+6, ,(39)15+6

Este procedimiento simplifica enormemente la eleccin de elementos, pero puede


dar al traste con la representatividad de la muestra cuando los elementos se hayan
numerados por algn criterio concreto, y los k-simos tienen todos una determinada
caracterstica, que haga conformarse una muestra no representativa.
49

Aplicando la estadstica en las ciencias sociales


Competencia 2

Muestreo Estratificado
A veces nos interesa, cuando las poblaciones son muy grandes, dividir stas en

subpoblaciones o estratos, sin elementos comunes, y que cubran toda la poblacin.


Una vez hecho esto, se pueden elegir de cada estrato los elementos de la muestra
utilizando el mtodo de muestreo aleatorio simple. Segn la intencin de la investigacin, la
cantidad de elementos seleccionados debe ser igual un todos los estratos proporcional al
tamao del estrato.
Este procedimiento tiene la gran ventaja de que se puede obtener una mayor
precisin en poblaciones no homogneas (aunque en este curso no estudiaremos los
mtodos necesarios)
Si decidiramos hacer una encuesta sobre la incidencia del tabaco en el colegio
Juventud Latina, podramos razonar de la siguiente forma:
Suponiendo que el colegio tiene 2000 alumnos distribuidos de la siguiente manera:

G
rado

Secundaria

Secundaria

Secundaria

545

450

460

330

215

27%

22%

23%

17%

11%

Prepa

2
Prepa

antidad
%

Y deseamos tomar una muestra de 100 alumnos para analizar la incidencia del
tabaco en la adolescencia, bastara tomar un nmero igual de alumnos de cada estrato, es
decir 25.
Si embargo, si lo que se quiere es hacer una encuesta para conocer la opinin que
tiene el alumnado sobre una medida que ha tomado el Consejo Escolar, es ms
representativo elegir de cada estrato, y en nmero proporcional a su tamao, los elementos
que compondrn la muestra. Si 1 de secundaria representa al 27% del alumnado, entonces
el 27% de la muestra (es decir 27 alumnos) se elegirn de este estrato usando muestreo
aleatorio simple, 22 para 2 de secundaria, y as hasta completar los 100 elementos de la
muestra.

Muestreo por Conglomerados


A veces, para simplificar los procesos de toma de datos, se empieza por elegir

ciertos conglomerados (que pueden ser bloques de viviendas, municipios, urnas electorales,
... ) y dentro de ellos se realiza el muestreo aleatorio.

50

Aplicando la estadstica en las ciencias sociales


Competencia 2
Concepto de distribucin muestral de medias
Hemos dicho ya, que el objetivo de nuestro estudio es poder prolongar a la
poblacin lo que descubrimos en una muestra.
Imagina que de la poblacin formada por todos los alumnos de la facultad, extraes
aleatoriamente una muestra de 40 alumnos, y les preguntas por su edad, encontrando que
la edad media obtenida es de 18.5 aos.
Pero, qu ocurrira, si extrajramos otra muestra?. Coincidiran las medias?. Y
coincidiran con la media de la poblacin?. Lo cierto es que parece lgico pensar que
aunque no tengan porqu coincidir, si debiesen estar bastante prximas. Pero, cunto de
prximas?, dependera esta proximidad del tamao de las muestras que elegimos?.
Parece necesario, que estudiemos la variabilidad de las medias obtenidas de las
muestras que repetidamente se extraigan. A continuacin se responde claramente a las
preguntas planteadas.
Error de muestreo
Siempre podemos esperar por mera casualidad, que existan diferencias entre la
muestra y la poblacin de la que fue extrada. casi nunca ser exactamente igual a

ys

rara vez ser exactamente igual a . Esta diferencia, conocida como error de muestreo
resulta sin importar que tan bien se haya diseado y realizado el plan de muestreo.
Dada la presencia del error de muestreo, el estudiante se ha de preguntar cmo es
posible generalizar siempre a partir de una muestra sobre una poblacin.
El teorema central del lmite (TCL)
Imagina que tienes una poblacin con media

y desviacin tpica y que extraes

aleatoriamente todas las posibles muestras, todas ellas de tamao n. Si obtuvieras las
medias de todas estas muestras, y las consideras una distribucin de datos (la distribucin
muestral de medias), comprobaras que:

a)

La media de los datos, es la media

de la poblacin, es decir la media de

las medas de las muestras, es igual que la media de la poblacin.

b)

Estas medias se distribuyen alrededor de la media de la poblacin, con una


desviacin tpica (llamada desviacin tpica de la media) igual a la de la
poblacin dividida por la raz de n-1, es decir, la desviacin tpica (d.t.) de
la media es:


51

s
n 1

Aplicando la estadstica en las ciencias sociales


Competencia 2

c)

La distribucin de las medias muestrales, es una distribucin de tipo "normal",


siempre que la poblacin de procedencia lo sea, o incluso si no lo es,
siempre que el tamao de las muestras contenga por lo menos 30 casos.

En consecuencia, "si una poblacin tiene media

y d.t. , y tomamos muestras de

tamao n ( de tamao al menos 30, o cualquier tamao, si la poblacin es normal"), las


medias de estas muestras siguen aproximadamente la curva de la distribucin "normal".
Adems, cuanto mayor es el valor de n, mejor es la aproximacin "normal".

Hemos nombrado un concepto importante:


La desviacin tpica (d.t.) de la media

s
n 1 , es el grado de variabilidad

de las medias muestrales.

Cuanto menor sea, ms ajustadas a la media de la poblacin sern las medias que
obtengamos de una muestra. De su propia definicin, es fcil darse cuenta de que cuanto
mayor es el tamao de la muestra, menor es este grado de variabilidad, y por tanto ms
similar a la media de la poblacin ser la media obtenida de la muestra.

La distribucin muestral de medias como una curva normal


Como se defini anteriormente, la curva normal se puede considerar como una
curva de probabilidad. Ahora que nos encontramos trabajando con una distribucin de
medias muestrales, ya no nos interesa obtener probabilidades asociadas con la distribucin
de puntajes crudos, a estas alturas lo que se pretende es hacer afirmaciones de
probabilidad acerca de las medias muestrales.

Estimacin
Llamaremos as al procedimiento utilizado cuando se quiere conocer las
caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra.
Durante esta unidad aprenderemos a realizar estimaciones sobre la media y la
proporcin de una caracterstica en una poblacin. La estimacin de otros parmetros
poblacionales, tales como la desviacin tpica, quedar fuera de nuestro estudio.

52

Aplicando la estadstica en las ciencias sociales


Competencia 2
En la figura de la izquierda se
puede observar que la probabilidad de
obtener un valor muestral muy diferente al
valor de la poblacin, disminuye a medida
que nos alejamos de la media de medias
(la verdadera media poblacional). Por
ende, esperamos que sea por mera
casualidad el que la mayora de las
medias muestrales caigan cerca del valor
de la media poblacional, mientras que
relativamente pocas medias muestrales caigan lejos de ella.
Ya que la distribucin muestral (toma la forma de una curva normal, podemos utilizar
los puntajes z para obtener la probabilidad de cualquier media muestraL El procedimiento
es el mismo que ya utilizaste. Por ejemplo:
Imagina que una universidad sostiene que sus ms recientes egresados tienen un
salario mensual medio de $20,000. Viendo como nos pintan las actuales polticas
econmicas del PAN, tenemos motivos para dudar de tal pretensin y decidimos ensayarla
en una muestra aleatoria de 100 exalumnos. En el proceso obtenemos una media muestral
( ) de solo $14,000. Ahora te preguntaras qu tan probable sera obtener una de
$14,000 o menor si la verdadera media poblacional ( ) fuera de $20,000 ?.
Supongamos que sabemos que la desviacin estndar de la distribucin muestral es
de $2,600 . Siguiendo el procedimiento estndar, convertimos la en un puntaje z.

14,000 20,000

2.31

2,600

dnde: = media muestral

=media de la poblacin (media de medias)

=desviacin estndar de la distribucin muestral de medias

Recurriendo a la tabla de distribucin z, vemos que la posibilidad de obtener una


de $14,000 cuando la media poblacional = $20,000, es del 1.04% con una
probabilidad tan pequea de equivocamos, podemos decir con cierta confianza que la

53

Aplicando la estadstica en las ciencias sociales


Competencia 2
verdadera es diferente a la que ostenta la universidad, tal vez solo sea un truco
publicitario.
Estimacin del Error estndar de la media
En el ejemplo anterior hicimos de cuenta que tenamos informacin de primera mano
acerca de la distribucin muestral de medias, sin embargo en la prctica real el investigador
social no tiene conocimiento real sobre la media de medias o la desviacin estndar de la
distribucin muestral ya que ello implicara trabajar con la poblacin completa. Sin embargo
se tiene un buen mtodo para estimar la desviacin estndar de la distribucin muestral de
medias basndose en los datos de la muestra. Esta estimacin se conoce con el nombre de
error estndar de la media y se simboliza

dnde:

.Por frmula:

s
n 1

representa el error estndar de la media. Este es una estimacin de la

de la distribucin muestral de medias.


s

es la desviacin estndar de la muestra

es el nmero total de puntajes de la muestra

A manera de ilustracin: Calculemos el error estndar de la media si de una muestra


de 10 entrevistados encontramos una la desviacin estndar con valor de 2.5

s
2.5
2.5

0.83
3
n 1
10 1

Con la ayuda del error estndar de la media, podemos encontrar el rango de valores
de la media dentro del cual es probable que flucte la verdadera media poblacional y
podemos tambin estimar la probabilidad de que nuestra media poblacional caiga realmente
dentro de este rango de valores medios. Este es el concepto de Intervalo de confianza.
INTERVALO DE CONFIANZA
Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel
de confianza especfico, por frmula se denota:
intervalo de confianza del m% =

z m%

NIVEL DE CONFIANZA
Probabilidad de que el parmetro a estimar se encuentre en el intervalo de

confianza. Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y
99.9%
54

Aplicando la estadstica en las ciencias sociales


Competencia 2

ERROR DE ESTIMACIN MXIMO


Es el radio de anchura del intervalo de confianza. Este valor nos dice en qu margen

de la media muestral se encuentra la media poblacional al nivel de confianza asignado.


Usando el ejemplo anterior en el que una universidad sostiene que sus ms
recientes egresados tienen un salario mensual medio de $20,000 . Recordemos que en
nuestra muestra encontramos que el salario mensual medio era de $14,000, entonces
basados en nuestros datos podemos encontrar el rango de valores en el que sabemos que
est la verdadera media poblacional con una confianza especfica, como ejemplo:
Intervalo de confianza del 95% =

z 95%
= 14000 (1.96)(2,000)
= 14000 (1.96)(2,000)
= 14000 3920 14000 3920

intervalo de confianza

= (10080;17920)

del 95%
El error de estimacin mximo es (1.96)

, donde 1.96 corresponde a una

z m% =

95%
Conclusin: Tenemos una confianza de 95% al suponer que la verdadera media
poblacional oscila entre los $10,0801 y los $17,920
Basados en este resultado, en el reporte de investigacin puedes redactar algo
parecido a estos ejemplos:

Estimamos con una confianza del 95% que el salario mensual medio de los
egresados universitarios es de $14,000 con un error mximo de estimacin de
$3,920

Podemos afirmar con una certeza de 95%, que el salario mensual medio de los
egresados universitarios es de $14,000 con una fluctuacin mxima de $3,920.

A continuacin se resume el procedimiento a efectuar para obtener el intervalo de


confianza del 95% de la siguiente muestra aleatoria de puntajes crudos.(datos o
calificaciones)

(x)

55

Aplicando la estadstica en las ciencias sociales


Competencia 2

X2
25
16
16
9
9
4
4
4
1
1

x
5
4
4
3
3
2
2
2
1
1
27

Pasos a seguir:
1. Encontrar la media de la muestra x

2. Obtener la desviacin estndar de la muestra s

89

3. Encontrar el error estndar de la media (estimacin de la desviacin estndar de la


distribucin muestral de medias)

4. Buscar en la tabla de la distribucin z en la columna B (rea entre la media y la z)


Como el intervalo de confianza es de 95%, en trminos de probabilidad se
representa:

pbilateral =0.95

punilateral =

= 0.475

5. Obtener el intervalo de confianza del 95%

z 95% 2.7 (1.96)(.42) 2.7 .82 2.7 .82 2.7 .82 1.88 3.52
=
=
=
=
intervalo de confianza del 95%= 1.88 3.52

6. Conclusin: podemos tener un 95% de confianza de que la verdadera media


poblacional sea un valor que flucta entre 1.88 y 3.53
Nota: solo con propsitos ilustrativos se emple una muestra pequea, en la
prctica n debe ser de por lo menos 30 casos.
Estimacin de Proporciones
Este mtodo se utiliza primordialmente cuando la variable de estudio se mide
cualitativamente.

56

Aplicando la estadstica en las ciencias sociales


Competencia 2
El investigador social a menudo necesita presentar una estimacin de una
proporcin poblacional basndose en la proporcin obtenida de una muestra aleatoria. Las
proporciones poblacionales se estiman con un procedimiento semejante al utilizado para
estimar las medias poblacionales. As como encontramos el error estndar de la media,
podemos ahora buscar el error estndar de la proporcin. Por frmula:

p(1 p)
N

p
Dnde:

representa el error estndar de la proporcin.


p

es una proporcin muestral

es el nmero de casos que conforman la muestra

Ejemplo ilustrativo:

Un encuestador informa que en una muestra de 100 estudiantes universitarios se


encontr que el 45% de ellos estan a favor de que se exija un segundo idioma para
obtener su ttulo universitario. El error estndar de la proporcin sera:

p(1 p)
(.45)(.55)
.2475

.002475 0.05
N
100
100

para encontrar el intervalo de confianzadel95%, multiplicamos el error estndar de la


proporcin por 1.96 y sumamos y restamos este producto por la proporcin obtenida en la
muestra (proporcin muestral)
Intervalo de confianza del 95% =

p z 95% p
= .45 (1.96)(.05)
= .45 0.98
= .45 0.98 .45 0.98

intervalo de confianza

= .35 .55

del 95%

Conclusin: Tenemos una confianza del 95% al afirmar que la proporcin


poblacional de estudiantes universitarios a favor de que se exija un segundo idioma para
obtener su ttulo universitario oscila entre el 35% y 55%.
Basados en este resultado, en el reporte de investigacin puedes redactar algo
parecido a estos ejemplos:
57

Aplicando la estadstica en las ciencias sociales


Competencia 2

Estimamos con una confianza del 95% que, de la poblacin de estudiantes


universitarios el 45 % est a favor de que se exija un segundo idioma para obtener
su ttulo universitario y aseguramos que de haber algn error de estimacin ste es
inferior al 10%

Podemos afirmar con una certeza de 95%, que el 45% ( 9.8%) de la poblacin de
estudiantes universitarios est a favor de que se exija un segundo idioma para
obtener su ttulo universitario

58

Aplicando la estadstica en las ciencias sociales


Competencia 3
Mtodo para determinar tamaos de muestra

1. Marco de muestreo

Una vez identificada la poblacin que conforma el estudio, es importante determinar de


dnde se van a elegir los elementos de la muestra, esto se conoce como marco muestral.

Por ejemplo: Si el estudio trata acerca de la calidad de vida determinadas comunidades y se


tienen identificadas todas las direcciones de todas las familias, entonces coinciden el marco
y la poblacin.

En este caso la seleccin de la muestra se hace sobre el marco o lista de direcciones de la


poblacin.

2. Tipos de variables

El tipo de variable condiciona la forma de llevar a cabo el anlisis e inter-pretacin de


resultados. De las variables cualitativas nos interesan las proporciones y de las variables
cuantitativas nos interesan las medias.
3. Preprueba y encuesta piloto

El instrumento a utilizarse para obtener informacin debe probarse en una encuesta piloto
siguiendo las reglas adecuadas de seleccin al azar.
4. Precisin y confianza para determinar tamaos de muestra

Para decidir el tamao de la muestra de una poblacin, se deben llevar a cabo las
siguientes consideraciones:
El tamao de la muestra se determina de tal manera que se garantice con
una probabilidad alta que el estimador (resultado de la muestra) no difiera del
parmetro (resultado que se obtendra de trabajar con la poblacin)

por

ms de una cantidad pequea y establecida de antemano, llamada


preescisin. Una vez obtenida la muestra, dicha probabilidad se conoce
como confianza de la muestra.

59

Aplicando la estadstica en las ciencias sociales


Competencia 3
Para un tamao de muestra determinado, los elementos que la conforman se
obtienen mediante seleccin aleatoria.

De lo anterior concluimos que si en el estudio se tiene inters por estimar varios parmetros
se calcula un tamao de muestra para cada uno de ellos, eligiendo el ms grande de los
tamaos de muestra obtenidos.
5. Significancia estadstica comparada con significancia prctica
Es importante reconocer que la significancia estadstica" de un efecto no tiene nada que
ver con su significancia prctica" o importancia". La significancia estadstica se basa
nicamente en las leyes de la probabilidad; un efecto estadsticamente importante es
simplemente aquel que es "raro" si la hiptesis nula es verdadera. Como lo indican los
comentarios de las unidades anteriores, la significancia estadstica de un efecto es en gran
medida una funcin de tamao de la muestra; dada una muestra suficientemente grande,
cualquier diferencia sin importar el tamao , puede declararse "estadsticamente
significante". El tamao de una diferencia "significante en el aspecto prctico" debe
determinarse sin recurrir a consideraciones estrictamente estadsticas, y la respuesta puede
variar con cada investigador. Sin embargo, una vez que se define el tamao de una
diferencia "significante en el aspecto prctico podemos utilizar esta definicin para
determinar el tamao de la muestra que asegure un poder adecuado al detectar las
diferencias reales de ese tamao o mayores.

Este material es una reproduccin tomada del libro de Investigacin de mercados un


enfoque prctico mencionado en la bibliografa (pginas 734-735)

6. Tamao de muestra para variables cualitativas


Si se desea que la proporcin p de una determinada variable cualitativa de la poblacin y
la proporcin de la misma variable en la muestra, no difieran por ms de una pequea
cantidad determinada por el investigador y denotada con la letra B, se dice que se desea
hacer una estimacin con una precisin de B o menor.

Por ejemplo: Si se desea que las diferencias de las proporciones de todos los egresados de
la Fac. de Trabajo Social que opinan que si volveran a estudiar en la misma institucin y
la muestra de egresados de sta, no difieran por ms de 0.05, se dice que se desea hacer
una estimacin con una precisin de 0.05 o menor.
60

Aplicando la estadstica en las ciencias sociales


Competencia 3

El siguiente paso es especificar el nivel de confianza para dicha precisin, esto es, la
probabilidad con que se espera que se cumpla que el parmetro y el estimador difieran por
menos de la precisin deseada. Con el fin de que no crezca mucho el tamao de la muestra
se sugiere usar una confianza del 90%.

Por formula:

donde:
n tamao de muestra
N tamao de la poblacin

Np (1 p)
( N 1) B 2
p(1 p)
2
z conf

B precisin
2
z conf

valor de z de la distribucin

normal
p proporcin de la informacin que de
la variable nos interesa

El valor de p se obtiene de la prueba piloto, si no existiera esta informacin debe


considerarse p=0.5 que da el mayor tamao de muestra posible.

Problemas ilustrativos

De la prueba piloto el investigador encontr que la proporcin de


profesionistas egresados de la Fac. de Trabajo Social que si volveran a
estudiar en la misma institucin es de 0.22. si la poblacin es de 257
egresados y se desea que la inferencia sobre la poblacin se haga con una
precisin de 0.07 con una confianza del 90%, cul debe ser el tamao de la
muestra?

Solucin:
Se busca en la tabla 1 con los valores ms prximos hacia arriba de N y p ya que los
valores exactos no aparecen en la tabla. Los ms cercanos son N=300 y p = 0.25, esto
produce un tamao de muestra n=78

Para un valor de precisin B=.05, 90% de confianza y p=0.75 (en la


tabla se busca p=(1 - 0.75 = 0.25)), cuando N=500 se obtiene un
tamao de muestra n=145

7. Tamao de muestra para variables cuantitativas

61

Aplicando la estadstica en las ciencias sociales


Competencia 3
Para obtener el tamao de muestra para el intervalo de confianza de una variable cardinal,
tambin se debe proponer un valor para la precisin B, pero en este caso, debido a que la
variable puede tomar cualquier valor numrico en ocasiones conviene dar la precisin en
trminos de desviacin estndar D B s . Por ejemplo, si se establece una precisin de 0.5
de desviacin estndar quiere decir que el estimador de la media y el parmetro de la media
difieren cuando mucho en la mitad del valor de la desviacin estndar.

La ecuacin para calcular el tamao de muestra cuando se propone un valor


de precisin B en trminos de la escala original de la variable es la siguiente:

Ns 2
NB 2
s2
2
z conf

Aclarando que, para utilizar esta ecuacin debe ser conocido el valor de desviacin
estndar (de la prueba piloto).

N
2

ND
1
2
z conf

Si se substituye el valor de B por su equivalente en desviaciones estndar, se


obtiene la ecuacin:

En la tabla 2 se presentan los tamaos de muestra adecuados para establecer intervalos


de confianza de variables cardinales. Para utilizar esta tabla debe tenerse en cuenta que el
valor de D est en trminos de desviacin estndar y su eleccin requiere prctica. Sin
embargo, recordando que el 68% de toda la poblacin en una distribucin normal se
encuentra a una desviacin estndar de la media ( D = 1 ), es claro que la precisin debe
ser una pequea fraccin de desviacin estndar, por ejemplo 0.05 o 0.1; normalmente D
0.2
Problema ilustrativo

Imaginemos que al investigador le interesa estimar de la poblacin el ingreso


promedio de los 420 exalumnos de la generacin de 1998 de la FAC de
Trabajo Social, con una confianza del 95% y precision de $300.00. De los
resultados de la prueba piloto se encontr que la desviacin estndar es de
$2,000.00. Con esta informacin se calcula el valor de D

D 300
62

2000

0.15

), cul debe ser el tamao de la muestra?

Aplicando la estadstica en las ciencias sociales


Competencia 3
Solucin:
En la tabla 2 buscamos para N=500 (se busca la N ms prxima hacia arriba cuando no es
exacto) y D=0.15, obtenindose n=128 tamao de la muestra

63

El curso est centrado en el examen de los diseos muestrales y en el estudio de la lgica


y procedimientos del contraste de hiptesis.

Objetivos
Conocer el proceso para contrastar hiptesis y su relacin con el mtodo cientfico.
Diferenciar entre hiptesis nula y alternativa
Conocer los conceptos
Nivel de significacin
Significacin
Tipos de error
Cuantificacin del error
Tomar decisiones basados en los criterios anteriores

Conocimientos de la unidad y
contenido
Se examinar el proceso de contrastacin o prueba de hiptesis
1

Contrastacin de Hiptesis
1.1

Las hiptesis y su relacin con el mtodo cientfico.

1.2

Diferencia entre hiptesis nula y alternativa

1.3

Nivel de significacin

1.4

Significacin

1.5

Toma de decisiones, tipos de error y cuantificacin del error

Diseo Experimental
2.1

Definicin de diseo experimental

2.2

Objetivo

2.3

Clasificacin

Prueba del signo


3.1

Diseo experimental de grupos relacionados

3.2

Potencia de una prueba

Contrastacin de Hiptesis
Las Hiptesis y su Relacin con el Mtodo Cientfico.
La investigacin cientfica es un proceso de bsqueda continua de nuevo
conocimiento. Cuando la observacin de datos o conocimientos ya adquiridos provocan una
duda da origen a un problema de investigacin. Una vez que se tiene conciencia del
problema de investigacin, ste se divide en subproblemas y se integran suficientes datos
preliminares que permitan plantear hiptesis de investigacin. Se contina con la bsqueda
de evidencia emprica y una vez que se han conseguido los datos se procede a su anlisis e
interpretacin. Si la hiptesis es soportada por la evidencia emprica se llega a la solucin
del problema y se concluye el ciclo de la investigacin (Leedy & Ormrod, 2009). En resumen,
el mtodo cientfico es el conjunto de procedimientos que siguen las diferentes ciencias
para contrastar las hiptesis formuladas (Moreno Villa, 2003).
Qu son las Hiptesis?
Son suposiciones o conjeturas acerca de determinados hechos. Esto significa que la
hiptesis es una verdad provisional y nunca definitiva (Rodrguez Moguel, 2005).
Importancia de las Hiptesis en la Investigacin Cientfica.
Las hiptesis han sido valiosas guas para la formulacin de teoras cientficas. Dentro
del mtodo cientfico las hiptesis son el hilo conductor del proceso de investigacin,
indican lo que andamos buscando. De hecho, hasta cuando una hiptesis resulta falsa es til
para el investigador. Si la hiptesis no puede probarse, sta es reemplazada por otra que
debe verificarse nuevamente y, vuelve a empezar el ciclo de verificacin experimental. De
ah que la nueva hiptesis sirve como instrumento para avanzar en el conocimiento
cientfico (Rodrguez Moguel, 2005).
Tipos de Hiptesis Planteadas en una Investigacin.
En una investigacin se establecen dos tipos de hiptesis,

La metodolgica de investigacin y

Las estadsticas (hiptesis nula e hiptesis alterna)


Estas ltimas, las estadsticas, permiten evaluar la hiptesis metodolgica de

investigacin a partir de tcnicas estadsticas. La Hiptesis de Investigacin se asocia con el


problema de investigacin y las Hiptesis estadsticas se asocian con los subtemas en los que
se divide el problema de investigacin.

Clasificacin de las Hiptesis Estadsticas

Hiptesis de una variable

Tambin conocidas como Hiptesis descriptivas. Slo pretenden describir el objeto de


estudio. Ejemplo: Los estudiantes de la FTS y DH son en su mayora de gnero femenino

Unidad de observacin: Los estudiantes de la FTS y DH

Variable: Gnero

Relacin: son

Hiptesis de dos variables que guardan una relacin de dependencia

Tambin conocidas como Hiptesis Explicativas. Pretenden encontrar la relacin causaefecto de los fenmenos. Ejemplo: Mientras ms entren a clase los estudiantes de la FTS y
DH mejores sern sus calificaciones

Unidad de observacin: Los estudiantes de la FTS y DH

Variables: Asistencia a clase y calificacin

Relacin: Mientras ms-mejor

Hiptesis de dos o ms variables con una relacin asociativa

Se llaman as porque cuando una variable cambia la otra se modifica sin que exista una
relacin de causa-efecto. Ejemplo: Cunto ms crece la inseguridad menos confianza tiene
la sociedad civil en los gobernantes.

Unidad de observacin: La sociedad

Variables: inseguridad y confianza

Relacin: cuanto ms-menos


Recordemos que una Hiptesis es una suposicin o conjetura acerca de

determinados hechos. Generalmente relacionados con parmetros como: Media, Varianza,


Porcentaje, Proporcin/Tasa.
Una prueba de hiptesis o contraste de hiptesis puede ser entendida como un
procedimiento estadstico simple cuya finalidad es corroborar o desmentir alguna
afirmacin que se hace con relacin a un parmetro poblacional. En definitiva, es una regla
de decisin sobre determinadas caractersticas de los parmetros poblacionales de nuestro
inters.
Planteamiento de Hiptesis.
Siempre se plantean dos hiptesis conocidas como hiptesis nula e hiptesis
alternativa. La Hiptesis nula es una suposicin inicial sobre el parmetro poblacional bajo
estudio que sirve para iniciar el procedimiento de prueba o verificacin. Generalmente se
65

usa el smbolo H0 para denotar la hiptesis nula. Por otra parte, la Hiptesis alternativa es la
hiptesis que se establece como alternativa de la hiptesis nula; si la H0 es rechazada,
entonces ser la hiptesis alternativa la que se tomar tentativamente como vlida. La
metodologa de prueba de hiptesis gira en torno a poder rechazar la H0.

Nota: Si queremos contrastarla, debe establecerse antes del anlisis. La hiptesis


nula (Ho) es una afirmacin que propone los resultados contrarios a los que el investigador
espera encontrar. Es decir, niega la relacin entre las variables. Por el contrario, la hiptesis
alternativa (Ha) afirma lo que el investigador desea que ocurra, y que es manifestado en la
hiptesis metodolgica.

Hiptesis nula

Hiptesis alternativa

Smbolo Ho

Smbolo Ha

Es la afirmacin que ponemos en duda (se

Afirmacin que plantea el investigador

refuta con evidencia emprica)

poniendo en duda la aseveracin de la Ho

No debe rechazarse sin una buena razn

Slo se puede considerar cierta si hay


suficiente evidencia para rechazar Ho

Utiliza los smbolos: =, y

Utiliza los smbolos: , >, <

Utiliza las frases como:

Utiliza las frases como:

Es igual a, Es menor o igual que, Es mayor o

Es diferente, Aumenta, Disminuye, Afecta,

igual a, No hay diferencia, Permanece

Modifica

igual

66

Revisemos una situacin hipottica para ejemplificar los principales elementos que se
relacionan en la tcnica de contraste de hiptesis.

Te aseguro que me
dijeron que tenan 49
aos en promedio.

Pues se ven
MUUUUY jvenes

Voy a investigar

Dicen que son los


efectos de la crema
Juvenatrol.

La diferencia entre lo
que me dijeron y lo
que encontraste es
muy grande

Problema de
investigacin

Bsqueda de
evidencia
emprica

Anlisis y toma
de decisiones

Te lo
dije !

25 aos

Debemos rechazar la idea (hiptesis) de que


la crema Juvenatrol rejuvenece 18 aos la
apariencia de las personas

67

Planteamiento de las hiptesis

Situacin: Quienes aparecen en el comercial de Rejuvenatrol lucen


de 20 aos pero en realidad tienen en promedio 49 aos.
Se traduce al lenguaje estadstico:

Ho: = 49 aos
y se establece su opuesto:
Razonamiento bsico en el contraste de hiptesis

68

Ha: < 49 aos

Razonamiento Bsico en el Contraste de Hiptesis


Regin crtica y nivel de significacin
Regin crtica

Nivel de significacin

Valores improbables si Ho es cierta

Es un valor pequeo 0.01, 0.05,

Es conocida antes de realizar el


experimento: Son los resultados
experimentales que refutaran H0

Se establece antes del experimento

Es la probabilidad de que la muestra


elegida NO represente a la
poblacin que se estudia (posibilidad
de error)

69

Nivel de significacin. Se sabe si nuestra hiptesis (Ha) es vlida o no despus de


realizado el anlisis porque al finalizar medimos la probabilidad de haber obtenido ese
resultado bajo el supuesto de que H0 es cierta. Si la probabilidad <<p>> es un valor menor
que , entonces: H0 es falsa. El valor p representa la probabilidad de encontrar el resultado
en la muestra de estudiada cuando H0 es cierta.
La Ha ser considerada como vlida si el resultado que
encontramos pertenece a un valor dentro de la llamada regin
crtica, la cual se define antes de la investigacin y su lmite es la
probabilidad

Curva normal. La curva normal tambin llamada curva de probabilidad es til para
comprender el contraste de hiptesis, por ello vamos a
recordarla.
Suponiendo que la Ho: = 49 aos es cierta y a partir
de la muestra se estim el parmetro

resultando de 10

aos, entonces cul es la probabilidad de que al


seleccionar una muestra al azar la edad media
sea de 25 aos?

buscamos en la

tabla de la Curva Normal (calificacin z) en la columna C el valor p = .0082, lo comparamos


con el valor =0.05. Como p< se rechaza Ho y se acepta Ha. Se concluye que la edad real de
las personas que aparecen en el anuncio es de 25z

70

aos.

Sobre el criterio de rechazo. Se dice que el contraste es significativo cuando p menor


que . Esto es, se rechaza H0 y en consecuencia se acepta Ha.
Relacin entre y p
Sobre
Es nmero pequeo, preelegido al
disear el experimento
Conocido a sabemos todo sobre la
regin crtica

Sobre p
Es conocido tras realizar el experimento
Conocido p sabemos todo sobre el
resultado del experimento

Tipos de Error
Riesgos al tomar decisiones. Al utilizar un estadstico de muestra para tomar
decisiones sobre el parmetro poblacional, existe el riesgo de llegar a una conclusin
equivocada. Cuando se aplica la metodologa de prueba de hiptesis existen dos tipos de
errores que se pueden cometer al tomar decisiones.
I.

Cuando se rechazar H0 por error se le denomina Error Tipo I y

II.

El Error Tipo II ocurre cuando se conserva por error la H0.


Ho Cierta

Se conserva Ho

Se rechaza
Ho

No hay error

Error I
Por error del azar se rechaz la Ho
La probabilidad de que esto ocurra
es

Ho Falsa
Error II
Por error del azar NO se
rechaz la Ho
La probabilidad de que esto
ocurra es
No hay error

Cmo sabremos si tomamos la decisin correcta? Eso solo se sabe si al repetirse la


investigacin se obtiene un resultado parecido. Lo que podemos decir es la confianza que se
tiene en que los resultados sean los correctos.

71

Que sabemos hasta aqu?

H0: Hiptesis nula


Es inocente

Los datos pueden refutarla


La que se acepta si las pruebas no
indican lo contrario
Rechazarla por error tiene graves
consecuencias

Error de tipo I
El acusado es inocente pero se
decide que es culpable.
Probabilidad

H1: Hiptesis
alternativa
Es culpable
No debera ser aceptada sin una
gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior
Error de tipo II
El acusado es culpable pero no lo
probamos.
Probabilidad

Las hiptesis no se plantean despus de observar los datos.


En ciencia, las hiptesis nula y alternativa no tienen el mismo papel:
H0: Hiptesis cientficamente ms simple.
H1: El peso de la prueba recae en ella.
debe ser pequeo
Rechazar una hiptesis consiste en observar si p<
Rechazar una hiptesis no prueba que sea falsa. Podemos cometer error de tipo I
No rechazar una hiptesis no prueba que sea cierta. Podemos cometer error de tipo
II
Si decidimos rechazar una hiptesis debemos mostrar la probabilidad de
equivocarnos.

72

Diseos experimentales
El concepto de diseo se utiliza en varias etapas de la investigacin cientfica. Se
emplea tanto en aspectos tcnico-metodolgicos como en aspectos estadstico-analticos. El
diseo experimental que se refiera al anlisis estadstico es el de nuestro inters y es el
concepto que intentaremos comprender.
Definicin de diseo experimental: Es un plan de investigacin mediante el cul se
intenta contrastar el efecto causal de por lo menos una variable manipulada por el
investigador (Variable Independiente), en el cual se determina el procedimiento de
asignacin de los sujetos a los distintos niveles de tratamiento y la seleccin de la tcnica de
anlisis ms adecuada.
Objetivo: Detectar la influencia que ejerce(n) la(s) variable(s) independientes sobre
la(s) dependiente(s).
Los diseos experimentales se clacifican de muchas maneras, para efectos de este
curso mostraremos solo dos de esas clasificaciones.
Clasificacin segn el suministro de tratamientoexperimental:
Diseo intergrupos: Tambin conocidas como muestras independientes
Diseo intrasujetos o medidas repetidas: Tambin conocidas como muestras
pareadas o correlacionadas
Diseos mixtos (solo este rengln NO FORMA PARTE DEL CURSO)
Clasificacin estadstica:
Diseos paramtricos
Diseos no paramtricos

73

Distintas personas en los grupos

Los sujetos del grupo de control tambin pertenecen al grupo experimental

74

Prueba del Signo


Es un anlisis matemtico que permite verificar ciertas afirmaciones o hiptesis.
Se ha elegido esta prueba ya que (1) es fcil de entender y (2) podemos ilustrar de
manera clara y sencilla todos los conceptos bsicos relacionados con las pruebas de
hiptesis.
El diseo experimental que habremos de utilizar se llama medidas repetidas, o

de grupos correlacionados. Las caractersticas esenciales son la existencia de


resultados pareados en las condiciones y la elaboracin de un estudio que analiza la
diferencia entre stos.

Ejemplo: Despus de obtener el permiso de las autoridades adecuadas, usted


realizar siguiente experimento.
Imagine que usted es un investigador y desea ayudar a las personas enfermas
de SIDA. Se elige a una muestra aleatoria de 10 pacientes con sida (quienes estn de
acuerdo en participar en el experimento) a partir de una poblacin de gran tamao de
pacientes en etapa avanzada tratados mediante consultas externas en el hospital
donde trabaja. A ninguno de estos pacientes se le ha suministrado mariguana. Cada
enfermo es admitido en el hospital por una semana para participar en el experimento.
El supuesto que hace respecto al empleo de la mariguana como terapia

Ho:: La mariguana no afecta el apetito de los enfermos terminales de SIDA

Ha:: La mariguana modifica el apetito de los enfermos terminales de SIDA

Procedimiento:
Durante los dos primeros das, los
pacientes se acostumbran al hospital.
Al tercer da, la mitad de los enfermos
reciben una pldora con una forma
sinttica del ingrediente activo de la
mariguana, THC, antes de cada
comida.
Al sexto da, se cambia esta pldora por un placebo antes de cada comida. La otra
mitad los pacientes son tratados de igual manera que en la condicin experimental,
excepto que reciben las pldoras en orden inverso, es decir, el placebo al tercer da y
las pldoras en el sexto da.

La variable dependiente es la cantidad de comida ingerida por cada paciente en los


das 3 y 6.
En este experimento, cada sujeto es estudiado bajo dos condiciones: una experimental
y otra de control
Paciente

Condicin experimental
Pldora THC
Alimento ingerido nmero
(caloras)

Condicin de control
Pldora placebo
Alimento ingerido (caloras)

Diferencias
(caloras)

1
2
3
4
5
6
7
8
9
10

1325
1350
1248
1087
1047
943
1118
908
1084
1088

1012
1275
950
840
942
860
1154
763
920
876

+ 313
+ 75
+ 298
+ 247
+ 105
+ 83
- 36
+ 145
+ 164
+ 212

Anlisis: Suponga que la mariguana no tiene efecto alguno sobre el apetito,


entonces, Sera posible obtener 9 signos positivos de 10 en el experimento?
Regla de decisin (Nivel ): Si la probabilidad obtenida es p , rechazamos
Ho. Si la probabilidad obtenida > , no podemos rechazar Ho, conservamos Ho. El nivel
alfa se establece al inicio del experimento. Por lo regular, los niveles alfa utilizados son
, = 0.10, , = 0.05 y =0.01.
Por ahora, supongamos que a = 0.05 para los datos acerca de la mariguana. As, para
evaluar los resultados del experimento de la mariguana, necesitamos:
(1) Determinar la probabilidad de obtener 9 signos positivos de 10 si slo opera
el azar y
(2) Comparar esta probabilidad con alfa.
Observacin:
Si ocurre algn empate, debe ser descartado y, por consiguiente, habr que
reducir n
Pero para el ejemplo no aplica porque no ocurren empates
Suponga que la mariguana no tiene efecto alguno sobre el apetito. Sera posible
obtener 9 signos positivos de 10 en el experimento?
Dicho de otra manera
Sera posible que por pura casualidad (CHIRIPA) 9 personas, de las 10
participantes, consumieron ms alimento despus de consumir la mariguana en el
experimento? La pregunta crucial realmente es
76

"qu tan improbable es esto?"


La pregunta realmente es
Qu tan posible es obtener 9 signos positivos de 10 en el experimento?
La pregunta ahora es
Qu tan posible es obtener 9 signos positivos de 10 en el experimento?
En la Tabla buscamos la probabilidad de obtener 9 signos + en 10 intentos,
suponiendo que la probabilidad de obtener un + es la misma que la de obtener un
signo -, esto es p=0.5
La probabilidad de conseguir un efecto tan extremo como el de 9 signos positivos o
ms (dos colas) es igual a la probabilidad de obtener 0, 1, 9 o 10 signos positivos. Como
la distribucin es simtrica, p (0, 1, 9 o 10 signos positivos) es
igual a p (9 o 10 signos positivos) X 2. As, de la tabla 1:

p = (0.0098 + 0.0010) x 2= (0.0108) x 2 = 0.0216 =

En t r ad a d e l a Tab l a
N

N mer o d e
ev en t o s

P = 0 .5 0

0.0098

10

0.001

10

0.05 Se rechaza Ho

Por lo tanto, concluimos que la mariguana afecta al apetito; parece incrementarlo


Error posible: al rechazar la hiptesis
nula, podra cometerse un Error del tipo 1.
En realidad Ho puede ser verdadera
y usted la ha rechazado.
Poblacin: estos resultados se
aplican a la poblacin de pacientes con sida
en etapa avanzada de donde se tom la
muestra.

77

Objetivos
Conocer el proceso para contrastar hiptesis utilizando la prueba paramtrica t-Student.
Diferenciar entre diseos experimentales de medidas repetidas, independientes con n
igual y con n diferentes
Seleccionar el diseo ms adecuado
Tomar decisiones basados en los criterios anteriores
Conocer el proceso para contrastar hiptesis utilizando la prueba paramtrica r de
Pearson.
Diferenciar entre variable dependiente e independiente
Tomar decisiones

Conocimientos de la unidad y
contenido
Prueba de Hiptesis Paramtricas
Aplicar pruebas paramtricas y analizar los resultados para decidir acerca de
las hiptesis. Se examinarn diferentes diseos experimentales y en base al diseo
se utilizar el procedimiento estadstico adecuado para realizar las pruebas de
hiptesis paramtricas.
4. Prueba t de Student
4.1 Conceptos Bsicos
4.2 Diseo Experimental de Grupos Relacionados
4.3 Diseo Experimental de Grupos Independientes
5. Correlacin
5.1 Definicin
5.2 Requisitos Para el uso de la r de Pearson
5.3 Direccin y Fuerza
5.4 Tipos de Correlacin
5.5 Valor de Correlacin
5.6 Interpretacin del coeficiente de determinacin

78

Conceptos Bsicos
Pruebas Paramtricas
Se llaman as porque su clculo implica una estimacin de los parmetros de la
poblacin con base en muestras estadsticas.
Notas para recordar:
Hiptesis Estadstica. Es una proposicin sobre los parmetros de una o ms
poblaciones. Ms formalmente, una hiptesis estadstica es una proposicin sobre la
distribucin de probabilidad de una variable aleatoria. Siempre son proposiciones
sobre la poblacin, no sobre la muestra. Son conjeturas que se hacen antes de empezar
el muestreo.
Etapas en la Prueba de Hiptesis
1. Evaluar los datos.
2. Revisar las suposiciones (normalidad de la distribucin).
3. Formular las hiptesis estadsticas (nula y alternativa).
4. Seleccionar la prueba estadstica.
5. Formular la regla de decisin.
6. Calcular la estadstica de prueba.
7. Formular la decisin estadstica (rechazar o no H0).
8. Conclusin.
9. Valor p
Caractersticas que se supone deben cumplirse para utilizar el procedimiento
paramtrico de contraste de hiptesis:

El nivel de medicin debe ser al menos de intervalo.

Que los valores de la variable dependiente sigan la distribucin de la curva

normal, por lo menos en la poblacin a la que pertenezca la muestra en la que se hizo


la investigacin;

Que las varianzas de los grupos que se comparan en una variable dependiente

sean aproximadamente iguales (homoscedasticidad, u homogeneidad de las


varianzas);

Nota: Este requisito puede ignorarse cuando tratamos con muestras relacionadas
(medidas repetidas) sin gran riesgo de distorsionar nuestro resultado. Para muestras no
relacionadas necesitamos ser ms cuidadosos cuando los tamaos de las muestras sean
bastante diferentes.
79

Y que la variable dependiente est medida en una escala que sea Cardinal

Nota: Debemos tomar una decisin a cerca de nuestra variable dependiente. Es


realmente un nivel de intervalo? Si es una escala no estandarizada, o si se basa en
estimaciones o calificaciones con humanos. Frecuentemente algunas variables parecen
intervalares pero en realidad su nivel es ordinal.
Ventajas de las Pruebas Paramtricas

Que la seleccin y asignacin de los participantes sea aleatoria

Ms poder de eficiencia.

Ms sensibles a los rasgos de los datos recolectados.

Menos posibilidad de errores.

Robustas (dan estimaciones probabilsticas bastante exactas).

Desventajas de las Pruebas Paramtricas

Ms complicadas de calcular.

Limitaciones en los tipos de datos que se pueden evaluar.

80

t de Student
Comnmente hacemos generalizaciones respecto de los diferentes grupos que
forman la poblacin. Por ejemplo: Los hombres son ms fuertes que las mujeres, las
mujeres son ms inteligentes que los
hombres,
As, continuamente nos la
pasamos afirmando que la media de
una muestra es ms grande, ms
fuerte y/o ms difcil que otra. No
obstante debemos comprobar si
efectivamente se dan estas diferencias.
Para examinar cuan significativas son estas diferencias emplearemos el
estadstico t de Student
Qu es la prueba t de Student?
Es una prueba estadstica para evaluar si dos grupos difieren entre si de manera
significativa respecto de sus medias. Es representada por el smbolo t
Planteamiento de las Hipotesis
H0: Las medias de los grupos no difieren significativamente entre si
Ha: Las medias de los grupos difieren significativamente entre si
Probar)
Regla de decisin: Se acepta Ha si:
Requisitos:

(Hipotesis a

ttobtenida
t crtica
obtenida tcrtica

Que los puntajes se distribuyan normalmente.


Que haya homocedasticidad de varianza. Significa que la distancia entre un
puntaje crudo y su media es MUY similar en ambos grupos
Que los puntajes tengan un nivel de medicin cardinal (cuantitativos).
Que la seleccin y asignacin de los participantes sea aleatoria
El procedimiento matemtico empleado para utilizar la prueba t depende del
diseo experimental.
Clasificacin de t segn tipo
de diseo experimental

81

Muestras independientes. Se comparan dos muestras tomadas de la misma


poblacin o de poblaciones diferentes. Ejemplos:

Tomadas de la misma poblacin: Hombres y mujeres de una universidad


pblica

Tomadas de poblaciones diferentes: Hombres y mujeres de una


universidad pblica y una universidad privada

Muestras independientes con n iguales. Se aplica cuando se tienen dos muestras


tomadas de la misma poblacin o de poblaciones diferentes, pero en ambas el tamao
de la muestra es el mismo. De lo contrario el diseo experimental se denomina
Muestras independientes con n diferentes.
Muestras correlacionadas. Se compara la misma muestra en dos situaciones
diferentes. Ejemplo: Calificacin obtenida en la escala de satisfaccin personal
obtenida antes y despus de utilizar el detergente Coloreria

Muestras independientes n iguales


Mediante el siguiente ejemplo aprenderemos el procedimiento para utilizar la
Prueba t cuando las muestras son del mismo tamao e independientes. A este
procedimiento, como ya vimos se le denomina muestras independientes con n iguales.
Contexto. Una Trabajadora Social desea conocer si el grado de autoritarismo
medio difiere entre los profesores de las escuelas primarias pblicas y privadas. Para
ello aplica un instrumento (cuestionario) conocido como escala de Vigano (1986) y
encuentra los siguientes datos:

82

Datos

Pasos para emplear la prueba t de Student

Profesores de
escuelas
particulares
X1
140
110
128
110
100
95
44
36
21

Profesores de
escuelas
pblicas
X2
90
95
65
70
45
35
22
60
18

1.
2.
3.
4.
5.
6.
7.
8.
9.

Se plantean las hiptesis estadsticas


Se plantea la probabilidad para la cual se comprobarn dichas
hiptesis estadsticas
Calcular la media de cada muestra
Calcular la desviacin estndar de cada muestra
Encontrar el error estndar de cada media
Calcular el error estndar de la diferencia
Calcular los grados de libertad
Sustituir en la frmula de t
t crtica
Aplicar regla de decisin. Se acepta Ha si: ttobtenida
obtenida tcrtica

Empecemos siguiendo los pasos arriba mencionados:


1.

Se plantean las hiptesis estadsticas


H0: Las medias de los grupos no difieren significativamente entre si
Ha: Las medias de los grupos difieren significativamente entre si
(Hipotesis a Probar)
H0: El grado de autoritarismo medio no difiere entre los profesores de las
escuelas primarias pblicas y privadas
Ha: El grado de autoritarismo medio difiere entre los profesores de las escuelas
primarias pblicas y privadas

2.

Se plantea la probabilidad para la cual se comprobarn

dichas hiptesis estadsticas:


3.

2colas=0.05

Calcular la media de cada muestra:

Profesores de escuelas particulares

Profesores de escuelas pblicas

4.

Calcular la desviacin estndar de cada muestra:

5.

Encontrar el error estndar de cada media:


83

=26.1

6.

Calcular el error estndar de la diferencia:

7.

Calcular los grados de libertad:


g.l.=n1+n2-2 = 9+9-2 = 16

8.

Sustituir en la frmula de t:

9.

Aplicar regla de decisin. Se acepta Ha si:

Buscamos en la tabla para comparar

ttobtenida
t crtica
obtenida tcrtica

1.86 t crtica 22..120


Decisin: Se conserva Ho ttobtenida
120
obtenida 1.86 tcrtica

Conclusin: No podemos aseguramos que el grado de autoritarismo es


diferente entre los profesores de las escuelas primarias pblicas y privadas. El
experimento no es concluyente porque el contraste no fue significativo.
Muestras independientes n diferentes
Al igual que en el tema anterior emplearemos un ejemplo para aprender el
procedimiento que nos permita utilizar la Prueba t cuando las muestras son de distinto
tamao e independientes. A este procedimiento, como ya vimos se le denomina
muestras independientes con n diferentes.

Situacin: Una investigadora social considera que: (Ha) las instituciones


asistenciales reciben mayor apoyo econmico de las empresas cuando se encuentran
84

en presencia de los medios de comunicacin. Para probar su hiptesis, con una


significancia = 0.05, la investigadora somete a prueba a dos grupos de empresas, uno
de control y otro experimental. Los datos obtenidos son los siguientes:
Pasos para probar la hiptesis:
1.

Se plantean las hiptesis estadsticas


H0: El apoyo econmico que reciben las instituciones asistenciales de las
empresas no se modifica con la presencia de los medios de comunicacin
Ha: Las instituciones asistenciales reciben mayor apoyo econmico de las
empresas cuando se encuentran en presencia de los medios de
comunicacin

2.

Se plantea la probabilidad para la cual se comprobarn

dichas hiptesis estadsticas 1cola=0.05


3.

Calcular la media de cada muestra

4.

Calcular la desviacin estndar de cada muestra

5.

Encontrar el error estndar de la diferencia

6.

Calcular los grados de libertad


g.l.=n1+n2-2 = 9+7-2 = 14

7.

Sustituir en la frmula de t

8.

Aplicar regla de decisin. Se acepta Ha si:

Buscamos en la tabla para comparar

85

ttobtenida
t crtica
obtenida tcrtica

5.38 t crtica 11..76


76
Decisin: Se acepta Ha ttobtenida
obtenida 5.38 tcrtica
Conclusin: Con el 95% de confianza aseguramos que las instituciones asistenciales
reciben mayor apoyo econmico de las empresas cuando se encuentran en presencia
de los medios de comunicacin.
Muestras Correlacionadas o Medidas Repetidas
A este procedimiento, como ya vimos
se le denomina muestras pareadas o

muestras repetidas. En los datos pareados


para cada una de las observaciones de la
primera muestra hay una observacin en la
segunda muestra para el mismo sujeto.
Dicho lo mismo en otras palabras, son
estudios donde se analiza la misma medida en el mismo individuo en dos instantes
diferentes.
Mediante el siguiente ejemplo aprenderemos el procedimiento para utilizar la
Prueba t cuando solo utilizamos una muestra la cul es observada antes y despus del
experimento tambin llamado tratamiento.
Contexto. Un investigador desea saber si existen diferencias en las actitudes
que asumen los adultos de diferentes clases sociales ante la contaminacin ambiental
antes y despus de pasar una pelcula sobre los efectos de sta sobre el ambiente. Los
datos obtenidos son los siguientes:
Datos

Pasos para contrastar las hiptesis


1. Se plantean las hiptesis estadsticas
2. Se plantea la probabilidad para la cual se comprobarn dichas

Antes Despus

hiptesis estadsticas

100

90

200

60

180

75

90

85

4. Calcular la media de cada grupo

49

40

5. Calcular la desviacin estndar de la muestra

110

65

6. Encontrar el error estndar de la diferencia

185

75

7. Sustituir en la frmula de t

170

95

165

85

8. Calcular los grados de libertad

86

3. Calcula en primer lugar una nueva variable D que es igual a la


primera variable Var1 menos la segunda variable Var2.

9. Aplicar regla de decisin. Se acepta Ha si:

ttobtenida
t crtica
obtenida tcrtica

Sumas

160

70

1409

740

1. Se plantean las hiptesis estadsticas


Ho: No existen diferencias en las actitudes ante la
contaminacin ambiental antes y despus de pelcula
Ha: Existen diferencias en las actitudes ante la contaminacin
ambiental antes y despus de pelcula
2. Se plantea la probabilidad para la cual se comprobarn dichas hiptesis

2colas 0.05

estadsticas

3. Calcula en primer lugar una nueva variable D que es igual a la primera

D=Antes-Despus

variable Var1 menos la segunda variable Var2.

Sumas

Antes
100
200
180
90
49
110
185
170
165
160
1409

Despus
90
60
75
85
40
65
75
95
85
70
740

D2
100
19600
11025
25
81
2025
12100
5625
6400
8100
65081

D
10
140
105
5
9
45
110
75
80
90

4. Calcular la media de cada grupo

5. Calcular la desviacin estndar de la muestra

6. Encontrar el error estndar de la diferencia

7. Sustituir en la frmula de t

8. Calcular los grados de libertad


g.l.=n-1=10-1=9
t crtica
9. Aplicar regla de decisin. Se acepta Ha si: ttobtenida
obtenida tcrtica

ttobtenida
4.47 t crtica 22..262
262
obtenida 4.47 tcrtica
87

Conclusin: Aseguramos con una confianza del 95% que la actitud que tienen
las personas ante la contaminacin ambiental cambia despus de ver la pelcula.
Resumen de los tres procedimientos:
Pasos comunes en la prueba t de Student
1.

Se plantean las hiptesis estadsticas

2.

Se plantea la probabilidad para la cual se comprobarn dichas hiptesis estadsticas

3.

Calcular la media de cada grupo

Muestras independientes
n iguales
4.

5.

6.

Calcular la desviacin
estndar de cada
muestra
Encontrar el error
estndar de cada
media
Calcular el error
estndar de la
diferencia

7.

Muestras independientes
n diferentes
4.

5.

Calcular la desviacin

4.

Calcula en primer lugar una

estndar de cada

nueva variable D que es

muestra

igual a la primera variable

Encontrar el error

(Var1) menos la segunda

estndar de la

variable (Var2).

diferencia

5.

Calcular la desviacin
estndar de la muestra

Calcular los grados de


libertad

g.l.=n1+n2-2

Muestras correlacionadas

6.
6.

Calcular los grados de

Encontrar el error estndar


de la diferencia

libertad

g.l.= n1+n2-2

7. Calcular los grados de


libertad
8.

Sustituir en la frmula de t

9.

Aplicar regla de decisin. Se acepta Ha si: ttobtenida


obtenida

100

88

ttcrtica
crtica

g.l.=n-1

Anlisis de Coeficiente de Correlacin Lineal de Pearson


Cotidianamente nos la pasamos suponiendo que existen conexiones entre
dos situaciones, por ejemplo:

El coeficiente de correlacin lineal de Pearson es una herramienta estadstica


que podemos usar para describir el grado de relacin lineal entre dos variables
cardinales y se representa con la letra r. Su objetivo es medir y evaluar la
asociacin lineal que existe entre dos variables. El coeficiente de correlacin es una
medida estadstica que determina el grado de intensidad con la que se relacionan las
dos variables mediante un nmero que se ubica en el rango [-1 r 1] y se puede
calcular a partir de la siguiente expresin:

][

Los requisitos para su uso son:

Que los puntajes se distribuyan normalmente.

Que haya homocedasticidad de varianza (Esto es, que la distancia entre un


puntaje crudo y su media es muy similar en ambos grupos)

Que los puntajes tengan un nivel de medicin cardinal (cuantitativos).

Que la seleccin y asignacin de los participantes sea aleatoria

Que los datos se agrupen en una recta


Interpretacin. Los tres puntos a considerar cuando se realiza la

interpretacin del coeficiente de correlacin lineal r de Pearson son: fuerza,


89

direccin y significancia.
Fuerza: indica el grado en que las dos variables se relacionan. Como ya
mencionamos, este coeficiente puede tomar cualquier valor entre [-1 y 1]
r=1: es una correlacin lineal directa (positiva) perfecta.
r=0: no estn asociadas linealmente las variables.
r=-1: es una correlacin lineal inversa (negativa) perfecta.
Puede ser interpretada de la siguiente manera:

Direccin: Indica la forma en que se relacionan las dos variables.


Signo

Interpretacin

+ (positivo)

Directa

- (negativo)

Inversa

Significancia: es la probabilidad de rechazar por error la H0. La correlacin es


significativa si robtenida rtabla
Diagrama de Dispersin
Una manera de visualizar la (posible) correlacin entre las observaciones de
dos variables X e Y, es a travs de un diagrama de dispersin, tambin llamado
diagrama de nube, en el cual los valores que toman estas variables son
representados por puntos. La secuencia para obtener un diagrama de dispersin es
en el eje x las variables

colocar

independientes y las variables


dependientes en el eje y. Se deben
tener por lo menos 20 parejas de
datos.
En el eje x se colocan los
valores de la variable que se
90

considera independiente y en eje y los datos de la variable que se considera


dependiente.
Los grficos (x , y) o de dispersin muestran las series como un conjunto de
puntos. La variable que est bajo el control del experimentador es la variable
independiente y habitualmente se representa a lo largo del eje horizontal. La
variable medida o dependiente usualmente se representa a lo largo del eje vertical.

Ejemplo de su uso e Interpretacin: Visualcese como director del rea de


Recursos Humanos de la empresa Coca Cola en Mxico y empieza a sentir que la
calidad en el producto se est deteriorando. Por lo
anterior le pide a la gerente de capacitacin que le
enve un reporte grfico que le permita visualizar
rpidamente el impacto que han tenido los cursos de
capacitacin relacionados con la mejora en la calidad.
Para tal efecto, la gerente considera que un diagrama
de dispersin es una buena herramienta e inicia por
recabar la informacin de 30 empleados y las
variables que compara son el nmero de
xitos (v.d.) porque considera que depende de
las horas de entrenamiento (v.i.). Los
resultados del diagrama de dispersin se
muestran a continuacin:
91

Se observa que existe una relacin directa entre las horas de entrenamiento
y el nmero de xitos de los empleados. A mayor tiempo dedicado al
entrenamiento (v.i) se obtiene un nmero mayor de xitos (v.d.)
Aplicando la teora.
Contexto. Una investigadora especializada en la salud emocional de la personas que
viven en pareja, basada en su experiencia supone que las parejas felices suelen sentirse
habitualmente bien con la pareja con la que conviven y suelen consultarse las cosas porque
ambos respetan las opiniones del otro. En las parejas satisfechas de su relacin es ms
frecuente que ambos miren al pasado con afecto. Tienden a
recordar ms los aspectos positivos que los negativos.
Para probar su hiptesis planea realizar una
investigacin con una significancia =0.05 y elige al azar a 10
parejas con ms de cinco aos de convivencia conyugal a
quienes aplica dos test. Uno para medir la satisfaccin y otro
para medir los niveles de comunicacin.
Pasos Para el Anlisis de Correlacin Lineal

1. Plantear las Hiptesis (H0 y Ha) Ha: Las parejas con mayor comunicacin estn
ms satisfechas con su relacin de pareja
2. Determinar cual es la variable dependiente.
3. Se plantea la probabilidad para la cual se comprobarn dichas hiptesis
estadsticas
4. Seleccionar una muestra de tamao n de ambas variables x e y
5. Obtener n pares de observaciones. (x1,y1) (x2, y2)...... (xn, yn)
6. Mostrar la relacin en un diagrama de dispersin: grafico de x vs y.
7. Sealar de manera descriptiva el sentido y la intensidad de relacin entre
variables.
8. Calcular el coeficiente de correlacin lineal r a partir de la muestra.
9. Obtener grados de libertad
10. Tomar decisin
11. Encontrar coeficiente de determinacin
12. Presentar conclusin
Llevmoslos a la prctica
92

Planteamiento de las Hiptesis (H0 y Ha)


Ha: Las parejas con mayor comunicacin estn ms satisfechas con su relacin de
pareja
Ha: Las parejas con mayor comunicacin estn ms satisfechas con su relacin de
pareja

Determinar cual es la variable dependiente.


La satisfaccin depende de la comunicacin

Se plantea la probabilidad para la cual se comprobarn dichas hiptesis


estadsticas

1cola=0.05

Seleccionar una muestra de tamao n de ambas variables x e y.


Diez parejas con ms de cinco aos de convivencia conyugal

Obtener n pares de observaciones. (x1,y1) (x2, y2)...... (xn, yn)


Comunicacin x
Satisfaccin y

10
9

8
10

8
9

7
6

10
9

9
8

6
7

5
4

4
4

8
7

Mostrar la relacin en un diagrama de dispersin: grafico de x vs y.


Sealar de manera descriptiva el sentido y la
intensidad de relacin entre variables.
En esta grfica se observa que hay ina
relacin directa entre los niveles de
comunicacin con el grado de
satisfaccin de la pareja.

Calcular el coeficiente de correlacin lineal r a partir de la muestra.


Comunicacin Satisfaccin
x
y
10
9
8
10
8
9
7
6
10
9
9
8
6
7
5
4
4
4
8
7
75
73

Suma

93

][

xy

x2

y2

90
80
72
42
90
72
42
20
16
56
580

100
64
64
49
100
81
36
25
16
64
599

81
100
81
36
81
64
49
16
16
49
573

][

= 0.8495

Obtener grados de libertad


gl= n-2= 10-2= 8
n=nmero de parejas

Tomar decisin
Se acepta Ha si: robtenida rtabla
0.8495 0.549 Podemos rechazar H0 y aceptamos la Ha

Encontrar coeficiente de determinacin r2


r2 = (0.8495)2 = 0.72165 es la proporcin de la variacin de y que se explica por la
relacin lineal entre x e y . Traducido a porcentaje 72%

Concluir
Se puede afirmar que existe una fuerte correlacin positiva entre la
comunicacin y la satisfaccin de las parejas. Del anlisis de correlacin
encontramos que la satisfaccin en la relacin de pareja es influenciada por la
comunicacin en un 72%. Por tanto aseguramos con una confianza del 95% que las
parejas con mayor comunicacin estn ms satisfechas con su relacin.

94

Objetivos
Conocer el proceso para contrastar hiptesis no paramtricas utilizando la X 2.
Utilizacin de la prueba bondad de ajuste
Utilizacin de la prueba de independencia
Tomar decisiones

Conocimientos de la unidad y
contenido
Prueba de Hiptesis no Paramtricas
Aplicar prueba no paramtricas X 2 y analizar los resultados para decidir
acerca de las hiptesis.
4. Prueba X 2

4.1
4.2
4.3
4.4

95

Concepto
Propiedades
Prueba X 2 para una muestra
Prueba X 2 para dos o ms muestras

Chi Cuadrada X 2
La prueba estadstica Chi cuadrada, tambin conocida como Ji cuadrada, es la
prueba no paramtrica ms utilizada en la investigacin social. Se utiliza para
contrastar aquellas hiptesis en las que no es posible fijar ningn supuesto sobre
parmetros o distribuciones poblacionales como medias, varianzas, etctera. Por ello a
este tipo de pruebas no paramtricas tambin se le conoce con el nombre de pruebas
de distribucin libre. Esto quiere decir que se realizan a partir de datos nominales u

ordinales y que las pruebas estn libres de supuestos acerca de la forma de la


distribucin de la poblacin. La Chi cuadrada se representa con el smbolo X 2 y sus
aplicaciones son: pruebas de bondad de ajuste (no son parte de este curso) y pruebas
de independencia. Su objetivo es comparar las frecuencias esperadas (poblacionales)
con las frecuencias obtenidas (de la muestra) y a partir de esta comparacin decidir si
existen diferencias significativas. Las frecuencias esperadas se refieren a la H0 y las
frecuencias obtenidas son los resultados obtenidos por el investigador. En esta prueba,
la hiptesis nula afirma que el conjunto de frecuencias obtenidas es igual al de las
frecuencias esperadas, mientras que la hiptesis alternativa arguye que existe
diferencia entre lo que se espera y lo que se observa. Mientras mayor sea el valor de X 2
menor es la probabilidad de que las frecuencias obtenidas se deban a la poblacin
descrita en la H0. Esto significa que, el valor de Chi cuadrada es significativo si la
diferencia entre las frecuencias esperadas y las frecuencias obtenidas es lo
suficientemente grande (Siegel y Castellan, 2003; Levin y Levin, 2002)
Propiedades de Chi cuadrada.

Toma valores no negativos X 2 0

No es simtrica. Es sesgada a la derecha

Siempre la regin crtica se ubica a la


derecha, en el sesgo

X 2 forma una familia de distribuciones de


probabilidad. Existe una distribucin X 2
diferente para cada grado de libertad.
Frmula de X 2:

Dnde: = suma; fo= frecuencia obtenida; fe=frecuencia esperada

Una vez obtenido el valor de Chi cuadrada, se requiere conocer los grados de libertad
(gl) para poder comparar el resultado obtenido con el valor de la distribucin Chi
cuadrada crtica (de la tabla ). La frmula para obtener los gl es: gl=k-1. Para una
muestra o cuando se trata de 3 o ms poblaciones independientes.
Reglas para su uso:
1. Las observaciones deben ser independientes
2. Nivel de medicin de al menos una variable ser nominal u ordinal
3. Muestreo puede ser no probabilstico
4. La muestra debe ser mayor a 20 (N>20)
5. fe>5
Procedimiento:
1. Plantear las hiptesis
2. Determinar la probabilidad con la que se trabajar: =.05 ; =.01
3. Generar tabla de contingencia
Tablas de contingencia son tablas de doble entrada (variables cualitativas) que
contienen las frecuencias con que ocurren las diferentes combinaciones de los
valores de las variables.
4. Calcular fe
5. Aplicar la frmula
6. Obtener gl
7. Plantear regla de decisin. Se acepta Ha y se rechaza H0 si: X 2obtenida X 2tabla
8. Concluir
Ejemplo de su Uso e Interpretacin de X 2Para Cuando se Utiliza Slo una Muestra:
La duea de la tiendita de la escuela quiere saber si alguno de sus productos
chatarra tiene mayor preferencia por los nios para comprar ms. Su objetivo, por lo
tanto es identificar el consumo de productos chatarra en una muestra de 60 nios
preescolares de Guadalupe, y su preferencia.
Paso 1. Hiptesis
H0:: No existen diferencias significativas en la preferencia de consumo de
97

productos chatarra en nios preescolares


H1:: Existen diferencias significativas en la preferencia de consumo de
productos chatarra en nios preescolares
Paso 2. Determinar la probabilidad con la que se trabajar. Nivel de significancia =.05
Paso 3. Elaborar la tabla de contingencia
pastelitos

frituras

refrescos

dulces

fo

fo

fo

fo

15

28

10

60

Considera que la informacin de la tabla de contingencia es suficiente?, se puede


concluir que no existen diferencias significativas en el consumo de productos chatarra
en nios preescolares?
Si no hay una diferencia significativa entre las frecuencias observadas y las
frecuencias esperadas (que es lo que propone la Ho), se supondra que las frecuencias
observadas fueran iguales o aproximadamente iguales. Es decir, se esperara vender el
mismo nmero de pastelitos que de frituras, refrescos y dulces. En este caso cualquier
diferencia observada entre el conjunto de frecuencias observadas y esperadas, podra
atribuirse al muestreo o a la casualidad.
Paso 4. Clculo de
pastelitos

fo

fe

15 15

frituras

refrescos

fo

fo

fe

28 15

dulces

fe

fo

fe

10 15

15

60

Paso 5. Desarrollo de la frmula:

Paso 6. Obtener grados de libertad gl=k-1=4-1=3


Paso 7. Regla de decisin: Se acepta Ha y se rechaza Ho si: X 2obtenida X 2tabla
X 2obtenida = 17.18 X 2tabla =7.82

Se acepta Ha

Paso 8. Interpretacin:
Con una confianza del 95% aseguramos que los nios de
preescolar tienen preferencias significativas en el consumo de
los productos chatarra que se venden en la tiendita de la
escuela.

98

Ejemplo de su Uso e Interpretacin de X 2Para Cuando se Utiliza ms una Muestra:


La cervecera Cuauhtmoc tiene dos tipos de cerveza: clara y negra. Antes de
lanzar su nueva propaganda desea saber si existen diferencias en la preferencia del
tipo de cervezas entre los hombres y las mujeres. Para determinar esto a un nivel de
significancia de .05 aplic una encuesta a 150 personas y obtuvo la siguiente
informacin:
Datos: Se encuestaron a 70 mujeres y a 80 hombres. La cerveza clara fue preferida por
55 y 45 hombres, mientras que, la cerveza negra fue elegida por 15 mujeres y por 35
hombres.
Procedimiento:
1. Plantear las hiptesis
H0:: No existen diferencias significativas entre la preferencia por un tipo de cerveza y el
gnero del consumidor
Ha:: Existe una relacin significativas entre la preferencia por un tipo de cerveza y el
gnero del consumidor

2. Determinar la probabilidad con la que se trabajar:


=.05
3. Generar tabla de contingencia
Tablas de contingencia son tablas de doble entrada (variables cualitativas) que
contienen las frecuencias con que ocurren las diferentes combinaciones de los
valores que toman las variables.
tipo de cerveza
clara

negra

total

55

15

70

45

35

80

100

50

150

gnero

total

4. Calcular fe

99

5. Aplicar la frmula

6. Obtener gl
gl =(columnas-1)(renglones-1)=(2-1)(2-1)=1
7. Plantear regla de decisin. Se acepta Ha y se rechaza H0 si: X 2obtenida X 2tabla

X 2obtenida= 8.37 X 2tabla=3.841 Se acepta Ha:: Existe una relacin significativas entre
la preferencia por un tipo de cerveza y el gnero del consumidor

8. Concluir:
De acuerdo con la evidencia afirmamos con una certeza del 95% que la
preferencia por el tipo de cerveza depende del gnero.

100

Potrebbero piacerti anche