Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Propsito
La estadstica ha llegado a ocupar un amplio escenario en el desarrollo de la ciencia y la
tecnologa, pero tambin en las ms diversas esferas de la vida cotidiana, incluidas la cultura y el
deporte. En esta perspectiva podemos decir que es una disciplina que lleg para expandirse y para
incorporarse a la cultura en la sociedad del conocimiento y la informacin. Un aspecto importante en
la prctica de los profesionales en T.S. y D.S. la constituye el proceso de investigacin, donde juegan un
importante papel los procedimientos Estadsticos, ya que proporcionan al egresado, instrumentos para
tomar decisiones cuando prevalecen condiciones de incertidumbre
La metodologa estadstica nos dota de una serie de principios, procedimientos, tcnicas y
mtodos para realizar cuatro tareas fundamentales en la investigacin:
1. Obtener datos pertinentes de manera rpida y a costos bajos;
2. Una vez obtenidos los datos, proporciona los mtodos para su organizacin y
procesamiento, a fin de obtener de ellos la informacin requerida;
3. Proporciona los principios y mtodos para que las conclusiones emanadas o acciones a
seguir sean el producto de procesos de induccin vlidos, que se obtengan de interpretaciones
adecuadas de los resultados; y
4. Proporciona los principios y lineamientos para comunicar apropiadamente los resultados,
conclusiones y recomendaciones, ya sea en el marco de un reporte, una presentacin oral o un artculo
cientfico.
As, los mtodos y tcnicas de la estadstica ayudan a la realizacin de mltiples tareas en las
organizaciones productivas y sociales, tanto en las instituciones pblicas como en las privadas; son la
base para la realizacin de investigaciones que permiten el sustento de la toma de decisiones en las
instituciones u organizaciones de los ms diversos giros.
Pretendemos, por tanto, que el estudiante de la Licenciatura en T. S. y D.H., se familiarice con
las nociones de Estadstica de mayor aplicacin en el Trabajo Social, con un doble objetivo: que sepa
analizar e interpretar la informacin estadstica, los argumentos relacionados con los datos o los
fenmenos estocsticos que pueden encontrar en diversos contextos, y que desarrolle su capacidad de
crtica hacia las informaciones de tipo estadstico procedentes de cualquier fuente.
Elementos de Competencia
1. Elaborar un reporte de Anlisis Descriptivo que facilite la adecuada
interpretacin de los resultados obtenidos de algn caso prctico (real o
hipottico) presentado en el aula, utilizando los procedimientos, tcnicas
y mtodos de estadstica descriptiva
2. Estimar parmetros poblacionales de las variables analizadas en el reporte
de Anlisis Descriptivo del caso prctico (real o hipottico) presentado en
el aula, para que las conclusiones emanadas o acciones a seguir sean el
producto de procesos de induccin vlidos, basados en adecuadas
interpretaciones de los resultados
3. Determinar el tamao de una muestra que represente a una determinada
poblacin, con la exactitud y confianza que el estudiante en el papel de
investigador determine.
Metodologa del curso
Esta asignatura ha de entenderse como una herramienta para el trabajador social, y por tanto
debe sustentarse, fundamentalmente, en la resolucin de casos prcticos. Por tanto, plantearemos una
metodologa que procure la participacin del alumnado en la resolucin de esos casos, ya sea
individualmente o de forma colectiva.
Sesiones de Clase
Los estudiantes tienen la obligacin de asistir a todas las sesiones de clase presencial. En este
programa no se permiten las ausencias. En el caso excepcional de que no pueda evitarse la ausencia,
se exigir que el estudiante realice un trabajo/experiencia de compensacin igual y pertinente que
ser definido por el profesor As tambin, el estudiante que no pueda asistir a una sesin de clase, es
el o la responsable de negociar con el instructor la realizacin de un trabajo escrito extraordinario
dedicado a recuperar la instruccin perdida. El instructor disear este trabajo asignado de forma que
cumpla con los objetivos y el contenido de la sesin de clase perdida. En correspondencia con ello, se
fijar una fecha lmite para la entrega del trabajo terminado.
Competencia No 1
Al finalizar esta unidad de aprendizaje el estudiante debe ser capaz de elaborar un reporte de
Anlisis Descriptivo que facilite la adecuada interpretacin de los resultados obtenidos de algn caso
prctico (real o hipottico) presentado en el aula, utilizando los procedimientos, tcnicas y
mtodos de estadstica descriptiva
Contenidos
1.1 Introduccin al curso de estadstica y conceptos bsicos
1.2 Distribucin de frecuencias y tcnicas de representacin grfica
1.3 Medidas de tendencia central
Introduccin
Importancia de la Estadstica para el profesional en Trabajo Social y Desarrollo Humano
En la actualidad se ha incorporado la estadstica, en forma generalizada, al currculo de
matemticas de la enseanza primaria y secundaria y de las diferentes especialidades universitarias en
la mayora de pases desarrollados. En Mxico algunos conceptos estadsticos se estudian desde
el nivel secundario, pero falta mucho por hacer en este rubro. Las razones de este inters hacia la
enseanza de la estadstica han sido repetidamente sealadas por diversos autores, desde
comienzos de la dcada de los ochenta. Por ejemplo en Holmes (1980) encontramos las
siguientes:
La estadstica es una parte de la educacin general deseable para los futuros ciudadanos
adultos, quienes precisan adquirir la capacidad de lectura e interpretacin de tablas y grficos
estadsticos que con frecuencia aparecen en los medios informativos. Para orientarse en el mundo
actual, ligado por las telecomunicaciones e interdependiente social, econmica y polticamente, es
preciso interpretar una amplia gama de informacin sobre los temas ms variados.
Es til para la vida posterior, ya que en muchas profesiones se precisan unos conocimientos
bsicos del tema. La estadstica es indispensable en el estudio los fenmenos complejos,
en los que hay que comenzar por definir el objeto de estudio, y las variables
relevantes, tomar datos de las mismas, interpretarlos y analizarlos.
Su estudio ayuda al desarrollo personal, fomentando un
razonamiento crtico, basado en la valoracin de la evidencia
objetiva; hemos de ser capaces de usar los datos cuantitativos para
controlar nuestros juicios e interpretar los de los dems; es importante adquirir
un sentido de los mtodos y razonamientos que permiten transformar estos
datos para resolver problemas de decisin y efectuar predicciones (Ottaviani,
1998).
Ayuda a comprender otros temas del currculum, donde con frecuencia aparecen grficos,
resmenes o conceptos estadsticos.
El trabajo social y las ciencias de la educacin utilizan la base metodolgica de la estadstica
para los procesos de investigacin aplicada, no slo para monitorear programas en sistemas educativos
sino para cualquier asunto relacionado con la evaluacin y toma de decisiones. Las ciencias biolgicas y
las disciplinas emergentes, como el desarrollo sustentable, o agroecosistemas, medio ambiente,
cambio global y ecologa, consideran a la metodologa estadstica como fundamental para la
generacin del conocimiento y para el diseo e implantacin de estrategias de intervencin. Hay una
gran cantidad de estudios e investigaciones en estas disciplinas que sin la metodologa estadstica
seran impensables.
Definicin de Estadstica
"Ciencia que se ocupa del estudio de fenmenos de tipo genrico, normalmente complejos y
Recopilacin
de informacin
(numrica o
alfabtica)
Organizacin
de la
informacin
recabada
Anlisis e
interpretacin
de los
resultados
Presentacin
de los
resultados
Funciones de la estadstica
Se puede hacer una distincin entre las dos funciones del mtodo
estadstico: las tcnicas de estadsticas descriptivas y las tcnicas
estadsticas inferenciales. El propsito principal de la estadstica
descriptiva es presentar la informacin en forma cmoda, utilizable y
comprensible. Por otra parte, la estadstica inferencial se ocupa de hacer deducciones acerca de la
poblacin de estudio basndose en la o las muestras tomadas de ella.
Conceptos bsicos
Variable. Es cualquier caracterstica de una persona, medio ambiente o situacin experimental
que pueda cambiar de persona a persona, de un medio ambiente a otro medio ambiente o de una
situacin experimental a otra.
Ejemplos: sexo del entrevistado, estado civil actual del entrevistado, edad del entrevistado,
etctera, etctera.
Variable Independiente en un experimento. Es una variable controlada sistemticamente por
el investigador. Por lo general, en una investigacin el cientfico se interesa por el efecto que tiene una
variable A sobre alguna o ms variables. Ejemplo: El investigador desea saber cmo el alcohol afecta la
memoria. Para averiguarlo, es posible que el investigador vare los niveles de alcohol para
posteriormente medir la cantidad de recuerdos que maneja el sujeto de estudio.
La variable que controla el investigador es el nivel de alcohol y es a la que llamaremos la
variable independiente
Variable Dependiente en un experimento. Es la variable que mide el investigador para
determinar el efecto de la variable independiente
Ejemplos: Del ejemplo anterior, la cantidad de recuerdos que maneja el sujeto de estudio, es
DATO
Cmo te llamas?
Pancho Lpez
A que te dedicas?
Garza asada
Estas casado?
Qu marca es tu auto?
Transam
Como t
o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar las
unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables o atributos que se estn analizando.
Por ejemplo, la tasa de analfabetismo y el acceso al agua potable son indicadores sociales
simples, ya que se refieren a atributos que se puede constatar su presencia o nivel calidad en forma
simple y emprica. Diferente es el caso de un indicador como clase social o prestigio que requieren un
marco conceptual ms complejo al ser un constructo terico ambos y no tiene una equivalencia
emprica concreta. En la composicin de indicadores se debe tener conceptualmente claro lo que
buscamos y no requieren un gran desarrollo matemtico o estadstico.
Por ejemplo: viviendas de un pueblo que no tienen agua potable y expresado en porcentajes.
Argumento: El 59% de las casas del pueblo X no tienen agua potable instalada y hay que traerla
manualmente. Otro ndice seria que no tienen electricidad. Reuniendo varios ndices tenemos un
indicador, por ejemplo de pobreza. Ordenando varios indicadores como uno de pobreza, otro de
analfabetismo, otro de esperanza de vida, tenemos una escala de prioridades a resolver o simplemente
describir. Podemos tomar acciones sobre el analfabetismo enseando a leer y sobre la pobreza
instalando el agua y la electricidad, pero no podemos tomar acciones sobre la esperanza de vida, que
es un valor nominal o ms bien un objetivo a mejorar, por esto los ndices deben ser homogneos con
relacin al propsito de la accin.
La secuencia o la vida de un indicador comienza seleccionando uno o varios que representen a
nuestro entender lo que se quiere investigar. Se ha seleccionado Esperanza de vida al nacer,
Analfabetismo y Nivel de vida (Producto Interno Bruto) y con estos tres indicadores tenemos uno de
Desarrollo Humano para comparar naciones.
Proceso para introducir un indicador: Metodologa en las ciencias sociales.
Seleccionando un tpico.
Definiendo el problema.
Revisando la literatura.
estn en las estadsticas del censo y con los cuales se construyen 10 o 20 indicadores, que han de ser
ordenados finalmente por Prioridades sociales, precisando de una encuesta para este fin.
Los ndices de desarrollo humano y las escalas de prioridades de la calidad de vida, se han
elaborado a nivel mundial por las Naciones Unidas: ndice de Desarrollo Humano, comprenden la
Esperanza de Vida, Tasa de Alfabetizacin, Tasa de Enseanza y Producto Interno Bruto. Los
indicadores de objetivos de desarrollo han catalogado 12 prioridades con sus estadsticas para todos
los pases. El primero es la pobreza y, consecuentemente, el hambre.
El tema de las prioridades sociales como una aplicacin de la metodologa para la poltica
social, establece qu acciones se ejecutarn primero y cuales siguen despus; de acuerdo con un orden
que se preestablece, preguntando a los usuarios o clientes de un plan de desarrollo sobre qu temas
deben ser los primeros en atenderse o asignar ayudas.
Estas prioridades se establecen con los indicadores sociales de desarrollo, tales como: el ndice
de pobreza, medido, por ejemplo, con el coeficiente de Engel o el coste de la canasta bsica o el nivel
de economa autosuficiente. Una vez seleccionada una lista de indicadores necesaria para establecer
los ndices que definen cada indicador. En el ejemplo anterior, el ndice de pobreza pudiera ser
definido por el costo de la alimentacin dividido por los ingresos familiares, esto es, el coeficiente de
Engel. Tambin el porcentaje de hogares sin electricidad o agua permiten medir la pobreza. En este
proceso, se puede proceder con otro indicador, como el nivel de educacin o las facilidades de
asistencia mdica. As terminamos la escala de indicadores que han sido definidos y compuestos con
ndices o porcentajes o promedios, o cualquier medidor. Son sumamente tiles para planificar
objetivos a corto y medio plazo sobre la calidad de vida de la poblacin.
Prioridades sociales cualitativas para reas (indicadores) que se consideran interconectadas y
que vienen estudindose en la ltima dcada.
Economa autosuficiente.
Violencia.
Discriminacin.
Mayores.
Jvenes.
hacerse algn comentario sobre la evolucin del desarrollo en la poblacin ya que existen otras
encuestas durante la ltima dcada. Tambin se pueden tener observaciones de tipo sociolgico sobre
los cambios en la cultura de la poblacin dado que sta y las necesidades definen las prioridades,
opinin cierta en un anlisis funcionalista.
Las viviendas y las personas sin hogar son prioritarias, sin embargo aparecen de manera distinta
en 1995. En ese momento, por ejemplo, no se meda el nmero de personas sin hogar. Los temas
relacionados con salud han sido redefinidos y elevaron su prioridad al primer lugar en 2004. Los dos
ltimos Estrs... y Falta de tiempo... aparecen por primera vez y son indicadores cualitativos. El
indicador Economa... ha sido tambin redefinido. Mayores y Jvenes son fluctuantes, en tanto
Transporte y Desempleo no figuran. Aparecen nuevos indicadores y dejan de usarse otros.
Otras encuestas no gubernamentales, del peridico local y fundaciones, coinciden en
prioridades dentro del rango de las diez posiciones, pero con diferencias. Esta cuestin es interesante.
Niveles de Medicin
Es de suma importancia conocer el nivel de medicin de cada una de las variables con las
cuales estamos trabajando, pues de acuerdo a su forma o nivel de medicin son los procedimientos
estadsticos que podemos emplear. Antes de conocer los tres niveles de medicin es importante tener
claro el significado de la palabra medir, pues generalmente pensamos que una medicin nos va a
significar un valor numrico y no es cierto en todos los casos. Cuando preguntamos a alguien cmo es
el lugar que visit, toda la informacin que nos proporciona para describir el paisaje son medidas que
tomo a travs de las observaciones que realizo utilizando sus cinco sentidos o bien algn instrumento
de medicin. Pues bien podemos entonces definir:
Medir: Es asignar un valor a un fenmeno observado. Los tres Niveles de Medicin son
NOMINAL, ORDINAL Y CARDINAL los cuales vamos a definir y ejemplificar a continuacin.
Nominal. Es asignar un valor a un fenmeno observado utilizando para ello etiquetas que no
indican por si mismas ningn orden jerrquico o distancia entre la posible gama de respuestas.
Algunos ejemplos son: sexo, estado civil, nombre, lugar de origen,...
Ordinal. Es asignar un valor a un fenmeno observado utilizando para ello etiquetas que nos
indican un orden jerrquico pero no distancia.
Algunos ejemplos son: escolaridad, frecuencia con que asistes a los conciertos del auditorio
coca cola, puesto, que tanto te gusta estudiar estadstica,...
Cardinal Es asignar un valor a un fenmeno observado utilizando para ello cantidades
numricas que indican por si mismas un orden jerrquico y distancia.
Algunos ejemplos son: edad, nmero de hijos, ingresos, temperatura,...
Este nivel de medicin se divide en dos categoras, intervalar y de razn, aunque para fines
estadsticos ambos se trataran de igual forma
Intervalar En este caso, el cero es un valor arbitrario, por ejemplo, cuando observamos que la
temperatura ambiental esta en cero grados sabemos que esto nos indica que hace fro y no que haya
ausencia de temperatura. Es un valor arbitrario porque a alguien se le ocurri que cuando se congela el
agua era cero grados centgrados
Razn En este caso, el cero indica ausencia, por ejemplo, cuando alguien nos dice que tiene
cero hermanos, significa que carece de ellos.
Admn. de
empresas
Educacin
400
Humanidades
150
Ciencias Soc.
250
Ciencias
200
Total = n =
50
1050
Tcnicas de seduccin
empleada por los
universitarios
Tcnicas
Embriagar a la
chica
Falsa promesa de
matrimonio
Amor fingido
76
Amenaza de
terminar
Total = n =
17
26
76
Respuestas de los
adolescentes
entrevistados
Frecuencia con
que eres
impuntual
Frecuentemente
55
Ocasionalmente
87
Nunca
23
n
165
195
TIPO DE OCURRENCIA: Se debe informar al lector que tipo de cantidad se est manejando,
por ejemplo si estamos hablando de la asistencia a un concierto en el auditorio coca cola de
Monterrey, podemos manejarlo de alguna de las siguientes formas:
Frecuencia de asistentes
Porcentaje de asistentes
Proporcin de asistentes
f indica frecuencia
%=P x 100
P es la proporcin.
CI
131
119
103
93
108
100
111
130
104
135
113
CI
122
115
103
90
108
114
127
87
127
108
112
CI
100
117
121
105
136
123
108
89
94
139
82
CI
113
110
109
118
115
126
106
108
115
133
114
CI
119
104
147
134
117
119
91
137
101
107
112
CI
121
125
103
89
110
122
123
124
125
115
113
CI
128
85
113
143
80
102
132
96
129
83
142
CI
112
120
107
108
111
100
97
111
131
109
145
CI
93
135
98
142
127
106
110
101
110
116
123
Podemos observar que esta informacin no tiene ni pies ni cabeza, por ello organizarla es
importante a fin de que adquiera algn sentido, al realizar esta tarea estamos generando una
distribucin de frecuencias de los CI de los 110 estudiantes elegidos al azar. Primero tememos que
encontrar el CI ms alto a fin de saber dnde vamos a empezar y el ms bajo para conocer el punto
f
1
1
1
1
1
2
1
1
1
2
1
2
1
2
1
CI
129
128
127
126
125
124
123
122
121
120
119
118
117
116
115
f
1
2
3
1
2
1
3
2
2
1
3
2
2
2
4
CI
114
113
112
111
110
109
108
107
106
105
104
103
102
101
100
f
2
4
3
3
5
2
6
2
2
2
2
3
1
2
4
CI
98
97
96
94
93
91
90
89
87
85
83
82
80
f
1
2
1
1
2
1
1
2
1
2
1
1
1
Como podr observar los datos estn muy dispersos y no existe una tendencia visual clara del
comportamiento de los mismos. En estas condiciones se acostumbra agrupar los datos en intervalos de
clase, para obtener una distribucin de frecuencias de datos agrupados.
Regla para formar una tabla de Distribucin de Frecuencias de Datos Agrupados
Los intervalos de clase (IC) no deben ser tan amplios que se pierda la discriminacin
proporcionada por nuestra medida original, ni tan pequeos que se desvirte el objetivo que se busca
con la agrupacin. En las ciencias sociales es aceptado agrupar los datos utilizando entre 5 y 20
intervalos de clase
Procedimiento:
Paso 1.
Paso 6.
Asigne cada uno de los datos obtenidos a sus apropiados intervalos de clase.
Paso 7.
Lmite real inferior (LRI)= (Lmite inferior + Lmite superior del IC contiguo inferior)/2
LRI
LI LS
2
Lmite real superior (LRS)= (Lmite inferior del IC contiguo superior + Lmite superior)/2
LRS
LI LS
2
Los Puntos Medios, como su nombre lo dice se encuentran a la mitad del camino entre el lmite
superior y el lmite inferior de un IC, sin importar si utilizamos los lmites aparentes o los verdaderos.
Por frmula tenemos:
Punto Medio (x) = (Lmite inferior + Lmite superior)/2
Punto Medio (x) = (Lmite real inferior + Lmite real superior)/2
Tcnicas de Representacin Grfica de Datos
Partes de una Grfica
Parejas
Solteros
Solteras
TITULO DE LA GRAFICA
Es una breve descripcin del tema que se esta tratando, el cual tiene como propsito ubicar al
publico sobre el asunto que se desea abordar.
2.
TIPO DE OCURRENCIA
Se debe informar al lector que tipo de cantidad se est manejando, por ejemplo si estamos
hablando de la asistencia a un concierto en el auditorio coca cola de Monterrey, podemos manejarlo
de alguna de las siguientes formas:
Frecuencia de asistentes
Porcentaje de asistentes
Proporcin de asistentes
3.
ESCALA
4.
SIMBOLOGIA
Representa los grupos que nos interesan comparar respecto a una caracterstica en particular
estas son las variables independientes
5.
MARCO
De preferencia debe enmarcarse la grfica a fin de dar una mejor presentacin, sin embargo
esto es opcional.
Regla de los 3/4
Como es bien sabido las grficas pueden ser empleadas para confundir al lector cuando se
manipulan intencionalmente los ejes o cuando se omite en el eje Y la frecuencia cero, es por ello que
para evitar una anarqua en la tcnica de representacin grfica, es necesario adoptar un convenio
para minimizar la posibilidad de interpretaciones errneas. La mayora de los estadsticos en que la
altura del eje Y debe ser aproximadamente 0.75 de la longitud del eje X, siendo aceptable que esta
proporcin oscile entre 0.7 y 0.8.
Siempre que un grfico lleve ejes coordenados debemos emplear la regla de los . A
continuacin veremos algunos ejemplos de representaciones grficas.
Las grficas que a continuacin vamos a manejar, son empleadas para representar variables
cuyo nivel de medicin es NOMINAL u ORDINAL.
Regla de los
Estado civil de los afiliados al INSEN
60
50
40
30
20
10
0
Estado Civil
Esto significa que el valor del eje Y puede tener cualquier longitud entre 7 y 8 cm. inclusive.
o
El eje X debe ser dividido en partes iguales, cada seccin es utilizada por una barra
Las barras van separadas entre s, ya que los valores que toman (soltero, casado,...) no indican
continuidad y la separacin entre ellas debe ser de igual tamao
Parejas
Solteros
Solteras
1er conc.
2do conc.
3er conc.
4to conc.
El eje X debe ser dividido en partes iguales, cada seccin es utilizada por el grupo de
comparacin
Los grupos de comparacin son separados entre s y la separacin entre ellas debe ser de igual
tamao
Parejas
Frec. 50
40
Solteros
30
20
Solteras
10
0
1er conc.
2do conc.
3er conc.
4to conc.
Regla de los
Se elige en forma arbitraria un valor para el eje X, tomando en cuenta la cantidad de divisiones
en que debe seccionarse ste con el fin de colocar las barras.
Si X= a 20 cm., el valor de Y se obtiene de la siguiente operacin:
Ymin=.7X Ymin=.7 (20 cm)=14 cm.
Yideal=.75 Yideal=.75 (20 cm)=15 cm.
Ymax=.8X Ymax=.8(20 cm) =16 cm
Esto significa que el valor del eje Y puede tener cualquier longitud entre 14 cm. y 16 cm.
inclusive.
Grafica Circular
La grfica que a continuacin vamos a manejar, es empleada para representar variables cuyo
nivel de medicin es NOMINAL u ORDINAL preferentemente, sin embargo con variables CARDINALES
tambin pueden emplearse.
Casado
25%
Viudo
56%
Recordemos que la operacin que nos permite encontrar la abertura de los ngulos que
deseamos manejar esta dada por la siguiente frmula:
Angulo= P x 360=f/N x 360
ngulo
Soltero
22
.11
11
40
Casado
50
.25
25
90
Viudo
112
.56
56
20|
Divorciado
16
.08
29
Total
(N)
f =200
Intervalo de clase
c%
Porcentaje
%
150
154
149.5
154.5
152
110
100
145
149
144.5
149.5
147
108
98
140
144
139.5
144.5
142
106
96
135
139
134.5
139.5
137
103
94
130
134
129.5
134.5
132
98
89
125
129
124.5
129.5
127
91
83
120
124
119.5
124.5
122
82
75
115
119
13
114.5
119.5
117
73
66
12
110
114
17
109.5
114.5
112
60
55
15
105
109
14
104.5
109.5
107
43
39
13
100
104
12
99.5
104.5
102
29
26
11
95
99
94.5
99.5
97
17
15
90
94
89.5
94.5
92
13
12
85
89
84.5
89.5
87
80
84
79.5
84.5
82
Histograma
Polgono de Porcentajes
15
2
14
2
13
2
12
2
11
2
10
2
92
82
18
16
14
12
10
8
6
4
2
0
150
154
149.5
154.5
152
110
145
149
144.5
149.5
147
108
140
144
139.5
144.5
142
106
135
139
134.5
139.5
137
103
130
134
129.5
134.5
132
98
125
129
124.5
129.5
127
91
120
124
119.5
124.5
122
82
115
119
13
114.5
119.5
117
73
110
114
17
109.5
114.5
112
60
105
109
14
104.5
109.5
107
43
100
104
12
99.5
104.5
102
29
95
99
94.5
99.5
97
17
90
94
89.5
94.5
92
13
85
89
84.5
89.5
87
80
84
79.5
84.5
82
La caracterstica de las ojivas es que son curvas que nunca bajan, siempre van en ascenso o por
lo menos permanecen constantes.
Grfica de la Ojiva de la distribucin de frecuencias del ejemplo
Histograma
Intervalo de Clase
Proporcin
Punto Medio
Ojiva
Distribucin de
Frecuencias
Regla de los
Polgono
Tabla
Frecuencia
Grafica Circular
Porcentaje
Porcentaje acumulado
Tcnicas de
Representacin grfica
Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal y cardinal).
La moda tiene la ventaja de no ser afectada por valores extremos.
Puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cual
es el valor representativo de la serie de datos?
El nivel de medicin de
(e)
Tcnicas de
seduccin
(f)
(g)
Frecuencia con
que eres
impuntual
Clase Social
f
Admn. de
empresas
400
Embriagar a
la chica
76
Frecuentemente
55
Alta
Educacin
50
Falsa promesa de
matrimonio
26
Ocasionalmente
87
Media
49
Humanidades
150
Amor fingido
76
Nunca
23
Baja
46
Ciencias Soc.
250
Amenaza de
terminar
17
Marginal
12
Ciencias
200
Solucin:
Para el inciso (d) el rea acadmica (dato) que aparece ms frecuentemente es
Admn. de empresas, por lo tanto el rea acadmica promedio segn la Mo es
Admn. de empresas
El nivel de medicin de
estos datos es:
Nominal y Ordinal
(h)
I. C.
95 - 99
97
90 - 94
92
85 - 89
12
87
80 - 84
15
82
75 -79
12
77
70 -74
72
65 - 69
67
60 - 64
62
Solucin:
Para el inciso (h) el intervalo de clase que aparece ms frecuentemente es (80 84), el punto medio
(x) de ese intervalo es (80+84)/2=82, por lo tanto el promedio segn la Mo es 82
Ejemplo: Calcular las modas de las siguientes distribuciones de frecuencia
I. C.
95 - 99
97
(Bimodal)
90 - 94
92
85 - 89
87
80 - 84
75 -79
I. C.
95 - 99
90 - 94
85 - 89
82
80 - 84
77
75 -79
70 -74
72
70 -74
65 - 69
67
Moda=(67+62)/2
65 - 69
60 - 64
62
Moda = 65
60 - 64
Moda= 87
Representacin Grfica
Polgono de Frecuencias Distribucin Bimodal
8-
No hay moda
La Mediana (Mdn)
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, el
valor central que puede dar una mejor descripcin de los datos, es el obtenido mediante la
l
medida de tendencia central llamada mediana.
l
Definicin:
Es el dato que aparece al centro de una lista de datos o distribucin de frecuencias siempre y
cuando stos (los datos) estn ordenados en forma ascendente o descendente
Propiedades de la mediana
Hay slo una mediana en una serie de datos.
No es afectada por los valores extremos ( altos o bajos )
Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se
encuentra en el intervalo abierto.
Puede ser calculada en distribuciones con escala cardinal, y ordinal.
Ejemplo:
Obtenga la mediana para cada uno de los siguientes conjuntos de medidas
a. 20, 18, 15, 18, 13, 15, 15, 15, 20
b. 12, 18, 15, 14, 17, 18, 11, 18, 14, 12
c. 129, 15, 15, 15,14, 13, 13, 12, 11
Cuando N es impar
Cuando N es par
N 1
2
Centro 1
Centro 2
N
2
N
1
2
a). x
20
b).
Mdn = 15
c). x
18
129
20
18
Mdn = (14+15)/2
15
18
18
Mdn =14.5
15
18
17
Mdn = 14
5 posicin
15
5 posicin
14
15
14
6 posicin
13
15
14
13
15
12
12
13
12
11
15
5 posicin
15
11
(d)
rea
acadmica
(e)
Tcnicas de
seduccin
(f )
Frecuencia con
que eres
impuntual
Admn. de
empresas
400
Embriagar a la
chica
76
Frecuentemente
55
Educacin
50
Falsa promesa
de matrimonio
26
Ocasionalmente
87
Humanidades
Ciencias
Sociales
Ciencias
150
76
Nunca
23
17
Total
N=165
250
200
Amor fingido
Amenaza de
terminar
N 1
165 1
2
se ve a continuacin
Frecuencia con
que eres
impuntual
Frecuentemente
fa
55
165
Hasta aqu ya se han ocupado
110 lugares, por lo tanto ya se ocupo
Ocasionalmente
87
110
Nunca
23
23
el lugar 83
Total
N=165
f
5
9
12
15
12
9
4
3
N=69
(h)
I. C.
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Total
f
38
52
43
7
10
15
8
7
N=180
Solucin (g)
En el inciso (g) el valor de N es 69, como es un valor impar solo existe un lugar al centro y se
localiza utilizando la frmula
N 1
2
ve a continuacin
69 1
2
I. C.
95 - 99
90 - 94
85 - 89
12
80 - 84
15
43
de frecuencias
75 -79
12
28
28 es la fa dentro de la frmula
70 -74
16
65 - 69
60 - 64
Total
N=69
i(
Mdn LRI
f a )
Nota:
La frmula se aplica utilizando el intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados
Donde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=79.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=69
fa
es la frecuencia acumulada del intervalo de clase contiguo inferior. Para ste ejemplo fa
= 28
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=15
El procedimiento queda como sigue:
Paso 2.
Paso 3.
i(
f a )
Paso 4.
= 32.5/15 = 2.167
i(
Mdn LRI
Paso 5.
f a )
Solucin (h)
En el inciso (h) el valor de N es 180, como es un valor par existen dos lugares al centro y se
localizan utilizando las formulas:
Centro 1= N =
2
Centro 2= N
2
180
2
1=
= 90
90 + 1= 91
95 - 99
38
fa
Aqu nos pasamos por primera vez de 91, el centro que nos faltaba encontrar, por lo tanto la Mdn
es un valor que oscila entre 89.5 y 94.5 que son los lmites reales del intervalo de clase que se
90 - 94
52
142
85 - 89
43
90
80 - 84
47
75 -79
10
40
70 -74
15
30
65 - 69
15
60 - 64
Total
fa
fa
N=180
i(
Mdn LRI
f a )
Nota:
La frmula se aplica utilizando el intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados, en este caso como los centros caen en diferentes intervalos de clase
se elige uno de ellos, cualesquiera, el resultado de la Mdn es el mismo, y si observamos con
detenimiento el nico valor que puede tener la Mdn en esta situacin es el valor del LMITE REAL
que es comn a ambos intervalos de clase.
A fin de demostrarlo calcularemos la Mdn en ambos intervalos
Clculo de la Mediana utilizando el intervalo de clase ( 85 89 )
Donde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=84.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=180
fa
Paso 2.
N/2- fa = 90-47= 43
Paso 3.
i(
Paso 4.
f a )
= 215/43 = 5
i(
Paso 5.
Mdn LRI
f a )
= 84.5 + 5 = 89.5
Mdn = 89.5
es la frecuencia acumulada del intervalo de clase contiguo inferior. Para ste ejemplo fa
= 90
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=52
El procedimiento queda como sigue:
Paso 1. N/2 = 180/2 =90
Paso 2. N/2- fa = 90-90= 0
Paso 3. i(N/2- fa) = 5 (0) = 0
i(
Paso 4.
f a )
= 0/52 = 0
i(
Paso 5. Mdn LRI
f a )
= 89.5 + 0 = 89.5
Mdn = 89.5
La Media aritmtica ( )
La medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente
abreviada como media
Definicin
Es el punto de equilibrio de una lista de datos o distribucin de frecuencias.
Propiedades de la media aritmtica
Puede ser calculada en distribuciones con escala cardinal
x
n
Donde
Donde:
x
N
Dnde:
fx
n
fx
Ejemplos:
Obtenga la media para cada una de las siguientes tablas de distribuciones de frecuencias
(d)
(e)
rea acadmica
Tcnicas de
seduccin
Embriagar a la
chica
Falsa promesa
de matrimonio
Amor fingido
f
Admn. de
empresas
Educacin
400
50
Humanidades
(f )
76
26
Ocasionalmente
87
76
Nunca
23
f
55
150
Ciencias Soc.
Amenaza de
terminar
250
17
Ciencias
200
Solucin:
En los incisos d y e se trata de valores NOMINALES y el inciso f maneja valores ORDINALES,
como puede observarse, ste tipo de valores no se pueden sumar por lo cual el promedio Media es
imposible de obtener.
Obtenga la media para cada una de las siguientes tablas de distribuciones de frecuencias
(g)
Cuntos
hermanos
tienes?
6
5
4
3
2
1
0
(h)
I. C.
5
9
12
15
12
9
4
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
5
9
12
15
12
9
4
3
Solucin: Los incisos g y h son distribuciones de frecuencias por lo que se aplica la frmula
fx
X
n
Cuantos hnos.
tienes?
6
5
4
3
2
1
0
Totales
fx
5
30
9
45
12
48
15
45
12
24
9
9
4
0
N= 66 fx=201
= fx = 201/66 = 3.05
N
Basndonos en este resultado podemos concluir entonces que en promedio segn lo indica la
media, la poblacin entrevistada cuenta con 3 hermanos.
Calificaciones
I. C.
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Totales
f
5
9
12
15
12
9
4
3
N= 69
PM
x
97
92
87
82
77
72
67
62
fx
485
828
1044
1230
924
648
268
186
fx=5613
= fx = 5613 / 69 = 81.35
N
Basndonos en este resultado podemos concluir entonces que la poblacin entrevistada segn
lo indica la media obtuvo en promedio una calificacin de 81.35.
Curva Normal
Leptocrtica
Mo
Mdn
Mesocrtica
Platicrtica
Mo
Mdn
Mo
Mdn
Curva Bimodal
Silla de montar
Curva U
Mo
Mo Mdn Mo
Mdn
Mo
Curva Sesgada
Sesgo Positivo
Mdn
Sesgo Negativo
Mdn
NIVEL DE
MEDICION
MEDIDA DE
TENDENCIA
CENTRAL
MODA
Mo
MEDIANA
Mdn
MEDIA
N OMINAL
Siempre
ORDINAL
CARDIN AL
bimodal
Debido a que los datos
nominales no se pueden
ordenar
el
promedio
Mediana no se
puede
obtener
Debido a que los datos
nominales no se pueden
sumar el promedio Media
no se puede obtener
unimodal
Mdn >
Las medidas de dispersin en conjunto con las medidas de tendencia central son de
gran ayuda para entender mejor cmo se comporta una variable dentro de una poblacin, y
es de mayor envergadura cuando las utilizamos para comparar una variable en dos o ms
poblaciones distintas.
Cundo nos pueden ayudar estos estadgrafos, para qu sirven?
Pues bien, imagine que usted es un millonario y despilfarrador extranjero que visita
por primera vez nuestro pas, llega a la ciudad de Acapulco. Y aunque todo lo que
experimenta en este viaje le gusta, su clima es lo que ms le cautiv. Ahora imagine que
alguien le comenta que el desierto de Sonora tiene en promedio los mismos grados de
temperatura que la ciudad de Acapulco. Si usted no tuviera conocimientos de estadstica y
siendo extranjero, podra pensar que ambas regiones tienen el mismo clima y como tiene
mucho $$$, lo ms probable es que con el equipaje con que lleg a Acapulco, (que es el
adecuado para esa ciudad) se dirija al desierto de Sonora.
Si esto ocurriera, Qu pasara?, Lo ms seguro es que se afectara su salud al
experimentar tantos cambios tan bruscos de temperatura y sin la proteccin adecuada.
Como puede verse en las grficas de abajo, en Acapulco las temperaturas oscilan entre 28C
y 32C, mientras que en el desierto de Sonora la fluctuacin va de los 0C a los 60C
Acapulco
Desierto de Sonora
28C
32C
=30C
0C
60C
= 30C
Las medidas de dispersin indican precisamente, como su nombre lo dice, que tan
dispersos, valga la redundancia, o que tan compactos son los valores que se manejan. Esto
significa que entre mayor sea el resultado obtenido mayor es tambin la dispersin de los
datos
Considerando las grficas de temperatura, podemos observar que para Acapulco el rango de
temperatura es:
R =Max-Min = 32-28 = 4C
Mientras que para el desierto de Sonora el rango es:
R =Max-Min = 60-0 = 60C
Como se puede observar, el rango es mayor cuando los datos estn ms dispersos. Esta es la
idea central en la interpretacin de cualquiera de las medidas de dispersin que se calcule.
Existen muchos diferentes estadgrafos utilizados para medir la dispersin de los datos, pero en
este curso solo vamos a manejar el clculo de Rango, Varianza y Desviacin estndar.
x2
2
N
x 2
2
Desviacin estndar = s
Ejemplo:
x
20
20
18
18
15
15
15
15
13
x=149
x
400
400
324
324
225
225
225
225
169
2
x =2517
N=9
s2
2
s=
2517
16.562 279.67 274.23 5.44
9
2
s = 5.44
x 2
2
=
N
= x = 149 / 9 =
16.56
s = 2.33
x2
2
5.44 = 2.33
fx 2
2
N
fx 2
2
Desviacin estndar = s
Cuantos
hermanos
tienes ?
6
5
4
3
2
1
0
Totales
(fx)(x)
f
fx
fx
5
9
12
15
12
9
4
180
225
192
135
24
9
0
N=66 fx=201
fx =765
= fx = 201/66 = 3.05
N
30
45
48
45
24
9
0
2
Rango = R = 6-0 = 6
s2
s2 = 2.3
fx 2
2
= (765 / 66) 3.05 2 = 11.6 9.3 = 2.3
N
fx 2
2
=
N
2.3 = 1.51
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Totales
5
9
12
15
12
9
4
3
N= 69
PM
x
97
92
87
82
77
72
67
62
= fx = 5613 / 69 = 81.35
N
(fx)(x)
fx
485
828
1044
1230
924
648
268
186
fx=5613
fx
47045
76176
90828
100860
71148
46656
17956
11532
2
fx = 462201
s2
fx 2
2
= (462201 / 69) 81.35
N
fx 2
2
= 80.7 = 8.99
N
PM
Calificaciones
I. C.
95 - 99
90 - 94
85 - 89
80 - 84
75 -79
70 -74
65 - 69
60 - 64
Totales
5
9
12
15
12
9
4
3
N= 69
x
97
92
87
82
77
72
67
62
Rango = R = 99 - 60 = 39
(fx)(x)
fx
485
828
1044
1230
924
648
268
186
fx=5613
fx
47045
76176
90828
100860
71148
46656
17956
11532
2
fx = 462201
s2
fx 2
2
= (462201 / 69) 81.35
N
fx 2
2
= 80.7 = 8.99
N
= fx = 5613 / 69 = 81.35
N
MUESTRA
POBLACIN
calificaci n media
desviacin _ std
xx
s
Si interesa interpretar una calificacin de 97, y se sabe que la media y la desviacin estndar
son 81 y 9, respectivamente, se obtendr que
97 81
1.78
9
1.78 SD
63
72
81
90
99
2.1.2
Mtodos de muestreo
2.1.2.1
Muestreo aleatorio
2.1.2.2
Muestreo no aleatorio
2.1.3
Error de muestreo
2.2.2
2.2.3
Intervalos de confianza
2.2.4
Estimacin de proporciones
Las Actividades de aprendizaje que deben ser cubiertas por el alumno son:
Presentaciones por parte del profesor en el aula
Resolucin de problemas de forma individual y por equipo
Realizar bsquedas en Internet para localizar algunos reportes en lnea de
investigaciones sociales que utilizaron Muestreo aleatorio y no aleatorio
Consulta y anlisis de libros y publicaciones
Uso del paquete SPSS como apoyo tecnolgico
45
Una parte de algo es una fraccin que ha sido tomada de acuerdo con una cierta
regla o criterio, que no siendo un criterio cientfico no necesariamente representa la
totalidad de ese algo.
La nica forma de evitar que al seleccionar una parte de algo se caiga en una
eleccin no representativa, es hacindolo de forma cientfica. Siendo el algo
desconocido, esta eleccin debe hacerse de manera aleatoria. Una muestra es
una parte de algo, tomada aleatoriamente, con lo que se garantiza que es
representativa de ese algo. Esto no slo se acepta en la ciencia, sino que provee
de una teora que permite cuantificar la representatividad.
Tomemos como ejemplo una imagen, la cual slo se deja ver a travs un rea
pequea (la cantidad de rea descubierta es la misma en las dos primeras imgenes)
46
muestreo, ya que el investigador incluye solo aquellos casos que le convienen y excluye los
inconvenientes. Por ejemplo, se seleccionan para la muestra nicamente los estudiantes del
maestro investigador.
que interesen en la investigacin, tales como edad, sexo, clase social o escolaridad,... son
muestreadas de acuerdo al porcentaje que ocupan en la poblacin. Por ejemplo,
supongamos que se nos pidiera obtener una muestra de estudiantes de la U.A.N.L. donde
se sabe que la poblacin de universitarios esta compuesta en un 42% de hombres y un 58%
de mujeres. Utilizando este mtodo de muestreo, se da a los entrevistadores una cuota de
estudiantes para localizar, de manera tal que en la muestra un 42% sean hombres y un 58%
se componga de mujeres.
seleccionar la muestra que represente a la poblacin de estudio. Por ejemplo, para obtener
una muestra de juicio que refleje los motivos por los cuales los automovilistas se vuelven
agresivos al conducir, podemos, a nivel intuitivo escoger la muestra seleccionando a un
grupo de ecotaxistas debido a que este grupo de automovilistas parecen reflejar la mayora
de los sntomas de agresividad.
48
Muestreo Simple
Si queremos elegir una muestra formada por 40 elementos de una poblacin de 600
Muestreo Sistemtico
Es anlogo al anterior, aunque resulta ms cmoda la eleccin de los elementos. Si
600
40 , este resultado nos indica que se pueden formar con los 600 elementos de la
poblacin 40 grupos de 15 elementos cada uno. Se elige un elemento de salida entre los 15
primeros, y suponiendo que sea el k-simo, el resto de los elementos sern los k-simos de
cada grupo. En concreto, si el elemento de partida es el nmero 6, los
Muestreo Estratificado
A veces nos interesa, cuando las poblaciones son muy grandes, dividir stas en
G
rado
Secundaria
Secundaria
Secundaria
545
450
460
330
215
27%
22%
23%
17%
11%
Prepa
2
Prepa
antidad
%
Y deseamos tomar una muestra de 100 alumnos para analizar la incidencia del
tabaco en la adolescencia, bastara tomar un nmero igual de alumnos de cada estrato, es
decir 25.
Si embargo, si lo que se quiere es hacer una encuesta para conocer la opinin que
tiene el alumnado sobre una medida que ha tomado el Consejo Escolar, es ms
representativo elegir de cada estrato, y en nmero proporcional a su tamao, los elementos
que compondrn la muestra. Si 1 de secundaria representa al 27% del alumnado, entonces
el 27% de la muestra (es decir 27 alumnos) se elegirn de este estrato usando muestreo
aleatorio simple, 22 para 2 de secundaria, y as hasta completar los 100 elementos de la
muestra.
ciertos conglomerados (que pueden ser bloques de viviendas, municipios, urnas electorales,
... ) y dentro de ellos se realiza el muestreo aleatorio.
50
ys
rara vez ser exactamente igual a . Esta diferencia, conocida como error de muestreo
resulta sin importar que tan bien se haya diseado y realizado el plan de muestreo.
Dada la presencia del error de muestreo, el estudiante se ha de preguntar cmo es
posible generalizar siempre a partir de una muestra sobre una poblacin.
El teorema central del lmite (TCL)
Imagina que tienes una poblacin con media
aleatoriamente todas las posibles muestras, todas ellas de tamao n. Si obtuvieras las
medias de todas estas muestras, y las consideras una distribucin de datos (la distribucin
muestral de medias), comprobaras que:
a)
b)
51
s
n 1
c)
La desviacin tpica (d.t.) de la media
s
n 1 , es el grado de variabilidad
Cuanto menor sea, ms ajustadas a la media de la poblacin sern las medias que
obtengamos de una muestra. De su propia definicin, es fcil darse cuenta de que cuanto
mayor es el tamao de la muestra, menor es este grado de variabilidad, y por tanto ms
similar a la media de la poblacin ser la media obtenida de la muestra.
Estimacin
Llamaremos as al procedimiento utilizado cuando se quiere conocer las
caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra.
Durante esta unidad aprenderemos a realizar estimaciones sobre la media y la
proporcin de una caracterstica en una poblacin. La estimacin de otros parmetros
poblacionales, tales como la desviacin tpica, quedar fuera de nuestro estudio.
52
14,000 20,000
2.31
2,600
53
dnde:
.Por frmula:
s
n 1
s
2.5
2.5
0.83
3
n 1
10 1
Con la ayuda del error estndar de la media, podemos encontrar el rango de valores
de la media dentro del cual es probable que flucte la verdadera media poblacional y
podemos tambin estimar la probabilidad de que nuestra media poblacional caiga realmente
dentro de este rango de valores medios. Este es el concepto de Intervalo de confianza.
INTERVALO DE CONFIANZA
Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel
de confianza especfico, por frmula se denota:
intervalo de confianza del m% =
z m%
NIVEL DE CONFIANZA
Probabilidad de que el parmetro a estimar se encuentre en el intervalo de
confianza. Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y
99.9%
54
z 95%
= 14000 (1.96)(2,000)
= 14000 (1.96)(2,000)
= 14000 3920 14000 3920
intervalo de confianza
= (10080;17920)
del 95%
El error de estimacin mximo es (1.96)
z m% =
95%
Conclusin: Tenemos una confianza de 95% al suponer que la verdadera media
poblacional oscila entre los $10,0801 y los $17,920
Basados en este resultado, en el reporte de investigacin puedes redactar algo
parecido a estos ejemplos:
Estimamos con una confianza del 95% que el salario mensual medio de los
egresados universitarios es de $14,000 con un error mximo de estimacin de
$3,920
Podemos afirmar con una certeza de 95%, que el salario mensual medio de los
egresados universitarios es de $14,000 con una fluctuacin mxima de $3,920.
(x)
55
X2
25
16
16
9
9
4
4
4
1
1
x
5
4
4
3
3
2
2
2
1
1
27
Pasos a seguir:
1. Encontrar la media de la muestra x
89
pbilateral =0.95
punilateral =
= 0.475
z 95% 2.7 (1.96)(.42) 2.7 .82 2.7 .82 2.7 .82 1.88 3.52
=
=
=
=
intervalo de confianza del 95%= 1.88 3.52
56
p(1 p)
N
p
Dnde:
Ejemplo ilustrativo:
p(1 p)
(.45)(.55)
.2475
.002475 0.05
N
100
100
p z 95% p
= .45 (1.96)(.05)
= .45 0.98
= .45 0.98 .45 0.98
intervalo de confianza
= .35 .55
del 95%
Podemos afirmar con una certeza de 95%, que el 45% ( 9.8%) de la poblacin de
estudiantes universitarios est a favor de que se exija un segundo idioma para
obtener su ttulo universitario
58
1. Marco de muestreo
2. Tipos de variables
El instrumento a utilizarse para obtener informacin debe probarse en una encuesta piloto
siguiendo las reglas adecuadas de seleccin al azar.
4. Precisin y confianza para determinar tamaos de muestra
Para decidir el tamao de la muestra de una poblacin, se deben llevar a cabo las
siguientes consideraciones:
El tamao de la muestra se determina de tal manera que se garantice con
una probabilidad alta que el estimador (resultado de la muestra) no difiera del
parmetro (resultado que se obtendra de trabajar con la poblacin)
por
59
De lo anterior concluimos que si en el estudio se tiene inters por estimar varios parmetros
se calcula un tamao de muestra para cada uno de ellos, eligiendo el ms grande de los
tamaos de muestra obtenidos.
5. Significancia estadstica comparada con significancia prctica
Es importante reconocer que la significancia estadstica" de un efecto no tiene nada que
ver con su significancia prctica" o importancia". La significancia estadstica se basa
nicamente en las leyes de la probabilidad; un efecto estadsticamente importante es
simplemente aquel que es "raro" si la hiptesis nula es verdadera. Como lo indican los
comentarios de las unidades anteriores, la significancia estadstica de un efecto es en gran
medida una funcin de tamao de la muestra; dada una muestra suficientemente grande,
cualquier diferencia sin importar el tamao , puede declararse "estadsticamente
significante". El tamao de una diferencia "significante en el aspecto prctico" debe
determinarse sin recurrir a consideraciones estrictamente estadsticas, y la respuesta puede
variar con cada investigador. Sin embargo, una vez que se define el tamao de una
diferencia "significante en el aspecto prctico podemos utilizar esta definicin para
determinar el tamao de la muestra que asegure un poder adecuado al detectar las
diferencias reales de ese tamao o mayores.
Por ejemplo: Si se desea que las diferencias de las proporciones de todos los egresados de
la Fac. de Trabajo Social que opinan que si volveran a estudiar en la misma institucin y
la muestra de egresados de sta, no difieran por ms de 0.05, se dice que se desea hacer
una estimacin con una precisin de 0.05 o menor.
60
El siguiente paso es especificar el nivel de confianza para dicha precisin, esto es, la
probabilidad con que se espera que se cumpla que el parmetro y el estimador difieran por
menos de la precisin deseada. Con el fin de que no crezca mucho el tamao de la muestra
se sugiere usar una confianza del 90%.
Por formula:
donde:
n tamao de muestra
N tamao de la poblacin
Np (1 p)
( N 1) B 2
p(1 p)
2
z conf
B precisin
2
z conf
valor de z de la distribucin
normal
p proporcin de la informacin que de
la variable nos interesa
Problemas ilustrativos
Solucin:
Se busca en la tabla 1 con los valores ms prximos hacia arriba de N y p ya que los
valores exactos no aparecen en la tabla. Los ms cercanos son N=300 y p = 0.25, esto
produce un tamao de muestra n=78
61
Ns 2
NB 2
s2
2
z conf
Aclarando que, para utilizar esta ecuacin debe ser conocido el valor de desviacin
estndar (de la prueba piloto).
N
2
ND
1
2
z conf
D 300
62
2000
0.15
63
Objetivos
Conocer el proceso para contrastar hiptesis y su relacin con el mtodo cientfico.
Diferenciar entre hiptesis nula y alternativa
Conocer los conceptos
Nivel de significacin
Significacin
Tipos de error
Cuantificacin del error
Tomar decisiones basados en los criterios anteriores
Conocimientos de la unidad y
contenido
Se examinar el proceso de contrastacin o prueba de hiptesis
1
Contrastacin de Hiptesis
1.1
1.2
1.3
Nivel de significacin
1.4
Significacin
1.5
Diseo Experimental
2.1
2.2
Objetivo
2.3
Clasificacin
3.2
Contrastacin de Hiptesis
Las Hiptesis y su Relacin con el Mtodo Cientfico.
La investigacin cientfica es un proceso de bsqueda continua de nuevo
conocimiento. Cuando la observacin de datos o conocimientos ya adquiridos provocan una
duda da origen a un problema de investigacin. Una vez que se tiene conciencia del
problema de investigacin, ste se divide en subproblemas y se integran suficientes datos
preliminares que permitan plantear hiptesis de investigacin. Se contina con la bsqueda
de evidencia emprica y una vez que se han conseguido los datos se procede a su anlisis e
interpretacin. Si la hiptesis es soportada por la evidencia emprica se llega a la solucin
del problema y se concluye el ciclo de la investigacin (Leedy & Ormrod, 2009). En resumen,
el mtodo cientfico es el conjunto de procedimientos que siguen las diferentes ciencias
para contrastar las hiptesis formuladas (Moreno Villa, 2003).
Qu son las Hiptesis?
Son suposiciones o conjeturas acerca de determinados hechos. Esto significa que la
hiptesis es una verdad provisional y nunca definitiva (Rodrguez Moguel, 2005).
Importancia de las Hiptesis en la Investigacin Cientfica.
Las hiptesis han sido valiosas guas para la formulacin de teoras cientficas. Dentro
del mtodo cientfico las hiptesis son el hilo conductor del proceso de investigacin,
indican lo que andamos buscando. De hecho, hasta cuando una hiptesis resulta falsa es til
para el investigador. Si la hiptesis no puede probarse, sta es reemplazada por otra que
debe verificarse nuevamente y, vuelve a empezar el ciclo de verificacin experimental. De
ah que la nueva hiptesis sirve como instrumento para avanzar en el conocimiento
cientfico (Rodrguez Moguel, 2005).
Tipos de Hiptesis Planteadas en una Investigacin.
En una investigacin se establecen dos tipos de hiptesis,
La metodolgica de investigacin y
Variable: Gnero
Relacin: son
Tambin conocidas como Hiptesis Explicativas. Pretenden encontrar la relacin causaefecto de los fenmenos. Ejemplo: Mientras ms entren a clase los estudiantes de la FTS y
DH mejores sern sus calificaciones
Se llaman as porque cuando una variable cambia la otra se modifica sin que exista una
relacin de causa-efecto. Ejemplo: Cunto ms crece la inseguridad menos confianza tiene
la sociedad civil en los gobernantes.
usa el smbolo H0 para denotar la hiptesis nula. Por otra parte, la Hiptesis alternativa es la
hiptesis que se establece como alternativa de la hiptesis nula; si la H0 es rechazada,
entonces ser la hiptesis alternativa la que se tomar tentativamente como vlida. La
metodologa de prueba de hiptesis gira en torno a poder rechazar la H0.
Hiptesis nula
Hiptesis alternativa
Smbolo Ho
Smbolo Ha
Modifica
igual
66
Revisemos una situacin hipottica para ejemplificar los principales elementos que se
relacionan en la tcnica de contraste de hiptesis.
Te aseguro que me
dijeron que tenan 49
aos en promedio.
Pues se ven
MUUUUY jvenes
Voy a investigar
La diferencia entre lo
que me dijeron y lo
que encontraste es
muy grande
Problema de
investigacin
Bsqueda de
evidencia
emprica
Anlisis y toma
de decisiones
Te lo
dije !
25 aos
67
Ho: = 49 aos
y se establece su opuesto:
Razonamiento bsico en el contraste de hiptesis
68
Nivel de significacin
69
Curva normal. La curva normal tambin llamada curva de probabilidad es til para
comprender el contraste de hiptesis, por ello vamos a
recordarla.
Suponiendo que la Ho: = 49 aos es cierta y a partir
de la muestra se estim el parmetro
resultando de 10
buscamos en la
70
aos.
Sobre p
Es conocido tras realizar el experimento
Conocido p sabemos todo sobre el
resultado del experimento
Tipos de Error
Riesgos al tomar decisiones. Al utilizar un estadstico de muestra para tomar
decisiones sobre el parmetro poblacional, existe el riesgo de llegar a una conclusin
equivocada. Cuando se aplica la metodologa de prueba de hiptesis existen dos tipos de
errores que se pueden cometer al tomar decisiones.
I.
II.
Se conserva Ho
Se rechaza
Ho
No hay error
Error I
Por error del azar se rechaz la Ho
La probabilidad de que esto ocurra
es
Ho Falsa
Error II
Por error del azar NO se
rechaz la Ho
La probabilidad de que esto
ocurra es
No hay error
71
Error de tipo I
El acusado es inocente pero se
decide que es culpable.
Probabilidad
H1: Hiptesis
alternativa
Es culpable
No debera ser aceptada sin una
gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior
Error de tipo II
El acusado es culpable pero no lo
probamos.
Probabilidad
72
Diseos experimentales
El concepto de diseo se utiliza en varias etapas de la investigacin cientfica. Se
emplea tanto en aspectos tcnico-metodolgicos como en aspectos estadstico-analticos. El
diseo experimental que se refiera al anlisis estadstico es el de nuestro inters y es el
concepto que intentaremos comprender.
Definicin de diseo experimental: Es un plan de investigacin mediante el cul se
intenta contrastar el efecto causal de por lo menos una variable manipulada por el
investigador (Variable Independiente), en el cual se determina el procedimiento de
asignacin de los sujetos a los distintos niveles de tratamiento y la seleccin de la tcnica de
anlisis ms adecuada.
Objetivo: Detectar la influencia que ejerce(n) la(s) variable(s) independientes sobre
la(s) dependiente(s).
Los diseos experimentales se clacifican de muchas maneras, para efectos de este
curso mostraremos solo dos de esas clasificaciones.
Clasificacin segn el suministro de tratamientoexperimental:
Diseo intergrupos: Tambin conocidas como muestras independientes
Diseo intrasujetos o medidas repetidas: Tambin conocidas como muestras
pareadas o correlacionadas
Diseos mixtos (solo este rengln NO FORMA PARTE DEL CURSO)
Clasificacin estadstica:
Diseos paramtricos
Diseos no paramtricos
73
74
Procedimiento:
Durante los dos primeros das, los
pacientes se acostumbran al hospital.
Al tercer da, la mitad de los enfermos
reciben una pldora con una forma
sinttica del ingrediente activo de la
mariguana, THC, antes de cada
comida.
Al sexto da, se cambia esta pldora por un placebo antes de cada comida. La otra
mitad los pacientes son tratados de igual manera que en la condicin experimental,
excepto que reciben las pldoras en orden inverso, es decir, el placebo al tercer da y
las pldoras en el sexto da.
Condicin experimental
Pldora THC
Alimento ingerido nmero
(caloras)
Condicin de control
Pldora placebo
Alimento ingerido (caloras)
Diferencias
(caloras)
1
2
3
4
5
6
7
8
9
10
1325
1350
1248
1087
1047
943
1118
908
1084
1088
1012
1275
950
840
942
860
1154
763
920
876
+ 313
+ 75
+ 298
+ 247
+ 105
+ 83
- 36
+ 145
+ 164
+ 212
En t r ad a d e l a Tab l a
N
N mer o d e
ev en t o s
P = 0 .5 0
0.0098
10
0.001
10
0.05 Se rechaza Ho
77
Objetivos
Conocer el proceso para contrastar hiptesis utilizando la prueba paramtrica t-Student.
Diferenciar entre diseos experimentales de medidas repetidas, independientes con n
igual y con n diferentes
Seleccionar el diseo ms adecuado
Tomar decisiones basados en los criterios anteriores
Conocer el proceso para contrastar hiptesis utilizando la prueba paramtrica r de
Pearson.
Diferenciar entre variable dependiente e independiente
Tomar decisiones
Conocimientos de la unidad y
contenido
Prueba de Hiptesis Paramtricas
Aplicar pruebas paramtricas y analizar los resultados para decidir acerca de
las hiptesis. Se examinarn diferentes diseos experimentales y en base al diseo
se utilizar el procedimiento estadstico adecuado para realizar las pruebas de
hiptesis paramtricas.
4. Prueba t de Student
4.1 Conceptos Bsicos
4.2 Diseo Experimental de Grupos Relacionados
4.3 Diseo Experimental de Grupos Independientes
5. Correlacin
5.1 Definicin
5.2 Requisitos Para el uso de la r de Pearson
5.3 Direccin y Fuerza
5.4 Tipos de Correlacin
5.5 Valor de Correlacin
5.6 Interpretacin del coeficiente de determinacin
78
Conceptos Bsicos
Pruebas Paramtricas
Se llaman as porque su clculo implica una estimacin de los parmetros de la
poblacin con base en muestras estadsticas.
Notas para recordar:
Hiptesis Estadstica. Es una proposicin sobre los parmetros de una o ms
poblaciones. Ms formalmente, una hiptesis estadstica es una proposicin sobre la
distribucin de probabilidad de una variable aleatoria. Siempre son proposiciones
sobre la poblacin, no sobre la muestra. Son conjeturas que se hacen antes de empezar
el muestreo.
Etapas en la Prueba de Hiptesis
1. Evaluar los datos.
2. Revisar las suposiciones (normalidad de la distribucin).
3. Formular las hiptesis estadsticas (nula y alternativa).
4. Seleccionar la prueba estadstica.
5. Formular la regla de decisin.
6. Calcular la estadstica de prueba.
7. Formular la decisin estadstica (rechazar o no H0).
8. Conclusin.
9. Valor p
Caractersticas que se supone deben cumplirse para utilizar el procedimiento
paramtrico de contraste de hiptesis:
Que las varianzas de los grupos que se comparan en una variable dependiente
Nota: Este requisito puede ignorarse cuando tratamos con muestras relacionadas
(medidas repetidas) sin gran riesgo de distorsionar nuestro resultado. Para muestras no
relacionadas necesitamos ser ms cuidadosos cuando los tamaos de las muestras sean
bastante diferentes.
79
Y que la variable dependiente est medida en una escala que sea Cardinal
Ms poder de eficiencia.
Ms complicadas de calcular.
80
t de Student
Comnmente hacemos generalizaciones respecto de los diferentes grupos que
forman la poblacin. Por ejemplo: Los hombres son ms fuertes que las mujeres, las
mujeres son ms inteligentes que los
hombres,
As, continuamente nos la
pasamos afirmando que la media de
una muestra es ms grande, ms
fuerte y/o ms difcil que otra. No
obstante debemos comprobar si
efectivamente se dan estas diferencias.
Para examinar cuan significativas son estas diferencias emplearemos el
estadstico t de Student
Qu es la prueba t de Student?
Es una prueba estadstica para evaluar si dos grupos difieren entre si de manera
significativa respecto de sus medias. Es representada por el smbolo t
Planteamiento de las Hipotesis
H0: Las medias de los grupos no difieren significativamente entre si
Ha: Las medias de los grupos difieren significativamente entre si
Probar)
Regla de decisin: Se acepta Ha si:
Requisitos:
(Hipotesis a
ttobtenida
t crtica
obtenida tcrtica
81
82
Datos
Profesores de
escuelas
particulares
X1
140
110
128
110
100
95
44
36
21
Profesores de
escuelas
pblicas
X2
90
95
65
70
45
35
22
60
18
1.
2.
3.
4.
5.
6.
7.
8.
9.
2.
2colas=0.05
4.
5.
=26.1
6.
7.
8.
Sustituir en la frmula de t:
9.
ttobtenida
t crtica
obtenida tcrtica
2.
4.
5.
6.
7.
Sustituir en la frmula de t
8.
85
ttobtenida
t crtica
obtenida tcrtica
Antes Despus
hiptesis estadsticas
100
90
200
60
180
75
90
85
49
40
110
65
185
75
7. Sustituir en la frmula de t
170
95
165
85
86
ttobtenida
t crtica
obtenida tcrtica
Sumas
160
70
1409
740
2colas 0.05
estadsticas
D=Antes-Despus
Sumas
Antes
100
200
180
90
49
110
185
170
165
160
1409
Despus
90
60
75
85
40
65
75
95
85
70
740
D2
100
19600
11025
25
81
2025
12100
5625
6400
8100
65081
D
10
140
105
5
9
45
110
75
80
90
7. Sustituir en la frmula de t
ttobtenida
4.47 t crtica 22..262
262
obtenida 4.47 tcrtica
87
Conclusin: Aseguramos con una confianza del 95% que la actitud que tienen
las personas ante la contaminacin ambiental cambia despus de ver la pelcula.
Resumen de los tres procedimientos:
Pasos comunes en la prueba t de Student
1.
2.
3.
Muestras independientes
n iguales
4.
5.
6.
Calcular la desviacin
estndar de cada
muestra
Encontrar el error
estndar de cada
media
Calcular el error
estndar de la
diferencia
7.
Muestras independientes
n diferentes
4.
5.
Calcular la desviacin
4.
estndar de cada
muestra
Encontrar el error
estndar de la
variable (Var2).
diferencia
5.
Calcular la desviacin
estndar de la muestra
g.l.=n1+n2-2
Muestras correlacionadas
6.
6.
libertad
g.l.= n1+n2-2
Sustituir en la frmula de t
9.
100
88
ttcrtica
crtica
g.l.=n-1
][
direccin y significancia.
Fuerza: indica el grado en que las dos variables se relacionan. Como ya
mencionamos, este coeficiente puede tomar cualquier valor entre [-1 y 1]
r=1: es una correlacin lineal directa (positiva) perfecta.
r=0: no estn asociadas linealmente las variables.
r=-1: es una correlacin lineal inversa (negativa) perfecta.
Puede ser interpretada de la siguiente manera:
Interpretacin
+ (positivo)
Directa
- (negativo)
Inversa
colocar
Se observa que existe una relacin directa entre las horas de entrenamiento
y el nmero de xitos de los empleados. A mayor tiempo dedicado al
entrenamiento (v.i) se obtiene un nmero mayor de xitos (v.d.)
Aplicando la teora.
Contexto. Una investigadora especializada en la salud emocional de la personas que
viven en pareja, basada en su experiencia supone que las parejas felices suelen sentirse
habitualmente bien con la pareja con la que conviven y suelen consultarse las cosas porque
ambos respetan las opiniones del otro. En las parejas satisfechas de su relacin es ms
frecuente que ambos miren al pasado con afecto. Tienden a
recordar ms los aspectos positivos que los negativos.
Para probar su hiptesis planea realizar una
investigacin con una significancia =0.05 y elige al azar a 10
parejas con ms de cinco aos de convivencia conyugal a
quienes aplica dos test. Uno para medir la satisfaccin y otro
para medir los niveles de comunicacin.
Pasos Para el Anlisis de Correlacin Lineal
1. Plantear las Hiptesis (H0 y Ha) Ha: Las parejas con mayor comunicacin estn
ms satisfechas con su relacin de pareja
2. Determinar cual es la variable dependiente.
3. Se plantea la probabilidad para la cual se comprobarn dichas hiptesis
estadsticas
4. Seleccionar una muestra de tamao n de ambas variables x e y
5. Obtener n pares de observaciones. (x1,y1) (x2, y2)...... (xn, yn)
6. Mostrar la relacin en un diagrama de dispersin: grafico de x vs y.
7. Sealar de manera descriptiva el sentido y la intensidad de relacin entre
variables.
8. Calcular el coeficiente de correlacin lineal r a partir de la muestra.
9. Obtener grados de libertad
10. Tomar decisin
11. Encontrar coeficiente de determinacin
12. Presentar conclusin
Llevmoslos a la prctica
92
1cola=0.05
10
9
8
10
8
9
7
6
10
9
9
8
6
7
5
4
4
4
8
7
Suma
93
][
xy
x2
y2
90
80
72
42
90
72
42
20
16
56
580
100
64
64
49
100
81
36
25
16
64
599
81
100
81
36
81
64
49
16
16
49
573
][
= 0.8495
Tomar decisin
Se acepta Ha si: robtenida rtabla
0.8495 0.549 Podemos rechazar H0 y aceptamos la Ha
Concluir
Se puede afirmar que existe una fuerte correlacin positiva entre la
comunicacin y la satisfaccin de las parejas. Del anlisis de correlacin
encontramos que la satisfaccin en la relacin de pareja es influenciada por la
comunicacin en un 72%. Por tanto aseguramos con una confianza del 95% que las
parejas con mayor comunicacin estn ms satisfechas con su relacin.
94
Objetivos
Conocer el proceso para contrastar hiptesis no paramtricas utilizando la X 2.
Utilizacin de la prueba bondad de ajuste
Utilizacin de la prueba de independencia
Tomar decisiones
Conocimientos de la unidad y
contenido
Prueba de Hiptesis no Paramtricas
Aplicar prueba no paramtricas X 2 y analizar los resultados para decidir
acerca de las hiptesis.
4. Prueba X 2
4.1
4.2
4.3
4.4
95
Concepto
Propiedades
Prueba X 2 para una muestra
Prueba X 2 para dos o ms muestras
Chi Cuadrada X 2
La prueba estadstica Chi cuadrada, tambin conocida como Ji cuadrada, es la
prueba no paramtrica ms utilizada en la investigacin social. Se utiliza para
contrastar aquellas hiptesis en las que no es posible fijar ningn supuesto sobre
parmetros o distribuciones poblacionales como medias, varianzas, etctera. Por ello a
este tipo de pruebas no paramtricas tambin se le conoce con el nombre de pruebas
de distribucin libre. Esto quiere decir que se realizan a partir de datos nominales u
Una vez obtenido el valor de Chi cuadrada, se requiere conocer los grados de libertad
(gl) para poder comparar el resultado obtenido con el valor de la distribucin Chi
cuadrada crtica (de la tabla ). La frmula para obtener los gl es: gl=k-1. Para una
muestra o cuando se trata de 3 o ms poblaciones independientes.
Reglas para su uso:
1. Las observaciones deben ser independientes
2. Nivel de medicin de al menos una variable ser nominal u ordinal
3. Muestreo puede ser no probabilstico
4. La muestra debe ser mayor a 20 (N>20)
5. fe>5
Procedimiento:
1. Plantear las hiptesis
2. Determinar la probabilidad con la que se trabajar: =.05 ; =.01
3. Generar tabla de contingencia
Tablas de contingencia son tablas de doble entrada (variables cualitativas) que
contienen las frecuencias con que ocurren las diferentes combinaciones de los
valores de las variables.
4. Calcular fe
5. Aplicar la frmula
6. Obtener gl
7. Plantear regla de decisin. Se acepta Ha y se rechaza H0 si: X 2obtenida X 2tabla
8. Concluir
Ejemplo de su Uso e Interpretacin de X 2Para Cuando se Utiliza Slo una Muestra:
La duea de la tiendita de la escuela quiere saber si alguno de sus productos
chatarra tiene mayor preferencia por los nios para comprar ms. Su objetivo, por lo
tanto es identificar el consumo de productos chatarra en una muestra de 60 nios
preescolares de Guadalupe, y su preferencia.
Paso 1. Hiptesis
H0:: No existen diferencias significativas en la preferencia de consumo de
97
frituras
refrescos
dulces
fo
fo
fo
fo
15
28
10
60
fo
fe
15 15
frituras
refrescos
fo
fo
fe
28 15
dulces
fe
fo
fe
10 15
15
60
Se acepta Ha
Paso 8. Interpretacin:
Con una confianza del 95% aseguramos que los nios de
preescolar tienen preferencias significativas en el consumo de
los productos chatarra que se venden en la tiendita de la
escuela.
98
negra
total
55
15
70
45
35
80
100
50
150
gnero
total
4. Calcular fe
99
5. Aplicar la frmula
6. Obtener gl
gl =(columnas-1)(renglones-1)=(2-1)(2-1)=1
7. Plantear regla de decisin. Se acepta Ha y se rechaza H0 si: X 2obtenida X 2tabla
X 2obtenida= 8.37 X 2tabla=3.841 Se acepta Ha:: Existe una relacin significativas entre
la preferencia por un tipo de cerveza y el gnero del consumidor
8. Concluir:
De acuerdo con la evidencia afirmamos con una certeza del 95% que la
preferencia por el tipo de cerveza depende del gnero.
100