Sei sulla pagina 1di 18

1.1.

Introduccin

La estadstica actual no solo es un conjunto de tcnicas para resumir y trasmitir


informacin cuantitativa, sino que sirve tambin y fundamentalmente, para hacer
inferencias, generalizaciones y extrapolaciones de un conjunto relativamente pequeo de
datos a un conjunto mayor. Una de las aplicaciones ms importantes de estas tcnicas es
en la actualidad el propio trabajo de adquisicin de conocimientos mediante la
investigacin cientfica, a la que ha proporcionado unos poderosos instrumentos para el
anlisis de datos y la toma de decisiones.
Veamos algunos ejemplos de aplicaciones a los que nos iremos refiriendo ms adelante.
En nuestro ejemplo 1 imaginaremos que la empresa ABC nos encarga un estudio de las
caractersticas de personalidad de su plantilla de mandos intermedios con vistas a
promocionar a dos de ellos a un puesto de mayor responsabilidad. Les administr a mos
varios test y cuestionarios y medimos diversos rasgos de personalidad, entre ellos el grado
en que exhiben lo que se denomina patrn A de comportamiento. Se llama patrn A de
comportamiento a un conjunto de comportamientos caracterizados por la prisa, la presin
y el estrs, tpicos de ejecutivos. En un estudio hecho sobre este patrn Friedman y
Rosenman (1974) encontraron que los sujetos que exhibieron este patrn tienen una
mayor probabilidad de padecer prematuramente enfermedades coronarias. Al terminar la
correccin de esas pruebas contamos con un conjunto de nmeros a partir de los cuales
describiremos las personalidades de los miembros de esa plantilla.
Para el ejemplo 2 nos hemos inspirado en los trabajos de Meichenbaum sobre inoculac i n
de estrs. La forma de vida de nuestros das fomenta el padecimiento de situaciones de
estrs, que el psiclogo norteamericano Lazarus defini en trminos de evaluaciones que
hace el individuo en el sentido de que sus recursos personales no son suficientes para dar
respuesta a las demandas generadas por un evento particular. Nuestro estilo de vida hace
ms probable que nos encontremos en esas situaciones. Los psiclogos consideran que
hay dos formas de abordar el problema, no excluyentes entre si: cambiar de vida y el
medio, o aprender a convivir con esas situaciones de una forma ms adaptativa, es decir,
consiguiendo que tengan menos efectos. En esta segunda va se enmarca la tcnica de la
inoculacin de estrs.
Supongamos que deseamos hacer un experimento para estudiar la efectividad de esta
tcnica. Para ello seleccionamos a 40 sujetos y los dividimos al azar en dos grupos de 20.
A los 40 les evaluamos su nivel de estrs, pero luego slo a uno de los grupos les
entrenamos en esta tcnica de inoculacin de estrs. Les recomendamos aplicar lo
aprendido a su vida cotidiana y, pasados seis meses, volvemos a evaluar el nivel de estrs
de los 40 individuos. Si esta tcnica es realmente til esperamos encontrar un menor nivel
de estrs en los que la han utilizado (grupo experimental) que en los que no lo han hecho
(grupo control).

Sin embargo, creemos que hay otras variables que pueden incidir en los resultados. En
concreto, el nivel cultural y la tcnica como una forma de aplicacin. Para poder tenerlo
en cuenta, al comienzo del estudio les pasamos el test de Weschler de inteligencia y les
preguntamos por su nivel de estudios (ninguno, primarios, secundarios o universitarios).
Al final nos encontramos con un conjunto de puntuaciones de cada uno de los 40 sujetos,
a partir de las cuales deseamos extraer conclusiones acerca de la eficacia de la tcnica de
inoculacin de estrs y de los efectos moduladores que puedan tener el nivel cultural y la
inteligencia sobre esa eficacia.
En el ejemplo 3 nuestro inters se centra en el estudio del procesamiento de informac i n
en tareas simples, para lo cual se ha utilizado tradicionalmente como medida el tiempo de
reaccin. Supongamos que queremos conocer el tiempo que necesita un sujeto concreto
para responder en la tareas tipo C de Donders. En este tipo de tarea se presenta al sujeto
en cada ensayo uno de dos posibles estmulos. Se le instruye para responder presionando
un botn tan rpido como pueda si el estmulo presentado es el otro no debe dar respuesta
alguna. No en todos los ensayos tarda lo mismo. Hay una cierta variabilidad en las
distintas ejecuciones de la tarea. Para hacernos una idea global de cmo la realiza nuestro
sujeto decidimos administrarle 30 ensayos de esta tarea. Al final disponemos de 30 datos,
cada uno representando el tiempo invertido por el sujeto en uno de los ensayos. A
continuacin nos planteamos la tarea de describir cmo realiza el sujeto ese tipo de tareas
a partir de esos datos.
En el ejemplo 4 de lo que se trata es de hacer un sondeo acerca del resultado de un
referndum que se celebrara prximamente en Bolivia. Lo ms exacto sera preguntar a
todos y cada uno de los bolivianos por su intencin de voto, pero por razones econmicas,
esto no sera sensato. Decidimos, en consecuencia, seleccionar un grupo de 3000
bolivianos de todos los departamentos y sus respectivas provincias y edades, y les
consultamos su intencin de voto. Nos encontramos con un nmero de respuestas SI y
otro de respuestas NO. A partir de estos datos trataremos de hacernos una idea de cul
podra ser el resultado en el referndum.
En todos estos ejemplos, el desarrollo del trabajo llega a un punto en el que es necesario
trabajar con un conjunto relativamente grande de nmeros con los que describir aquello
que estamos estudiando. Adems, en alguno de estos estudios tambin llega un punto en
el que surge la necesidad, o el deseo, de extraer conclusiones, a partir de las observaciones
potenciales que no se han hecho. La estadstica proporciona los medios tcnicos para
realizar estas tareas.
Estas dos grandes funciones de la estadstica (descripcin y realizacin de inferenc ias)
reflejan la propia historia del desarrollo de esta ciencia. La estadstica actual es el
producto del encuentro y mutua fecundacin de dos ramas distintas del saber, la antigua
estadstica y el clculo de probabilidades, que se encontraron en el siglo XIX.

Etimolgicamente, la palabra estadstica procede de la palabra estado. Ya en la


antigedad los romanos y los egipcios hicieron intentos por tener un conocimiento preciso
del nmero de sus habitantes y de sus posesiones, es decir, por conocer el estado de sus
naciones (de ah la raz del trmino). Para ello hicieron recolecciones de datos que
posteriormente tenan que resumir de una forma comprensiva y que permitiera
proporcionar informaciones tiles.
Sin embargo, las conclusiones extradas se agotaban en el propio conjunto de datos
observados, pues el objetivo consista en hacerse una idea clara de lo que haba, y lo que
haba se contaba y meda. Lo que posibilito el calculo de probabilidades fue,
precisamente, el desarrollo de un conjunto de mtodos para extrapolar las conclusiones a
entidades no observables. Es decir, proporciono el instrumento adecuado para poder hacer
inferencias acerca de grandes cantidades de observaciones potenciales a partir de unas
pocas observaciones reales. Estas tcnicas tuvieron su fundamento en el desarrollo de la
curva normal por Gauss, en su aplicacin por Galton a los problemas de Herencia, etc.
Sin embargo los autnticos fundadores de estas tcnicas fueron Karl Pearson (1875 -
1936) y Ronald Fisher (1890 - 1962) (sobre la historia de la estadstica en psicologa,
vase Cowles, 1989; Walker, 1975)
Clsicamente la estadstica se ha dividido en dos partes, la estadstica descriptiva y la
estadstica inferencial. Estas dos partes reflejan, como ya hemos dicho, las dos grandes
pocas de su historia, pero tambin pueden reflejar la profundidad de los anlisis que se
realizan o incluso, las fases de un estudio, puesto que para hacer un estudio inferenc ia l
primero hay que hacer un estudio descriptivo de los datos. Es decir, un estudio descriptivo
se agota en la descripcin, mientras que uno inferencial comienza por la descriptiva y
luego aborda la inferencial.
Podemos dar la siguiente definicin de la estadstica, en la que aparecen algunos trminos
de los que no hemos dado todava una definicin precisa, aunque ello no impedir
entender su significado.

Estadstica es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de


muestras y de la realizacin de inferencias acerca de las poblaciones de las que stas
proceden.

Una ltima idea que merece la pena destacar en la introduccin es la distincin entre
estadstica terica y estadstica aplicada. La primera se dedica al estudio de los mtodos
formalmente vlidos para la realizacin de inferencias. La segunda se dedica a la
aplicacin de esos mtodos y modelos de actuacin a campos reales. Segn Kruskall
(1974) estadstica aplicada, al menos en principio, es la aplicacin documentada de
mtodos que han sido tericamente investigados, es decir, el salto real despus de estudiar
la teora del salto (pg. 390)

1.2 Curvas normales, probabilidades, muestras y poblaciones.- En muchas de las


variables utilizadas en la investigacin psicolgica, la distribucin de los valores presenta
aproximadamente una forma de campana, simtrica y un modal, a la que llamamos curva
normal. Dado que la forma de esta curva responde a una frmula matemtica exacta,
existe un porcentaje especfico de valores entre cualesquiera dos puntos de ella.
Las cifras importantes que conviene recordar con respecto a una curva normal son: un 34
% de los valores se encuentran entre la media y 1 desvo estndar por encima de la media,
y un 14 % entre 1 y 2 desvos estndar por encima de ella.
Una tabla de reas de la curva normal indica el porcentaje de valores entre la media y
cualquier puntuacin Z positiva en particular. Utilizando esa tabla, y sabiendo que la
curva normal es simtrica y que el 50 % de los valores se encuentra por encima de la
media, podemos determinar el porcentaje de valores por encima o por debajo de cualquier
puntuacin Z en particular. Tambin podemos utilizar la tabla para determinar la
puntuacin Z correspondiente al punto en el que comienza un determinado porcentaje de
valores.
La mayora de los investigadores psicolgicos considera que la probabilidad de un hecho
es su frecuencia relativa esperada. Sin embargo, algunos consideran a la probabilidad
como el grado subjetivo de convencimiento de que el hecho suceder. La probabilidad
generalmente se calcula como la razn entre la cantidad de resultados favorables y la
cantidad total de resultados posibles. Se simboliza con una p y tiene un rango de 0 (hecho
imposible) a 1 (hecho cierto). El rea bajo la curva normal indica la probabilidad de que
los valores se ubiquen dentro de determinado intervalo de valores.
Una muestra es un grupo de individuos o grupo analizado, por lo general en
representacin de un grupo mayor o poblacin que no puede ser analizado en su totalidad.
Lo ideal es que la muestra sea seleccionada de la poblacin utilizando un procedimie nto
estrictamente aleatorio. La media, la varianza y dems clculos de una muestra se
denominan estadsticos muestrales. Cuando se refieren a una poblacin, se denomina n
parmetros poblacionales y se simboliza con letras griegas ( Para la media, 2 para la
varianza, y para el desvi estndar)
La mayora de las tcnicas que estn es este documento, utilizan inferenc ias
probabilsticas para sacar conclusiones acerca de poblaciones, sobre la base de
informacin obtenida a partir de muestra. En este proceso se presume que las poblaciones
estn normalmente distribuidas.

1.3 Por qu muestrear la poblacin.- Como se observ con anterioridad, a menudo no


es posible estudiar la poblacin completa. Algunas de las principales razones por las que
es necesario muestrear, son:

1. La naturaleza destructiva de ciertas pruebas


2. La imposibilidad fsica de revisar todos los integrantes de la poblacin
3. El costo de estudiar a todos los integrantes de una poblacin a menudo es prohibitivo
4. Lo adecuado de los resultados de la muestra
5. En ocasiones se necesitara mucho tiempo para entrevistar a toda la poblacin.

1.4 Que es una muestra probabilstica.- En general, hay dos tipos de muestras: la
muestra probabilstica y la muestra no probabilstica.
Muestra probabilstica.- Muestra que selecciona de modo que cada integrante de la
poblacin en estudio tenga una probabilidad conocida (no igual a cero) de ser incluido en
la muestra.
Mtodos de muestreo probabilstico.- No hay un mejor mtodo para seleccionar una
muestra probabilstica de una poblacin de inters. Los mtodos de muestreo
probabilstico tienen un objetivo similar: permitir que el azar determine los integrantes
que se incluirn en la muestra. El primer mtodo que se presenta es el muestreo aleatorio
simple.

Muestra aleatoria simple.- Muestra formulada de manera que cada integrante de la


poblacin tenga la misma probabilidad de quedar incluido.

Para ilustrar el muestreo aleatorio simple y su seleccin, supngase que una poblacin
consta de 845 empleados de una institucin financiera. Se seleccionar una muestra de
52 a partir de esta poblacin. Una de las formas de asegurar que todos los empleados en
la poblacin tengan la misma oportunidad de ser elegidos es escribir primero el nombre
de cada uno de ellos en una papeleta y depositar en una caja todos los papeles. Despus
que se han mezclado bien se realiza la primera seleccin. Este proceso se repite hasta que
se eligen 52, el tamao de la muestra.
Un mtodo ms adecuado de definir una muestra aleatoria es emplear el nmero de
identificacin de cada empleado y una tabla de nmeros aleatorios. Como su nombre lo
indica, estos nmeros han sido generados por un proceso aleatorio (en este caso en una
computadora). Para cada dgito de un nmero, la probabilidad de 0, 1, 2, ...........9 es la
misma. As, la probabilidad de que el empleado nmero 011 sea elegido, es la misma que
la del 722 o el 382. Por lo tanto, se elimina por completo los sesgos en el proceso de
seleccin.

Ejemplo.- A continuacin se da la lista de clases de un curso de estadstica para la carrera


de psicologa (en una universidad privada). Se seleccionan tres estudiantes y se les harn
varias preguntas sobre el contenido del curso y el mtodo de enseanza.
1.- Se escriben a mano los nmeros del 00 al 35 en papeletas y se colocan estas en un
recipiente. Los tres nmeros que se seleccionan son 31, 7 y 25. Qu estudiantes se
incluirn en la muestra?
2. Ahora utilice la tabla de dgitos aleatorios, para seleccionar su propia muestra.
3. Qu hara si encontrara el nmero 59 en la tabla de dgitos aleatorios?
Muestra aleatoria sistemtica.- Los integrantes de la poblacin se ordenan
alfabticamente, en un archivo segn la fecha en que se reciben, o por algn otro mtodo.
Se selecciona al azar un punto de inicio y despus se elige cada k-simo elemento de la
poblacin para la muestra.

Muestreo aleatorio estratificado.- Una poblacin se divide primero en subgrupos,


denominados estratos, y se selecciona una muestra de cada estrato.

Muestreo por conglomerados.- Se emplea a menudo para reducir el costo de muestrear


una poblacin dispersa en un rea geogrfica grande.

2. Distribuciones de muestreo
El objetivo de este captulo es desarrollar el concepto de una distribucin de muestreo
para variables tanto numricas como categricas y examinar el teorema del lmite
central para casos en los que una poblacin est normalmente distribuida o no.

Un objetivo importante del anlisis de datos es el uso de estadsticas como la media de


muestra y la proporcin de muestra con el fin de estimar los parmetros correspondientes
en las poblaciones respectivas. Debemos darnos cuenta que en estudios enumerativos,
uno se interesa por extraer conclusiones respecto a una poblacin, no respecto a una
muestra.

En la prctica, se selecciona aleatoriamente una muestra simple de tamao


predeterminado de la poblacin. Los elementos que se deben incluir en la muestra se
determinan mediante el uso de un generador de nmeros aleatorios, como podra ser una
tabla de nmeros aleatorios. Hipotticamente, con el fin de poder usar la estadstica de
muestra para estimar el parmetro de poblacin, deberamos examinar cada muestra
posible que pudiera ocurrir. Si esta seleccin de todas las muestras posibles realmente se
tuviera que hacer, la distribucin de los resultados se denomina distribucin de
muestreo. El proceso de generalizar estos resultados de muestra para la poblacin se
refiere como una inferencia estadstica.

Comenzaremos analizando las propiedades de los estimadores de muestra que se usan


para estimar los parmetros de poblacin. Despus desarrollaremos el concepto de la
distribucin de muestreo y estudiaremos el teorema del lmite central. Las distribucio nes
de muestreo para la media y para la proporcin se desarrollaran para situaciones en las
que el muestreo ocurre con reemplazo y sin reemplazo.

2.1 Distribucin de muestreo de la media

2.1.1 Propiedades de la media


Entre varias propiedades matemticas importantes de la media aritmtica para una
distribucin normal estn

a) Imparcialidad
b) Eficiencia
c) Consistencia
La primera propiedad, la imparcialidad, implica el hecho de que el promedio de todas
las medias de muestra posibles (de un tamao de muestra dado n) ser igual a la media
de la poblacin.

Esta propiedad puede demostrarse empricamente viendo el siguiente ejemplo: suponga


que solicitamos a cada una de las mecangrafas que comprenden una poblacin de
servicio de apoyo secretarial de un departamento particular de una compaa se le pidiera
mecanografiar la misma pgina de un manuscrito. El nmero de errores cometidos por
cada mecangrafa fue el siguiente:

Mecangrafa Nmero de errores


A 3
B 2
C 1
D 4

Esta distribucin de poblacin se muestra en la figura 1

Figura 1

Recordemos que cuando los datos de una poblacin estn disponibles, la media puede
calcularse a partir de

3 +2 +1 +4
= =1 = = 2,5
4

Y la desviacin estndar puede calcularse a partir de


( )2 (3 2,5)2 + (2 2,5)2 + (1 2,5)2 + (4 2,5)2
= =1 =
4
= 1,12

Si se seleccionan muestra de dos mecangrafas con reemplazo de esta poblacin hay 16


muestras posibles que podran seleccionarse ( = 42 = 16) estos resultados de
muestras posibles se exhiben en la tabla 1

Tabla 1 Las 16 muestras de n=2 mecangrafas de una poblacin de N=4 mecangrafas


al muestrear con reemplazo.

Muestra Mecangrafas Resultados de muestra Media de muestra


1 A,A 3,3 3
2 A,B 3,2 2,5
3 A,C 3,1 2
4 A,D 3,4 3,5
5 B,A 2,3 2,5
6 B,B 2,2 2
7 B,C 2,1 1,5
8 B,D 2,4 3
9 C,A 1,3 2
10 C,B 1,2 1,5
11 C,C 1,1 1
12 C,D 1,4 2,5
13 D,A 4,3 3,5
14 D,B 4,2 3
15 D,C 4,1 2,5
16 D,D 4,4 4
()=2,5

Si estas 16 medias de muestra se promedian, la media de estos valores () es igual a


2,5, que es la media de la poblacin

Por otra parte, si el muestreo se llev a cabo sin reemplazo, habra seis muestras
posibles de dos mecangrafas:

! 4!
= =6
! ( )! 2! 2!

Estas seis muestras posibles se enumeran en la tabla 2

Tabla 2 Las 6 muestras de n=2 mecangrafas de una poblacin de N=4 mecangrafas al


muestrear sin reemplazo.

Muestra Mecangrafas Resultados de muestra Media de muestra


1 A,B 3,2 2,5
2 A,C 3,1 2
3 A,D 3,4 3,5
4 B,C 2,1 1,5
5 B,D 2,4 3
6 C,D 1,4 2,5
()=2,5

En este caso, asimismo, el promedio de todas las medias de muestra ( ) es igual a la


media de la poblacin, 2,5. Por tanto hemos demostrado que la media aritmtica de
muestra es un estimador imparcial de la media de la poblacin. Esto nos dice que aun
cuando no sepamos qu tan cerca est el promedio de cualquier muestra particular
seleccionada a la media de poblacin, al menos estamos seguros de que el promedio de
todas las medias de muestra que se podran haber seleccionado ser igual a la media de la
poblacin.

La segunda propiedad que posee la media, la eficiencia, se refiere a la precisin de la


muestra de estadstica como un estimador del parmetro de poblacin.
Para distribuciones como la normal, la media aritmtica se considera ms estable de
muestra a muestra que otras mediciones de tendencia central. Para una muestra de tamao
n, la media aritmtica se acerca ms en promedio, a la media de poblacin que cualquier
otro estimador imparcial, por lo que la media de muestra es una mejor estimacin de la
media de poblacin.

La tercera propiedad, la consistencia, se refiere al efecto del tamao de muestra sobre la


utilidad de un estimador. Al incrementarse el tamao de muestra, la variaci n de la media
de muestra de la media de poblacin se hace ms pequea, de manera que la media
aritmtica de muestra se vuelve una mejor estimacin de la media de poblacin.

2.2 Error estndar de la media

Las fluctuaciones en el nmero promedio de errores de mecanografa que se obtuvo de


las muestras posibles al muestrear con reemplazo se muestran en la figura 2

Figura 2 Distribucin de muestreo del nmero promedio de errores para muestras de dos
mecangrafas.
En este pequeo ejemplo, aunque podemos observar una buena cantidad de fluctuacio nes
en la media de muestra, dependiendo de qu mecangrafas se seleccionaron, no hay una
cantidad similar de fluctuacin en la poblacin real misma. El hecho de que las medias
de muestra son menos variables que los datos de poblacin se desprenden directamente
de la ley de grandes nmeros. Una media de muestra particular promedia conjuntame nte
todos los valores de la muestra. Una poblacin puede consistir en resultados individua les
que pueden tener un amplio radio de valores, de extremadamente pequeos a
extremadamente grandes. Sin embargo, si un valor extremo cae en la muestra, aunque
tendr un efecto en la media, el efecto se reducir pues se promediara con todos los dems
valores de la muestra. Adems, al incrementarse el tamao de muestra, el efecto de un
solo valor extremo se hace cada vez menor, puesto que se est promediando con ms
observaciones.
Este fenmeno se expresa estadsticamente en el valor de la desviacin estndar de la
media de muestra. sta es la medicin de variabilidad de la media de muestra a muestra
y se denomina como error estndar de la media, . Al muestrear con reemplazo, el
error estndar de la media es igual a:

La desviacin estndar de la poblacin dividida entre la raz cuadrada del tamao de


muestra. Por tanto, al incrementarse el tamao de la muestra, el error estndar de la media
disminuir en un factor igual a la raz cuadrada del tamao de muestra.

2.2 Error de muestreo. - En el anlisis anterior se subray la importancia de seleccionar


una muestra de manera que cada elemento de la poblacin tenga una probabilidad real de
ser seleccionado. Para lograr esto, podra elegirse un muestreo aleatorio simple, uno
sistemtico, uno estratificado, un muestreo por conglomerados, o una combinacin de
estos mtodos. Lgicamente es poco probable que una media muestral sea idntica a la
media poblacional. De igual forma la desviacin estndar u otra medida calculada a partir
de la muestra, probablemente no sera exactamente igual al valor correspondiente de la
poblacin. Por tanto podemos esperar que haya alguna diferencia entre una estadstica
de muestra, como la media muestral o la desviacin estndar, y el correspondiente
parmetro poblacional. La diferencia entre una estadstica de muestra y un parmetro
poblacional se denomina error de muestreo. Ese error se debe simplemente al azar.

Error de muestreo.- Diferencia entre una estadstica de muestra y su parmetro de


poblacin correspondiente.

Ejemplo.- Supngase que una poblacin de cinco trabajadoras de produccin tienen tasas
de eficiencia de 97, 103, 96, 99 y 105. Considera adems que se selecciona una muestra
de dos tasas (97 y 105) de la poblacin para calcular la tasa media de la poblacin. Tal
media sera 101, obtenida de (97 + 105)/2. Se selecciona otra muestra de dos tasas: 103
y 96, con una media muestral de 99,5. La media de todas las tasas (media de la poblacin)
es 100, obtenida de (97+103+96+99+105)/5 = 500/5 =100,0. El error de muestreo para
la primera muestra es de 1,0, determinado por:

X 101 100 0,1


La segunda muestra tiene un error de muestreo de -0,5, determinado por:
X 99,5 100 0,5
Cada una de estas diferencias, 1,0 y -0,5, es el error que habra al calcular la media de la
poblacin con base en la media muestral y estos errores de muestreo se deben al azar.

1.6 Distribucin muestral de medias.- En el ejemplo sobre tasas de eficiencia se mostr


que las medias muestrales de un tamao especfico varan de una muestra a otra. La tasa
de eficiencia media de la primera muestra de dos empleadas era 101, y la media de la
segunda muestra fue 99,5. Probablemente una tercera muestra dara como resultado una
media diferente.
La media de la poblacin era 100. Si se organizaran las medias de todas las muestras
posibles de tamao dos en una distribucin probabilstica, se obtendra la distribuci n
muestral de medias.
Distribucin muestral de medias.- Una distribucin probabilstica que consta de una
lista de todas las medias muestrales posibles de un tamao de muestra dado de una
poblacin y la probabilidad de ocurrencia asociada con cada media muestral.

1.7 Teorema de lmite central.- La poblacin y el tamao de muestras en el ejemplo


anterior se fijaron intencionalmente pequeos a fin de enfatizar dos conceptos: primero,
que la media de las medias muestrales es exactamente igual a la media de la poblacin, y
segundo, que la forma de la distribucin de las medias muestrales no es necesariame nte
igual a la de la poblacin.

Considere el diagrama siguiente, observe la forma de la poblacin comparada con la de


la distribucin de muestreo de las medias. Esta distribucin se aproxima mas
estrechamente a la distribucin normal.

Poblacin Uniforme Distribucin muestral que tiende a la


Distribucin Normal
20 22 24 26 28 21 22 23 24 25 26 27
Tiempo de servicio Tiempo medio de servicio

Si la poblacin est distribuida normalmente, la distribucin de muestreo de las medias


tambin lo est.
Por qu es importante esta tendencia hacia la distribucin normal? Esto es la base del
teorema de lmite central, uno de los ms importantes teoremas en estadstica.

Teorema de lmite central.- En el caso de una poblacin con media y la varianza 2,


la distribucin muestral de las medias de todas las muestras posibles de tamao n
generadas a partir de la poblacin, tendr una distribucin aproximadamente normal
(siendo la media de la distribucin muestral igual a y la varianza igual a 2 /n)
considerando que el tamao de la muestra es bastante grande.

1.8 Estimacin puntual.- Un nmero (denominado punto) que se emplea para estimar
un parmetro poblacional.

Ejemplo.- Se realizara un estudio sobre las notas de examen final que obtienen los
alumnos de la carrera de psicologa. Una muestra de 20 alumnos dio las siguientes
notas:

66 58 70 75 65
64 72 75 80 60
66 74 79 70 64
82 60 85 65 70

Cul es la mejor estimacin de la nota promedio final de los alumnos de la carrera de


psicologa?
Solucin:
La suma de las 20 calificaciones es 1400. La nota promedio es 70, y se obtiene de

X
x 1400 70 puntos
n 20

De igual manera, la proporcin de la poblacin de alumnos de la carrera de psicologa


que est a favor de medidas ms estrictas para la proteccin ambiental puede estimarse
utilizando una proporcin muestral. Si p es la proporcin poblacional desconocida y p es
la proporcin muestral, la estimacin puntual para la proporcin de poblacin es:

Nmero de existos en la muestra X


p
Nmero muestreado n

Donde X representa el nmero de xitos en la muestra y n es el tamao de la muestra.


Ejemplo.- De 2000 personas muestreadas, 1600 estn a favor de medidas ms estrictas de
proteccin ambiental. Cul es la proporcin poblacional estimada.
Solucin.-
numero de exitos en la muestra 1600
p 0,80 80%
numero muestreado 2000

El valor de 80% es una estimacin de la proporcin en la poblacin que favorecen


medidas ms estrictas.
En resumen, con base en la distribucin muestral de medias y el teorema de lmite central,
la media muestral puede utilizarse como un buen estimador de la media poblacional. Por
supuesto, se supone que el tamao de la poblacin es lo suficientemente grande. Puede
decirse lo mismo acerca de una proporcin poblacional (que es un caso especial de media
muestral), la varianza poblacional, la desviacin estndar de la poblacin y otros
parmetros de la poblacin. Cada uno de estos estimadores es una estimacin por punto.

1.9 Estimacin de intervalo.- Expresa la amplitud dentro de la cual probablemente se


encuentra un parmetro poblacional.

El intervalo dentro del que se espera est un parmetro poblacional, por lo general se
denomina intervalo de confianza. Por ejemplo, el intervalo de confianza para la media
poblacional es el intervalo que tiene una mayor probabilidad de contener a la media
poblacional. Se utiliza con frecuencia dos intervalos de confianza para la media
poblacional: el intervalo de confianza de 95% y el intervalo de confianza de 99%, o
incluso un valor tal como 87,6 %.
Cmo se interpreta, por ejemplo, un intervalo de confianza de 95 %?
Un intervalo de confianza de tal valor significa que aproximadamente 95% de los
intervalos construidos similarmente contendr el parmetro que se estima. Si se emplea
un nivel de confianza de 99%, entonces se espera que casi 99% de los intervalos contenga
al parmetro a estimar.

Otra interpretacin del intervalo de confianza de 95%, es que 95% de las medias
muestrales para un tamao de muestra especificado, estar dentro de 1,96 desviacio nes
estndar de la media de poblacin hipottica. En forma semejante, para un intervalo de
confianza de 99%, entonces 99% de las medias muestrales estarn dentro de 2,58
desviaciones estndares de la media poblacional hipottica.

Para ampliar el concepto de intervalo de confianza, suponga que hay tiempo para
seleccionar 100 muestra de tamao 256 de una poblacin, y calcular las medias
muestrales y los intervalos de confianza para cada muestra. Se descubrir que 95 de los
100 intervalos de confianza contienen la media poblacional y aproximadamente 5 de los
intervalos no la contienen. Esto se representa en el esquema siguiente:

Media poblacional Intervalo de confianza del 95 %

Muestra 1 de tamao 256 contiene a la media


Muestra 2 de tamao 256 contiene a la media

Muestra 3 de tamao 256 contiene a la media

Muestra 4 de tamao 256 no contiene a la media

Muestra 5 de tamao 256 contiene a la media

Cmo se elabora un intervalo de confianza? Primero es necesario calcular el error


estndar de la media.
Error estndar de la media.- Desviacin estndar de la distribucin de muestreo de las
medias muestrales.

El error estndar de la media se calcula mediante:



x
n
Donde:

es la desviacin estndar de la poblacin

es el error estndar de la media, llamado tambin desviacin estndar de la


distribucin muestral de medias

n es el tamao de la muestra

En la formula anterior, para el error estndar de la media se supone conocida la desviacin


estndar de la poblacin . Si no se conoce y n = 30 o mayor (se considera muestra
grande), la desviacin estndar de la media, denotada por s, sirve para aproximar la
desviacin estndar de la poblacin . Entonces la frmula para el error estndar queda:
s
sx
n

Obsrvese que el error estndar de la media variar de acuerdo con el tamao de la


muestra que est en el denominador. A medida que aumenta cada vez ms el tamao de
la muestra, n, la variabilidad de las medias muestrales se vuelve cada vez ms pequea.
Lgicamente, una estimacin de la media poblacional basada en una muestra grande es
ms confiable que una estimacin realizada con una muestra pequea. En otras palabras,
el error en la estimacin de la media poblacional disminuye a medida que aumenta el
tamao de la muestra. Si el tamao de la muestra se volviera cada vez ms grande y, por
ltimo, fuera igual al tamao de la poblacin, no habra error en la prediccin de la media
poblacional, debido a que el tamao de la muestra y de la poblacin sera igual.

Elaboracin de los intervalos de confianza de la media de 95% y de 99%


Estos intervalos de confianza se establecen como sigue cuando n 30
Intervalo de confianza de 95 %
s
x 1,96
n
Intervalo de confianza de 99 %
s
x 2,58
n

Como se describi antes, los valores 1,96 y 2,58 se refieren a los valores z correspondiente
al 95 % o al 99 % centrales de las observaciones.
Otros niveles de confianza pueden emplearse. Para estos casos el valor z cambia
correspondientemente.
Por ejemplo, si se desea formar el intervalo de confianza de 92 % la frmula es:
s
x 1,75
n

El valor de 1,75 proviene de la tabla de la distribucin z. La tabla se basa en la mitad de


la distribucin normal, de modo que 0,9200/2 = 0,4600. El nmero ms prximo en el
cuerpo de la tabla es 0,4599 y el correspondiente valor de z es 1,75.
Trate de buscar los siguientes valores z y compruebe sus respuestas contra las que se dan
a la derecha
Intervalo de confianza Nmero ms cercano Valor z
90% 0,4505 1,65
96% 0,4798 2,05

Ejemplo propuesto.- En un experimento se trata de seleccionar una muestra aleatoria de


256 alumnos de la Universidad Mayor de San Andrs para el estudio. Un elemento de
inters es su nota final promedio del semestre. La media muestral que se calcula es de 78
puntos y la desviacin estndar de la muestra es de 9 puntos.
1. Cul ser la nota final promedio estimado de los alumnos de la Universidad Mayor
de San Andrs (la poblacin) es decir, cul es la estimacin por punto.
2. Cul es el intervalo de confianza de 95 %
3. Cules son los lmites del intervalo de confianza de 95 %
4. Qu grado de confianza se est usando.

Ejemplo.- Una muestra aleatoria de 100 estudiantes de psicologa responde a una prueba
de inteligencia espacial, obteniendo una media de 80 y una desviacin tpica de 10.
Entre que lmites se hallar la verdadera inteligencia espacial media de los estudiantes
de psicologa, con un nivel de confianza de 0,99?
Solucin:
1. La media de inteligencia espacial es de 80
2. El intervalo de confianza esta entre

s 10
x 2,58 80 2,58
n 100
10
80 2,58 80 2,58
10
77,42 y 82,58
3. Los puntos extremos del intervalo de confianza se denominan lmites de confianza. En
este ejemplo, tales lmites son 77,42 y 82,58
4. La medida de confianza que se obtiene se denomina grado de confianza. En este caso
es 0,99
5. Interpretacin: Si hubiera tiempo para seleccionar 100 muestras de tamao 100 de la
poblacin de alumnos de la carrera de psicologa y calcular sus medias muestrales y los
intervalos de confianza, la media de la prueba de inteligencia espacial se encontrara
aproximadamente en 99 de los 100 intervalos de confianza. Un intervalo puede o no
contener a la media de la poblacin. Aproximadamente 1 de los 100 intervalos de
confianza no contienen a la media poblacional de la inteligencia espacial.
Ejemplo1.- Una muestra de 49 observaciones se toma de una poblacin normal. La media
muestral es de 55, y la desviacin estndar de la muestra es 10. Determine el interva lo
de confianza de 99% para la media de la poblacin.
Ejemplo2.- Una muestra de 81 observaciones se toma de una poblacin normal. La media
muestral es de 40, y la desviacin estndar de la muestra es 5. Determine el intervalo de
confianza de 95% para la media de la poblacin.
Ejemplo3.- Supngase que el departamento de investigacin de psicologa, realiz una
encuesta para determinar la cantidad promedio de dinero que gastan los fumadores
consuetudinarios en cigarrillos durante una semana. Una muestra de 49 fumadores revel
que en promedio gastan 20 bolivianos, con una desviacin estndar de 3 bolivianos.
Cul es la estimacin por puntos? Explique lo que eso indica
Utilice el intervalo de confianza de 95 % y determine el intervalo de confianza para la .
Ejemplo 4.- Un profesor de ingls cont el nmero de palabras con errores ortogrficos
en un ensayo que recientemente asign a sus alumnos. Para el grupo de 40 estudiantes, el
nmero de palabras mal escritas fue de 6,05, y la desviacin estndar, de 2,44. Establezca
un intervalo de confianza de 95 % para el nmero medio de palabras con errores
ortogrficos en la poblacin de estudiantes.
Ejemplo 5.- Un impresor de serigrafas compra vasos de plstico para imprimir logotipos
de encuentro deportivo y de otras ocasiones especiales. El impresor recibe una remesa
grande esta maana y quiere estimar el porcentaje de artculos defectuosos. Una muestra
de 30 vasos de 200 resulto ser defectuosa.
a) Qu proporcin del envi se estima que est defectuosa.
b) Establezca un intervalo de confianza de 95 % de la proporcin de vasos
defectuosos.

Intervalo de confianza para una proporcin de la poblacin.-


La teora y el procedimiento para determinar un estimador por punto y un estimador de
intervalo para una proporcin de la poblacin, se asemeja bastante a los que se
describieron en la seccin anterior. Por lo tanto, ser breve el siguiente anlisis sobre las
estimaciones puntuales y las de intervalo.
Como se observ con anterioridad, una estimacin puntual para una proporcin de la
poblacin se obtiene dividiendo el nmero de xitos en la muestra entre el nmero total
muestreado. Supngase que 100 de las 400 personas muestreadas afirmaron que prefieren
un nuevo refresco que probaron, en comparacin con el que consumen regularme nte.
La mejor estimacin de la proporcin de la poblacin que est a favor de la nueva bebida
es 0,25, o 25%, que se obtiene dividiendo 100/400. Obsrvese que la proporcin se basa
en un conteo del nmero de xitos en relacin con el nmero total muestreado.
Cmo se estima el intervalo de confianza para una proporcin de la poblacin?
p z p

Donde:
p Es el error estndar de la proporcin:

p(1 p)
p
n

Por tanto el intervalo de confianza se establece mediante:

p (1 p )
pz
n

Donde:
p Es la proporcin muestral
z es el valor z del grado de confianza seleccionado
n es el tamao de la muestra

Para una poblacin finita donde el nmero total de elementos es N y el tamao de la


muestra es n, se hace el siguiente ajuste a los errores estndares de la media y de la
proporcin:

Error estndar de la media

N n
x *
n N 1
Error estndar de la proporcin:

p(1 p N n
p *
n N 1

Este ajuste se denomina factor de correccin por poblacin finita. Por qu es necesario
aplicar un factor y cul es su efecto? Lgicamente si la muestra es un porcentaje
considerable de la poblacin, entonces se esperara que cualquier estimacin fuera ms
precisa que para muestras ms pequeas. Obsrvese el efecto del trmino (N-n)/(N-1).
Supngase que la poblacin es 1000 y la muestra es 100. Entonces esta proporcin es
(1000-100)/(1000-1), o sea 900/999. Con la raz cuadrada se obtiene el factor de
correccin, 0,9492. Multiplicando el error estndar se reduce el error aproximadame nte
en 5%. Esto es 1-0,9492 0,05. Esta reduccin en el tamao del error estndar resulta
en una amplitud menor de valores en la estimacin de la media poblacional. Si la muestra
es de 200, el factor de correccin es 0,8949, lo que significa que el error estndar se reduce
en ms de 10%.
La regla general es que si la proporcin n/N es de menos de 0,05, se omite el factor de
correccin por poblacin finita.

1.10 Estimacin de intervalo de la media ( desconocida) Del mismo modo en que la


media de la poblacin x , por lo general, se desconoce, es probable que la desviacin
estndar real de la poblacin, x , tampoco sea conocida. Por tanto, necesitamos obtener
una estimacin de intervalo de confianza de x , utilizando solamente las estadsticas de
muestra: media muestral y desviacin estndar de la muestra.
Para lograrlo estudiaremos el trabajo de William S. Gosset.
La estimacin del intervalo de confianza para la media, con x , desconocida, se expresa
de la siguiente manera:

s
x t n 1
n
o
s s
x t n 1 x x t n 1
n n

En la que tn-1 es el valor crtico de la distribucin t con n-1 grados de libertad para un rea
de /2 en el extremo superior.
Para poder ver cmo los intervalos de confianza de una media pueden construirse cuando
se desconoce la desviacin estndar de la poblacin, tomemos en consideracin la
siguiente aplicacin:
La administracin de una sucursal de un banco, desea estimar la cantidad promedio que
se tiene en las cuentas de ahorro de los clientes del banco. Se seleccion una muestra
aleatoria de 30 depositantes y los resultados indicaron un promedio de muestra de
Bs.4.750 y una desviacin estndar de Bs. 1.200.
1. Establezca una estimacin de intervalo de confianza de la cantidad promedio que se
tiene en todas las cuentas de ahorro del banco.
2. Si un cliente tiene Bs. 4.000 en una cuenta de ahorro, podra considerarse fuera de lo
normal? Explique su respuesta.
Solucin: Datos del problema
Tamao de la muestra 30 depositantes
Grados de libertad = n-1 = 30-1 = 29
Valor del estadstico t con un nivel de confianza del 95 % y 29 grados de libertad = 2,045

s 1.200
x t n 1 4.750 (2,045) 4.750 448.037
n 30
4.331,963 x 5.198,037

Concluimos con 95 % de confianza que la cantidad promedio que se tiene en las cuentas
de ahorro de los clientes est entre Bs. 4.331,96 y Bs. 5.198,04. El intervalo de confianza
de 95 % establece que existe una seguridad de 95 % de que la muestra que hemos
seleccionado es una en la cual la media de poblacin, X est localizada dentro del
intervalo.
Esta confianza de 95 % realmente indica que si se seleccionaran todas las muestras
posibles de tamao 30 (algo que nunca se har en la prctica), 95 % de los interva los
desarrollados incluiran a la media de poblacin verdadera en alguna parte dentro del
intervalo.
Con relacin a la segunda pregunta, si un cliente tiene Bs. 4.000 en una cuenta de ahorro,
podra considerarse fuera de lo normal?
Un valor individual de 4.000 esta nicamente a 0,625 desviaciones estndar por debajo
de la media de la muestra de 4.750
El intervalo de confianza representa la estimacin del promedio de una muestra de 30
depositantes, por lo tanto, ese valor individual no se considera un dato fuera de lo normal.

Potrebbero piacerti anche