Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduccin
Sin embargo, creemos que hay otras variables que pueden incidir en los resultados. En
concreto, el nivel cultural y la tcnica como una forma de aplicacin. Para poder tenerlo
en cuenta, al comienzo del estudio les pasamos el test de Weschler de inteligencia y les
preguntamos por su nivel de estudios (ninguno, primarios, secundarios o universitarios).
Al final nos encontramos con un conjunto de puntuaciones de cada uno de los 40 sujetos,
a partir de las cuales deseamos extraer conclusiones acerca de la eficacia de la tcnica de
inoculacin de estrs y de los efectos moduladores que puedan tener el nivel cultural y la
inteligencia sobre esa eficacia.
En el ejemplo 3 nuestro inters se centra en el estudio del procesamiento de informac i n
en tareas simples, para lo cual se ha utilizado tradicionalmente como medida el tiempo de
reaccin. Supongamos que queremos conocer el tiempo que necesita un sujeto concreto
para responder en la tareas tipo C de Donders. En este tipo de tarea se presenta al sujeto
en cada ensayo uno de dos posibles estmulos. Se le instruye para responder presionando
un botn tan rpido como pueda si el estmulo presentado es el otro no debe dar respuesta
alguna. No en todos los ensayos tarda lo mismo. Hay una cierta variabilidad en las
distintas ejecuciones de la tarea. Para hacernos una idea global de cmo la realiza nuestro
sujeto decidimos administrarle 30 ensayos de esta tarea. Al final disponemos de 30 datos,
cada uno representando el tiempo invertido por el sujeto en uno de los ensayos. A
continuacin nos planteamos la tarea de describir cmo realiza el sujeto ese tipo de tareas
a partir de esos datos.
En el ejemplo 4 de lo que se trata es de hacer un sondeo acerca del resultado de un
referndum que se celebrara prximamente en Bolivia. Lo ms exacto sera preguntar a
todos y cada uno de los bolivianos por su intencin de voto, pero por razones econmicas,
esto no sera sensato. Decidimos, en consecuencia, seleccionar un grupo de 3000
bolivianos de todos los departamentos y sus respectivas provincias y edades, y les
consultamos su intencin de voto. Nos encontramos con un nmero de respuestas SI y
otro de respuestas NO. A partir de estos datos trataremos de hacernos una idea de cul
podra ser el resultado en el referndum.
En todos estos ejemplos, el desarrollo del trabajo llega a un punto en el que es necesario
trabajar con un conjunto relativamente grande de nmeros con los que describir aquello
que estamos estudiando. Adems, en alguno de estos estudios tambin llega un punto en
el que surge la necesidad, o el deseo, de extraer conclusiones, a partir de las observaciones
potenciales que no se han hecho. La estadstica proporciona los medios tcnicos para
realizar estas tareas.
Estas dos grandes funciones de la estadstica (descripcin y realizacin de inferenc ias)
reflejan la propia historia del desarrollo de esta ciencia. La estadstica actual es el
producto del encuentro y mutua fecundacin de dos ramas distintas del saber, la antigua
estadstica y el clculo de probabilidades, que se encontraron en el siglo XIX.
Una ltima idea que merece la pena destacar en la introduccin es la distincin entre
estadstica terica y estadstica aplicada. La primera se dedica al estudio de los mtodos
formalmente vlidos para la realizacin de inferencias. La segunda se dedica a la
aplicacin de esos mtodos y modelos de actuacin a campos reales. Segn Kruskall
(1974) estadstica aplicada, al menos en principio, es la aplicacin documentada de
mtodos que han sido tericamente investigados, es decir, el salto real despus de estudiar
la teora del salto (pg. 390)
1.4 Que es una muestra probabilstica.- En general, hay dos tipos de muestras: la
muestra probabilstica y la muestra no probabilstica.
Muestra probabilstica.- Muestra que selecciona de modo que cada integrante de la
poblacin en estudio tenga una probabilidad conocida (no igual a cero) de ser incluido en
la muestra.
Mtodos de muestreo probabilstico.- No hay un mejor mtodo para seleccionar una
muestra probabilstica de una poblacin de inters. Los mtodos de muestreo
probabilstico tienen un objetivo similar: permitir que el azar determine los integrantes
que se incluirn en la muestra. El primer mtodo que se presenta es el muestreo aleatorio
simple.
Para ilustrar el muestreo aleatorio simple y su seleccin, supngase que una poblacin
consta de 845 empleados de una institucin financiera. Se seleccionar una muestra de
52 a partir de esta poblacin. Una de las formas de asegurar que todos los empleados en
la poblacin tengan la misma oportunidad de ser elegidos es escribir primero el nombre
de cada uno de ellos en una papeleta y depositar en una caja todos los papeles. Despus
que se han mezclado bien se realiza la primera seleccin. Este proceso se repite hasta que
se eligen 52, el tamao de la muestra.
Un mtodo ms adecuado de definir una muestra aleatoria es emplear el nmero de
identificacin de cada empleado y una tabla de nmeros aleatorios. Como su nombre lo
indica, estos nmeros han sido generados por un proceso aleatorio (en este caso en una
computadora). Para cada dgito de un nmero, la probabilidad de 0, 1, 2, ...........9 es la
misma. As, la probabilidad de que el empleado nmero 011 sea elegido, es la misma que
la del 722 o el 382. Por lo tanto, se elimina por completo los sesgos en el proceso de
seleccin.
2. Distribuciones de muestreo
El objetivo de este captulo es desarrollar el concepto de una distribucin de muestreo
para variables tanto numricas como categricas y examinar el teorema del lmite
central para casos en los que una poblacin est normalmente distribuida o no.
a) Imparcialidad
b) Eficiencia
c) Consistencia
La primera propiedad, la imparcialidad, implica el hecho de que el promedio de todas
las medias de muestra posibles (de un tamao de muestra dado n) ser igual a la media
de la poblacin.
Figura 1
Recordemos que cuando los datos de una poblacin estn disponibles, la media puede
calcularse a partir de
3 +2 +1 +4
= =1 = = 2,5
4
Por otra parte, si el muestreo se llev a cabo sin reemplazo, habra seis muestras
posibles de dos mecangrafas:
! 4!
= =6
! ( )! 2! 2!
Figura 2 Distribucin de muestreo del nmero promedio de errores para muestras de dos
mecangrafas.
En este pequeo ejemplo, aunque podemos observar una buena cantidad de fluctuacio nes
en la media de muestra, dependiendo de qu mecangrafas se seleccionaron, no hay una
cantidad similar de fluctuacin en la poblacin real misma. El hecho de que las medias
de muestra son menos variables que los datos de poblacin se desprenden directamente
de la ley de grandes nmeros. Una media de muestra particular promedia conjuntame nte
todos los valores de la muestra. Una poblacin puede consistir en resultados individua les
que pueden tener un amplio radio de valores, de extremadamente pequeos a
extremadamente grandes. Sin embargo, si un valor extremo cae en la muestra, aunque
tendr un efecto en la media, el efecto se reducir pues se promediara con todos los dems
valores de la muestra. Adems, al incrementarse el tamao de muestra, el efecto de un
solo valor extremo se hace cada vez menor, puesto que se est promediando con ms
observaciones.
Este fenmeno se expresa estadsticamente en el valor de la desviacin estndar de la
media de muestra. sta es la medicin de variabilidad de la media de muestra a muestra
y se denomina como error estndar de la media, . Al muestrear con reemplazo, el
error estndar de la media es igual a:
Ejemplo.- Supngase que una poblacin de cinco trabajadoras de produccin tienen tasas
de eficiencia de 97, 103, 96, 99 y 105. Considera adems que se selecciona una muestra
de dos tasas (97 y 105) de la poblacin para calcular la tasa media de la poblacin. Tal
media sera 101, obtenida de (97 + 105)/2. Se selecciona otra muestra de dos tasas: 103
y 96, con una media muestral de 99,5. La media de todas las tasas (media de la poblacin)
es 100, obtenida de (97+103+96+99+105)/5 = 500/5 =100,0. El error de muestreo para
la primera muestra es de 1,0, determinado por:
1.8 Estimacin puntual.- Un nmero (denominado punto) que se emplea para estimar
un parmetro poblacional.
Ejemplo.- Se realizara un estudio sobre las notas de examen final que obtienen los
alumnos de la carrera de psicologa. Una muestra de 20 alumnos dio las siguientes
notas:
66 58 70 75 65
64 72 75 80 60
66 74 79 70 64
82 60 85 65 70
X
x 1400 70 puntos
n 20
El intervalo dentro del que se espera est un parmetro poblacional, por lo general se
denomina intervalo de confianza. Por ejemplo, el intervalo de confianza para la media
poblacional es el intervalo que tiene una mayor probabilidad de contener a la media
poblacional. Se utiliza con frecuencia dos intervalos de confianza para la media
poblacional: el intervalo de confianza de 95% y el intervalo de confianza de 99%, o
incluso un valor tal como 87,6 %.
Cmo se interpreta, por ejemplo, un intervalo de confianza de 95 %?
Un intervalo de confianza de tal valor significa que aproximadamente 95% de los
intervalos construidos similarmente contendr el parmetro que se estima. Si se emplea
un nivel de confianza de 99%, entonces se espera que casi 99% de los intervalos contenga
al parmetro a estimar.
Otra interpretacin del intervalo de confianza de 95%, es que 95% de las medias
muestrales para un tamao de muestra especificado, estar dentro de 1,96 desviacio nes
estndar de la media de poblacin hipottica. En forma semejante, para un intervalo de
confianza de 99%, entonces 99% de las medias muestrales estarn dentro de 2,58
desviaciones estndares de la media poblacional hipottica.
Para ampliar el concepto de intervalo de confianza, suponga que hay tiempo para
seleccionar 100 muestra de tamao 256 de una poblacin, y calcular las medias
muestrales y los intervalos de confianza para cada muestra. Se descubrir que 95 de los
100 intervalos de confianza contienen la media poblacional y aproximadamente 5 de los
intervalos no la contienen. Esto se representa en el esquema siguiente:
n es el tamao de la muestra
Como se describi antes, los valores 1,96 y 2,58 se refieren a los valores z correspondiente
al 95 % o al 99 % centrales de las observaciones.
Otros niveles de confianza pueden emplearse. Para estos casos el valor z cambia
correspondientemente.
Por ejemplo, si se desea formar el intervalo de confianza de 92 % la frmula es:
s
x 1,75
n
Ejemplo.- Una muestra aleatoria de 100 estudiantes de psicologa responde a una prueba
de inteligencia espacial, obteniendo una media de 80 y una desviacin tpica de 10.
Entre que lmites se hallar la verdadera inteligencia espacial media de los estudiantes
de psicologa, con un nivel de confianza de 0,99?
Solucin:
1. La media de inteligencia espacial es de 80
2. El intervalo de confianza esta entre
s 10
x 2,58 80 2,58
n 100
10
80 2,58 80 2,58
10
77,42 y 82,58
3. Los puntos extremos del intervalo de confianza se denominan lmites de confianza. En
este ejemplo, tales lmites son 77,42 y 82,58
4. La medida de confianza que se obtiene se denomina grado de confianza. En este caso
es 0,99
5. Interpretacin: Si hubiera tiempo para seleccionar 100 muestras de tamao 100 de la
poblacin de alumnos de la carrera de psicologa y calcular sus medias muestrales y los
intervalos de confianza, la media de la prueba de inteligencia espacial se encontrara
aproximadamente en 99 de los 100 intervalos de confianza. Un intervalo puede o no
contener a la media de la poblacin. Aproximadamente 1 de los 100 intervalos de
confianza no contienen a la media poblacional de la inteligencia espacial.
Ejemplo1.- Una muestra de 49 observaciones se toma de una poblacin normal. La media
muestral es de 55, y la desviacin estndar de la muestra es 10. Determine el interva lo
de confianza de 99% para la media de la poblacin.
Ejemplo2.- Una muestra de 81 observaciones se toma de una poblacin normal. La media
muestral es de 40, y la desviacin estndar de la muestra es 5. Determine el intervalo de
confianza de 95% para la media de la poblacin.
Ejemplo3.- Supngase que el departamento de investigacin de psicologa, realiz una
encuesta para determinar la cantidad promedio de dinero que gastan los fumadores
consuetudinarios en cigarrillos durante una semana. Una muestra de 49 fumadores revel
que en promedio gastan 20 bolivianos, con una desviacin estndar de 3 bolivianos.
Cul es la estimacin por puntos? Explique lo que eso indica
Utilice el intervalo de confianza de 95 % y determine el intervalo de confianza para la .
Ejemplo 4.- Un profesor de ingls cont el nmero de palabras con errores ortogrficos
en un ensayo que recientemente asign a sus alumnos. Para el grupo de 40 estudiantes, el
nmero de palabras mal escritas fue de 6,05, y la desviacin estndar, de 2,44. Establezca
un intervalo de confianza de 95 % para el nmero medio de palabras con errores
ortogrficos en la poblacin de estudiantes.
Ejemplo 5.- Un impresor de serigrafas compra vasos de plstico para imprimir logotipos
de encuentro deportivo y de otras ocasiones especiales. El impresor recibe una remesa
grande esta maana y quiere estimar el porcentaje de artculos defectuosos. Una muestra
de 30 vasos de 200 resulto ser defectuosa.
a) Qu proporcin del envi se estima que est defectuosa.
b) Establezca un intervalo de confianza de 95 % de la proporcin de vasos
defectuosos.
Donde:
p Es el error estndar de la proporcin:
p(1 p)
p
n
p (1 p )
pz
n
Donde:
p Es la proporcin muestral
z es el valor z del grado de confianza seleccionado
n es el tamao de la muestra
N n
x *
n N 1
Error estndar de la proporcin:
p(1 p N n
p *
n N 1
Este ajuste se denomina factor de correccin por poblacin finita. Por qu es necesario
aplicar un factor y cul es su efecto? Lgicamente si la muestra es un porcentaje
considerable de la poblacin, entonces se esperara que cualquier estimacin fuera ms
precisa que para muestras ms pequeas. Obsrvese el efecto del trmino (N-n)/(N-1).
Supngase que la poblacin es 1000 y la muestra es 100. Entonces esta proporcin es
(1000-100)/(1000-1), o sea 900/999. Con la raz cuadrada se obtiene el factor de
correccin, 0,9492. Multiplicando el error estndar se reduce el error aproximadame nte
en 5%. Esto es 1-0,9492 0,05. Esta reduccin en el tamao del error estndar resulta
en una amplitud menor de valores en la estimacin de la media poblacional. Si la muestra
es de 200, el factor de correccin es 0,8949, lo que significa que el error estndar se reduce
en ms de 10%.
La regla general es que si la proporcin n/N es de menos de 0,05, se omite el factor de
correccin por poblacin finita.
s
x t n 1
n
o
s s
x t n 1 x x t n 1
n n
En la que tn-1 es el valor crtico de la distribucin t con n-1 grados de libertad para un rea
de /2 en el extremo superior.
Para poder ver cmo los intervalos de confianza de una media pueden construirse cuando
se desconoce la desviacin estndar de la poblacin, tomemos en consideracin la
siguiente aplicacin:
La administracin de una sucursal de un banco, desea estimar la cantidad promedio que
se tiene en las cuentas de ahorro de los clientes del banco. Se seleccion una muestra
aleatoria de 30 depositantes y los resultados indicaron un promedio de muestra de
Bs.4.750 y una desviacin estndar de Bs. 1.200.
1. Establezca una estimacin de intervalo de confianza de la cantidad promedio que se
tiene en todas las cuentas de ahorro del banco.
2. Si un cliente tiene Bs. 4.000 en una cuenta de ahorro, podra considerarse fuera de lo
normal? Explique su respuesta.
Solucin: Datos del problema
Tamao de la muestra 30 depositantes
Grados de libertad = n-1 = 30-1 = 29
Valor del estadstico t con un nivel de confianza del 95 % y 29 grados de libertad = 2,045
s 1.200
x t n 1 4.750 (2,045) 4.750 448.037
n 30
4.331,963 x 5.198,037
Concluimos con 95 % de confianza que la cantidad promedio que se tiene en las cuentas
de ahorro de los clientes est entre Bs. 4.331,96 y Bs. 5.198,04. El intervalo de confianza
de 95 % establece que existe una seguridad de 95 % de que la muestra que hemos
seleccionado es una en la cual la media de poblacin, X est localizada dentro del
intervalo.
Esta confianza de 95 % realmente indica que si se seleccionaran todas las muestras
posibles de tamao 30 (algo que nunca se har en la prctica), 95 % de los interva los
desarrollados incluiran a la media de poblacin verdadera en alguna parte dentro del
intervalo.
Con relacin a la segunda pregunta, si un cliente tiene Bs. 4.000 en una cuenta de ahorro,
podra considerarse fuera de lo normal?
Un valor individual de 4.000 esta nicamente a 0,625 desviaciones estndar por debajo
de la media de la muestra de 4.750
El intervalo de confianza representa la estimacin del promedio de una muestra de 30
depositantes, por lo tanto, ese valor individual no se considera un dato fuera de lo normal.