Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1.1 INTRODUCCION.
Cabe recordar que el objetivo de la estadística es hacer inferencias acerca de una población con base
en la información contenida en una muestra. Este mismo objetivo motiva el estudio del problema.
Vamos a considerar el problema de muestreo de una población que no es, necesariamente, muy
grande.
Los investigadores de mercado a menudo realizan estudios para obtener información sobre las
preferencias de las personas. Los auditores suelen seleccionar muestras de las facturas no cobradas
de una empresa, y, a partir de ella, realizan inferencias sobre la población. Los directores de
personal a menudo necesitan información sobre las actitudes de los empleados hacia nuevos
métodos de producción y creen conveniente tomar una muestra de todos los trabajadores.
TERMINOS TÉCNICOS
Ejemplo: Se realiza una encuesta de opinión sobre Intención de voto en las próximas elecciones
presidenciales en el Perú.
En este caso un elemento es un votante, persona mayor de 18 años y con D.N.I., registrado en Lima
Metropolitana.
POBLACIÓN OBJETIVO: es un conjunto de elementos sobre los cuales deseamos hacer alguna
inferencia.
Considerando otro ejemplo, supongamos que Unique quiere evaluar la respuesta de los
consumidores a una línea nueva de lápices labiales y quiere obtener una muestra de mujeres
mayores de 18 años, en este caso la unidad de muestreo sería igual a un elemento. En forma
alternativa, la unidad de muestreo serían las familias. En este último caso, las familias participarían
en la muestra y se entrevistarían a todas las mujeres mayores e 18 años en cada familia.
Si especificamos al votante individual como la unidad de muestreo, una lista de todos los votantes
registrados puede servir como el marco para una encuesta de opinión pública.
Para las encuestas telefónicas, el marco de muestreo podría ser, una lista de todos los números
telefónicos residenciales de la ciudad.
Para las entrevistas personales, una lista de las direcciones de todas las calles.
Para una encuesta de agricultura, una lista de todas las granjas o un mapa de las áreas que contienen
granjas.
Los datos son obtenidos de los elementos de la muestra y son usados para describir a la población.
Considérese al votante individual como la unidad de muestreo y a la lista de votantes registrados
como el marco.
En la encuesta de opinión publica cierto número de votantes (la muestra) van a ser entrevistados
para determinar su preferencia en las próximas elecciones.
Podemos usar la información obtenida de estos votantes para hacer inferencia acerca de la
preferencia de los votantes en una población determinada.
PARÁMETRO: Es una medida utilizada para describir alguna característica de una población., y
para determinar su valor es necesario utilizar la información de la población completa.
Los parámetros de la población o parámetros poblacionales son constantes desconocidas asociadas a
características de una o más variables. Dada una variable Y, los parámetros de interés mas
utilizados son:
TOTAL POBLACIONAL: Y
n
Y
i 1
i
suma de los valores de Yi en la población y se representa por Y
MEDIA POBLACIONAL: Y
N
Y i
Y i 1
N
VARIANZA POBLACIONAL: 2
N
(Y i Y )2
2 i 1
1 si i C
Yi
0 si i C
N
1
P
N
Y
i 1
i Proporción de unidades de la Población que pertenecen a C.
ESTADÍSTICO O ESTADÍGRAFO
Es una medida usada para describir alguna característica de la muestra y la toma de decisiones
contienen un grado de incertidumbre.
i) MEDIA MUESTRAL : y
ii) PROPORCIÓN MUESTRAL : p̂
2
iii)VARIANZA MUESTRAL : s
ESTIMADOR Y ESTIMACIÓN
Un estimador de un parámetro poblacional ˆ (media, total, razón, proporción en la población) es
una función cuyo dominio es el conjunto S (muestras posibles) y su recorrido coincide con posibles
valores que puede tomar el parámetro .
En otros términos, un estimador se interpreta como un procedimiento, generalmente establecido a
través de una fórmula, mediante el cual a cada muestra de muestras posibles, se le asigna un número
que se reconoce como posible valor de .
característica
A estimar
de la
población
Si se imagina que este procedimiento se repite con todas las muestras posibles, los datos que
proporcionan cada una de ellas al ingresar al estimador (fórmula) darán como resultado números
(estimaciones) los cuales, en general, diferirán de muestra en muestra. Es decir, que para cada
muestra posible se obtiene un número (no necesariamente distinto).
Una muestra Aleatoria simple con reemplazo, de tamaño n, obtenida a partir de una población de N
unidades, se puede pensar como la extracción de n muestras independientes de tamaño 1.
Una unidad se extrae de la población al azar, para ser la primera unidad muestreada, con una
probabilidad 1/N.
Luego, la unidad muestreada se reemplaza en la población, y una segunda unidad se elige al azar
con una probabilidad de 1/N.
Este procedimiento se repite hasta que la muestra contenga n unidades y puede tener duplicados de
la población.
Una muestra aleatoria simple sin reemplazo de tamaño n se elige de modo que cada subconjunto
posible e n unidades distintas en la población tiene la misma probabilidad de ser elegido en la
N
muestra. Existen muestras posibles, y cada una es igualmente probable, de modo que la
n
probabilidad de elegir cualquier muestra individual S de n unidades es:
1 n! N n !
PS
N N!
n
Como consecuencia de esta definición, la probabilidad de que cualquier unidad dada aparezca en la
muestra es n N .
Para extraer una muestra aleatoria simple, necesitamos una lista de todas las unidades de
En una encuesta por muestro elegimos ciertas propiedades que intentamos medir y registrar para
cada unidad que venga dentro de la muestra. Esta propiedades de las unidades se llaman
características o simplemente atributos.
Los valores obtenidos para cualquier atributo especifico en las N unidades que comprenden la
población, se representan por Y1 , Y2 ,..., YN . Los valores correspondientes para las unidades en
muestreo se denotan por y1 , y 2 ,..., y n
Las letras mayúsculas se refieren a las características de la población y las minúsculas a las de la
muestra.
Población Muestra
___________________________________________________________________
N n
Total : Y Yi Y1 Y2 .... Y N y i y1 y 2 .... y n
i 1 i 1
N n
Y1 Y2 .... YN y1 y 2 .... y n
Yi yi
Media: Y i 1
y i 1
N N n n
__________________________________________________________________
Aun cuando el muestreo se realiza con muchos propósitos, el interés se centra, con frecuencia, en
cuatro características de la población.
Estimadores
_________________________________________________________________
Media de la población Y Yˆ y media muestral
n
Total de la población Y Yˆ Ny N y i n
i 1
_________________________________________________________________
Observación
y i
μ̂ Ŷ y i 1
n
ESTIMADOR DE LA VARIANZA DE y :
2 2
Vˆ y 1 f ,
s n s
1
n N n
y y
n
2
i
i 1
donde s2
n 1
f n es la fracción de muestreo.
N
y1 33,5
y2 32
y3 52
y4 43
y5 40
y6 41
y7 45
y8 42,5
y9 39
n
N yi
Yˆ N y i 1
n
ESTIMADOR DE LA VARIANZA DE Ŷ :
n
y y
2
i
donde s2
n 1
f n es la fracción de muestreo.
N
s2
Z 1 / 2 Vˆ N y Z 1 / 2 N 2
1 f
n
Ejemplo 1.2. Una empresa industrial está interesada en el tiempo por semana que los científicos
emplean para ciertas tareas triviales. Las hojas de control del tiempo de una muestra aleatoria de n =
50 empleados muestran que la cantidad promedio de tiempo empleado en esas tareas es de 10.31
horas, con una varianza muestral de s 2 2.25 . La compañía emplea N = 750 científicos. Estime el
número total horas-hombre que se pierden por semana en las tareas insignificantes y establezca un
límite del 95% para el error de estimación.
Para calcular el tamaño de muestra cuando deseamos estimar la media poblacional, se utiliza la
siguiente expresión:
Z12 / 2 S 2
n e2
(1.1)
1 Z12 / 2 S 2
1
N e2
donde:
N : tamaño de los elementos de la población.
y y
2
s 2
i
n 1
e : Error máximo que aceptamos en las estimaciones las cuales se obtienen en base a
la muestra elegida.
Z12 / 2 2
n0 (1.2)
e2
Si n o / N es despreciable, para calcular el tamaño de muestra utilizamos la ecuación (4.2), sino es
despreciable usamos la siguiente fórmula para calcular n:
n0
n
n (1.3)
0
1
N
Ejemplo 1.3. Un nutricionista del departamento de salud pública, al conducir una investigación
entre una población de muchachas adolescentes con el fin de determinar su ingestión diaria
promedio de proteína, está buscando el consejo de un estadístico con respecto al tamaño de muestra
que debe tomar.
Supóngase que al nutricionista le gustaría que su estimación estuviera dentro de cinco unidades
aproximadamente respecto del valor real. Supóngase también que se decide por un coeficiente de
confianza del 95% y que, en base a su experiencia el nutricionista siente que la desviación estándar
de la población es quizá aproximadamente 20 gramos.
Error de estimación ˆ E
Perror de estimación E 1
Z1 / 2 V y E para n.
Recordemos que la varianza estimada de y , esta dada por:
2
V̂ y
s
1 f
n
También
2
Nn
V y
n N 1
Tamaño de muestra requerido para estimar con un límite para el error del estimador E:
N Z12α/2 σ 2 Nσ 2
n
(N 1)E 2 Z 2 σ 2 (N 1)V σ 2
E2
donde: V es la varianza del estimador θ̂ .
( Z1 / 2 ) 2
Observación
Ejemplo 4. La cantidad promedio de dinero μ para las cuentas por cobrar de un hospital debe ser
estimada. Aunque no se cuenta con datos anteriores para estimar la varianza poblacional . Se
2
sabe que la mayoría de las cuentas caen dentro de una desviación estándar de 25 dolares. Existen N
= 1000 cuentas abiertas. Encuentre el tamaño de muestra necesario para estimar μ con un límite
para el error de estimación de E $3
Tamaño de muestra requerido para estimar Y con un límite para el error de estimación E:
o, equivalentemente,
z1 / 2 N V y E
Luego el tamaño de muestra requerido para estimar Y con un límite para el error e, es:
N 2
n
( N 1) V 2
E2
donde : V 2 2
N Z1 / 2
Ejemplo 1.5. Un investigador está interesado en estimar la ganancia en peso total de 0 a 4 semanas
de N = 1000 polluelos alimentados con una nueva ración. Obviamente, pesar cada ave sería tedioso
y tomaría demasiado tiempo. Por lo tanto, determine el número de polluelos que serán
seleccionados en este estudio para estimar Y con un límite para el error de estimación igual a 1000
gramos. Muchos estudios similares sobre nutrición de polluelos se han llevado a cabo en el pasado.
Usando los datos de esos estudios, el investigador encontró que , la varianza poblacional, fue
2
Observación:
Si el tamaño de la muestra es menor que 30, los puntos de porcentaje se pueden tomar de la
tabla t de Student con (n-1) grados de libertad, siendo estos, los grados de libertad en la
varianza estimada s 2 . La distribución t se ajusta exactamente sólo si las observaciones de
yi están normalmente distribuidas y N es infinito.
Ejemplo 1.6. Se recabaron firmas para una población de 676 hojas. Cada hoja tenía espacio
suficiente para 42 firmas pero en muchas de las hojas se recabó un número menor. Se contó el
número de firmas por hoja en una muestra al azar de 50 hojas (muestra del 7% aproximadamente),
los resultados se muestran en la siguiente Tabla.
Estimar el número total de firmas para la petición y los límites de confianza al 80%. Basado en la
experiencia las medias de las muestras de las observaciones se distribuyen aproximadamente de
acuerdo a una normal.
yi 42 41 36 32 29 27 23 19 16 15 14 11 10 9 7 6 5 4 3 Total
ni 23 4 1 1 1 2 1 1 2 2 1 1 1 1 1 3 2 1 1 50
Notación: Suponemos que todas y cada una de la unidades en la población caen dentro de una, de
dos posibles clases C y C´. La notación es como sigue:
Numero de unidades en C en la :
Población Muestra
A a
Proporción de unidades en C en la :
Población Muestra
P = A/N p = a/n
Para cualquier unidad en la muestra o población, se define y i como 1 si la unidad está en C (posee
la característica específica) , y como 0 si la unidad está en C [ (no posee la característica específica).
Para esta población de valores y i , esta claro que:
N
Y yi A
i 1
y i
A
Y i 1
P
N N
en la misma forma para la muestra:
n
y i
a
y i 1
p
n n
De modo, que el problema de estimar A y P es similar a la estimación del total y la media de una
población en la cual, todos los valores son 1 o 0.
y i
a
P̂ p y i 1
n n
ESTIMADOR DE LA VARIANZA DE P̂ :
Pˆ Qˆ
Vˆ Pˆ 1 f ,
n 1
donde : Qˆ 1 Pˆ
Pˆ Qˆ
Z1 / 2 Vˆ Pˆ Z1 / 2 1 f
n 1
Ejemplo 1.7. De una lista de 3042 nombres y direcciones, una muestra aleatoria simple de 200
nombres mostró, al revisarla. 38 direcciones equivocadas. Estime el número total de direcciones que
se necesita corregir en la lista y encuentre el error estándar de esta estimación.
1.3.3.1. SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA
PROPORCIÓN DE UNA POBLACIÓN
Para calcular el tamaño de muestra cuando deseamos estimar la proporción de una población, se
utiliza la siguiente expresión:
Z12 α/ 2 NPQ
n
N 1 e2 P2 Z12α/ 2 PQ
donde:
Observación
Ejemplo 1.8. En una empresa de 5000 trabajadores se desea estimar la proporción de trabajadores
que tienen una capacidad vital de fuerza debajo del 70% y la media de la capacidad vital de fuerza
de todos los trabajadores, estas estimaciones se necesitan dentro del 5% del valor verdadero del
parámetro que estamos estimando. ¿Qué tamaño de muestra es requerido? Considere un nivel de
significancia del 5%. Considere que por un estudio similar se estimó que la proporción de
trabajadores que tienen una capacidad vital de fuerza debajo del 70% fue de 0.28.
Solución
Observación. Otra expresión que se utiliza para seleccionar el tamaño de muestra para la
estimación de la proporción de una población,
NPQ
n
N 1VPQ PQ
E2
donde: Q 1 P y V
Z 1 / 2
Ejemplo 1.9. Los dirigentes del consejo estudiantil en un colegio desean realizar una encuesta para
determinar la proporción de estudiantes que está a favor de una propuesta de código de honor. Ya
que entrevistar a 2000 estudiantes en un lapso razonable es casi imposible. Determine el tamaño de
muestra (Número de estudiantes a entrevistarse) necesario para estimar p con un límite para el error
de estimación de magnitud E = 0.05 y una confiabilidad del 95%. Suponga que no hay información
previa disponible para estimar P.
Solución
Ejercicio:
Con referencia al ejemplo anterior, supongamos que además de estimar la proporción de estudiantes
que apoya la propuesta de código de honor, los dirigentes del consejo estudiantil también desean
estimar el número de estudiantes que considera que la organización del consejo estudiantil funciona
de acuerdo a sus necesidades. Determine el tamaño de muestra combinado que se requiere en una
encuesta para estimar p1, la proporción de quienes están a favor de la propuesta de código de honor,
y p2, la proporción de los que opinan que el consejo estudiantil funciona de acuerdo con sus
necesidades, con límites para los errores de estimación de magnitud B1 = 0.05 y B2 = 0.07. Aunque
no se dispone de información anterior para estimar p2, aproximadamente el 60% de los estudiantes
opinó que el consejo satisfizo adecuadamente sus necesidades en una encuesta similar llevada a
cabo el año anterior.