Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
196
Sabemos que la descripción de los datos muestrales se logra con tres conceptos
básicos:
Medidas de tendencia central: la media es el estadístico muestral más conocido
Medidas de dispersión o variabilidad: el desvío estándar es el utilizado con más
frecuencia
Forma o tipo de distribución: simetría y curtosis.
Para ubicar éste interrogante a nivel práctico, supongamos que acabamos de ob-
tener una muestra de 25 cubiertas. Los cubiertas fueron sometidos a una prueba para
determinar los km. que duraban. Con los datos muestrales pueden obtenerse distintas
medidas descriptivas - media, mediana, desvío estándar, asimetría, curtosis. Sin embargo,
no nos interesa la muestra en sí porque las cubiertas fueron inutilizadas en el proceso de
prueba y ya no se pueden vender. Lo importante es obtener información sobre la pobla-
ción total de cubiertas.
2. DISTRIBUCIONES MUESTRALES.
El estudio de todas las muestras que pueden extraerse de una población (finita o
infinita), nos va a permitir:
calcular las medidas de tendencia central para el estadístico muestral
calcular las medidas de dispersión o variabilidad
determinar la forma que tiene la distribución
2x
300 2002 100 2002 200 2002 6.666,67 autos2
3
Servicios
Autos
Estadística I
199
CON REPOSICION
M = Nn
El cuadro anterior contiene todas las muestras posibles, que en total son 9. Puede
plantearse la siguiente pregunta: ¿cuántas muestras de tamaño n deben extraerse en
la vida real, cuando se desea realizar una investigación estadística mediante el muestreo
con reposición? La respuesta a esta pregunta da lugar a la
Media
Ensayo Muestra Resultados
muestral
1 S S 300 300 300
2 S G 300 100 200
3 S A 300 200 250
4 G S 100 300 200
5 G G 100 100 100
6 G A 100 200 150
7 A S 200 300 250
8 A G 200 100 150
9 A A 200 200 200
Total 1.800
Estadística I
200
Se puede observar que hay varios resultados para el valor de la media muestral, y
que ellos dependen de cómo se encuentren conformadas las M muestras diferentes de
tamaño n = 2. Los resultados presentados en el cuadro anterior constituyen el conjunto
de medias muestrales calculadas a partir de la población de medias muestrales definidas
previamente, lo que implica que el cuadro contiene una población de medias muestra-
les de tamaño M, y ese conjunto se denomina Distribución muestral de las medias.
Esta conclusión puede ser generalizada del siguiente modo: por el mismo princi-
pio que rige para la media, cualquier cálculo muestral (es decir cualquier otra medida
de posición y/o de dispersión que se obtenga a partir de los datos muestrales), y no sólo
la media aritmética puede considerarse como variable.
x 1.800
200 autos, lo que permite formular la
x M 9
x x
2
2 i 30.000 6.666,66
x 3.333,33 , lo cual permite enunciar la
M 9 2
2
2
x x
x n x n
Servicios
Autos
en el que se observa:
los valores extremos de la variable media muestral son coincidentes con
los de la variable xi (en este caso son 100 y 300), y
a medida que el tamaño n de la muestra crece, como la cantidad de muestras
posibles aumentará considerablemente, aparecerán para la media muestral
nuevos valores, que siempre oscilarán entre los valores extremos ya determi-
nados.
Estadística I
202
Es decir que, en ese caso, la gráfica de bastones que se observa más arriba pre-
sentará nuevos valores y una mayor cantidad de bastones. En el límite, cuando n crezca
indefinidamente, la variable media muestral se convertirá en continua y la gráfica de bas-
tones se transformará en un área, lo que permite obtener la
Esta última conclusión suele encontrarse en los libros de texto bajo la denomina-
ción de Teorema Central del Límite.
S-G S–A
G-A
Es decir que esta primera conclusión tiene una diferencia comparada con la indi-
cada para el caso con reposición.
N 3 3!
M 3
n
2 2! 3 2 !
El siguiente cuadro contiene las medias muestrales de cada una de las muestras
que aparecen en el cuadro anterior:
Media
Ensayo Muestra Resultados
muestral
1 S G 300 100 200
2 S A 300 200 250
3 G A 100 200 150
Total 600
Las conclusiones
no tienen modificación alguna en su texto, por lo que son válidas para los casos sin repo-
sición.
x 600
200 autos
x M 3
x x
2
2 i 5.000
x 1.666,67
M 3
lo cual permite decir que en el caso sin reposición la variancia de la variable aleato-
ria media muestral es diferente al caso con reposición. Por consiguiente, la 5ª con-
clusión es:
2 N n
2
Nn
x x
x n N1 x n N 1
6.666,66 3 2
2
1.666,67
x 2 3 1
N n
el coeficiente se denomina factor de corrección para poblaciones finitas.
N 1
Finalmente, la 6ª conclusión es similar a la señalada para el caso con reposición,
es decir que en el muestreo sin reposición, cuando n , la variable media muestral se
distribuye normalmente con media poblacional x x y variancia poblacional
x2 N n
2 .
x n N 1
x2 N n
Es decir que x N (x ; ) si n.
n N 1
x x x x
z
x x
n
Pero en realidad, más que encontrar las probabilidades de que las medias mues-
trales tomen determinados valores, nos interesa encontrar aquellos valores que determi-
nen un intervalo en el que estarían incluidas el 95 % de las medias, y esto también lo po-
demos calcular mediante la variable estandarizada:
x x z x x x x
n n
Lind, Douglas A.. Estadística aplicada a los negocios y la economía, 15th Edition. McGraw-
Hill Interamericana, 2012.
Esto significa que el estadístico muestral calculado (media, desvío estándar, pro-
porciones) suministra la información para estimar los valores de la población.
Nn
N 1
n Nn Nn
1
N N N 1
CON REPOSICION
se verifica que :
E(fi)=np V(fi)=npq
f i 1 1
E (hi ) h E
E ( f i ) np p
n n n
f i 1 1 pq
V (hi ) h2 V
2 V ( f i ) 2 npq
n n n n
lo cual, en virtud de que la 6ª conclusión es también válida para cualquier cálculo mues-
tral, permite decir que en el muestreo con reposición la variable proporción muestral
pq
hi se distribuye normalmente con media poblacional p y varianza poblacional
n
si n .
pq
Es decir que: hi N ( p; ) si n .
n
Cuando se trabaja sin reposición (lo que equivale a trabajar con poblaciones fini-
tas) la variable proporción muestral tiene una distribución normal con media pobla-
pq N n
cional p y varianza poblacional cuando n .
n N 1
pq N n
En definitiva, para casos sin reposición hi N ( p; ) si n .
n N 1
El desvío estándar muestral (Sx) es, para muestras de tamaño n>30, como cual-
quier cálculo muestral y en función de la generalización de la 3ª conclusión, una variable
que posee su media y su varianza poblacionales, las cuales son:
E( S )
x S x
x
Estadística I
209
x2
y V (S x ) S2
x 2n
por lo cual se puede decir que la variable desvío estándar muestral Sx se distribuye
2
normalmente con parámetros esperanza matemática x y varianza x .
2n
x2
Sx N ( x ; ) si n .
2n
PREGUNTAS TEORICAS:
EN POBLACIONES INFINITAS
Variables Media Varianza Desvío Estándar
Poblacional Poblacional Poblacional
Media x2 x
muestral E ( x) x x V ( x) 2 DS( x )
x n x n
x
Proporción
muestral E (hi ) h p pq pq
hi
V (hi ) h2 DS (hi ) h
n n
Desvío
Estándar x2 x
DS (S x ) S
muestral E (Sx ) x V (Sx ) S2 x
2n
Sx Sx x 2n
EN POBLACIONES FINITAS
Variables Media Varianza Desvío Estándar
Poblacional Poblacional Poblacional
Media x2 N n x N n
muestral E ( x ) x x V ( x) 2 DS ( x)
x n N 1 x n N 1
x
Proporción
muestral E (hi ) h p pq N n pq N n
hi V (hi ) h2 DS (hi ) h
n N 1 n N 1