Sei sulla pagina 1di 8

Definicin muestra aleatoria simple

En principio, podramos distinguir dos tipos de muestra: la probabilstica y la no probabilstica, en el sentido en que una muestra probabilstica es una muestra seleccionada de tal forma que cada elemento de la poblacin tiene la misma probabilidad de formar parte de la muestra. De esta manera, si se utilizan mtodos no probabilsticos, no todos los elementos de la poblacin tienen la misma probabilidad de ser incluidos. En este caso, diramos que los resultados estn sesgados, lo cual quiere decir que tal vez los resultados de la muestra no sean representativos de la poblacin. Una forma de asegurarnos de que el subconjunto escogido es representativo de toda la poblacin consiste en tomar una muestra aleatoria simple, la cual se caracteriza por: 1. Cada miembro de la poblacin tiene la misma probabilidad de ser elegido, y 2. Las observaciones son elegidas siguiendo una secuencia aleatoria.

Tras entender la importancia de escoger una muestra representativa de la poblacin, veamos que para lograr esto, podemos seleccionar, por ejemplo, una muestra aleatoria simple de la poblacin, pero es muy improbable que la media de la muestra sea idntica a la media de la poblacin. De la misma manera, tal vez la desviacin estndar u otra medicin que se calcule con base en la muestra no sea igual al valor correspondiente de la poblacin Por tanto, es posible que existan ciertas diferencias entre los estadsticos de la muestra (como la media o la desviacin estndar), y los parmetros de poblacin correspondientes. A dicha diferencia se la conoce como error de muestreo.

ww w.

Error en el muestreo:

at

em

at

ic a1

.c om

Distribucin muestral de la media de las muestras:


Consistira en una distribucin de probabilidad de todas las medias posibles de las muestras de un tamao de muestra dado. As pues, dada una poblacin (a la cual representaremos por la v.a. X ), podemos extraer de la misma k muestras, cada una de ellas de tamao n. Para cada una de las k muestras podemos calcular un estadstico, p.e., la media de las n observaciones que la componen. As tendremos un total de k nuevos valores una nueva v.a.

xi , i = 1,..., k . Podemos asociar estos valores a

X , cuya distribucin llamaremos distribucin muestral.

Una de las propiedades ms importantes es la siguiente: Teorema (Distribucin de las Medias Muestrales): Sea X una v.a. cualquiera de media y desviacin tpica , entonces: o Si consideramos todas las muestras aleatorias posibles, cada una de ellas de tamao n, se cumplir que

x = y x =
om

Adems, si X sigue una distribucin normal,

X tambin ser normal.

Seleccionar Calc > Random Data > Normal :

ww w.

at

em

A fin de visualizar el Teorema de Distribucin de las Medias Muestrales, vamos a simular la extraccin de k=100 muestras de una variable normal con media 80 y desviacin tpica 5. Tomaremos como n=9 el tamao de cada muestra:

at

ic a

Ejemplo:

1.c

Rellenamos los campos segn se indica en la imagen inferior:

Disponemos ahora de 100 nuevos valores (las medias) situados en la columna 20. A continuacin se muestran los Dotplot asociados a las columnas C1 (que representa 100 valores aleatorios obtenidos de una normal 80-5), y C20:

ww w.

at

em

at

Seleccionar Calc > Row Statistics y rellenar los campos segn se indica:

ic a

1.c

Habremos generado as una matriz de 9 columnas y 100 filas. Cada componente de esta matriz es una observacin aleatoria proveniente de una distribucin normal de media 80 y desviacin estndar 5. Consideraremos que cada una de las filas obtenidas es una muestra, y lo que haremos ahora ser calcular la media asociada a cada una de estas 100 muestras:

om

Seleccionar Graph > Character graph > Dotplot:

Dotplot
.. . . : .:: . :: ..::.: ::: . ... : .::::....::.:.::::::.:::.::.:::. :. : .:. . X-----+---------+---------+---------+---------+--------+-

.. ::: : . . ::: : : .:::::::.: .:::::::::::. :.::::::::::::::...: X-barra -----+---------+---------+---------+---------+--------+72,0 92,0


Finalmente, analizaremos tambin los estadsticos que describen la distribucin de las medias muestrales:

ww w.

at

em
76,0

at

ic a

1.c

om
80,0

84,0

88,0

Descriptive Statistics
Variable X-barra Variable X-barra N 100 Minimum 76,035 Mean 79,566 Maximum 83,799 Median 79,446 Q1 78,459 TrMean 79,543 Q3 80,627 StDev 1,596 SE Mean 0,160

Observamos lo siguiente: 1. La distribucin de la v.a. inicial X era normal y, segn el grfico de puntos anterior, parece que tambin la distribucin de la v.a. X-barra es normal, de media muy similar y desviacin estndar menor (los puntos de la X-barra estn menos dispersos que los de la X). 2. Ms concretamente, la media de los 100 valores contenidos en C20 (y que es una aproximacin a la media de la v.a. X-barra) es de 79,566 , valor muy similar a la media de X (que era de 80). Esto es coherente con lo que la teora nos indica:

x =
3. La desviacin estndar de los 100 valores en C20 (que ser una aproximacin a la desviacin estndar de X-barra) es de 1,596 . Si tomamos la desviacin estndar de X (que era de 5) y la dividimos por 3 (raz de 9, el tamao de la muestra), obtenemos el valor 1,667. Ambos valores son muy parecidos, tal y como la teora predice:

x =

n
om

Sea X una v.a. cualquiera de media y desviacin tpica , entonces: Si el tamao muestral n es suficientemente grande (en la prctica suele valer n>30), la distribucin de las medias muestrales se aproxima a la de una normal, i.e.:

ww w.

at

em

at
X N , n

El Teorema Central del Lmite:

La importancia del TCL radica en que sea cul sea la distribucin de la poblacin original (v.a. X), conforme el tamao de las muestras ( n ) aumenta, la distribucin de las medias se va aproximando a la de una normal (de la cual conocemos muchas propiedades). As, si la poblacin tiene una distribucin de probabilidad normal, entonces, para cualquier tamao de muestra la distribucin del muestreode la media tambin tendr una distribucin normal. Si la distribucin de la poblacin es simtrica (pero no normal), ser ver que surge la forma normal como lo establece el TCL an con muestras de al menos 30 para observar las caractersticas de normalidad. Un ejemplo grfico que muestra el Teorema Central del Lmite, lo podemos encontrar en el siguiente enlace: http://www.unalmed.edu.co/~estadist/C.L.T/T_C_L.htm , de forma que cambiando el tamao de la muestra veremos cmo va variando dicho grfico, obtendremos representaciones similares a la siguiente:

ic a

1.c

ww w.

at

em

at

ic a

Otro ejemplo similar al anterior, lo podemos encontrar en: . Nuevamente, http://www.ideamas.cl/cursoProb/javaEstat/central_limit_theorem/clt.html cambiando los datos veremos cmo la distribucin resultante se va aproximando a una distribucin normal:

1.c

om

CASOS PRCTICOS CON SOFTWARE___________________________________


Segn viene publicado en una prestigiosa revista de economa, el salario semanal medio de los profesores universitarios europeos es de 406,15 . Se estima adems que la desviacin estndar de dichos salarios es de 55,50 . Supongamos ahora que pretendemos tomar una muestra aleatoria de 100 profesores para estudiar sus salarios. Calcular las siguientes probabilidades referentes a la media de dicha muestra: 1. La probabilidad de que la media de la muestra sea menor de 400 . En primer lugar, observar lo siguiente: como n = 100 >> 30, por el Teorema Central del Lmite tendremos que la distribucin de las medias muestrales una normal con media 406,15 y desviacin estndar 5,50. Hemos de hallar

X se podr aproximar por

P( X < 400) :

Seleccionamos: Calc > Probability Distributions > Normal :

Cumulative Distribution Function Normal with mean = 406,150 and standard deviation = 5,55000 x 400,0000 P( X <= x) 0,1339

ww w.

at

em

at

ic a

1.c

om

2.

La probabilidad de que la media de la muestra est entre 400 y 410 . Sabemos que P ( 400 < X < 410) = P ( X < 410) P ( X < 400) . La segunda de stas probabilidades ya la hemos calculado en el apartado anterior. Para calcular la primera se razona anlogamente, obteniendo que:
Cumulative Distribution Function Normal with mean = 406,150 and standard deviation = 5,55000 x 410,0000 P( X <= x) 0,7561

Por tanto, tendremos:

P(400 < X < 410) = P( X < 410) P ( X < 400) = 0,6222

3. La probabilidad de que la media de la muestra sea mayor de 415 . En este caso, P ( X > 415) = 1 P ( X < 415) . Hemos de calcular pues esta ltima probabilidad, lo cual haremos de forma anloga a los apartados anteriores. Obtendremos lo siguiente:

Por consiguiente,

P( X > 415) = 1 P( X < 415) = 0,0554

ww w.

x 415,0000

P( X <= x) 0,9446

at

Normal with mean = 406,150 and standard deviation = 5,55000

em

Cumulative Distribution Function

4.

Hallar el valor del salario medio c tal que

Seleccionamos nuevamente: Calc > Probability Distributions > Normal , pero ahora elegiremos la opcin Inverse Cumulative Probability , con lo que obtendremos : Inverse Cumulative Distribution Function
Normal with mean = 406,150 and standard deviation = 5,55000 P( X <= x) 0,9500 x 415,2789

at

ic a
P( X < c) = 0,95

1.c

om

Potrebbero piacerti anche