Sei sulla pagina 1di 3

El nombre del capítulo es: 4 Conceptos Fundamentales

Los primeros dos conceptos, muestreo aleatorio (random sampling) y error muestral
(sampling error) son fundamentales para entender la lógica de la estadística inferencial.
Sumados los otros dos, la distribución muestral de las medias de la muestras (sampling
distribution of sample means) y teorema del límite central (Central Theory Theorem), tenemos
una buena base de estadística inferencial. En una línea, todos estos cuatro conceptos son
clave para la esta rama de la estadística.

Concepto 1: Muestreo aleatorio

Numerosos procedimientos estadísticos descansan en la asunción de que estamos trabajando


con una muestra que fue elegida de forma aleatoria. Pero esto no significa que agarramos un
puñado aleatorio de gente; para conseguir una muestra aleatoria se necesita cumplir con cierto
criterio de selección. Algunos de los requerimientos para cumplir con ese criterio de selección
son:
● La muestra tiene que ser elegida de tal forma que cada unidad/caso dentro de la
población tiene la misma chance de ser elegido. Hay que tener en cuenta lo diversa
que es la población
● La selección de cualquiera de las unidades/casos tiene que darse de tal forma que no
afecte de ninguna manera a la selección de la otra unidad/caso
● Los casos/unidades tienen que ser elegidos de tal forma que todas las combinaciones
son posibles. EL MÁS IMPORTANTE PARA NOSOTROS Y LA ESTADÍSTICA
INFERENCIAL

Cualquier proceso de selección comienza con la identificación de un marco de muestreo


(sampling frame), que es una representación física de la población. Un ejemplo es: si queremos
investigar algo acerca de lxs alumnxs que están anotados en 6 materias en la universidad, vamos a poder
comenzar con el muestreo una vez que tengamos en nuestro poder algún tipo de lista acerca de lxs
estudiante que cumplen ese criterio → esa lista es el marco de muestreo. En nuestro caso (aleatoriedad)
cada a caso del marco de muestreo se le tiene que asignar un número, y luego una tabla de números
aleatorios sería utilizada para elegir los casos individuales para formar parte de la muestra.

Concepto 2: Error muestral

Esta idea nace con el reconocimiento de que, gracias al muestreo aleatorio, hay un infinito
números de muestras posibles, más allá de que a la hora de investigar solamente trabajes
con una (la cual puede no llegar a ser representativa de la población por la infinita posibilidades
de muestras que hay, aunque hay pocas chances de ello). El error muestral se define como la
diferencia entre una determinada estadística de una muestra y la de un parámetro de la
población que es causa del “destino” (que no es buscada, sino que se da por la aleatoriedad de
la muestra y la muestra que elegimos).

Ilustración de error muestral:


Concepto 3: La distribución muestral de las medias de la muestras

Como sostiene el concepto 2, hay infinitas posibilidades de muestras. Si se hace el ejercicio de


buscar 1000 muestras (de por ej 50 alumnxs) en la misma población, investigando lo mismo
(media de edad de la población), se puede sacar la media de cada una de las muestras,
llegando a la distribución muestral de las medias de la muestras. Para desglosar ese
término, vamos por partes:
● Distribución → como cualquier otro tipo de distribución de algún dato (ingreso, edad, altura,
religión, etc). En este caso es la distribución de las medias de las muestras
● Distribución muestral (sampling distribution) → simplemente significa una distribución que es
el resultado de un muestreo retirado/repetido

Es obvio que este es un concepto abstracto, y nunca nadie se va a tomar el trabajo de tomar
1000 muestras de la misma población investigando lo mismo. De todas formas, el punto es: se
puede construir una distribución muestral si se quiere.

Concepto 4: Teorema del límite central

Si de todas formas de llevar a cabo el tedioso trabajo de buscar la media de 1000 muestras, se
puede graficar una curva con los datos obtenidos. Lo importante es que la curva resultante es
la curva de una distribución normal. Acá se observa la relación existente entre la distribución
muestral de las medias de las muestras y la población de donde se extraen las muestras; el
nombre que recibe dicha relación se denomina Teorema del límite central.

Antes de profundizar sobre ese concepto, es importante hacer tres aclaraciones:


● La distribución muestral de las medias de las muestras, como todas distribuciones,
tienen su propia media
● A su vez, como cualquier otra distribución, también tiene su desvío estándar
● Este desvío estándar recibe un nombre especial → error estándar de la media
○ Esto tiene sentido porque en definitiva, la distribución muestral de las medias de
las muestras también se puede considerar como la distribución del error de
muestreo.

Ahora sí, definición de Teorema del Límite Central (spoiler: no es tan lindo):
● Si una cantidad de muestras aleatorias de tamaño n son extraídas de una población con
una media (mu, 𝜇) y un desvío estándar (σ), la distribución muestral de las medias de
las muestras van a tener una media igual a 𝜇 y un desvío estándar igual a σ/√n. A
medida de que n crece, la distribución muestral se va a acercar a la distribución normal.

Vamos con la traducción: tenemos una población, que mide una media 𝜇 y un desvío estándar
σ. También tenemos una distribución muestral de las medias de las muestras construida de esa
población. Esa distribución tiene una muestra, que tiene que ser igual a la media de la
población. También va a tener su desvío estándar, llamado error estándar de la media; este va
a ser igual al desvío estándar de la población σ dividido por la raíz cuadrada de n (número de
casos en cada muestra). En otras palabras, la distribución muestral de las medias de las
muestras se va a parecer eventualmente a una distribución normal. Pongo fotito que quizás se
entiende mejor:

Potrebbero piacerti anche