Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Inferencia Estadstica
Introduccin
Estas a punto de concluir este curso introductorio de Estadstica y Probabilidad, para ello,
nos falta estudiar dos ltimos temas principales muy importantes: Distribuciones
Muestrales y Anlisis de Tendencias.
Con respecto al primero es importante mencionar que a menudo necesitamos estudiar las
propiedades de una determinada poblacin, pero nos encontramos con el inconveniente
de que sta es demasiado numerosa como para analizar a todos los individuos que la
componen. Por tal motivo, recurrimos a extraer una muestra 1 de la misma y a utilizar la
informacin obtenida para hacer inferencias sobre toda la poblacin.
Estas estimaciones sern vlidas slo si la muestra tomada es representativa de la
poblacin. En principio, podramos distinguir dos tipos de muestra: la probabilstica y la no
probabilstica; una muestra probabilstica es una muestra seleccionada de tal forma que
cada elemento de la poblacin tiene la misma probabilidad de formar parte de la muestra.
De esta manera, si se utilizan mtodos no probabilsticos, no todos los elementos de la
poblacin tienen la misma probabilidad de ser incluidos. En este caso, diramos que los
resultados estn sesgados, lo cual quiere decir que tal vez los resultados de la muestra no
sean representativos de la poblacin.
Una forma de asegurarnos de que el subconjunto escogido es representativo de toda la
poblacin consiste en tomar una muestra aleatoria simple, la cual se caracteriza por:
1. Cada miembro de la poblacin tiene la misma probabilidad de ser elegido, y
2. Las observaciones son elegidas siguiendo una secuencia aleatoria.
La tcnica con la cual obtendremos la muestra es el muestreo aleatorio, el cual realizado
bajo ciertas condiciones y sometidos a ciertos requisitos, se constituye en un
procedimiento prctico, econmico y rpido para generalizar conclusiones obtenidas a
travs de una muestra, aplicable a toda la poblacin de la que forma parte, dentro de
ciertos lmites de confiabilidad, establecidos de antemano. Existen diferentes tcnicas de
muestreo, las cuales mencionaremos (por las caractersticas del curso y ser slo
introductorio) sin entrar en detalle de cmo realizarlo:
Propsito
Al trmino de la unidad el estudiante sers competente para inferir el comportamiento de
un fenmeno fsico o social, a partir del anlisis de su comportamiento estadstico; lo
anterior te permitir estimar el comportamiento futuro del mismo.
Ejemplo
Vamos a suponer que tenemos una poblacin con N= 3 elementos, X = {1, 2 y 3]. Donde,
si fijas bien, =2 y 2=0.67. Se extraen muestras de n=2 elementos y, si lo hacemos con
reemplazo, obtenemos las siguientes muestras
(1,1); (1,2); (1,3); (2,1); (2,2); (2,3); (3,1); (3,2); (3,3)
Al calcular los estadsticos
y s2 obtenemos que:
Si te fijas bien, los estadsticos son variables aleatorias que pueden adoptar diferentes
valores y que tienen su propia distribucin de probabilidad. En el ejemplo vemos que
puede tomar 5 valores y que la probabilidad que corresponde a cada uno de ellos
(f( ), su distribucin) es:
f(
1.5
2.5
TOTAL
1/9
2/9
3/9
2/9
1/9
Grficamente tenemos
(6,6)
6
(8,6)
7
(10,6)
8
(12,6)
9
(14,6)
10
(6,8)
7
(8,8)
8
(10,8)
9
(12,8)
10
(14,8)
11
(6,10)
8
(8,10)
9
(10,10)
10
(12.10)
11
(14,10)
12
(6,12)
9
(8,12)
10
(10,12)
11
(12,12)
12
(14,12)
13
(6,14)
10
(8,14)
11
(10,14)
12
(12,14)
13
(14,14)
14
en
Frecuencia relativa
(P(X= ))
1/25
2/25
3/25
4/25
5/25
4/25
3/25
2/25
1/25
1
1
2
3
4
5
4
3
2
1
25
Si te fijas bien, los datos de la tabla cumplen con los requisitos para una distribucin de
probabilidades. Las probabilidades individuales son mayores que cero y su suma es igual
a 1.
La grfica quedara creciendo gradualmente hasta formar un pico para despus decrecer
de manera simtrica, como la distribucin Normal Recuerdas? Entonces tenemos que
, de la distribucin muestral.
Para hacerlo sumamos las 25 medias y las dividimos entre 25, obteniendo que
=10. Si
te fijas muy bien vers que la media de la distribucin muestral de tiene el mismo valor
que la media de la poblacin original. Por ltimo, calculemos la varianza de , a la cual
denotaremos por
La media
de la distribucin de
cual se extrajeron las muestras.
III.
La varianza de , de la distribucin de
dividida entre el tamao de la muestra.
En resumen,
En el segundo caso, cuando el muestreo se realiza a partir de una poblacin no
distribuida normalmente, usaremos un teorema muy importante en Matemticas llamado
Teorema del lmite central.
Teorema del lmite central: Dada una poblacin distribuida de cualquier forma, la
distribucin muestral, calculada a partir de muestras de tamao n de sta
poblacin, estar distribuida aproximadamente a una normal con media y varianza
, cuando el tamao de la muestra es grande.
Nota que el Teorema del lmite central nos permite muestrear a partir de poblaciones no
distribuidas normalmente con una garanta de aproximadamente los mismo resultados
que se obtendran si la poblacin estuviera distribuida normalmente, siempre que se tome
una muestra grande. Qu tan grande debe ser la muestra? No existe una respuesta
firme y rpida, dado que el tamao necesario de la muestra depende de la extensin de la
no normalidad presente en la poblacin. Una regla emprica ampliamente usada afirma
que, en la mayora de las situaciones prcticas, resulta satisfactorio un tamao de la
muestra de 30. Agreguemos que, en general, se hace mejor y mejor la aproximacin
hacia la normalidad de la distribucin muestral de , a medida que aumenta el tamao de
la muestra.
Como lo vers ms adelante en cursos de licenciatura, el conocimiento y comprensin de
las distribuciones muestrales ser un requisito necesario para entender los conceptos de
la Inferencia estadstica. La aplicacin ms sencilla del conocimiento de la distribucin
muestral de la media de la muestra es el calcular la probabilidad de obtener una muestra
con une media de alguna magnitud especificada.
Ejemplo
1.- Supngase que se sabe que, en cierta poblacin humana grande, la longitud craneal
est distribuida aproximadamente en forma normal con una media de 185.6 mm y una
desviacin estndar de 12.7 mm. Cul es la probabilidad de que una muestra aleatoria
de tamao 10 de sta poblacin tenga una media mayor que 190?
Como la poblacin se distribuye aproximadamente como una normal, podemos tomar que
se distribuye como una normal con media
= 185.6 mm y varianza
. De sta
Si recuerdas, de la unidad anterior, aprendiste que siempre que se tiene una variable
aleatoria normalmente distribuida, fcilmente se puede convertir en una variable aleatoria
distribuida de manera normal unitaria. Para transformar la variable aleatoria
en la
distribucin normal unitaria usaremos la frmula Z=
variable. Las ideas de regresin fueron aclaradas por primera vez por el cientfico ingls,
Sir Francis Galton (1822-1911) en los informes de sus investigaciones sobre la herencia,
primero en los chcharos y posteriormente, en la estatura humana. Describi una
tendencia del hijo adulto, que tiene padres bajos o altos, de regresar hacia la estatura
promedio de la poblacin general. Primero us la palabra reversin y, despus, regresin
para referirse a ste fenmeno.
b=
Con la ecuacin de la recta finalmente podremos hacer una estimacin o pronstico del
comportamiento de la variable y para valores de x que no se encuentren en la muestra,
que finalmente es el objetivo del anlisis de regresin.
Ejemplo
1.- Se tienen los siguientes datos sobre la aplicacin de fertilizante a un campo agrcola.
X:
Fertilizante
(kg/m2)
Y:
Produccin
(ton/ha)
1.5
3.3
4.8
6.5
7.5
18
20
23
30
Encontrar:
a) La ecuacin de la recta de mnimos cuadrados que se ajuste a los datos de la
tabla.
10
Para encontrar la recta, usaremos la siguiente tabla y las frmulas dadas anteriormente
11
X
Y
X2
X*Y
m=
b=
1.5
7
2.25
10.5
3.3
18
10.89
59.4
4.8
20
23.04
96
6.5
23
42.25
149.5
7.5
30
56.25
225
Sumas
23.6
98
134.68
540.4
= 3.342
= 3.823
12
En el caso (a) y (b) el ndice es positivo y negativo, significa que es muy bueno, lo
que se traduce en una relacin muy buena entre las variables, es decir, estn
relacionadas.
13
En el caso (b) y (c) el ndice es positivo y negativo, significa que los datos estn
muy dispersos con respecto a la recta, lo que se traduce en que las variables no
estn relacionadas.
Ejemplo
1.- Determine el coeficiente de correlacin de Pearson para los siguientes datos obtenidos
de una muestra:
X
Y
1.5
7
3.3
18
4.8
20
6.5
23
7.5
30
X
Y
X2
Y2
X*y
1.5
7
2.25
49
10.5
3.3
18
10.89
324
59.4
4.8
20
23.04
400
96
6.5
23
42.25
529
149.5
7.5
30
56.25
900
225
Sumas
23.6
98
134.68
2202
540.4
Entonces
El valor obtenido nos indica un ajuste muy bueno con lo que podemos decir que las
variables X y Y estn muy bien relacionadas.
14
Conclusin
Haz finalizado tu quinta unidad del curso de Estadstica y Probabilidad, en el cual
aprendiste los siguientes conceptos:
15
Referencias
De contenido
Libros
De consulta
Sitios de internet
Las siguientes ligas electrnicas te servirn de apoyo para la distribucin muestral de
medias y la regresin lineal.
FACULTAD DE INGENIERIA. (s.f.). Probabilidad y Estadstica: Captulo 15 Los
Estadsticos
y
sus
Distribuciones.
UNAM.
http://dcb.fic.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf
FACULTAD DE CONTADURIA Y ADMINISTRACION, Coordinacin de
Matempticas.
(s.f.).
Estadstica
II.
UNAM.
http://fcasua.contad.unam.mx/apuntes/interiores/docs/98/4/estadis_2.pdfUNAM.
Captulo
18:
Anlisis
de
regression
lineal.
UNAM.
http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/mater
iales/analisis_datosyMultivariable/18reglin_SPSS.pdf
De imgenes
43. Media muestral
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
44. Media muestral
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
45. Sir Francis Galton
Recuperado de:
http://www.probertencyclopaedia.com/CX_FRANCIS_GALTON.HTM
46. Dispersin de datos
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
47. Dispersin recta de datos
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
48. Dispersin recta de datos
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
49. Diagramas de dispersin
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
16