Inferencia Estadistica

Unidad 5.
Inferencia Estadstica
Introduccin
Estas a punto de concluir este curso introductorio de Estadstica y Probabilidad, para ello,
nos falta estudiar dos ltimos temas principales muy importantes: Distribuciones
Muestrales y Anlisis de Tendencias.
Con respecto al primero es importante mencionar que a menudo necesitamos estudiar las
propiedades de una determinada poblacin, pero nos encontramos con el inconveniente
de que sta es demasiado numerosa como para analizar a todos los individuos que la
componen. Por tal motivo, recurrimos a extraer una muestra 1 de la misma y a utilizar la
informacin obtenida para hacer inferencias sobre toda la poblacin.
Estas estimaciones sern vlidas slo si la muestra tomada es representativa de la
poblacin. En principio, podramos distinguir dos tipos de muestra: la probabilstica y la no
probabilstica; una muestra probabilstica es una muestra seleccionada de tal forma que
cada elemento de la poblacin tiene la misma probabilidad de formar parte de la muestra.
De esta manera, si se utilizan mtodos no probabilsticos, no todos los elementos de la
poblacin tienen la misma probabilidad de ser incluidos. En este caso, diramos que los
resultados estn sesgados, lo cual quiere decir que tal vez los resultados de la muestra no
sean representativos de la poblacin.
Una forma de asegurarnos de que el subconjunto escogido es representativo de toda la
poblacin consiste en tomar una muestra aleatoria simple, la cual se caracteriza por:
1. Cada miembro de la poblacin tiene la misma probabilidad de ser elegido, y
2. Las observaciones son elegidas siguiendo una secuencia aleatoria.
La tcnica con la cual obtendremos la muestra es el muestreo aleatorio, el cual realizado
bajo ciertas condiciones y sometidos a ciertos requisitos, se constituye en un
procedimiento prctico, econmico y rpido para generalizar conclusiones obtenidas a
travs de una muestra, aplicable a toda la poblacin de la que forma parte, dentro de
ciertos lmites de confiabilidad, establecidos de antemano. Existen diferentes tcnicas de
muestreo, las cuales mencionaremos (por las caractersticas del curso y ser slo
introductorio) sin entrar en detalle de cmo realizarlo:
Muestreo aleatorio simple: En el cual se da igual oportunidad de seleccin a c ada

muestra de la poblacin.
Muestreo aleatorio estratificado: Garantiza la representatividad, reduciendo el error
de la muestra al formar grupos o subpoblaciones ms o menos homogneas, en
cuanto a su composicin interna y heterognea cuando se comparan los estratos
entre s.
Una muestra es un subconjunto de la poblacin.
Muestreo aleatorio sistemtico: Se elige un individuo al azar y a partir de l, a

intervalos constantes, se eligen los dems hasta completar la muestra.
Muestreo aleatorio por conglomerados: Se usa cuando la poblacin se encuentra
dividida, de manera natural, en grupos que se supone que contienen toda la
variabilidad de la poblacin, es decir, la representa fielmente respecto a la
caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o
conglomerados para la realizacin del estudio.
En muchos casos, el muestreo es la nica manera de poder obtener alguna conclusin de

una poblacin, entre otras causas, por el coste econmico y el tiempo empleado que
supondra estudiar a todos los miembros de una poblacin.
Tras entender la importancia de escoger una muestra representativa de la poblacin,
vemos que para lograr esto, podemos seleccionar, por ejemplo, una muestra aleatoria
simple de la poblacin, pero es muy improbable que la media de la muestra sea idntica a
la media de la poblacin. De la misma manera, tal vez la desviacin estndar u otra
medicin que se calcule con base en la muestra no sea igual al valor correspondiente de
la poblacin Por tanto, es posible que existan ciertas diferencias entre los estadsticos de
la muestra (como la media o la desviacin estndar), y los parmetros de poblacin
correspondientes. A dicha diferencia se la conoce como error de muestreo.
En esta unidad veremos cmo es posible estimar la media de la poblacin a partir de la
distribucin que siguen las medias de las diferentes muestras obtenidas. Lo anterior es
una parte muy importante para trabajar con la Inferencia Estadstica.
Con respecto al segundo tema principal, Anlisis de Tendencias, surge porque a menudo
se est interesado en la relacin que existe entre un par de variables, por ejemplo, la
presin de la sangre y la edad; la altura de un padre con la altura de un hijo; la estatura y
el peso; el ingreso total familiar y los gastos mdicos; el nivel de consumo de un nutriente
y la ganancia del peso; etctera. La naturaleza y la intensidad de la relacin entre las
variables como stas, puede examinarse por medio de regresin y el coeficiente de
correlacin que son tcnicas del anlisis de tendencias. Es decir, el anlisis de regresin
ser til para averiguar la forma probable de la relacin entre las variables y, cuando se
emplea este mtodo de anlisis, el objetivo final por lo general es predecir o estimar el
valor de una variable, correspondiente a un valor dado de otra variab le.
En esta unidad veremos de qu se trata el anlisis de regresin, en particular
trabajaremos con la regresin lineal simple, y el coeficiente de correlacin de Pearson.
Propsito
Al trmino de la unidad el estudiante sers competente para inferir el comportamiento de
un fenmeno fsico o social, a partir del anlisis de su comportamiento estadstico; lo
anterior te permitir estimar el comportamiento futuro del mismo.
5.1 Distribuciones Muestrales

La Estadstica Inferencial trata sobre las inferencias con respecto a poblaciones a partir de
la informacin contenida en las muestras, es decir, trata de hacer inferencias sobre los
parmetros y 2 a travs de los estadsticos y s2. Para poder llevar a cabo estas
inferencias es necesario conocer la relacin que se establece entre los estadsticos y los
parmetros. El concepto que permite poner en relacin ambas cosas es la distribucin
muestral de un estadstico.
La distribucin muestral de un estadstico es la distribucin de todos los valores
posibles que pueden ser tomados por algn estadstico, calculados a partir de
muestras del mismo tamao extradas aleatoriamente de la misma poblacin.
Las distribuciones muestrales pueden construirse empricamente cuando se obtienen de
una poblacin discreta finita. Para construir una distribucin muestral se procede como
sigue:
1. De una poblacin finita, discreta, de tamao N, se extraen aleatoriamente todas
las muestras posibles de tamao n.
2. Se calcula el estadstico de inters para cada muestra (puede ser la media y/o la
varianza).
3. Se enumeran en una columna los diferentes valores observados del estadstico y,
en otra columna, la frecuencia correspondiente de la ocurrencia de cada uno de
esos valores.
Ejemplo
Vamos a suponer que tenemos una poblacin con N= 3 elementos, X = {1, 2 y 3]. Donde,
si fijas bien, =2 y 2=0.67. Se extraen muestras de n=2 elementos y, si lo hacemos con
reemplazo, obtenemos las siguientes muestras
(1,1); (1,2); (1,3); (2,1); (2,2); (2,3); (3,1); (3,2); (3,3)
Al calcular los estadsticos
y s2 obtenemos que:
Las medias seran: 1; 1.5; 2; 1.5; 2; 2.5; 2; 2.5 y 3 respectivamente.

Las varianzas seran: 0; 0.25; 1; 0.25; 0; 0.25; 1; 0.25 y 0 respectivamente.
Si te fijas bien, los estadsticos son variables aleatorias que pueden adoptar diferentes
valores y que tienen su propia distribucin de probabilidad. En el ejemplo vemos que
puede tomar 5 valores y que la probabilidad que corresponde a cada uno de ellos
(f( ), su distribucin) es:
f(
1.5
2.5
TOTAL
1/9
2/9
3/9
2/9
1/9
Grficamente tenemos
Imagen 43. Media muestral

Por lo comn, se tiene inters en conocer tres cosas acerca de una distribucin muestral
dada: su media, su varianza y su forma funcional (como se ve cuando se construye la
grfica). Puede reconocerse la dificultad de construir una distribucin muestral de acuerdo
con los pasos dados arriba, cuando la poblacin de muy grande. Tambin puede tenerse
un problema cuando se considera la construccin de una distribucin muestral para una
variable continua. Lo mejor que se puede hacer experimentalmente, en este caso, es
aproximar la distribucin muestral de un estadstico.
En la siguiente seccin trabajaremos con una de las distribuciones muestrales que se
usan con ms frecuencia, la distribucin muestral de la media.
5.2 Distribucin Muestral de la Media

Una importante distribucin muestral es la distribucin muestral de la media. Veamos
cmo se construye sta distribucin muestral, siguiendo los pasos que se indicaron en la
seccin anterior.
Ejemplo
Supngase que se tiene una poblacin de tamao N=5 que consiste en las edades de
cinco nios, pacientes externos en un centro de enfermedades mentales. Las edades son
las siguientes: 6, 8, 10, 12 y 14.
La media, , de sta poblacin es 10 y la varianza 2=8
Si extraemos de sta poblacin todas las muestras posibles de tamao n=2 (sin
reemplazo), junto con su media
(debajo de cada pareja) tenemos la siguiente tabla:
(6,6)
6
(8,6)
7
(10,6)
8
(12,6)
9
(14,6)
10
(6,8)
7
(8,8)
8
(10,8)
9
(12,8)
10
(14,8)
11
(6,10)
8
(8,10)
9
(10,10)
10
(12.10)
11
(14,10)
12
(6,12)
9
(8,12)
10
(10,12)
11
(12,12)
12
(14,12)
13
(6,14)
10
(8,14)
11
(10,14)
12
(12,14)
13
(14,14)
14
En la tabla se puede observar que cuando el muestreo es con reemplazo, se tienen 25

muestras posibles. En general, cuando el muestreo es con reemplazo, el nmero de
muestras posibles es igual a Nn.
Podemos construir la distribucin muestral de colocando los diferentes valores de
una columna y sus frecuencia de ocurrencia en otra.
Frecuencia
6
7
8
9
10
11
12
13
14
TOTAL
en
Frecuencia relativa
(P(X= ))
1/25
2/25
3/25
4/25
5/25
4/25
3/25
2/25
1/25
1
1
2
3
4
5
4
3
2
1
25
Si te fijas bien, los datos de la tabla cumplen con los requisitos para una distribucin de
probabilidades. Las probabilidades individuales son mayores que cero y su suma es igual
a 1.
La grfica quedara creciendo gradualmente hasta formar un pico para despus decrecer
de manera simtrica, como la distribucin Normal Recuerdas? Entonces tenemos que
Imagen 44. Media muestral
, de la distribucin muestral.
Calculemos ahora la media, a la cual denotaremos por
Para hacerlo sumamos las 25 medias y las dividimos entre 25, obteniendo que
=10. Si
te fijas muy bien vers que la media de la distribucin muestral de tiene el mismo valor
que la media de la poblacin original. Por ltimo, calculemos la varianza de , a la cual
denotaremos por
Se puede ver que la varianza de la distribucin muestral no es igual a la varianza de la

poblacin. Sin embargo, resulta interesante observar que la varianza de la distribucin
muestral es igual a la varianza de la poblacin, dividida entre el tamao de la muestra
usado para obtener la distribucin muestral. Es decir,

.
La raz cuadrada de la varianza de la distribucin muestral se llama error estndar de la
media o simplemente error estndar.
Para generalizar, tendremos 2 situaciones:
1. Si el muestreo se lleva a cabo a partir de una poblacin normalmente distribuida,
es decir X N(,).
2. Si el muestreo se lleva a cabo a partir de una poblacin no distribuida
normalmente.
En el primer caso, cuando el muestreo es a partir de una poblacin distribuida
normalmente, la distribucin de la media de la muestra poseer las siguientes
propiedades:
I.
La distribucin de ser normal.
II.
La media
de la distribucin de
cual se extrajeron las muestras.
ser igual a la media de la poblacin de la
III.
La varianza de , de la distribucin de
dividida entre el tamao de la muestra.
ser igual a la varianza de la poblacin
En resumen,
En el segundo caso, cuando el muestreo se realiza a partir de una poblacin no
distribuida normalmente, usaremos un teorema muy importante en Matemticas llamado
Teorema del lmite central.
Teorema del lmite central: Dada una poblacin distribuida de cualquier forma, la
distribucin muestral, calculada a partir de muestras de tamao n de sta
poblacin, estar distribuida aproximadamente a una normal con media y varianza
, cuando el tamao de la muestra es grande.
Nota que el Teorema del lmite central nos permite muestrear a partir de poblaciones no
distribuidas normalmente con una garanta de aproximadamente los mismo resultados
que se obtendran si la poblacin estuviera distribuida normalmente, siempre que se tome
una muestra grande. Qu tan grande debe ser la muestra? No existe una respuesta
firme y rpida, dado que el tamao necesario de la muestra depende de la extensin de la
no normalidad presente en la poblacin. Una regla emprica ampliamente usada afirma
que, en la mayora de las situaciones prcticas, resulta satisfactorio un tamao de la
muestra de 30. Agreguemos que, en general, se hace mejor y mejor la aproximacin
hacia la normalidad de la distribucin muestral de , a medida que aumenta el tamao de
la muestra.
Como lo vers ms adelante en cursos de licenciatura, el conocimiento y comprensin de
las distribuciones muestrales ser un requisito necesario para entender los conceptos de
la Inferencia estadstica. La aplicacin ms sencilla del conocimiento de la distribucin
muestral de la media de la muestra es el calcular la probabilidad de obtener una muestra
con une media de alguna magnitud especificada.
Ejemplo
1.- Supngase que se sabe que, en cierta poblacin humana grande, la longitud craneal
est distribuida aproximadamente en forma normal con una media de 185.6 mm y una
desviacin estndar de 12.7 mm. Cul es la probabilidad de que una muestra aleatoria
de tamao 10 de sta poblacin tenga una media mayor que 190?
Como la poblacin se distribuye aproximadamente como una normal, podemos tomar que
se distribuye como una normal con media
= 185.6 mm y varianza
. De sta
ltima expresin tenemos que la desviacin estndar muestral, obtenida a partir de la

varianza, est dada por
Si recuerdas, de la unidad anterior, aprendiste que siempre que se tiene una variable
aleatoria normalmente distribuida, fcilmente se puede convertir en una variable aleatoria
distribuida de manera normal unitaria. Para transformar la variable aleatoria
en la
distribucin normal unitaria usaremos la frmula Z=
La probabilidad que da respuesta a la pregunta formulada queda representada por el rea

hacia la derecha de =190 bajo la curva de la distribucin muestral. Esta rea es igual al
rea hacia la derecha de Z=
. Usando las tablas de la unidad 4, tenemos
que P( >190)= P(Z>1.09)=0.5 - P(0<z<1.09) = 0.5 0.3621 = 0.1379.

2.- El CI (coeficiente intelectual) de los alumnos de un centro especial de educacin se
distribuye normalmente con una media de 80 y desviacin estndar de 10. Al extraer una
muestra aleatoria de 25 alumnos
Cul es la probabilidad de que su media sea mayor que 75?
P( >75)= P(Z>-2.50)=P(Z<2.50)=0.5+P(0<z<2.50)=0.5+0.4938=0.9938
Cul es la probabilidad de que su media sea como mximo 83?
P( <83)= P(Z<1.50)=0.5+P(0<z<1.50)=0.5+0.4332=0.9332
(Se realiza en plataforma)
5.3 Anlisis de Tendencias

La observacin metodolgica de los fenmenos es la base del conocimiento y de la
experiencia humana. Nuestro aprendizaje est fundamentado en el anlisis de las
tendencias u orientacin que muestran las cosas que nos rodean. Por ejemplo, si se
aplica un poco de fertilizante a un cultivo agrcola, lo ms seguro es que se observe un
aumento en la produccin. Si se contina aplicando el fertilizante, seguramente la
produccin seguir aumentando. Sin embargo tambin existe la relacin entre el
presupuesto de publicidad de una empresa y el monto de las ventas que genera o entre la
presin baromtrica del ambiente y la probabilidad de que llueva. Sin embargo, hay
relaciones que no existen, o que no tienen sentido, como la edad de una persona y el
costo de un automvil o el nmero de llamadas a Guadalajara y la produccin de rboles
en Canad, por lo que es necesario identificar lgicamente las relaciones entre dos o ms
variables. Cmo? Con el anlisis de regresin.
El anlisis de regresin es til para averiguar la forma probable de la relacin entre las
variables y, cuando se emplea ste mtodo de anlisis, el objetivo final por lo general es
predecir o estimar el valor de una variable, correspondiente a un valor dado de otra
variable. Las ideas de regresin fueron aclaradas por primera vez por el cientfico ingls,
Sir Francis Galton (1822-1911) en los informes de sus investigaciones sobre la herencia,
primero en los chcharos y posteriormente, en la estatura humana. Describi una
tendencia del hijo adulto, que tiene padres bajos o altos, de regresar hacia la estatura
promedio de la poblacin general. Primero us la palabra reversin y, despus, regresin
para referirse a ste fenmeno.
En el problema tpico de regresin, como en la mayora de los problemas de la estadstica

aplicada, el investigador cuenta, para el anlisis, con una muestra de observaciones de
alguna poblacin real o hipottica. Basado en los resultados de su anlisis de los datos de
la muestra, tiene inters en llegar a decisiones acerca de la poblacin de la cual se
supone que se ha extrado la muestra. Por lo tanto, es importante que el investigador
comprenda la naturaleza de la poblacin en la que est interesado. Debe conocer lo
suficiente acerca de la poblacin, para ser capaz de construir un modelo matemtico que
lo represente, o bien, determinar si se ajusta razonablemente a algn modelo establecido.
Un investigador, que va a analizar un conjunto de datos por los mtodos de regresin
lineal simple, por ejemplo, debe tener la seguridad de que el modelo de regresin lineal
simple es, al menos, una representacin aproximada de su poblacin.
Es improbable que el modelo sea un retrato perfecto de la situacin real, ya que sta
caracterstica se encuentra rara vez en los modelos de valor prctico. Un modelo
construido de modo que corresponda precisamente con los detalles de la situacin,
generalmente es demasiado complicado como para proporcionar informacin alguna de
valor. Por otra parte, los resultados que se obtienen del anlisis de datos que se ha
forzado en un modelo al que no se ajustan, tampoco tiene valor. No obstante,
afortunadamente no se requiere un modelo que ajuste perfectamente para obtener
resultados tiles.
En esta seccin trabajaremos con el modelo ms sencillo de regresin, el modelo de
regresin lineal. Es importante mencionar que no es el nico modelo para realizar el
anlisis de regresin ya que existen otros modelos que incluso no son lineales pero por
ser un curso introductorio slo veremos el lineal. En la prctica real, se tiene que realizar
una grfica de los datos de la muestra para ver cmo estn dispersos y en base a est o
verificar si el modelo que mejor se ajusta es un modelo lineal o no lineal.
En el modelo de regresin lineal simple interesan dos variables, X y Y. Por lo general, la

variable X se le conoce como variable independiente, ya que se encuentra bajo el control
del investigador, es decir, los valores de X son seleccionados por el investigador y,
correspondiendo a cada valor preseleccionado de X, se obtienen uno o ms valores de Y.
Como consecuencia, a la otra variable, Y, se le da el nombre de variable dependiente y se
habla de la regresin de Y sobre de X. En la regresin lineal simple, el objeto de inters
del investigador es la ecuacin de regresin de la poblacin, es decir, la ecuacin que
describe la relacin verdadera entre la variable independiente X y la variable dependiente
Y. Para llegar a una decisin referente a la forma probable de sta relacin, se extrae una
muestra de la poblacin de inters y, usando los datos resultantes, calcula una ecuacin
de regresin de la muestra, que es la base para llegar a conclusiones referentes a la
ecuacin desconocida de regresin de la poblacin. Cmo calcula esa ecuacin?
Como su nombre lo dice, en el modelo de regresin lineal, la ecuacin buscada es una
lnea recta. El mtodo que se emplea para obtener la recta deseada se conoce como
mtodo de los mnimos cuadrados y la recta resultante se llama recta de los mnimos
cuadrados que es finalmente la ecuacin que usaremos para el anlisis de regresin. Si
recuerdas, la ecuacin de la recta es y=mx + b, donde m es la pendiente de la recta y b es
la ordenada al origen, el mtodo de los mnimos cuadrados nos proporciona el valor de la
pendiente y de la ordenada al origen a partir de los datos de la muestra.
La ecuacin de la recta de los mnimos cuadrados est da da por y=mx + b donde
m=
b=
Con la ecuacin de la recta finalmente podremos hacer una estimacin o pronstico del
comportamiento de la variable y para valores de x que no se encuentren en la muestra,
que finalmente es el objetivo del anlisis de regresin.
Ejemplo
1.- Se tienen los siguientes datos sobre la aplicacin de fertilizante a un campo agrcola.
X:
Fertilizante
(kg/m2)
Y:
Produccin
(ton/ha)
1.5
3.3
4.8
6.5
7.5
18
20
23
30
Encontrar:
a) La ecuacin de la recta de mnimos cuadrados que se ajuste a los datos de la
tabla.
10
Al graficar los datos, para ver cmo estn dispersos, obtenemos
Imagen 46. Dispersin de datos

Si te fijas, los datos estn dispersos de tal manera que si trazamos una lnea recta vemos
que es la que mejor se ajusta a su dispersin, por lo tanto el modelo que nos conviene
usar es el modelo de regresin lineal. Es decir, debemos encontrar la recta que mejor se
ajusta a los datos.
Imagen 47. Dispersin recta de datos
Para encontrar la recta, usaremos la siguiente tabla y las frmulas dadas anteriormente
11
X
Y
X2
X*Y
m=
b=
1.5
7
2.25
10.5
3.3
18
10.89
59.4
4.8
20
23.04
96
6.5
23
42.25
149.5
7.5
30
56.25
225
Sumas
23.6
98
134.68
540.4
= 3.342
= 3.823
Entonces, la ecuacin de la recta es y = 3.342x + 3.823
b. Estimar la produccin si se aplican 0.58 y 0.8 kilos de fertilizante por metro

cuadrado.
Si x=9 entonces y = 3.342(9) + 3.823 = 33.901 ton/ha
Si x=15 entonces y = 3.342(15) + 3.823 = 53.953 ton/ha
Al graficar los puntos de la tabla (muestra) y la ecuacin anterior tenemos
Imagen 48. Dispersin recta de datos

Finalmente, como puedes observar la recta se ajusta a los datos originales lo cual nos
hace pensar que es una buena estimacin.
(Se realiza en plataforma)
12
5.4 Coeficiente de Correlacin de Pearson

El anlisis de correlacin se refiere a la medicin de la intensidad de la relacin entre las
variables. Cuando se calculan medidas de correlacin a partir de un conjunto de datos, el
inters se centra en el grado de la correlacin entre las variables. De nuevo, el origen de
los conceptos y la terminologa del anlisis de correlacin se debe a Galton, quien us la
primero la palabra correlacin en 1888.
As como el anlisis de regresin permite obtener una frmula que expresa la relacin
entre 2 variables, el anlisis de correlacin obtiene un ndice que mue stra el grado de
relacin entre dos variables. El coeficiente de correlacin lineal, desarrollado por el
matemtico ingls Karl Pearson (1857-1936), y conocido con la letra r, puede tomar
valores desde -1 hasta +1, siendo estos extremos los valores que manifiestan una
relacin lineal perfecta (positiva o negativa y cuando la recta se ajusta perfectamente a los
datos de la muestra pasando sobre ellos) segn se ejemplifica en los siguientes
diagramas de dispersin:
Imagen 49. Diagramas de dispersin
En el caso (a) y (b) el ndice es positivo y negativo, significa que es muy bueno, lo
que se traduce en una relacin muy buena entre las variables, es decir, estn
relacionadas.
13
En el caso (b) y (c) el ndice es positivo y negativo, significa que los datos estn
muy dispersos con respecto a la recta, lo que se traduce en que las variables no
estn relacionadas.
Pero, cmo calculamos el valor de r? con la frmula
Ejemplo
1.- Determine el coeficiente de correlacin de Pearson para los siguientes datos obtenidos
de una muestra:
X
Y
1.5
7
3.3
18
4.8
20
6.5
23
7.5
30
Usando la siguiente tabla calculemos el valor de r
X
Y
X2
Y2
X*y
1.5
7
2.25
49
10.5
3.3
18
10.89
324
59.4
4.8
20
23.04
400
96
6.5
23
42.25
529
149.5
7.5
30
56.25
900
225
Sumas
23.6
98
134.68
2202
540.4
Entonces
El valor obtenido nos indica un ajuste muy bueno con lo que podemos decir que las
variables X y Y estn muy bien relacionadas.
(Se realizan en plataforma)
Evaluacin de Unidad (Se desarrollan en plataforma)
14
Conclusin
Haz finalizado tu quinta unidad del curso de Estadstica y Probabilidad, en el cual
aprendiste los siguientes conceptos:
15
Referencias
De contenido
Libros
Castillo, J. (1998). Estadstica Bsica. Mxico: Grupo Editorial Iberoamrica.

Freund, J. (1994). Estadstica Elemental. Mxico: Pearson Prentice Hall.
Ross, S. (2007). Introduccin a la Estadstica. Mxico: Revert.
Triola, M. (2009). Estadstica. Mxico: Pearson Prentice Hall.
Zavala Aguilar, R. (2011). Estadstica Bsica. Mxico: Trillas.
De consulta
Sitios de internet
Las siguientes ligas electrnicas te servirn de apoyo para la distribucin muestral de
medias y la regresin lineal.
FACULTAD DE INGENIERIA. (s.f.). Probabilidad y Estadstica: Captulo 15 Los
Estadsticos
y
sus
Distribuciones.
UNAM.
http://dcb.fic.unam.mx/profesores/irene/BEPI/capsbfc/cap15_bfc2011.pdf
FACULTAD DE CONTADURIA Y ADMINISTRACION, Coordinacin de
Matempticas.
(s.f.).
Estadstica
II.
UNAM.
http://fcasua.contad.unam.mx/apuntes/interiores/docs/98/4/estadis_2.pdfUNAM.
Captulo
18:
Anlisis
de
regression
lineal.
UNAM.
http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/mater
iales/analisis_datosyMultivariable/18reglin_SPSS.pdf
De imgenes
43. Media muestral
Elaborada por: Vctor Manuel Terreros Muoz
Editado por: Alma Martnez Campech
44. Media muestral
45. Sir Francis Galton
Recuperado de:
http://www.probertencyclopaedia.com/CX_FRANCIS_GALTON.HTM
46. Dispersin de datos
47. Dispersin recta de datos
48. Dispersin recta de datos
49. Diagramas de dispersin
16

Inferencia Estadistica

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Inferencia Estadistica

Caricato da

Copyright:

Formati disponibili

Unidad 5.

Muestreo aleatorio simple: En el cual se da igual oportunidad de seleccin a c ada

Una muestra es un subconjunto de la poblacin.

Muestreo aleatorio sistemtico: Se elige un individuo al azar y a partir de l, a

En muchos casos, el muestreo es la nica manera de poder obtener alguna conclusin de

5.1 Distribuciones Muestrales

Las medias seran: 1; 1.5; 2; 1.5; 2; 2.5; 2; 2.5 y 3 respectivamente.

Imagen 43. Media muestral

5.2 Distribucin Muestral de la Media

En la tabla se puede observar que cuando el muestreo es con reemplazo, se tienen 25

Imagen 44. Media muestral

Calculemos ahora la media, a la cual denotaremos por

Se puede ver que la varianza de la distribucin muestral no es igual a la varianza de la

usado para obtener la distribucin muestral. Es decir,

ser igual a la media de la poblacin de la

ser igual a la varianza de la poblacin

ltima expresin tenemos que la desviacin estndar muestral, obtenida a partir de la

La probabilidad que da respuesta a la pregunta formulada queda representada por el rea

. Usando las tablas de la unidad 4, tenemos

que P( >190)= P(Z>1.09)=0.5 - P(0<z<1.09) = 0.5 0.3621 = 0.1379.

(Se realiza en plataforma)

5.3 Anlisis de Tendencias

En el problema tpico de regresin, como en la mayora de los problemas de la estadstica

En el modelo de regresin lineal simple interesan dos variables, X y Y. Por lo general, la

Al graficar los datos, para ver cmo estn dispersos, obtenemos

Imagen 46. Dispersin de datos

Imagen 47. Dispersin recta de datos

Entonces, la ecuacin de la recta es y = 3.342x + 3.823

b. Estimar la produccin si se aplican 0.58 y 0.8 kilos de fertilizante por metro

Imagen 48. Dispersin recta de datos

(Se realiza en plataforma)

5.4 Coeficiente de Correlacin de Pearson

Imagen 49. Diagramas de dispersin

Pero, cmo calculamos el valor de r? con la frmula

Usando la siguiente tabla calculemos el valor de r

(Se realizan en plataforma)

Evaluacin de Unidad (Se desarrollan en plataforma)

Castillo, J. (1998). Estadstica Bsica. Mxico: Grupo Editorial Iberoamrica.

Potrebbero piacerti anche