Sei sulla pagina 1di 18

INSTITUTO TECNOLGICO DE

CAMPECHE
INGENIERA INFORMATICA
UNIDAD 4 Distribuciones
muestrales
TAREA-1

NOMBRE DEL ALUMNO:


VALLE LANDA KEVIN A.
MATERIA:
PROBABILIDAD Y ESTADSTICA
GRUPO:
MF3
02/10/2015

Indice

Qu es la Inferencia estadstica?...................................1
Los 2 problemas que atiende la Inferencia estadstica....1
Razones del muestreo.....................................................3
El muestreo aleatorio......................................................4
Mtodos de muestreo......................................................5
Objetivo del muestreo.....................................................6
Se puede esperar, que....................................................6
Distribucin de muestreo................................................6
Distribucin muestral para medias s2 conocida...........7
Distribucin muestral para medias, s2 desconocida........8
Distribucin muestral para proporciones........................9
Distribucin muestral para una varianza,.....................11
La distribucin F de Fisher para 2 varianzas............12
Bibliografia..........................................................................14

Competencia especfica a desarrollar:


Aplicar las diferentes tipos de muestreo: aleatorio
simple, sistematizado, estratificado y por
conglomerados.
Identificar y aplicar las distribuciones muestrales de
probabilidad Normal, T-Student,Chi-Cuadrado y F de
Fisher.
Conocer los aspectos fundamentales de la inferencia
estadstica.
Aplicar los modelos de la Estimacin estadstica en
situaciones reales o simuladas.

Qu es la Inferencia
estadstica?
La inferencia estadstica es el conjunto de mtodos y
tcnicas que permiten inducir, a partir de la
informacin emprica proporcionada por una muestra,
cual es el comportamiento de una determinada
poblacin con un riesgo de error medible en trminos
de probabilidad.

Los 2 problemas que atiende la


Inferencia estadstica
Los dos tipos de problemas que resuelven las
tcnicas estadsticas son: estimacin y contraste de
hiptesis. En ambos casos se trata de generalizar la

informacin obtenida en una muestra a una


poblacin. Estas tcnicas exigen que la muestra
sea aleatoria. En la prctica rara vez se dispone de
muestras aleatorias, por la tanto la situacin
habitual es la que se esquematiza en la figura.

Entre la muestra con la que se trabaja y la poblacin


de inters, o poblacin diana, aparece la
denominada poblacin de muestreo: poblacin (la
mayor parte de las veces no definida con precisin) de
la cual nuestra muestra es una muestra aleatoria. En
consecuencia la generalizacin est amenazada por
dos posibles tipos de errores: error aleatorio que es el
que las tcnicas estadsticas permiten cuantificar y
crticamente dependiente del tamao muestral, pero
tambin de la variabilidad de la variable a estudiar y
el error sistemtico que tiene que ver con la diferencia
entre la poblacin de muestreo y la poblacin diana y
que slo puede ser controlado por el diseo del
estudio.

Tamao muestral
El tamao muestral juega el mismo papel en
estadstica que el aumento de la lente en microscopa:
si no se ve una bacteria al microscopio, puede ocurrir
que:
- la preparacin no la contenga
- el aumento de la lente sea insuficiente.
Para decidir el aumento adecuado hay que tener una
idea del tamao del objeto.
Del mismo modo, para decidir el tamao muestral:
i) en un problema de estimacin hay que tener una
idea de la magnitud a estimar y del error aceptable.
ii) en un contraste de hiptesis hay que saber
el tamao del efecto que se quiere ver.

Razones del muestreo

a. Concepto e importancia
Es la actividad por la cual se toman ciertas muestras
de una poblacin de elementos de los cuales vamos a
tomar ciertos criterios de decisin, el muestreo es
importante porque a travs de l podemos
hacer anlisis de situaciones de una empresa o de
algn campo de la sociedad.
b. Terminologa bsica para el muestreo
Los nuevos trminos, los cuales son frecuentemente
usados en inferencia estadstica son:
Estadstico:
Un estadstico es una medida usada para describir
alguna caracterstica de una muestra , tal como una

media aritmtica, una mediana o una desviacin


estndar de una muestra.
Parmetro:
Una parmetro es una medida usada para describir
alguna caracterstica de una poblacin, tal como una
media aritmtica, una mediana o una desviacin
estndar de una poblacin.
Cuando los dos nuevos trminos de arriba son usados,
por ejemplo, el proceso de estimacin en
inferencia estadstica puede ser descrito como le
proceso de estimar un parmetro a partir del
estadstico correspondiente, tal como usar una media
muestral ( un estadstico para estimar la media de la
poblacin (un parmetro).

El muestreo aleatorio

Muestreo Aleatorio
Una muestra se dice que es extrada al azar cuando la
manera de seleccin es tal, que cada elemento de la
poblacin tiene igual oportunidad de ser seleccionado.
Una muestra aleatoria es tambin llamada una
muestra probabilstica son generalmente preferidas
por los estadsticos porque la seleccin de las
muestras es objetiva y el error muestral puede ser
medido en trminos de probabilidad bajo la curva
normal. Los tipos comunes de muestreo aleatorio son
el muestreo aleatorio simple, muestreo sistemtico,
muestreo estratificado y muestreo de conglomerados.

Muestreo aleatorio simple


Una muestra aleatoria simple es seleccionada de tal
manera que cada muestra posible del mismo tamao
tiene igual probabilidad de ser seleccionada de la
poblacin. Para obtener una muestra aleatoria simple,
cada elemento en la poblacin tenga la misma
probabilidad de ser seleccionado, el plan de muestreo
puede no conducir a una muestra aleatoria simple. Por
conveniencia, este mtodo pude ser reemplazado por
una tabla de nmeros aleatorios. Cuando una
poblacin es infinita, es obvio que la tarea de numerar
cada elemento de la poblacin es infinita, es obvio
que la tarea de numerar cada elemento de la
poblacin es imposible. Por lo tanto, ciertas
modificaciones del muestreo aleatorio simple son
necesarias. Los tipos ms comunes de muestreo
aleatorio modificado son sistemticos, estratificados y
de conglomerados.

Mtodos de muestreo

Son distintas formas de seleccionar los elementos


que formarn parte de la muestra:
-Muestreo probabilstico : aquel en el que cada
individuo de la poblacin tiene una probabilidad dada
y diferente de cero de pertenecer a la muestra.
-Muestreo no probabilstico: basado en una
opinin subjetiva, ya que en l se desconoce
la probabilidad de que un individuo concreto de
la poblacin sea incluido en la muestra.
-Muestreo fijo : aquel en el que el tamao de
la mustrales fijo
y determinado a priori.
-Muestreo secuencial : a diferencia del muestreo fijo,

aquel en el que el tamao de la muestra va variando


en funcin de la informacin que se va obteniendo.
-Muestreo aleatorio simple: muestreo
probabilstico en el que la probabilidad de estar
incluido en la muestra de determinado elemento o
conjunto de elementos es la misma que la de otro
conjunto con el mismo nmero de elementos.
-Muestreo estratificado : muestreo probabilstico
en el que la poblacin se clasifica en estratos
excluyentes entre s, sobre los cuales se realiza
un muestreo aleatorio simple.
-Muestreo por conglomerados o reas: muestreo
probabilstico en el que se establecen determinadas
reas geogrficas y, de entre ellas, se elige
al azar aquella que servir de muestra.
-Muestreo mediante itinerarios aleatorios:
muestreo no probabilstico en el que se fuerza al
entrevistador a elegir la muestra de forma totalmente
aleatoria.

Objetivo del muestreo

Primario: recoger muestras de alimentos


representativas y asegurarse luego de que no se
produzcan cambios en la composicin entre la
recogida y el anlisis.
Secundario: documentar la variabilidad natural de
las muestras cuando est relacionada con factores

como la estacin, el lugar geogrfico, el cultivar o los


sistemas de explotacin

Se puede esperar, que al


analizar una muestra de una
poblacin, un Estadstico pudiera
ser igual al Parmetro poblacional
correspondiente?
La exactitud de toda estimacin es de enorme
importancia. Esta exactitud depende en gran parte de
la forma como tom la muestra, y del cuidado que se
tenga para garantizar que la muestra proporcione una
imagen confiable de la poblacin. Sin embargo, con
mucha frecuencia se comprueba que la muestra no es
del todo representativa de la poblacin y resultara un
error de muestreo. El error de muestreo es la
diferencia entre el estadstico de la muestra utilizada
para calcular el parmetro de la poblacin y el valor
real pero desconocido del parmetro.

Distribucin de muestreo

Las distribuciones de muestreo constituyen una pieza


importante de estudio por varias razones. En la
mayora de los casos, la viabilidad de un experimento
dicta el tamao de la muestra. La distribucin de
muestreo es la distribucin de probabilidad de una
muestra de una poblacin en lugar de toda la
poblacin.

En palabras ms simples, supongamos que de una


determinada poblacin tomas todas las muestras
posibles de tamao n y calculas una estadstica (por
ejemplo, media) de todas las muestras. Si luego
preparas una distribucin de probabilidad de esta
estadstica, obtendrs una distribucin de muestreo.
Las propiedades de la distribucin de
muestreo pueden variar dependiendo de cun
pequea sea la muestra en comparacin con la
poblacin. Se supone que la poblacin se distribuye
normalmente como generalmente sucede. Si
el tamao de la muestra es lo suficientemente grande,
la distribucin de muestreo tambin estar cerca de lo
normal.
Si ste es el caso, entonces la distribucin de
muestreo puede ser totalmente determinada por dos
valores: la media y la desviacin estndar. Estos dos
parmetros son importantes para calcular la
distribucin de muestreo si se nos da la distribucin
normal de toda la poblacin.

Distribucin muestral para


medias s2 conocida.
Vale la pena notar que la distribucin de las medias
muestrales es simplemente una lista de todas las
medias muestrales posibles. Estas medias
muestrales , al igual que cualquier lista de nmeros,
tiene una media denominada la media de las medias
muestrales o la gran media. Esta media de las
medias se calcula de la forma usual: Las
observaciones individuales (medias muestrales)se
suma y el resultado se divide por el nmero de

observaciones (muestras). Se utiliza X (que se lee


como X doble barra) como smbolo de la gran media.
La media de las medias muestrales

X =

x
k

Donde K es el nmero de muestras en la distribucin


muestral
Varianza
La distribucin de las medias muestrales tambin
tiene una varianza. La varianza en las medias
muestrales es como cualquier otra varianza. Mide la
dispersin de las observaciones individuales (medias
muestrales) alrededor de su media (la gran media).
Varianza de la distribucin muestral de las
medias muestrales
2
X)
2 ( X)

( X
=
=
K
K
2
x

Si se tuviera que sacar la raz cuadrada de la varianza


en la distribucin de estas medias muestrales, se
tendra el error estndar de la distribucin muestral,

Distribucin muestral para


medias, s2 desconocida, la
distribucin t de Student
Cuando se calcula un intervalo de confianza para la
media poblacional, suele no contarse con una buena
estimacin de la desviacin estndar poblacional. En
tales casos se usa la misma muestra para estimar y
. Esta situacin es el caso que se conoce como
desconocida. Cuando se usa S para estimar , el
margen de error y la estimacin por intervalo de la
media poblacional se basan en una distribucin de

probabilidad conocida como distribucin t. Aunque la


elaboracin matemtica de la distribucin t parte de la
suposicin de que la poblacin de la que se muestrea
tiene una distribucin normal. Las investigaciones han
demostrado que la distribucin t se aplica en muchas
situaciones en que la poblacin se desva
significativamente de una poblacin normal. Ms
adelante, en esta misma seccin, se proporcionan
lineamientos para usar la distribucin t cuando la
poblacin no est distribuida normalmente. La
distribucin t es una familia de distribuciones de
probabilidad similares; cada distribucin t depende de
un parmetro conocido como grados de libertad. La
distribucin t para un grado de libertad es nica, como
la distribucin t para dos grados de libertad, aumenta
la diferencia entre la distribucin t y la distribucin
normal estndar se va reduciendo. En la figura
siguiente se muestran las distribuciones t para 10 y 20
grados de libertad aumentada, relacin con la
distribucin de probabilidad normal estndar. Observe
que una distribucin t para ms grados de libertad
exhibe menos variabilidad y un mayor parecido con la
distribucin normal estndar, tambin que la media de
toda distribucin es cero.

Distribucin muestral para


proporciones
1. APROXIMACIN DE LA NORMAL A LA BINOMIAL.

En este caso se estarn calculando probabilidades


de experimentos Binomiales de una forma muy
aproximada con la distribucin Normal, esto puede
llevarse a cabo si n y p = p(xito) no es muy

10

cercana a 0 y 1, o cuando n es pequeo y p tiene un


valor muy cercano a ; esto es,

Dnde:
x = variable de tipo discreto; solo toma valores
enteros
m = np = media de la distribucin Binomial
s=
= desviacin estndar de la distribucin
Binomial
Cuando ocurren las condiciones anteriores, la
grfica de la distribucin Binomial, es muy parecida
a la distribucin Normal, por lo que es adecuado
calcular probabilidades con la Normal en lugar de
con la Binomial y de una forma ms rpida.
En resumen, se utiliza la aproximacin Normal para
evaluar probabilidades Binomiales siempre que p no
est cercano a 0 o 1. La aproximacin es excelente
cuando n es grande y bastante buena para valores
pequeos de n si p est razonablemente cercana a
. Una posible gua para determinar cundo puede
utilizarse la aproximacin Normal es tener en
cuenta el clculo de np y nq. S ambos, np y
nq son mayores o iguales a 5, la aproximacin ser
buena.
Antes de empezar a resolver problemas con la
aproximacin Normal, es bueno aclarar que se estn
evaluando probabilidades asociadas a una variable

11

discreta x, con una distribucin que evala


variables de tipo continuo como es la Normal,
Por lo que z sufre un pequeo cambio como se
muestra a continuacin:

Por qu vamos a sumar o a restar a x?


Este es un factor de correccin debido a que se est
evaluando una variable discreta con una
distribucin continua, por lo que hay que delimitar
claramente desde que punto se va a evaluar la
variable, dicho de otra forma, en que lmite de la
barra (inferior o superior) nos debemos posicionar
para determinar la probabilidad requerida, cada
barra de probabilidad a evaluar tiene como base la
unidad, ese es el porqu del .

12


Distribucin muestral para una
varianza, la distribucin c2 (ji
cuadrada)
En realidad la distribucin ji-cuadrada es la
distribucin muestral de s2. O sea que si se extraen
todas las muestras posibles de una poblacin normal y
a cada muestra se le calcula su varianza, se obtendr
la distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin
estndar, se necesita conocer el estadstico X2. Si se
elige una muestra de tamao n de una poblacin
normal con varianza 2, el estadstico:
( n1 ) s 2
2

Tiene una distribucin muestral que es una


distribucin ji-cuadrada con gj=n-1 grados de libertad
y se denota X2 (X es la misma de la letra griega ji). El
estadstico ji-cuadrada esta dado por:
X 2=

( n1 ) s2
2

Cuando n es el tamao de la muestra, S2 la varianza


2
muestral y la varianza de la poblacin de donde
se extrajo la muestra. El estadstico ji-cuadrada
tambin se puede dar con la siguiente expresin:
2

X=

(X x )2
2

Propiedades de las distribuciones ji-cuadrada


1. Los valores de X2 son mayores o iguales 0.

13

2. La forma de una distribucin X2 depende del gl=


n-1. En consecuencia, hay un nmero infinito de
distribuciones X2.
3. El rea bajo una curva ji-cuadrada y sobre el eje
horizontal es 1.
4. Las distribuciones X2 no son simtricas. Tienen
colas estrechas que se extienden a la derecha,
esto es, estn sesgadas a la derecha.
5. Cuando n > 2, la media de una distribucin X2 es
n -1 y la varianza es 2(n-1).
6. El valor modal de una distribucin X2 se da en el
valor (n-3).

La distribucin F de Fisher
para 2 varianzas (var1/var2)
La necesidad de disponer de mtodos estadsticos
para comparar las varianzas de dos poblaciones es
evidente a partir del anlisis de una sola poblacin
frecuentemente se desea comparar la precisin de un
instrumento de medicin con la de otro, la estabilidad
de un proceso de manufactura con la de otro o hasta
la forma en que vara el procedimiento para calificar
de un profesor universitario con la de otro.
Intuitivamente, podramos comparar las varianzas de
2
2
dos poblaciones 1 y 2 , utilizando la razn de las
varianzas muestrales

S 21

S 22

.Si

S 21

S 22

es casi igual a

1, se tendr poca evidencia para indicar que


22

no son iguales. Por otra parte, un valor muy

grande o muy pequeo para

14

S1

S2

, proporcionara

evidencia de una diferencia en las varianzas de las


poblaciones.
La variable aleatoria F se define como el cociente de
dos variables aleatorias ji-cuadrada independientes,
cada una dividida entre sus respectivos grados de
libertad. Esto es,
U
F
F= 1
V
F2

Donde U y V son variables aleatorias ji-cuadrada


independientes con grados de libertad V1 y V2
respectivamente.
Sean U y V dos variables aleatorias independientes
que tienen distribucin ji-cuadradas con F1 y F2 grados
de libertad, respectivamente. Entonces la distribucion
de la variable aleatoria
U
F1
F=
V
F2

esta dada por :

f ( x )=

n
2()
x

[ ]( )
( ) ( )( )
v +v
r 1 2
2

v1
v2

n 1
2

v
v
v x
r 1 r 2 1+ 1
2
2
v2
2

v 1+v

0 < x < y se dice que sigue la distribucion f con V1


grados de libertad en el numerador y V2 grados en de
libertad en el denominador.

15

Bibliografia
http://www.mat.uda.cl/hsalinas/cursos/2011/2do/clase
8.pdf
https://www.uv.es/ceaces/tex1t/3%20infemues/dnorm
al.htm
http://www.wikipedia.com

16

Potrebbero piacerti anche