Sei sulla pagina 1di 16

DISTRIBUCION BINOMIAL

La funcin de probabilidad de la distribucin binomial , tambin


denominada funcin de la distribucin de Bernoulli , es:

n
k
p
q

es
es
es
es

el
el
la
la

nme ro de pruebas.
nmero de xitos.
prob abilidad de xito.
prob abilidad de fracaso.

El nmero combinatorio
CARACTERISTICAS
1. En cada prueba del experimento slo son posibles dos resultados: el
suceso A (xito) y su contrario
.
2. La probabilidad del suceso A es constante, es decir, que no vara de una
prueba a otra. Se representa por p.
3. El resultado obtenido en cada prueba es independiente de los resultados
obtenidos anteriormente.
La distribucin binomial se suele representar por B(n, p).
n es el nmero de pruebas de que consta el experimento.
p es la probabilidad de xito.
La probabilidad de

es 1 p, y la representamos por q.

Variable aleatoria binomial


La variable aleatoria binomial, X, expresa el nmero de xitos obtenidos en
cada prueba del experimento.
La variable binomial es una variable aleatoria discreta, slo puede tomar los
valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.
EJM
k = 6, al lanzar una moneda 10 veces y obtener 6 caras.

EJERCICIOS RESUELTOS DE DISTRIBUCION BINOMIAL


1. Se lanza una moneda cuatro veces. Calcular la probabilidad de que
salgan ms caras que cruces
B(4, 0.5) p = 0.5q = 0.5

2. Si de seis a siete de la tarde se admite que un nmero de telfono de


cada cinco est comunicando, cul es la probabilidad de que, cuando se
marquen 10 nmeros de telfono elegidos al azar, slo comuniquen dos?

B(10, 1/5)p = 1/5q = 4/5

3. En una urna hay 30 bolas, 10 rojas y el resto blancas. Se elige una bola
al azar y se anota si es roja; el proceso se repite, devolviendo la bola, 10
veces. Calcular la media y la desviacin tpica
B(10, 1/3) p = 1/3q = 2/3

DISTRIBUCION NORMAL
Variable aleatoria de la distribucin normal
Una variable aleatoria continua, X, sigue una distribucin normal de media
ydesviacin tpica , y se designa por N(, ), si se cumplen las siguientes
condiciones:
1. La variable puede tomar cualquier valor: (-, +)
2. La funcin de densidad, es la expresin en trminos de ecuacin
matemtica de la curva de Gauss:

CARACTERISTICAS

El campo de existencia es cualquier valor real, es decir, (-, +).


Es simtrica respecto a la media .
Tiene un mximo en la media .
Crece hasta la media y decrece a partir de ella.
En los puntos y + presenta puntos de inflexin.
El eje de abscisas es una asntota de la curva.
El re a del recinto determinado por la funcin y el eje de abscisas es
igual a la unidad .
Al ser simtrica respecto al eje que pasa por x = , deja un re a igual a
0.5 a la izquierda y otra igual a 0.5 a la derecha .
La p robabilidad equivale al re a encerrad a bajo la curva.
p( - < X + ) = 0.6826 = 68.26 %
p( - 2 < X + 2) = 0.954 = 95.4 %

p( - 3 < X + 3) = 0.997 = 99.7 %

EJERCICIOS RESUELTOS DE DISTRIBUCION NORMAL


1. En una ciudad se estima que la temperatura mxima en el mes de junio
sigue una distribucin normal, con media 23 y desviacin tpica 5.
Calcular el nmero de das del mes en los que se espera alcanzar
mximas entre 21 y 27

2. Varios test de inteligencia dieron una puntuacin que sigue una ley
normal con media 100 y desviacin tpica 15
1 Determinar el porcentaje de poblacin que obtendra un coeficiente entre
95 y 110

2 Qu intervalo centrado en 100 contiene al 50% de la poblacin?

3 En una poblacin de 2500 individuos cuntos individuos se esperan que


tengan un coeficiente superior a 125?

3. Tras un test de cultura general se observa que las puntuaciones


obtenidas siguen una distribucin una distribucin N(65, 18). Se desea
clasificar a los examinados en tres grupos (de baja cultura general, de
cultura general aceptable, de excelente cultura general) de modo que
hay en el primero un 20% la poblacin, un 65% el segundo y un 15% en
el tercero. Cules han de ser las puntuaciones que marcan el paso de
un grupo al otro?

Baja cultura hasta 49 puntos.


Cultura aceptable entre 50 y 83.
Excelente cultura a partir de 84 puntos.

DISTRIBUCION CHI CUADRADO


En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2. O
sea que si se extraen todas las muestras posibles de una poblacin normal y
a cada muestra se le calcula su varianza, se obtendr la distribucin
muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita
conocer el estadstico X2. Si se elige una muestra de tamao n de una
poblacin normal con varianza

, el estadstico:

tiene una distribucin muestral que es una distribucin ji-cuadrada con


gl=n-1 grados de libertad y se denota X2 (X es la minscula de la letra
griega ji). El estadstico ji-cuadrada esta dado por:

donde n es el tamao de la muestra, s2 la varianza muestral y


la
varianza de la poblacin de donde se extrajo la muestra. El estadstico jicuadrada tambin se puede dar con la siguiente expresin:

PROPIEDADES
Los valores de X2 son mayores o iguales que 0.
La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay
un nmero infinito de distribuciones X 2.
El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
Las distribuciones X2 no son simtricas. Tienen colas estrechas que se
extienden a la derecha; esto es, estn sesgadas a la derecha.
Cuando n>2, la media de una distribucin X 2 es n-1 y la varianza es 2(n-1).
El valor modal de una distribucin X2 se da en el valor (n-3).

EJERCICIOS RESUELTOS DE DISTRIBUCION CHI CUADRADO


1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar
un de sus destinos en una ciudad grande forman una distribucin normal
con una desviacin estndar
=1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a s 2=2 como
sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de


libertad y se encuentra que a este valor le corresponde un rea a la derecha
de 0.01. En consecuencia, el valor de la probabilidad es P(s 2>2)

2. Encuentre la probabilidad de que una muestra aleatoria de 25


observaciones, de una poblacin normal con varianza
, tenga una
varianza muestral:
Mayor que 9.1
Entre 3.462 y 10.745
Solucin.
Primero se proceder a calcular el valor de la ji-cuadrada:
Al buscar este nmero en el rengln de 24 grados de libertad nos da un
rea a la derecha de 0.05. Por lo que la P(s 2 >9.1) = 0.05
Se calcularn dos valores de ji-cuadrada:
y
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de
libertad. Al buscar el valor de 13.846 se encuentra un rea a la derecha de
0.95. El valor de 42.98 da un rea a la derecha de 0.01. Como se est
pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos
0.01 quedando 0.94.
Por lo tanto la P(3.462
s2 10.745) = 0.94

DISTRIBUCION POISSON
Esta distribucin es una de las ms importantes distribuciones de variable
discreta. Sus principales aplicaciones hacen referencia a la modelizacin de
situaciones en las que nos interesa determinar el nmero de hechos de
cierto tipo que se pueden producir en un intervalo de tiempo o de espacio,
bajo presupuestos de aleatoriedad y ciertas circunstancias restrictivas. Otro
de sus usos frecuentes es la consideracin lmite de procesos dicotmicos
reiterados un gran nmero de veces si la probabilidad de obtener un xito
es muy pequea .
CARACTERISTICAS
En este tipo de experimentos los xitos buscados son expresados por
unidad de rea, tiempo, pieza, etc
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc,
etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de
tiempo, rea, o producto, la frmula a utilizar sera:

donde:
p(x, l) = probabilidad de que ocurran x xitos, cuando el nmero promedio
de ocurrencia de ellos es l
l = media o promedio de xitos por unidad de tiempo, rea o producto
e = 2.718
x = variable que nos denota el nmero de xitos que se desea que ocurra

EJERCICIOS RESUELTOS DE DISTRIBUCION POISSON


1. Si un banco recibe en promedio 6 cheques sin fondo por da, cules son
las probabilidades de que reciba, a) cuatro cheques sin fondo en un da
dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos?

Solucin:
a)
x = variable que nos define el nmero de cheques sin fondo que
llegan al banco en un da cualquiera = 0, 1, 2, 3, ....., etc, etc.
l = 6 cheques sin fondo por da
e = 2.718

b) x= variable que nos define el nmero de cheques sin fondo que llegan al
banco en dos das consecutivos = 0, 1, 2, 3, ......, etc., etc.
l = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos
das consecutivos
Nota: l siempre debe de estar en funcin de x siempre o dicho de otra
forma, debe hablar de lo mismo que x.

2. En la inspeccin de hojalata producida por un proceso electroltico


continuo, se identifican 0.2 imperfecciones en promedio por minuto.
Determine las probabilidades de identificar a) una imperfeccin en 3
minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando ms
una imperfeccin en 15 minutos.
Solucin:
a)
x = variable que nos define el nmero de imperfecciones en la
hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la
hojalata

b)
x = variable que nos define el nmero de imperfecciones en la
hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

=1-(0.367918+0.367918) =
0.26416
c)
x = variable que nos define el nmero de imperfecciones en la
hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.
l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la
hojalata

= 0.0498026 + 0.149408 =
0.1992106

DISTRIBUCION T-STUDENT
Supngase que se toma una muestra de una poblacin normal con
media

y varianza

. Si

es el promedio de las n observaciones que

contiene la muestra aleatoria, entonces la distribucin

es una

distribucin normal estndar. Supngase que la varianza de la poblacin


2
es desconocida. Qu sucede con la distribucin de esta estadstica si se
reemplaza
pregunta.

por s? La distribucin t proporciona la respuesta a esta

La media y la varianza de la distribucin t son


=0y
para
>2, respectivamente.
La siguiente figura presenta la grfica de varias distribuciones t. La
apariencia general de la distribucin t es similar a la de la distribucin
normal estndar: ambas son simtricas y unimodales, y el valor mximo de
la ordenada se alcanza en la media
= 0. Sin embargo, la
distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad
de las colas es mayor que en la distribucin normal. A medida que el
nmero de grados de libertad tiende a infinito, la forma lmite de la
distribucin t es la distribucin normal estndar.

PROPIEDADES
Cada curva t tiene forma de campana con centro en 0.
Cada curva t, est ms dispersa que la curva normal estndar z.
A medida que
disminuye.

aumenta, la dispersin de la curva t correspondiente

A medida que
, la secuencia de curvas t se aproxima a la curva
normal estndar, por lo que la curva z recibe a veces el nombre de curva t
con gl =
La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con


grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas
normales con media
aleatoria

y desviacin estndar

tiene una distribucin t con

. Entonces la variable
= n-1 grados de libertad.

EJERCICIOS RESUELTOS DE DISTRIBUCION T-STUDENT


1. El valor t con
= 14 grados de libertad que deja un rea de 0.025 a la
izquierda, y por tanto un rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha,


es por esto que se tiene que hacer la resta de
. La manera de
encontrar el valor de t es buscar el valor de
en el primer rengln de la
tabla y luego buscar los grados de libertad en la primer columna y donde se
intercepten
y
se obtendr el valor de t.
2. Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a
la izquierda, encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
3. Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra
aleatoria de tamao 15 que se selecciona de una distribucin normal.
Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos


damos cuenta que a este valor le corresponde un rea de 0.05 a la

izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se


tiene un valor de 0.005, que equivale a
. Luego se busca el valor de
0.005 en el primer rengln con 14 grados de libertad y se obtiene un valor
de t = 2.977, pero como el valor de
est en el extremo izquierdo de la
curva entonces la respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045
4. Un ingeniero qumico afirma que el rendimiento medio de la poblacin de
cierto proceso en lotes es 500 gramos por milmetro de materia prima.
Para verificar esta afirmacin toma una muestra de 25 lotes cada mes. Si
el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho con su
afirmacin. Qu conclusin extraera de una muestra que tiene una
media de 518 gramos por milmetro y una desviacin estndar de 40
gramos? Suponga que la distribucin de rendimientos es
aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por
tanto, el fabricante queda satisfecho con esta afirmacin si una muestra de
25 lotes rinde un valor t entre 1.711 y 1.711.
Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la


probabilidad de obtener un valor de t con 24 grados de libertad igual o
mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aqu
que es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.

DISTRIBUCION FISHER
Es una distribucin de probabilidad de gran aplicacin en la inferencia
estadstica , fundamentalmente en la contrastacin de la igualdad de
varianzas de dos poblaciones normales, y , fundamentalmente en el anlisis
de la varianza , tcnica que permite detectar la existencia o inexistencia de
diferencias significativas entre muestras diferentes y que es, por tanto
esencial , en todos aquellos casos en los que se quiere investigar la
relevancia de un factor en el desarrollo y naturaleza de una caracterstica.
La distribucin se plantea partiendo de dos variables X e Y tales que :
es decir una chi2 con m grados de libertad
es decir una chi2 con n grados de libertad ;

de manera que si establecemos el cociente


, es decir el cociente
entre ambas chi2 divididas a su vez, por sus correspondientes grados de
libertad tendremos que la funcin F corresponde a una distribucin F de
Snedecor con m y n grados de libertad ; es decir una

Queda claro por tanto que la distribucin F de Snedecor tiene dos


parmetros , que son m y n ; grados de libertad del numerador , grados de
libertad del denominador.

EJERCICIOS RESUELTOS DE DISTRIBUCION DE FISHER


1. Un fabricante de automviles pone a prueba dos nuevos mtodos de
ensamblaje de motores respecto al tiempo en minutos. Los resultados se
muestran el la tabla:
Mtodo 1

Mtodo 2

n1 = 31

n2 = 25

s12 = 50

s22 = 24

2
2
Construya un intervalo de confianza del 90% para
1 /
2 .
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el
numerador se tiene la siguiente frmula:

al despejar:
.
F toma dos valores dependiendo del nivel de confianza y de los grados de
libertad. En este caso los grados de libertad uno valen 30 y los grados de
libertad dos 24.

y
Estos resultados los podemos interpretar de la siguiente manera:
Con un nivel de confianza del 90% se sabe que la relacin de varianzas
2
1

/ 22 esta entre 1.07 y 3.93. Esto supondra que la varianza de la


poblacin 1 es mayor a la varianza de la poblacin 2 entre 1.07 y 3.93.
2. Una compaa fabrica propulsores para uso en motores de turbina. Al
ingeniero de manufactura le gustara seleccionar el proceso que tenga la
menor variabilidad en la rugosidad de la superficie. Para ello toma una
muestra de n1=16 partes del primer proceso, la cual tiene una
desviacin estndar s1 = 4.7 micropulgadas, y una muestra aleatoria de
n2=12 partes del segundo proceso, la cual tiene una desviacin estndar
s2 = 5.1 micropulgadas. Se desea encontrar un intervalo de confianza del
2
90% para el cociente de las dos varianzas
1 /
. Suponga que los dos procesos son independientes y que la rugosidad de
la superficie est distribuida de manera normal.
2
2

Solucin:
Por la recomendacin de que la varianza muestral mayor va en el
numerador se tiene la siguiente frmula:

al despejar:
.
En este caso los grados de libertad uno valen 11 y los grados de libertad
dos 15.

y
Estos resultados los podemos interpretar de la siguiente manera:
Puesto que este intervalo de confianza incluye a la unidad, no es posible
afirmar que las desviaciones estndar de la rugosidad de la superficie de los
dos procesos sean diferentes con un nivel de confianza del 90%.
3. Si s12 y
de las muestras
tamao n1= 25 y

s22 representan las varianzas


aleatorias independientes de
n2 = 31, tomadas de

poblaciones

normales con varianzas

2
1

=10 y
= 15,
P(s12/s22 > 1.26).
2
2

respectivamente, encuentre

Solucin:
Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24


grados de libertad uno. Cuando se este en esta posicin se busca adentro
de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de
este valor se obtiene un rea de 0.95, pero esta rea correspondera a la
probabilidad de que las relaciones de varianzas muestrales fueran menor a
1.26, por lo que se calcula su complemento que sera 0.05, siendo esta la
probabilidad de que s12/s22 > 1.26.

MUESTREO

La inferencia estadstica estudia como sacar conclusiones generales para


toda la poblacin a partir del estudio de una muestra, y el grado de
fiabilidad o significacin de los resultados obtenidos.
Muestreo probabilstico
Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir
variostipos de muestreo :
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la poblacin y
se seleccionan al azar los n elementos que contiene la muestra
Muestreo aleatorio sistemtico
Se elige un individuo al azar y a partir de l, a intervalos constantes, se
eligen los dems hasta completar la muestra.
EJEMPLO
Si tenemos una poblacin formada por 100 elementos y queremos extraer
una muestra de 25 elementos, en primer lugar debemos establecer el
intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos
el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el
4, y a partir de l obtenemos los restantes elementos de la muestra.
2, 6, 10, 14,..., 98
Muestreo aleatorio estratificado
Se divide la poblacin en clases o estratos y se escoge, aleatoriamente,
un nmero de individuos de cada estrato proporcional al nmero de
componentes de cada estrato.
EJEMPLO
En una fbrica que consta de 600 trabajadores queremos tomar una
muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en
la B, 150 en la C y 100 en la D.

Distribucin muestral
Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida
puede ser infinita o finita.
En todo nuestro estudio vamos a limitarnos a una poblacin de
partida infi nita o a muestreo con reposicin .
Si consideremos todas las posibles muestras de tamao n en una poblacin,
para cada muestra podemos calcular un estadstico (media, desviacin
tpica, prop orcin, ...) que variar de una a otra.
As obtenemos una distribucin del estadstico que se llama distribucin
muestral

ESTIMACION ESTADISTICA
Estimacin de parmetros

Es el procedimiento utilizado para conocer las caractersticas de un


parmetro poblacional, a partir del conocimiento de la muestra.
Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin
de un valor de un parmetro de la poblacin; pero tambin necesitamos
precisar un:
Intervalo de confi anza
Se llama as a un intervalo en el que sabemos que est un parmetro, con
un nivel de confianza especfico.
Nivel de confi anza
Probabilidad de que el parmetro a estimar se encuentre en el intervalo de
confianza.
Error de estimacin admisible
Que estar relacionado con el radio del intervalo de confianza.
Estimacin de la media de una poblacin
El intervalo de confi anza , para la media de una poblacin, con unnivel
de confianza de 1 , siendo X la media de una muestra de
tamaon y la desviacin tpica de la poblacin, es:

El error mximo de estimacin es:


Cuanto mayor sea el tamao de la muestra, n, menor es el error .
Cuanto mayor sea el nivel de confi anza , 1-, mayor es el error .
Tamao de la muestra

Si aumentamos el nivel de confi anza , aumenta el tamao de la


muestra .
Si disminuimos el error , tenemos que aumentar el tamao de la
muestra .
EJEMPLOS:
1. El tiempo que tardan las cajeras de un supermercado en cobrar a los
clientes sigue una ley normal con media desconocida y desviacin tpica
0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un
tiempo medio de 5,2 minutos.
.Calcula el intervalo de confianza al nivel del 95% para el tiempo
medio que se tarda en cobrar a los clientes.

.Indica el tamao muestral necesario para estimar dicho tiempo


medio con un el error de 0,5 minutos y un nivel de confianza del
95%.

n 4
Estimacin de una proporcin
Si en una poblacin , una determinada caracterstica se presenta en una
proporcin p, la proporcin p' , de individuos con dicha caracterstica en
las muestras de tamao n, se distribuirn segn:
Intervalo de confi anza para una proporcin

El error mximo de estimacin es:

EJEMPLO:
En una fbrica de componentes electrnicos, la proporcin de componentes
finales defectuosos era del 20%. Tras una serie de operaciones e inversiones
destinadas a mejorar el rendimiento se analiz una muestra aleatoria de
500 componentes, encontrndose que 90 de ellos eran defectuosos. Qu
nivel de confianza debe adoptarse para aceptar que el rendimiento no ha
sufrido variaciones?
p = 0.2
q = 1 - p =0.8 p'= 90/ 500 = 0.18
E = 0.2 - 0.18 = 0.02

P (1 - z/2 <1.12) = 0.86861 - 0.8686 = 0.1314


0.8686 - 0.1314 = 0.737
Nivel de confi anza: 73.72%

BIBLIOGRAFIA

Estadstica inferencial y descriptiva, Zamora


Probabilidad. Serie Schaum - Seymour Lipschutz
george-c-canavos-probabilidad-y-estadc3adsticaaplicaciones-y-mc3a9todos
Estadistica para administracion y economia Anderson
10th

Potrebbero piacerti anche