Sei sulla pagina 1di 61

Ao de la Promocin de la

Industria Responsable y
Compromiso Climtico
INGENIERIA DE SISTEMAS

INFERENCIA ESTADISTICA
Ing. Noel Benito Miranda Yataco

TRABAJO MONOGRAFICO
INTEGRANTE:
Orihuela Roman Jean Carlos

HUANCAYO - PERU

2014

INTRODUCCION

Una distribucin de probabilidad indica toda la gama de valores que pueden


representarse como resultado de un experimento. Una distribucin de
probabilidad es similar al distribucin de frecuencias relativas .Si embargo,
en vez de describir el pasado, describe la probabilidad que un evento se
realice en el futuro, constituye una herramienta fundamental para la
prospectiva, puesto que se puede disear un escenario de acontecimientos
futuros considerando las tendencias actuales de diversos fenmenos
naturales.
Las decisiones estadsticas basadas en la estadstica inferencial son
fundamentales en la investigacin que son evaluadas en trminos de
distribucin de probabilidades.
En el presente trabajo, se estudia de manera gil los diverso tipos de
distribucin
probabilstica,
caracterizaremos
cada
distribucin,
la
fundamentacin matemtica de los diversos resultados no se enfocaran en
el presente trabajo; slo me limitar al estudio descriptivo de la distribucin
de probabilidades discretas.

MARCO TEORICO
1. DISTRIBUCIN DE BERNOULLI Y DISTRIBUCIN BINOMIAL

La distribucin de Bernoulli (o distribucin dicotmica), nombrada as por


el matemtico y cientfico suizo Jakob Bernoulli, es una distribucin de
probabilidad discreta, que toma valor 1 para la probabilidad de xito ( ) y
valor 0 para la probabilidad de fracaso (

).

Si X es una variable aleatoria que mide "nmero de xitos", y se realiza un


nico experimento con dos posibles resultados (xito o fracaso), se dice que
la variable aleatoria X se distribuye como una Bernoulli de parmetro P.
Su formula es:

2. DISTRIBUCION BINOMIAL

B (n, p)
FUNCIONES DE PROBABILIDAD:
Llamamos funcin de probabilidad f a la aplicacin de E(X) (Espacio
Muestral) en el intervalo [0,1] que verifica:
f(A) = p(A)
Bsicamente se trata de estudiar la probabilidad como una funcin
utilizando para su estudio todas las propiedades de las funciones.
LA DISTRIBUCIN BINOMIAL:
Llamamos experiencia aleatoria dicotmica a aquella que slo puede tener
dos posibles resultados A y A'. Usualmente A recibe el nombre de xito,
adems representaremos como p = p(A) y q = 1-p=p(A').
A la funcin de probabilidad de una variable aleatoria X resultado de contar
el nmero de xitos al repetir n veces una experiencia aleatoria dicotmica
con probabilidad de xito p la llamamos distribucin binomial y la
representamos por B (n, p). Para esta distribucin se verifica que, la variable
X puede tomar los valores:
0, 1, 2, ... , n
y que la variable toma cada uno de estos valores con probabilidad:

Para entender mejor esta parte partimos de un ejemplo para deducir esta
frmula y saber de dnde llega que nos permita cualquier problema que
tenga este tipo de distribucin.
Partimos .Se lanza al aire una moneda normal 3 veces, determine la
probabilidad de que aparezcan 2 guilas.
Solucin:
Antes de empezar a resolver este problema, lo primero que hay que hacer
es identificarlo como un problema que tiene una distribucin binomial, y
podemos decir que efectivamente as es, ya que se trata de un experimento
en donde solo se pueden esperar dos tipos de resultados al lanzar la
moneda, guila o sello, cutas probabilidades de ocurrencia son constantes,
cada uno de los lanzamientos es independiente de los dems y el nmero
de ensayos o repeticiones del experimento son constantes, n = 3.
Para dar solucin a este problema, lo primero que hay que hacer es un
diagrama de rbol, en donde representaremos los tres lanzamientos, de ah
se obtendr el espacio muestral y posteriormente la probabilidad pedida,
usando la frmula correspondiente.

A = guila, S = sello

=AAA, AAS, ASA, ASS, SAA, SAS, SSA, SSS


Para obtener la frmula, definiremos lo siguiente:
n = nmero de lanzamientos de moneda
x = nmero de xitos requeridos = nmero de guilas = 2
p = probabilidad de xito= p(aparezca guila) =1/2
q = probabilidad de fracaso= p(aparezca sello) =1/2

Entonces podemos partir de la siguiente expresin para desarrollar la


frmula ;P(aparezcan 2 guilas)=(No. De ramas del rbol en donde ap. 2
guilas)(probabilidad asociada a cada rama).Entonces el nmero de ramas
en donde aparecen dos guilas se puede obtener; Enumerando las ramas de
inters, estas seran: AAS, ASA, SAA, QU TIPO DE ARREGLOS SON ESTOS
ELEMENTOS DEL ESPACIO MUESTRAL?, Son permutaciones en donde
algunos objetos son iguales, entonces, el nmero de ramas se puede
obtener con la frmula correspondiente,
nPx1,x 2 ,... xk

Donde n = x1+x2+...+xk
siguiente;

n!
x1 ! x 2 !... x k !

.Sustituyendo en esta frmula, tenemos lo

nPx ,n x

n!
x! ( n x )!

Esta frmula puede ser sustituida por la de combinaciones, solo en el caso


de dos tipos de objetos, si hay ms de dos tipos de objetos, definitivamente
solo se usa la frmula original, como se observar en el caso de la
distribucin multinomial, pero por qu vamos a cambiar de frmula?,
simplemente porque en todos los libros de texto que te encuentres vas a
encontrar la frmula de combinaciones en lugar de la de permutaciones,
que es la siguiente,
nCx

n!
x! ( n x )!

y sustituyendo valores, nos damos cuenta de que efectivamente son 3 las


ramas de inters, que son donde aparecen dos guilas, donde n = 3, x = 2.
3

C2

3!
3!
3 x 2!

3ramas
2! ( 3 2 )! 2! !1!
2!1!

Y la probabilidad asociada a cada rama? Probabilidad asociada a cada rama


x n x
= p(guila)*p(guila)*p(sello)= p*p*q = p 2q = p q
,entonces llegamos a
ver la frmula de la distribucin Binomial sera:

p( n , x , p ) n C n x p x q n x
Entonces podemos ver que es la misma del comienzo
2.1 PARMETROS DE UNA DISTRIBUCIN BINOMIAL:
- Media, Esperanza o valor esperado.

nP
Donde:
n = nmero de ensayos o repeticiones del experimento
P = probabilidad de xito o la probabilidad referente al evento del
cual se desea calcular la media que se refiere la media

Q = complemento de P
-

varianza

nPQ
2.2 EJEMPLOS DE APLICACIN:
1.- La ltima novela de un autor ha tenido un gran xito, hasta el punto de
que el 80% de los lectores ya la han leido. Un grupo de 4 amigos son
aficionados a la lectura ,Cul es la probabilidad de que el grupo hayan leido
la novela 2 personas?
SOL:
n=4
p = 0.8
q = 0.2
B(4, 0.8)

2.Cul es la probabilidad de que el grupo hayan cmo mximo 2?


SOL:

3.- Un agente de seguros vende plizas a cinco personas de la misma edad


y que disfrutan de buena salud. Segn las tablas actuales, la probabilidad
de que una persona en estas condiciones viva 30 aos o ms es 2/3. Hllese
la probabilidad de que, transcurridos 30 aos, vivan Las cinco personas
SOL:
B(5, 2/3) p = 2/3 q = 1/3

4.- Cul es la probabilidad que vivan al menos tres personas?


SOL:

5.- Cul es la probabilidad que vivan exactamente dos personas?


SOL:

6.- Se dice que el 75% de los accidentes de una planta se atribuyen a


errores humanos. Si en un perodo de tiempo dado, se suscitan 5
accidentes, determine la probabilidad de que; a) dos de los accidentes se
atribuyan a errores humanos, b) como mximo 1 de los accidentes se
atribuya a errores de tipo humano,
SOL:
a) n = 5
x = variable que nos define el nmero de accidentes debidos a errores
humanos
x = 0, 1, 2,...,5 accidentes debidos a errores de tipo humano
p = p(xito) = p(un accidente se deba a errores humanos) = 0.75
q = p(fracaso) = p(un accidente no se deba a errores humanos) = 1-p =
0.25

b)

p( x 0 ,1,n 5, p 0.75 ) p( x 0 ) p( x 1 )5 C0 ( 0.75 )0 ( 0.25 )5 0

C1 ( 0.75 )1 ( 0.25 )51 0.000976 0.014648 0.015624


3. DISTRIBUCION GEOMETRICA O PASCAL

La distribucin Geomtrica tambin est relacionada con una secuencia de


ensayos de Bernoulli, excepto que el nmero de ensayos no es fijo. En

consecuencia, la distribucin geomtrica hereda las caractersticas de la


distribucin binomial, a excepcin del concepto del cual se quiere calcular la
probabilidad. En este caso la variable aleatoria de inters, denotada
mediante X, se define como el nmero de ensayos requeridos para lograr el
primer xito. Es obvio que para obtener el primer xito se debe realizar el
experimento cuando menos una vez, por lo que los valores que puede
tomar la variable aleatoria X son 1, 2, 3, ... , n, esto es, no puede tomar el
valor cero. En este caso se cumple que (X = x) si y slo si los primeros (x
1) ensayos son fracasos (q) y el x-simo ensayo es xito (p), por lo que:

qqqqqqq p q x 1 p

P(X = x) =

x 1 veces

De acuerdo a lo anterior, podemos decir que:


Una variable aleatoria X se distribuye de acuerdo con un modelo
probabilstico geomtrico, si su funcin de probabilidades es:

q x 1 p si x 1, 2, , n
f ( x)
de otra manera
0
Algunas puntualizaciones de la definicin de X:
Ntese que, en esta definicin, condiciones independientes significa
que p, la probabilidad de A, y 1 p, la de su complementario Ac, no
varan a lo largo de las sucesivas repeticiones de la experiencia.
Tal y como la hemos definido, X se refiere al nmero de lanzamientos
hasta que se produce A, pero sin contabilizar el ltimo caso en que se
da A. Por dicha razn X puede tomar los valores k = 0, 1, 2, ... con
probabilidad no nula.
Un ejemplo de este modelo podra ser la experiencia consistente en lanzar
sucesivamente un dado regular hasta que aparezca el nmero 6. Si
definimos la variable aleatoria X como el nmero de lanzamientos de un
dado regular hasta que aparezca un 6, queda claro que X sigue una
distribucin geomtrica de parmetro p = 1/6.
Preguntas:
A qu suceso nos referimos cuando decimos X = 0?
Cul es la probabilidad de que el primer 6 aparezca en el cuarto
lanzamiento?
Propiedades del modelo Geomtrico o de Pascal
1) Esperanza: E(X) = (1 p)/p

E ( X ) x( q x 1 p )
x 1

2) Varianza: V(X) = (1 p)/p2

1
p

V ( X ) E ( X ) x (q
2

x 1

x 1

1
p)
p

q
p2

EJEMPLOS DE APLICACIN
1.- Se lanza un dado hasta que aparece el nmero 6. Cul es la
probabilidad de que el nmero de lanzamientos sean 3?
SOL:
En este problema el xito es la aparicin del nmero 6 y la probabilidad de
que salga el nmero 6 al lanzar un dado es 1/6, por lo que p = 1/6 y q = 5/6.
Como nos interesa calcular la probabilidad de que el 6 aparezca en el tercer
lanzamiento, entonces:

P(X = 3) = (

5
6

)3-1 (

1
6

)=(

5
6

)2 (

1
6

) = 0.1157

2.- La probabilidad de que cierto anlisis clnico d una reaccin positiva es


0.4. Los resultados de los anlisis son independientes unos de otros Cul es
la probabilidad de que la primera reaccin positiva ocurra antes del tercer
anlisis?
SOL:
Aqu el xito es que salga una reaccin positiva, por lo que p = 0.4 y q =
0.6. Si la primera reaccin positiva debe aparecer antes del tercer anlisis,
entonces:
P(X < 3) = P(X = 1) + P(X = 2) = (0.6) 1-1 (0.4) + (0.6)2-1 (0.4) = 0.64
3.- Se tienen 4 llaves de las cuales slo una abre un candado. Se prueban
las llaves una tras otra, con reemplazo, hasta encontrar la que abre el
candado. Calcular la probabilidad de que el candado se abra despus del
segundo intento.
SOL:
Si seleccionamos una llave al azar, la probabilidad de que ste abra el
candado es y como el xito es que se abra el candado, entonces p = =
0.25 y q = 0.75. Deseamos encontrar P(X>2).

Sabemos que P(X>2) = 1 P(X 2) y que:

P(X 2) = P(X = 1) + P(X = 2) = [(0.75) 1-1 (0.25) + (0.75)2-1 (0.25)] =


0.4375
Por lo tanto:
P(X>2) = 1 0.4375 = 0.5625

4.- Tres personas lanzan una moneda y el disparejo paga el caf. Si los tres
resultados son iguales, las monedas se lanzan nuevamente. Encontrar la
probabilidad de que se necesiten menos de 4 intentos para saber quin
paga el caf.
SOL:
En este problema el xito consiste en sacar el disparejo. Lo primero que
debemos hacer para resolver el problema, es encontrar el espacio muestral
correspondiente al lanzamiento de 3 monedas:
S = {(c, c, c) (c, c, +) (c, +, c) (+, c, c) (c, +, +) (+, c, +) (+, +, c) (+,
+, +)}
Podemos apreciar que la magnitud del espacio muestral es 8 y que es un
espacio equiprobable. El nmero de resultados en que aparece el disparejo
es 6, por lo que p = 6/8 = 0.75 y q = 0.25.
Si queremos obtener la probabilidad de que se necesiten menos de 4
intentos para saber quin paga el caf, entonces:
P(x<4) = P(x = 1) + P(x = 2) + P(x = 3) = (0.25)1-0 (0.75) + (0.25)2-1 (0.75)
+ (0.25)3-1 (0.75) = 0.9844

5.- Se lanzan 2 dados hasta que la suma de los nmeros que aparecen sea
7. Calcular:
a
La esperanza del nmero de lanzamientos que se necesiten.
b
La variancia del nmero de lanzamientos que se necesiten.
SOL:
El xito en este experimento es que la suma de los nmeros que aparecen
sea 7, por lo que el primer paso es el clculo de su probabilidad.En
problemas anteriores hemos visto que la magnitud del espacio muestral de
este experimento es 36. Ahora calculemos el nmero de formas posibles en
que aparece el 7. Los posibles resultados son: {(1, 6) (2, 5) (3, 4) (4, 3) (5,
2) (6, 1)} y aplicando la funcin de conjunto aditivo vemos que son 6
resultados, por lo que p = 6/36 = 1/6 y q = 5/6.
-

Sabemos que para calcular el valor esperado utilizamos el modelo


matemtico _
E( X )
E( X )

1
p

1
1

6
1
p
6

La variancia del nmero de lanzamientos se calcula con:

2 V (X )

5
6

p2 1
6

30

4. DISTRIBUCION HIPERGEOMETRICA

Hasta ahora hemos analizado distribuciones que modelizaban situaciones


en las que se realizaban pruebas que entraaban una dicotoma (proceso de
Bernoulli) de manera que en cada experiencia la probabilidad de obtener
cada uno de los dos posibles resultados se mantena constante. Si el
proceso consista en una serie de extracciones o selecciones ello implicaba
la reposicin de cada extraccin o seleccin, o bien la consideracin de una
poblacin muy grande. Sin embargo si la poblacin es pequea y las
extracciones no se remplazan las probabilidades no se mantendrn
constantes. En ese caso las distribuciones anteriores no nos servirn para la
modelizar la situacin. La distribucin hipergeomtrica viene a cubrir esta
necesidad de modelizar procesos de Bernoulli con probabilidades no
constantes (sin reemplazamiento) .
La distribucin hipergeomtrica es especialmente til en todos aquellos
casos en los que se extraigan muestras o se realizan experiencias repetidas
sin devolucin del elemento extrado o sin retornar a la situacin
experimental inicial.
Modeliza , de hecho, situaciones en las que se repite un nmero
determinado de veces una prueba dicotmica de manera que con cada
sucesivo resultado se ve alterada la probabilidad de obtener en la siguiente
prueba uno u otro resultado. Es una distribucin .fundamental en el estudio
de muestras pequeas de poblaciones .pequeas y en el clculo de
probabilidades de, juegos de azar y tiene grandes aplicaciones en el control
de calidad en otros procesos experimentales en los que no es posible
retornar a la situacin de partida.
La distribucin hipergeomtrica puede derivarse de un proceso
experimental puro o de Bernouilli con las siguientes caractersticas:
Los experimentos que tienen este tipo de distribucin tienen las siguientes
caractersticas:
a
b
c
d

Al realizar un experimento con este tipo de distribucin, se


esperan dos tipos de resultados.
Las probabilidades asociadas a cada uno de los resultados no
son constantes.
Cada ensayo o repeticin del experimento no es independiente
de los dems.
El nmero de repeticiones del experimento (n) es constante.

Supongamos la extraccin aleatoria de n elementos de un conjunto formado


por N elementos totales, de los cuales Np son del tipo A y Nq son del tipo
(p+q=l) .Si realizamos las extracciones sin devolver los elementos extrados

, y llamamos X. al nmero de elementos del tipo A que extraemos en n


extracciones X seguir una distribucin hipergeomtrica de parmetros N ,
n,p
Funcin de cuanta.
La funcin de cuanta de una distribucin Hipergeomtrica har
corresponder a cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad
del suceso "obtener x resultados del tipo A ", y (n-x) resultados del tipo no A
en las n pruebas realizadas de entre las N posibles.
Veamos:

Hay un total de
tipo A y n-x del tipo

formas distintas de obtener x resultados del


,

si partimos de una poblacin formada por Np

elementos del tipo A y Nq elementos del tipo

.Por otro lado si realizamos n

pruebas o extracciones hay un total de


posibles muestras ( grupos de
n elementos), aplicando la regla de Laplace tendramos.

Que para valores de X comprendidos entre el conjunto de enteros 0,1,. .n


ser la expresin de la funcin de cuanta de una distribucin ,
Hipergeomtrica de parmetros N,n,p .
Media y varianza.
Considerando que una variable hipergeomtrica de parmetros N, n, p
puede considerarse generada por la reiteracin de un proceso dicotmico n
veces en el que las n dicotomas NO son independientes ; podemos
considerar que una variable hipergeomtrica es la suma de n variables
dicotmicas NO independientes.
Es bien sabido que la media de la suma de variables aleatorias (sean stas
independientes o no) es la suma de las medias y por tanto la media de una
distribucin hipergeomtrica ser , como en el caso de la binomial :
En cambio si las variables sumando no son independientes la varianza de la
variable suma no ser la suma de las varianzas.Si se evala el valor de la
varianza para nuestro caso se obtiene que la varianza de una distribucin
hipergeomtrica de parmetros N,n,p es : si

4.1 EJEMPLOS DE APLICACION :


1 .- En una urna o recipiente hay un total de N objetos, entre los cuales hay
una cantidad a de objetos que son defectuosos, si se seleccionan de esta
urna n objetos al azar, y sin reemplazo, cul es la probabilidad de obtener
x objetos defectuosos?
SOL :
Luego;

p( x , n )

C x * N a C n x
N Cn

donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de entre n
seleccionados
a

C x * N a C n x muestras de n objetos en donde hay x que son defectuosos y


n-x buenos

C n todas las muestras posibles de seleccionar de n objetos tomadas


de entre N objetos en total = espacio muestral

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son


defectuosos, si de seleccionan 4 objetos al azar, cul es la probabilidad de
que 2 sean defectuosos?
LUEGO :
N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
3!
7!
*
C2*10 3 C4 2
( 3 2 )! 2! ( 7 2 )! 2!
3 C2* 7 C2
p( x 2 , n 4 )

10!
10 C4
10 C4
( 10 4 )! 4!
3

3!
7!
3 x 2 x1! 7 x 6 x5!
*
*
5! 2! 3 x 2 x7 x6 * 4!
1! 2! 5! 2! 1! 2!
10!
10 x9 x8 x7 x6!
10 x9 x8 x 7 2! 2!
6! 4!
6! 4!

Donde:
Probabilidad asociada a cada muestra de 4 objetos que se
3x 2 x7 x6
seleccionaron, con lo que se demuestra que las probabilidades
10 x9 x8 x 7
no son constantes

Formas o maneras de obtener 2 objetos defectuosos entre los


4!
4 seleccionados = muestras de 4 objetos entre los que 2 son
2!2!
defectuosos

Como se observa en el desarrollo de la solucin del problema, la pretensin


es demostrar que las probabilidades asociadas a cada uno de los resultados
no son constantes. Luego la probabilidad de obtener 2 objetos defectuosos
entre los 4 seleccionados al azar sera:

3 x 2 x7 x6
4!
252 24 6048
*

0.30
10 x9 x8 x 7 2!2! 5040 4 20160

2.- Para evitar que lo descubran en la aduana, un viajero ha colocado 6


tabletas de narctico en una botella que contiene 9 pldoras de vitamina
que son similares en apariencia. Si el oficial de la aduana selecciona 3
tabletas aleatoriamente para analizarlas, a) Cul es la probabilidad de que
el viajero sea arrestado por posesin de narcticos?, b) Cul es la
probabilidad de que no sea arrestado por posesin de narcticos?.
SOL:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narctico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narctico = variable que nos indica el nmero de
tabletas de narctico que se puede encontrar al seleccionar las 3 tabletas
p(viajero sea arrestado por posesin de narcticos) = p(de que entre las 3
tabletas seleccionadas haya 1 o ms tabletas de narctico)
C1* 9 C2
C* C
C* C
6 2 9 1 6 3 9 0
15 C3
15 C3
15 C3
( 6 )( 36 ) ( 15 )( 9 ) ( 20 )( 1 ) 216 135 20
371

0.81538
455
455
455
455
455
p( x 1,23tabletas; n 3 )

Otra forma de resolver(el viajero sea arrestado por posesin de narcticos)


= 1 p(de que entre las tabletas seleccionadas no haya una sola de
narctico)

1 p( x 0; n 3 ) 1

1
b

C0* 9 C3

15 C3

( 1 )( 84 )
0.184615 0.815385
455

p(no sea arrestado por posesin de narcticos)

p( x 0; n 3 )

C0* 9 C3 ( 1 )( 84 )

0.184615
15 C3
455

3.- De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el


lote contiene 3 proyectiles defectuosos que no explotarn, cul es la
probabilidad de que , a) los 4 exploten?, b) al menos 2 no exploten?
SOL:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados

x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el


nmero de proyectiles que explotan entre la muestra que se dispara

p( x 4; n 4 )

C4* 3 C0 ( 35 )( 1 ) 35

0.16667
210
210
10 C4

b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o ms proyectiles no exploten) = p(x = 2 o
3; n=4) =

C2* 7 C2 3 C3* 7 C1 ( 3 )( 21 ) ( 1 )( 7 ) 63 7
70

0.333333
210
210
210
10 C4

4,. a)Cul es la probabilidad de que una mesera se rehse a servir bebidas


alcohlicas nicamente a dos menores de edad si verifica aleatoriamente
solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la
edad suficiente?, b) Cal es la probabilidad de que como mximo 2 de las
identificaciones pertenezcan a menores de edad?
SOL:
a) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el nmero de identificaciones que pertenecen a
personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

p( x 2,n 5 )

C2 * 5 C3
9

C5

( 3 )( 10 )
0.238095
126

b) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el nmero de identificaciones que pertenecen
a personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

p( x 0,1,2; n 5 )

C0* 5 C5 4 C1* 5 C4 4 C2* 5 C3 ( 1 )( 1 ) ( 4 )( 5 ) ( 6 )( 10 )

126
9 C5
1 20 60 81

0.64286
126
126
5. DISTRIBUCION DE POISSON

La distribucin de Poisson, que debe su nombre al matemtico francs


Simen Denis Poisson (1781-1840), ya haba sido introducida en 1718 por
Abraham De Moivre como una forma lmite de la distribucin binomial que
surge cuando se observa un evento raro despus de un nmero grande de

repeticiones10. En general, la distribucin de Poisson se puede utilizar como


una aproximacin de la binomial, Bin(n, p), si el nmero de pruebas n es
grande, pero la probabilidad de xito p es pequea; una regla es que la
aproximacin Poisson-binomial es buena si n20 y p0,05 y muy
buena si n100 y p0,01. La distribucin de Poisson tambin surge
cuando un evento o suceso raro ocurre aleatoriamente en el espacio o el
tiempo. La variable asociada es el nmero de ocurrencias del evento en un
intervalo o espacio continuo, por tanto, es una variable aleatoria discreta
que toma valores enteros de 0 en adelante (0, 1, 2,...). As, el nmero de
pacientes que llegan a un consultorio en un lapso dado, el nmero de
llamadas que recibe un servicio de atencin a urgencias durante 1 hora, el
nmero de clulas anormales en una superficie histolgica o el nmero de
glbulos blancos en un milmetro cbico de sangre son ejemplos de
variables que siguen una distribucin de Poisson. En general, es una
distribucin muy utilizada en diversas reas de la investigacin mdica y, en
particular, en epidemiologa.
El concepto de evento raro o poco frecuente debe ser entendido en el
sentido de que la probabilidad de observar k eventos decrece rpidamente
a medida que k aumenta. Supngase, por ejemplo, que el nmero de
reacciones adversas tras la administracin de un frmaco sigue una
distribucin de Poisson de media lambda=2. Si se administra este frmaco a
1.000 individuos, la probabilidad de que se produzca una reaccin adversa
(k=1) es 0,27; los valores de dicha probabilidad para k=2, 3, 4, 5, 6
reacciones, respectivamente, son: 0,27; 0,18; 0,09; 0,03 y 0,01. Para k=10 o
mayor, la probabilidad es virtualmente 0. El rpido descenso de la
probabilidad de que se produzcan k reacciones adversas a medida que k
aumenta puede observarse claramente en el grfico de la funcin de
densidad obtenido con

Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por
unidad de rea, tiempo, pieza, etc, etc,:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc,
etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.

Para determinar la probabilidad de que ocurran x xitos por unidad de


tiempo, rea, o producto, la frmula a utilizar sera:

p( x , )

x
x!

Donde:
p(x, ) = probabilidad de que ocurran x xitos, cuando el nmero promedio
de ocurrencia de ellos es
= media o promedio de xitos por unidad de tiempo, rea o producto
= 2.718
x = variable que nos denota el nmero de xitos que se desea que ocurra
Hay que hacer notar que en esta distribucin el nmero de xitos que
ocurren por unidad de tiempo, rea o producto es totalmente al azar y que
cada intervalo de tiempo es independiente de otro intervalo dado, as como
cada rea es independiente de otra rea dada y cada producto es
independiente de otro producto dado.
Propiedades del modelo de Poisson
1) Esperanza: E(X) = .
2) Varianza: V(X) = .
En esta distribucin la esperanza y la varianza coinciden.
3) La suma de dos variables aleatorias independientes con distribucin de
Poisson resulta en una nueva variable aleatoria, tambin con distribucin de
Poisson, de parmetro igual a la suma de parmetros:
X1 ~ P( = 1) y X2 ~ P( = 2)
y definimos Z = X1 + X2, entonces,
Z ~ P( = 1 + 2)
Este resultado se extiende inmediatamente al caso de n variables aleatorias
independientes con distribucin de Poisson. En este caso, la variable suma
de todas ellas sigue una distribucin de Poisson de parmetro igual a la
suma de los parmetros.
5.1 EJERCICIOS DE APLICACIN
1.- Si un banco recibe en promedio 6 cheques sin fondo por da, cules son
las probabilidades de que reciba, cuatro cheques sin fondo en un da dado,
b) 10 cheques sin fondos en cualquiera de dos das consecutivos?
SOL:
a) x = variable que nos define el nmero de cheques sin fondo que
llegan al banco en un da cualquiera = 0, 1, 2, 3, ....., etc.
= 6 cheques sin fondo por da
= 2.718

p( x 4, 6 )

( 6 )4 ( 2.718 )6 ( 1296 )( 0.00248 )

0.13392
4!
24

b) x= variable que nos define el nmero de cheques sin fondo que


llegan al banco en dos das consecutivos = 0, 1, 2, 3,......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos
das consecutivos
Nota: siempre debe de estar en funcin de x siempre o dicho de otra
forma, debe hablar de lo mismo que x.

p( x 10, 12 )

( 12 )10 ( 2.718 )12 ( 6.191736410 )( 0.000006151 )

0.104953
10!
3628800

2.- En la inspeccin de hojalata producida por un proceso electroltico


continuo, se identifican 0.2 imperfecciones en promedio por minuto.
Determine las probabilidades de identificar a) una imperfeccin en 3
minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando ms una
imperfeccin en 15 minutos.
Solucin:
a x = variable que nos define el nmero de imperfecciones en la
hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la
hojalata

p( x 1, 0.6 )

( 0.6 )1( 2.718 )0.6 ( 0.6 )( 0.548845 )

0.329307
1!
1

x = variable que nos define el nmero de imperfecciones en la


hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata

( 1 )0 ( 2.718 )1 ( 1 )( 2.718 )1

0!
1!

p( x 2,3,4 ,etc.... 1 ) 1 p( x 0,1, 1 ) 1

=1-(0.367918+0.367918) = 0.26416
c

x = variable que nos define el nmero de imperfecciones en la


hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la
hojalata

( 3 )0 ( 2.718 )3 ( 3 )1( 2.718 )3


p( x 0 ,1, 3 ) p( x 0, 3 ) p( x 1, 3 )

0!
1!
= 0.0498026 + 0.149408 = 0.1992106
3.- Cierta enfermedad tiene una probabilidad muy baja de ocurrir,
p=1/100.000. Calcular la probabilidad de que en una ciudad con 500.000
habitantes haya ms de 3 personas con dicha enfermedad. Calcular el
nmero esperado de habitantes que la padecen.
SOL :
Si consideramos la v.a. X que contabiliza el nmero de personas que
padecen la enfermedad, es claro que sigue un modelo binomial, pero que
puede ser muy bien aproximado por un modelo de Poisson, de modo que

As el nmero esperado de personas que padecen la enfermedad es


. Como
, existe una gran dispersin, y no sera extrao
encontrar que en realidad hay muchas ms personas o menos que estn
enfermas. La probabilidad de que haya ms de tres personas enfermas es:

6. DISTRIBUCIN UNIFORME CONTINUA


6.1 Funcin de Densidad
Una variable aleatoria continua X se apega a un modelo probabilstico
uniforme en el intervalo [a, b], si todos los puntos del intervalo tienen la
misma probabilidad de ocurrencia.
Definicin. Una variable aleatoria X est distribuida uniformemente en el
intervalo [a, b], en donde a y b son finitos, si su funcin de densidad es:

La grfica que representa esta distribucin es:


Poner grfica
De acuerdo a lo anterior, una variable aleatoria distribuida uniformemente,
tiene una funcin de densidad que es una constante en el intervalo de
definicin [a, b]. A fin de satisfacer la condicin de que
, la
funcin de densidad debe ser igual al recproco de la longitud del intervalo.
Para cualquier subintervalo [c, d], en donde a c<d b, la P(c x d)=
. As, la probabilidad slo depende de la magnitud del
subintervalo y no de la ubicacin del mismo.
6.2 Funcin de Distribucin Acumulada.
La Funcin de Distribucin Acumulada est dada por:

, por lo que:

6.3 Media o Esperanza.


En el captulo anterior vimos que la media o valor esperado de una variable
aleatoria continua es
. Si referimos esta
expresin al intervalo [a, b] y utilizamos la funcin de densidad de la
distribucin, tenemos que:

6 4. Varianza.
Tambin vimos que la variancia se calcula con la siguiente expresin:
, donde
. Si nuevamente
referimos esta expresin al intervalo [a, b] y utilizamos la funcin de
densidad

de

la

distribucin,

tenemos:

Sustituyendo valores tenemos:


=

6.5 EJERCICIOS DE APLICACIN


1.- Sea X una lnea cuyos valores se apegan a una distribucin uniforme. Se
elige un punto al azar sobre el segmento de la lnea [0, 2]. Cul es la
probabilidad de que el punto elegido se encuentre entre 1 y 1.5?.
SOL :
Se ha establecido que para cualquier subintervalo que est dentro del
intervalo donde tiene validez la distribucin, la probabilidad se calcula
mediante la siguiente expresin:
P(c x d)=
En consecuencia:

2.- La cantidad de refresco que se despacha en un baso es una variable


aleatoria que se distribuye en forma uniforme entre [130, 160] mililitros.
Calcular la probabilidad de que un vaso contenga a lo ms 140 mililitros.
SOL:
Deseamos encontrar P(x 140) y sabemos que el planteamiento
corresponde a la funcin de distribucin acumulada para el valor 140.
Utilizando la expresin correspondiente vista anteriormente tenemos:

3.- Se sabe que el peso X de ciertos bloques de acero, es una variable


aleatoria continua distribuida uniformemente en el intervalo [50,70]
toneladas. Encontrar:
a)
La funcin de densidad de la variable.
b) La probabilidad de que si se pesa un bloque seleccionado al azar pese
cuando menos 62 toneladas.
SOL:
a)

b)
4.- Suponga que la variable aleatoria X est distribuida uniformemente en el
intervalo [-a, a]. Determinar el valor de a de modo que se satisfaga que P(x
> 1) = 1/3
Solucin.
Tenemos que
Por otra parte sabemos que:

por lo que:

5.- Suponga que X est distribuida uniformemente en el intervalo [2, 8].


a) Calcular P(2 x 7)
b) Determinar el valor de la constante k, de modo que: P(X > k) = 0.30

SOL:
De acuerdo a lo visto anteriormente sabemos que
a)
b)
7. DISTRIBUCIN UNIFORME DISCRETA
Es una distribucin muy sencilla que asigna probabilidades iguales a un
conjunto finito de puntos del espacio. Modeliza fenmenos en los que
tenemos un conjunto de n sucesos posibles, cada uno de los cuales con la
misma probabilidad de ocurrir. Si aleatorizamos de forma que cada uno de
stos sucesos se corresponda con un nmero natural del 1 al n obtendremos
una distribucin uniforme. Tendremos un nico parmetro; n
Diremos, por tanto que
Puede hacerse derivar en consecuencia de un proceso experimental de
seleccin aleatoria, en el que la caracterstica que consideramos en la
seleccin slo puede tomar un conjunto de n valores discretos y donde
cualquiera de estos valores puede obtenerse con igual probabilidad. Por su
elementalidad no es una distribucin de excesivo inters prctico. Su
funcin de cuanta definida para los valores de x ={ 1, 2, , n} vendr dada
por
la
constante:
P(x)
=
l
/n
para
x
={
1,
2,
,
n}
Su funcin de distribucin vendr dada por

Puede comprobarse que su media ser:

Su varianza ser :

Tenemos esta distribucin cuando el resultado de una experiencia aleatoria


puede ser un conjunto finito de n posibles resultados, todos ellos

igualmente probables.
7.1 EJERCICIOS DE APLICACIN
1.- Sea X, puntuacin en el lanzamiento de un dado regular. Esta variable
toma seis valores posibles, todos con la misma probabilidad p = 1/6. La
funcin de densidad de esta variable ser:
f(k) = P[X = k] = 1/6
k = 1, 2, 3, 4, 5, 6

2.- La funcin de masa de la variable aleatoria X: nmero que aparece al


lanzar un dado es:

Planteemos sus caractersticas principales de tendencia central y dispersin.


El valor esperado y varianza de una distribucin discreta uniforme se
obtienen as:
Valor esperado (

Varianza (
Para el caso del lanzamiento del dado: el valor esperado y la varianza del
nmero de puntos en la cara superior son:

3.- Seleccin de un empleado entre equipo de 10 con el fin de supervisar un


proyecto especifico. Esa seleccin se hace al azar utilizando papeleta con
nmeros.
a- Cul es la probabilidad de que el nmero de la papeleta seleccionado sea
menor de 4?

4.- Seleccin de un empleado entre equipo de 10 con el fin de supervisar un


proyecto especfico. Esa seleccin se hace al azar utilizando papeleta con
nmeros.
Cul es la media y la varianza de la distribucin de probabilidad del nmero
de la papeleta?

5.- Un jugador lanza un dado corriente. Si sale nmero primo, gana tantos
cientos de euros como marca el dado, pero si no sale nmero primo, pierde
tantos cientos de euros como marca el dado. Determinar la funcin de
probabilidad y la esperanza matemtica del juego.
x
p x p i
i

+10
0
+
200
+
300
400
+
500
600

100/6
200/6
300/6
400/6
500/6
600/6
100/6

=16.667
8. DISTRIBUCIN NORMAL

La distribucin normal es, sin duda, la distribucin de probabilidad ms


importante del Clculo de probabilidades y de la Estadstica. Fue
descubierta por De Moivre (1773), como aproximacin de la distribucin
binomial. De todas formas, la importancia de la distribucin normal queda
totalmente consolidada por ser la distribucin lmite de numerosas variables
aleatorias, discretas y continuas, como se demuestra a travs de los
teoremas centrales del lmite. Las consecuencias de estos teoremas
implican la casi universal presencia de la distribucin normal en todos los
campos de las ciencias empricas: biologa, medicina, psicologa, fsica,
economa, etc. En particular, muchas medidas de datos continuos en
medicina y en biologa (talla, presin arterial, etc.) se aproximan a la
distribucin normal. Junto a lo anterior, no es menos importante el inters
que supone la simplicidad de sus caractersticas y de que de ella derivan,
entre otras, tres distribuciones (Ji-cuadrado, t y F) que se mencionarn ms
adelante, de importancia clave en el campo de la contrastacin de Hiptesis
estadsticas. La distribucin normal queda totalmente definida mediante dos
parmetros: la media (Mu) y la desviacin estndar (sigma).
La distribucin normal es de suma importancia en estadstica por tres
razones principales:
1. Numerosas variables continuas de fenmenos aleatorios tienden a
comportarse probabilsticamente mediante sta.
2. Es el lmite al que convergen tanto variables aleatorias continuas
como discretas.
3. Proporciona la base de la inferencia estadstica clsica debido a su
relacin con el teorema del lmite central.
Propiedades de la distribucin normal
1. Su grafica tiene forma acampanada.
2. El valor esperado, la mediana y la moda tienen el mismo valor
cuando la variable aleatoria se distribuye normalmente.
3. Su dispersin media es igual a 1.33 desviaciones estndar. Es decir,
el alcance intercuartil est contenido dentro de un intervalo de dos
tercios de una desviacin estndar por debajo de la media a dos
tercios de una desviacin estndar por encima de la media.

En la prctica, algunas de las variables que observamos slo pueden


aproximar estas propiedades. As que si el fenmeno puede mediarse
aproximadamente mediante la distribucin normal se tendr:
1. Que el polgono puede verse en forma de campana y simtrico.
2. Sus mediciones de tendencia central tienen bastante parecido.
3. El valor intercuartil puede diferir ligeramente de 1.33 desviaciones
estndar.
4. El dominio de la variable aleatoria normalmente distribuida
generalmente caer dentro de 3 desviaciones estndar por encima y
por debajo de la media.
El modelo matemtico
El modelo o expresin matemtica que representa una funcin de densidad
de probabilidad se denota mediante el smbolo
. Para la distribucin
normal, se tiene la siguiente funcin de probabilidad.

Donde
es la constante matemtica aproximada por 2.71828
es la constante matemtica aproximada por 3.14159

Parmetros
es cualquier valor de la variable aleatoria continua, donde
As,

En la distribucin normal estndar se sabe que las reas se distribuyen de la


siguiente manera:
Funcin de Densidad
Normal (0,1)

Manejo de tablas
La tabla anexa representa las probabilidades o reas bajo la curva normal
calculadas hasta los valores particulares de inters

(Transformados). Al

observar la tabla se observa que todos los valores deben registrarse


primero con hasta dos lugares decimales. Por ejemplo, para leer el rea de
probabilidad bajo la curva hasta

, podemos recorrer hacia abajo la

columna Z de la tabla hasta que ubiquemos el valor de inters

(en

dcimas). As pues, nos detenemos en la fila


. A continuacin,
leemos esta fila hasta que intersecamos la columna que contiene el lugar de
centsimas del valor (
). Por tanto, en el cuerpo de la tabla, la
probabilidad tabulada para z=1.57 corresponde a la interseccin de la fila
z=1.5 con la columna z=0.07 y es 0.9418.
8.1 EJERCICIOS DE APLICACIN
1.- Si X es una variable aleatoria de una distribucin N(, ), hallar: p(3
X +3)
SOL:

Es decir, que aproximadamente el 99.74% de los valores de X estn a


menos de tres desviaciones tpicas de la media.
2.- En una distribucin normal de media 4 y desviacin tpica 2, calcular el
valor de a para que: P(4a x 4+a) = 0.5934
SOL:

3 .- En una ciudad se estima que la temperatura mxima en el mes de junio


sigue una distribucin normal, con media 23 y desviacin tpica 5. Calcular
el nmero de das del mes en los que se espera alcanzar mximas entre 21
y 27
SOL:

4.- La media de los pesos de 500 estudiantes de un colegio es 70 kg y la


desviacin tpica 3 kg. Suponiendo que los pesos se distribuyen
normalmente, hallar cuntos estudiantes pesan:
SOL:
4.1 Entre 60 kg y 75 kg

4.2Ms de 90 kg

4.3Menos de 64 kg

4.4 De464 kg

4.5 De 564 kg o menos


5.- Se supone que los resultados de un examen siguen una distribucin
normal con media 78 y desviacin tpica 36. Se pide:
SOL:
a) Cul es la probabilidad de que una persona que se presenta el
examen obtenga una calificacin superior a 72?

b) Calcular la proporcin de estudiantes que tienen puntuaciones


que exceden por lo menos en cinco puntos de la puntuacin
que marca la frontera entre el Apto y el No-Apto (son
declarados No-Aptos el 25% de los estudiantes que obtuvieron
las puntuaciones ms bajas)
p class="b">

9. DISTRIBUCIN GAMMA
La distribucin gamma se puede caracterizar del modo siguiente: si se est
interesado en la ocurrencia de un evento generado por un proceso de
Poisson de media lambda, la variable que mide el tiempo transcurrido hasta
obtener n ocurrencias del evento sigue una distribucin gamma con
parmetros a= nlambda (escala) y p=n (forma). Se denota
Gamma(a,p).
Por ejemplo, la distribucin gamma aparece cuando se realiza el estudio de
la duracin de elementos fsicos (tiempo de vida). Esta distribucin presenta
como propiedad interesante la falta de memoria. Por esta razn, es muy
utilizada en las teoras de la fiabilidad, mantenimiento y fenmenos de
espera (por ejemplo en una consulta mdica tiempo que transcurre hasta
la llegada del segundo paciente).
Campo de variacin:
0<x<
Parmetros:
a: parmetro de escala, a > 0
p: parmetro de forma, p > 0
Este modelo es una generalizacin del modelo Exponencial ya que, en
ocasiones, se utiliza para modelar variables que describen el tiempo hasta
que se produce p veces un determinado suceso.
Su funcin de densidad es de la forma:

Como vemos, este modelo depende de dos parmetros positivos: y p. La


funcin (p) es la denominada funcin Gamma de Euler que representa la
siguiente integral:

Que verifica (p + 1) = p(p), con lo que, si p es un nmero entero positivo,


(p + 1) = p!
Propiedades de la distribucin Gamma
1. Su esperanza es p.

2. Su varianza es p2
3. La distribucin Gamma (, p = 1) es una distribucin Exponencial de
parmetro . Es decir, el modelo Exponencial es un caso particular de
la Gamma con p = 1.
4. Dadas dos variables aleatorias con distribucin Gamma y parmetro
comn
X ~ G(, p1) y Y ~ G(, p2)
se cumplir que la suma tambin sigue una distribucin Gamma
X + Y ~ G(, p1 + p2).
Una consecuencia inmediata de esta propiedad es que, si tenemos k
variables aleatorias con distribucin Exponencial de parmetro (comn) e
independientes, la suma de todas ellas seguir una distribucin G(, k).
9.1 EJERCICIOS DE APLICACION
1.- Suponga que cierta pieza metlica se romper despus de sufrir dos
ciclos de esfuerzo. Si estos ciclos ocurren de manera independiente a una
frecuencia promedio de dos por cada 100 horas. Obtener la probabilidad de
que el intervalo de tiempo se encuentre hasta que ocurre el segundo ciclo.
a. Dentro de una desviacin con respecto del tiempo promedio.
b. A ms de dos desviaciones por encima de la media.
SOL:

2.- En cierta ciudad el consumo diario de energa elctrica, en millones de


kilovatios por hora, puede considerarse como una variable aleatoria con
distribucin GAMMA de parmetros = 3 y = 0.5.
La planta de energa de esta ciudad tiene una capacidad diaria de 10
millones de KW/hora
Cul es la probabilidad de que este abastecimientos sea:
a. Insuficiente en un da cualquiera?.
b. Se consuman entre 3 y 8 millones de K. W./Hora?
c. Encuentre E(x) y V(x).
SOL:

3.-

4.-

5.- Datos

SOL:

10.

DISTRIBUCIN EXPONENCIAL

Antes de introducir la variable exponencial puede mirarse un origen natural


de sta a partir de una variable aleatoria Poisson, la cual indica el nmero
de veces que ocurre un evento en una unidad de tiempo. Si se escribe la
funcin de probabilidad Poisson de la siguiente manera:
la probabilidad de que no ocurra algn evento, en el periodo hasta el tiempo
est dada por:

De esta manera, puede definirse ahora una variable aleatoria continua


que mide el tiempo que tarda en ocurrir el primer evento de Poisson. Es
decir,
Lo que permite construir la funcin de distribucin acumulada as:

Al derivar, con respecto a


aleatoria exponencial

se tiene la funcin de densidad de la variable

Valor esperado:
Varianza:
Observaciones:
1. En la definicin de la variable aleatoria exponencial, sta se plantea como
tiempo que tarda en ocurrir el primer evento Poisson. Sin embargo, esta
definicin puede hacerse extensiva a las dems unidades de medicin
consideradas en los eventos de Poisson, por ejemplo, cantidad de metros de
carretera que deben recorrerse hasta que aparezca el primer bache,
cantidad de
que deben inspeccionarse en una hacienda hasta que
aparezca el primer cafetal de broca, etc.
2. En el lenguaje de las aplicaciones tambin se utiliza la distribucin
exponencial para modelar tiempo entre eventos, distancia entre eventos,
volumen entre eventos.
Ejemplo
Supngase que la duracin de los instrumentos electrnicos D

yD

tienen

distribuciones Exponenciales asi : D


D
Cual se debe preferir para usarlo durante un periodo de 45 horas?
Debera preferirse aquel instrumento que de mayor garanta de duracin
para un mnimo de tiempo como el requerido, es decir, debe calcularse la
probabilidad de que el instrumento dure por lo menos 45 horas, en cada
caso.

El instrumento dos tiene mayor probabilidad de tener duracin de 45 o ms


horas.
Comprueba los anteriores resultados utilizando la funcin de distribucin.
10.1 EJERCICIOS DE APLICACIN
1.- El tiempo durante el cual cierta marca de batera trabaja en forma
efectiva hasta que falle (tiempo de falla) se distribuye segn el modelo
exponencial con un tiempo promedio de fallas igual a 360 das.
a) qu probabilidad hay que el tiempo de falla sea mayor que 400
das?.
b) Si una de estas bateras ha trabajado ya 400 das, qu
probabilidad hay que trabaja ms de 200 das ms?
c) Si se estn usando 5 de tales bateras calcular la probabilidad de
que ms de dos de ellas continen trabajando despus de 360 das.
SOL:
Sea X=el tiempo que trabaja la batera hasta que falle. El tiempo
promedio de falla es de 360 das. Entonces, X ~Exp (=1/360) y su
funcin de densidad es:

2.- Suponga que la vida de cierto tipo de tubos electrnicos tiene una
distribucin exponencial con vida media de 500 horas. Si X representa la
vida del tubo (tiempo q dura el tubo).
a) Hallar la probabilidad que se queme antes de las 300 horas.
b) Cul es la probabilidad que dure por lo menos 300 horas?
c) Si un tubo particular ha durado 300 horas. cal es la probabilidad
de que dure otras 400 horas?
SOL:

3.- Suponga que el tiempo que necesita un cajero de un banco para atender
a un cliente tiene un distribucin exponencial con una media de 40
segundos.
a) Hallar la probabilidad que el tiempo necesario para atender un
cliente dado sea mayor que 20 minutos?
b) Cul es la probabilidad que el tiempo necesario para atender a un
cliente est comprendido entre 1 y 2 minutos.
SOL:

4.-Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos


sigue una distribucin exponencial con media de 16 aos. Cul es la
probabilidad de que a una persona a la que se le ha implantado este
marcapasos se le deba reimplantar otro antes de 20 aos? Si el marcapasos
lleva funcionando correctamente 5 aos en un paciente, cul es la
probabilidad de que haya que cambiarlo antes de
aos?
SOL:
Sea T la variable aleatoria que mide la duracin de un marcapasos en una
persona. Tenemos que

Entonces

11.

DISTRIBUCIN CHI- CUADRADO

La denominada Distribucin Chi Cuadrado (que usualmente se escribe y


se lee como: Ji Cuadrado), es una distribucin cuadrtica de la probabilidad
que utiliza bsicamente variables aleatorias continuas. La Distribucin Chi

Cuadrado de la probabilidad se denota mediante la letra griega minscula ji


elevada al cuadrado (2), y consiste en establecer un espacio continuo
delimitado por la suma de los cuadrados de n variables aleatorias que son
independientes entre s, espacio dentro del cual la variable X puede asumir
cualquiera de los infinitos valores que lo conforman, y por tanto para
establecer el valor aproximado de una variable X dentro de ese espacio se
procede a incluir una estimacin de sus posibles lmites que estn dados por
los distintos Grados de Libertad que pueden existir entre las variables
aleatorias analizadas que dan origen al referido espacio. En otras palabras,
la Distribucin Chi Cuadrado en un delimitado espacio conjuga un
determinado nmero de variables aleatorias independientes entre s, con
unos valores de probabilidad ubicados entre 1 y 0 que son atribuibles a esas
variables, y con unos lmites de la probabilidad para el verdadero valor de X
delimitados por los Grados de Libertad atribuibles a las variables aleatorias
analizadas.
La Distribucin Chi Cuadrado permite calcular la probabilidad existente para
que una variable X, que tiene un determinado Grado de Libertad frente a
otras variables del mismo conjunto, permanezca dentro de unos lmites
ideales previstos para X cuando tiene ese especfico Grado de Libertad o
independencia. En otras palabras, la Distribucin Chi Cuadrado suministra
un modelo ideal sobre los lmites probables que deberan regir las
fluctuaciones en la aparicin de un determinado valor aleatorio X
dependiendo del Grado de Libertad que tiene ese valor frente a otras
variables similares dentro de un conjunto de datos analizados. La frmula
matemtica para calcular la probabilidad de que una variable X permanezca
dentro del lmite ideal correspondiente al respectivo Grado de Libertad es la
siguiente:

En esta ecuacin la letra k que aparece como un subndice de la expresin


2 indica el Grado de Libertad que se toma como lmite para calcular la
probabilidad de la variable aleatoria X. Esta ecuacin para ser despejada
requiere el uso de la compleja Funcin Gamma (representada por la letra
griega mayscula gamma: ), y por tanto generalmente para solucionar
esta ecuacin se emplean mtodos basados en la consulta de tablas o en el
uso de algoritmos para ordenador que permiten obtener los valores de
probabilidad respectivos.
Representacin Grfica del Modelo Ideal de la Distribucin Chi Cuadrado:
Un concepto matemtico es mucho ms fcil de comprender si se puede
visualizar la forma que generalmente asume en el abstracto mundo de los
nmeros.

La anterior grfica muestra los valores de la probabilidad de ocurrencia de


X dentro de una Distribucin Chi Cuadrado. En el eje horizontal de las
coordenadas se observa que de derecha a izquierda se incluyen todos los
valores posibles que puede asumir la variable aleatoria X. Estos valores
siempre corresponden a nmeros positivos (no admite nmeros negativos o
menores a cero), y tales valores pueden ir desde cero (0) hasta el infinito
(), aunque en esta grfica para efectos ilustrativos slo se han incluido
algunos valores relevantes ubicados entre 0 y 50. En el eje vertical se han
incluido algunos valores representativos de la probabilidad, y por eso ese
eje slo admite valores ubicados entre cero (que equivale a Muy
Improbable) y 1 (que equivale a Muy Probable). Las lneas curvas
numeradas de color verde, que desde la parte superior derecha hasta la
parte inferior izquierda surcan toda la grfica, representan algunos Grados
de Libertad aplicables a todos los valores que puede asumir X dentro de
este espacio perfectamente delimitado.

Para calcular la probabilidad que tiene la variable X de aparecer dentro de


un determinado intervalo delimitado por cierto Grado de Libertad, es
necesario obtener el punto de la respectiva lnea roja (Grado de Libertad) en
que se produce la interseccin con la lnea recta prolongada desde el valor X
ubicado en el eje horizontal, y a continuacin desde ese punto de
interseccin es necesario prolongar una lnea recta hasta el eje vertical que
nos da el valor de la respectiva probabilidad de ocurrencia para la variable
X.
Recordemos que si la variable aleatoria contina X tiene una distribucin
Gamma, entonces su funcin de densidad de probabilidad es

Con parmetros > 0 y r > 0.


Donde E(X) = r/ y V(X) = r/
Sea X una variable aleatoria continua. Diremos que X tiene una distribucin
Chi cuadrado con m grados de libertad si su funcin de densidad de
probabilidad est dada por

Esta funcin es un caso especial de la funcin de distribucin Gamma en el


cual hacemos = 1/2 y r = v/2.
Observaciones.
1.

es la notacin que emplearemos para afirmar que X tiene


una distribucin Chi-cuadrado
2. v representa el nmero de grados de libertad con el cual se evala
los valores de esta distribucin.
3. El valor esperado de X es E(X) = v. Su varianza es V(X) = 2v
4.La mayora de libros presentan una tabla de la Distribucin
usando el complemento de la distribucin acumulada; es decir,
.
En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2. O
sea que si se extraen todas las muestras posibles de una poblacin normal y
a cada muestra se le calcula su varianza, se obtendr la distribucin
muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita
conocer el estadstico X2. Si se elige una muestra de tamao n de una
poblacin normal con varianza

, el estadstico:

Tiene una distribucin muestral que es una distribucin ji-cuadrada con


gl=n-1 grados de libertad y se denota X2 (X es la minscula de la letra
griega ji). El estadstico ji-cuadrada esta dado por:

Donde n es el tamao de la muestra, s 2 la varianza muestral y


la
varianza de la poblacin de donde se extrajo la muestra. El estadstico jicuadrada tambin se puede dar con la siguiente expresin:

Propiedades de las distribuciones chi-cuadrada


1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribucin X 2 depende del gl=n-1. En consecuencia,
hay un nmero infinito de distribuciones X2.
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se
extienden a la derecha; esto es, estn sesgadas a la derecha.
5. Cuando n>2, la media de una distribucin X 2 es n-1 y la varianza es
2(n-1).

6. El valor modal de una distribucin X2 se da en el valor (n-3).


La siguiente figura ilustra tres distribuciones X 2. Note que el valor modal
aparece en el valor
(n-3) = (gl-2).

La funcin de densidad de la distribucin X2 esta dada por:

Para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y
estadstica de Walpole, la cual da valores crticos
(gl) para veinte
valores especiales de
. Para denotar el valor crtico de una distribucin X 2
con gl grados de libertad se usa el smbolo
(gl); este valor crtico
determina a su derecha un rea de
bajo la curva X2 y sobre el eje
horizontal. Por ejemplo para encontrar X 20.05(6) en la tabla se localiza 6 gl en
el lado izquierdo y
tabla.

10.1 EJERCICIOS DE APLICACIN


1.-

a lo largo del lado superior de la misma

SOL:

2.- Suponga que los tiempos requeridos por un cierto autobs para alcanzar
un de sus destinos en una ciudad grande forman una distribucin normal
con una desviacin estndar
=1 minuto. Si se elige al azar una muestra
de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea
mayor que 2.
SOL:
Primero se encontrar el valor de ji-cuadrada correspondiente a s 2=2 como
sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de


libertad y se encuentra que a este valor le corresponde un rea a la derecha
de 0.01. En consecuencia, el valor de la probabilidad es P(s 2>2)

3.- Encuentre la probabilidad de que una muestra aleatoria de 25


observaciones, de una poblacin normal con varianza
varianza muestral:
Mayor que 9.1
Entre 3.462 y 10.745
SOL:

, tenga una

Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea


a la derecha de 0.05. Por lo que la P(s2 >9.1) = 0.05
1. Se calcularn dos valores de ji-cuadrada:
y
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de
libertad. Al buscar el valor de 13.846 se encuentra un rea a la derecha de
0.95. El valor de 42.98 da un rea a la derecha de 0.01. Como se est
pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos
0.01 quedando 0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94

3.- Indique cuales son las frmulas para varianza en chi cuadrada y el valor
de que depende Para poder estimar la varianza de una poblacin normal se
utilizar la distribucin ji-cuadrada.

Al despejar esta frmula la varianza poblacional nos queda:

Los valores de X2 dependern de nivel de confianza que se quiera al cual le


llamamos

. Si nos ubicamos en la grfica se tiene:

4.-Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas


de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9,
45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la
varianza de todos los paquetes de semillas de pasto que distribuye esta
compaa, suponga una poblacin normal.
SOL :
Primero se calcula la desviacin estndar de la muestra:

Al elevar este resultado al cuadrado se obtiene la varianza de la muestra


s2= 0.286. Para obtener un intervalo de confianza de 95% se elige un
=
0.05. Despus con el uso de la tabla con 9 grados de libertad se obtienen
los valores de X2.

Se puede observar en la grfica anterior que el valor de X 2 corre en forma


normal, esto es de izquierda a derecha. Por lo tanto, el intervalo de
confianza de 95% para la varianza es:

Grficamente:

Se observa que la varianza corre en sentido contrario, pero esto es slo en


la grfica. La interpretacin quedara similar a nuestros temas anteriores
referentes a estimacin. Con un nivel de confianza del 95% se sabe que la
varianza de la poblacin de los pesos de los paquetes de semillas de pasto
esta entre 0.135 y 0.935 decagramos al cuadrado.
5.- En trabajo de laboratorio se desea llevar a cabo comprobaciones
cuidadosas de la variabilidad de los resultados que producen muestras
estndar. En un estudio de la cantidad de calcio en el agua potable, el cual
se efecta como parte del control de calidad, se analiz seis veces la misma
muestra en el laboratorio en intervalos aleatorios. Los seis resultados en
partes por milln fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la
varianza de los resultados de la poblacin para este estndar, usando un
nivel de confianza del 90%.
SOL:
Al calcular la varianza de la muestra se obtiene un valor de s 2= 0.0285. Se
busca en la tabla los valores correspondientes con 5 grados de libertad,
obtenindose dos resultados. Para X 2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza esta dado por:
y

12.

DISTRIBUCION T DE STUDENT

La distribucin t de Student se construye como un cociente entre una


normal y la raz de una

Ji-cuadrado independientes. Esta distribucin desempea un papel


importante en la inferencia estadstica asociada a la teora de muestras
pequeas. Se usa habitualmente en el contraste de hiptesis para la media
de una poblacin, o para comparar las medias de dos poblaciones, y viene
definida por sus grados de libertad n. A medida que aumentan los grados de
libertad, la distribucin t de Student se aproxima a una normal de media 0 y
varianza 1 (normal estndar).
La distribucin t de student (desarrollada por Gosset ) es , con la chi2 , la F
de Snedecor, y , por supuesto, la normal , transcendental para aplicaciones
inferenciales , en especial para aquellas en las que se desconoce la varianza
; dado que no depende de las varianzas de las variables que la integran. Su
expresin formal parte de dos variables X e Y tales que:
e
De manera que

Siendo t una nueva distribucin conocida como t de student con n


grados de libertad.
La distribucin t de student. Admite, tambin, una definicin alternativa,
tomada como la distribucin marginal de la primera variable de una
distribucin "normal-gamma; en este sentido la expresin de su funcin de
densidad vendra dada por:

Siendo n los grados de libertad que actan de parmetro


gamma de Euler

la funcin

La distribucin t de student con n grados de libertad tiene siempre como


media el valor "0" , sea cuales fueren los grados de libertad ; es simtrica
,asintticamente tiende a
,de forma campaniforme , al igual que la
distribucin normal, teniendo como varianza el valor
Los valores de la funcin de probabilidad para los diversos
estn
tabulados atendiendo al nico parmetro de la distribucin, es decir, el
nmero de grados de libertad ; evidentemente , es ms recomendable para
su clculo la utilizacin del programa que presentamos.
En otro orden de cosas la distribucin t de student con n grados de libertad
converge en ley a una normal tipificada (estandarizada) cuando el nmero
de grados de libertad tiende a infinito

11.1 EJERCICIOS
APLICACIN

DE

Es importante resaltar que al ser una distribucin simtrica al tener


informacin sobre un valor positivo, se obtiene el dato para el mismo valor
con signo negativo.
Un hecho de relevancia significativa, es que se utiliza para calcular
probabilidades con respecto al promedio, en estos casos, el divisor al
estandarizar los valores se divide sobre S/ n, trmino que se conoce como
el error estndar de la media y mide la variabilidad de la media entre
muestra y muestra. A mayor tamao de muestra, menor es el error estndar
de la media.
Por ltimo, se puede afirmar, la distribucin t es til para realizar inferencias
acerca de la media poblacional cuando no se conoce s y la poblacin es
normal, independiente del n, no obstante, an cuando la distribucin sea un
tanto sesgada, la t sigue siendo apropiada, esto se conoce como una
distribucin robusta, es decir, a cambios moderados de los supuestos, el
modelo sigue siendo valido. Como en el caso de la distribucin normal, sta
distribucin tambin usa valores tabulados, tal como se aprecian en la tabla
precedente, teniendo en cuenta, que a medida que los g.l aumenten los
valores tienden a ser igual a los encontrados en la tabla Z.
1.- Los valores de las matriculas de estudiantes en una universidad privada
tienen un comportamiento aproximadamente normal, donde el promedio es
de 2.100.000. Se seleccionan 8 liquidaciones, siendo los valores los
siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000, 2.250.000,
1.950.000, 2.050.000, 2.350.000. Determine la probabilidad de que:
El promedio sea menor de 2.000.000.
El promedio se encuentre entre 2.000.000 y 2.200.000
El promedio sea mayor o igual a 2.500.000
SOL:
Sea X = Liquidacin matriculas. m = 2.100.000; s =? ,=2.098.750
s=168.644.8085 n=8
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
La probabilidad se encuentra entre 0.9 y 0.95, segn la tabla T que se
encuentra ms adelante, no obstante, al t ser negativo, la probabilidad est
entre 0.1 y 0.05, es decir, los valores complementarios. Para buscar en la
tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se
encuentra entre los valores mencionados. De ah que sea importante utilizar
el Excel, que nos permite calcular la probabilidad exacta.

b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( 2.000.000).


Luego de tipificar, se tiene:
P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92
Existe una alta probabilidad de que el promedio de las matriculas se
encuentre entre 2.000.000 y 2.200.000.
c) P( >2.500.000)= P(t> 6.70) = 1- P(t< 6.70)= 1-1=0
Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de
3.49 y corresponde a 0.995, es claro, entonces, que para valores mayores
de 3.49, la probabilidad ser de 1.
Por lo tanto, la probabilidad de que el promedio de matricula sea superiora a
2.500.000 es cero.
2.-Los puntajes de un grupo de estudiantes se comportan normal, con
promedio de 50, sin embargo, no se conoce la desviacin. Se tom una m.a
de 9 estudiantes encontrando una varianza de 36 y un promedio de 52. Cul
es la probabilidad de que el promedio:
Sea mayor de 54?
Sea menor que 54?

SOL:
Sea X = Puntaje estudiantes.
m = 50 puntos ; s = ?
=52 s2=36 s=6 n=9
a) P( >54)=1- P(t<(54-50)/(6/3)) = 1- P(t<2) = 1- 0.9625 = 0.0375
1-a
n
0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1
1.000 1.376 1.963 3.078 6.314 12.70 31.82 63.65
6
1
7
8
0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
Como se observa en la tabla, el 2.0 se encuentra entre 1.86 y 2.306, valores
que corresponden a las reas de 0.95 y 0.975. Realizando una estimacin
burda, se promedian los dos valores correspondientes a las reas.
Encontrando que la probabilidad de que el promedio del puntaje de los
estudiantes sea mayor de 54 es muy baja, 0.0375.
c) P( <54)= P(t<(54-50)/(6/3)) = P(t<2) = 0.9625. Por el contrario de lo
anterior, es muy probable que el promedio del puntaje de los estudiantes
sea menor de 54, dicha probabilidad equivale al 0.9625.

3.- El valor t con


= 14 grados de libertad que deja un rea de 0.025 a la
izquierda, y por tanto un rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145
SOL:

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha,


es por esto que se tiene que hacer la resta de
. La manera de
encontrar el valor de t es buscar el valor de
en el primer rengln de la
tabla y luego buscar los grados de libertad en la primer columna y donde se
intercepten

se obtendr el valor de t.

4.- Encuentre la probabilidad de t 0.025 < t < t0.05.


SOL:

Como t0.05 deja un rea de 0.05 a la derecha, y t 0.025 deja un rea de 0.025 a
la izquierda, encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
5.-Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria
de tamao 15 que se selecciona de una distribucin normal.
Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos


damos cuenta que a este valor le corresponde un rea de 0.05 a la
izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se
tiene un valor de 0.005, que equivale a
. Luego se busca el valor de
0.005 en el primer rengln con 14 grados de libertad y se obtiene un valor
de t = 2.977, pero como el valor de
est en el extremo izquierdo de la
curva entonces la respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045
INTERVALO DE CONFIANZA PARA

; CON

DESCONOCIDA

Si

y s son la media y la desviacin estndar de una muestra aleatoria de

una poblacin normal con varianza


confianza de (

Donde
de

/2

)100% para

es el valor t con

, desconocida, un intervalo de
es:

= n-1 grados de libertad, que deja un rea

/2 a la derecha. Se hace una distincin entre los casos de

conocida y
desconocida al calcular las estimaciones del intervalo de
confianza. Se debe enfatizar que para el primer caso se utiliza el teorema
del lmite central, mientras que para
desconocida se hace uso de la
distribucin muestral de la variable aleatoria t. Sin embargo, el uso de la
distribucin t se basa en la premisa de que el muestreo se realiza de una
distribucin normal. En tanto que la distribucin tenga forma aproximada de
campana, los intervalos de confianza se pueden calcular cuando la varianza
se desconoce mediante el uso de la distribucin t y se puede esperar
buenos resultados.
Con mucha frecuencia los estadsticos recomiendan que aun cuando la
normalidad no se pueda suponer, con
reemplazar a

desconocida y n 30, s puede

y se puede utilizar el intervalo de confianza:

Por lo general ste se denomina como un intervalo de confianza de muestra


grande. La justificacin yace slo en la presuncin de que con una muestra
grande como 30, s estar muy cerca de la
real y de esta manera el
teorema del lmite central sigue valiendo. Se debe hacer nfasis en que esto
es solo una aproximacin y que la calidad de este enfoque mejora a medida
que el tamao de la muestra crece ms.
EJEMPLOS DE APLICACION
6.- El contenido de siete contenedores similares de cido sulfrico son 9.8,
10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza
del 95% para la media de todos los contenedores si se supone una
distribucin aproximadamente normal.
SOL:
La media muestral y la desviacin estndar para los datos dados son:
10 y s= 0.283
En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aqu,
el intervalo de confianza de 95% para es:

Con un nivel de confianza del 95% se sabe que el promedio del contenido
de los contenedores est entre 9.47 y 10.26 litros.
7.- Un artculo publicado en el Journal of Testing and Evaluation presenta las
siguientes 20 mediciones del tiempo de combustin residual en segundos
de especmenes tratados de ropa de dormir para nios:
9.85 9.93 9.75 9.77 9.67
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
SOL:
Se desea encontrar un nivel de confianza del 95% para el tiempo de
combustin residual promedio. Supngase que el tiempo de combustin
residual sigue una distribucin normal.
Solucin:
La media muestral y la desviacin estndar para los datos dados son:
9.8525 y s= 0.0965
En la tabla se encuentra que t 0.025=2.093 con 19 grados de libertad, de aqu,
el intervalo de confianza de 95% para es:

Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustin
residual promedio se encuentra entre 9.8073 y 9.8977 segundos.

13.

DISTRIBUCION DE FISHER

Otra de las distribuciones importantes asociadas a la normal es la que se


define como el cociente de dos variables con distribucin Ji-cuadrado
divididas por sus respectivos grados de libertad, n y m. En este caso la
variable aleatoria sigue una distribucin F de Snedecor de parmetros n y
m. Hay muchas aplicaciones de la F en estadstica y, en particular, tiene un
papel importante en las tcnicas del anlisis de la varianza y del diseo de
experimentos. Campo de variacin:
0x<
Parmetros:
n: grados de libertad del numerador, n>0
m: grados de libertad del denominador, m>0
A diferencia de otras pruebas de medias que se basan en la diferencia
existente entre dos valores, el anlisis de varianza emplea la razn de las
estimaciones, dividiendo la estimacin intermediante entre la estimacin
interna

Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico


britnico, cuyas teoras estadsticas hicieron mucho ms precisos los
experimentos cientficos. Sus proyectos estadsticos, primero utilizados en
biologa, rpidamente cobraron importancia y fueron aplicados a la
experimentacin agrcola, mdica e industrial. Fisher tambin contribuy a
clarificar las funciones que desempean la mutacin y la seleccin natural
en la gentica, particularmente en la poblacin humana.
El valor estadstico de prueba resultante se debe comparar con un valor
tabular de F, que indicar el valor mximo del valor estadstico de prueba
que ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado.
Antes de proceder a efectuar este clculo, se debe considerar las
caractersticas de la distribucin F
Caractersticas de la distribucin F
- Existe una distribucin F diferente para cada combinacin de tamao de
muestra y nmero de muestras. Por tanto, existe una distribucin F que se
aplica cuando se toman cinco muestras de seis observaciones cada una, al
igual que una distribucin F diferente para cinco muestras de siete
observaciones cada una. A propsito de esto, el nmero distribuciones de
muestreo diferentes es tan grande que sera poco prctico hacer una
extensa tabulacin de distribuciones. Por tanto, como se hizo en el caso de
la distribucin t, solamente se tabulan los valores que ms comnmente se
utilizan. En el caso de la distribucin F, los valores crticos para los niveles
0,05 y 0,01 generalmente se proporcionan para determinadas
combinaciones de tamaos de muestra y nmero de muestras.
La razn ms pequea es 0. La razn no puede ser negativa, ya que ambos
trminos de la razn F estn elevados al cuadrado.
Por otra parte, grandes diferencias entre los valores medios de la muestra,
acompaadas de pequeas variancias muestrales pueden dar como
resultado valores extremadamente grandes de la razn F.

- La forma de cada distribucin de muestreo terico F depende del nmero


de grados de libertad que estn asociados a ella. Tanto el numerador como
el denominador tienen grados de libertad relacionados.
Determinacin de los grados de libertad
Los grados de libertad para el numerador y el denominador de la razn F se
basan en los clculos necesarios para derivar cada estimacin de la
variancia de la poblacin. La estimacin intermediante de variancia
(numerador) comprende la divisin de la suma de las diferencias elevadas al
cuadrado entre el nmero de medias (muestras) menos uno, o bien, k - 1.
As, k - 1 es el nmero de grados de libertad para el numerador. En forma
semejante, el calcular cada variancia muestral, la suma de las diferencias
elevadas al cuadrado entre el valor medio de la muestra y cada valor de la
misma se divide entre el nmero de observaciones de la muestra menos
uno, o bien, n - 1. Por tanto, el promedio de las variancias muestrales se
determina dividiendo la suma de las variancias de la muestra entre el
nmero de muestras, o k. Los grados de libertad para el denominador son
entonces, k(n -l). Uso de la tabla de F del anlisis de variancia (ANOVA)
En la tabla 5 se ilustra la estructura de una tabla de F para un nivel de
significacin de 0,01 o 1% y 0,05 o 5%.

Clculo de la razn F a partir de datos muestrales

Para calcular F se debe seguir el siguiente procedimiento


1) Calcular la estimacin interna (Denominador)

2) Calcular la estimacin intermediante (Numerador)

Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia


Estadstica del autor Genther, se tendr que buscar primero los grados de
libertad dos para luego localizar el rea correspondiente, relacionndola con
los grados de libertad uno, para calcular el valor de F. El valor de 30.4 es el
correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados
de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos
grficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su
forma depende de dos variables que son los grados de libertad.

EJEMPLOS DE APLICACIN
1.-Los pesos en kg por 1,7 m de estatura se ilustran en la siguiente tabla. La
finalidad es determinar si existen diferencias reales entre las cuatro
muestras. Emplear un nivel de significacin de 0,05

SOL:
Las hiptesis Nula y Alternativa son:

Calculando las medias aritmticas se obtiene:

Se llena la siguiente tabla para calcular las varianzas muestrales:

Remplazando los datos en la frmula de la varianza se obtienen las


varianzas de las 4 muestras.

Calculando la estimacin interna de varianza se obtiene:

Para calcular la estimacin intermediante de varianza primero se calcular la


varianza de las medias aritmticas

Se llena la siguiente tabla:

Se remplaza los datos de la tabla para calcular varianza de las medias


aritmticas

Calculando la estimacin intermediante de varianza se obtiene:


:

Encontrar el valor de F, en cada uno de los siguientes casos:


a. El rea a la derecha de F, es de 0.25 con
b. El rea a la izquierda de F, es de 0.95 con
c. El rea a la derecha de F es de 0.95 con
d. El rea a la izquierda de F, es de 0.10 con
SOL:

=4 y
=15 y
=6 y
=24 y

=9.
=10.
=8.
=24

2. Como el rea que da la tabla es de cero a Fisher, se tiene que


localizar primero los grados de libertad dos que son 9, luego un rea
de 0.75 con 4 grados de libertad uno.

3.

En este caso se puede buscar el rea de 0.95 directamente en la


tabla con sus respectivos grados de libertad.

4.- Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden
un rea a la derecha de F de 0.95.

5.- Se busca directamente el rea de 0.10, con sus respectivos grados de


libertad.

6.- Si s12 y s22 son las varianzas mustrales de muestras aleatorias


independientes de tamaos n1=10 y n2 =20, tomadas de poblaciones
normales que tienen las mismas varianzas, encuentre P (s 12/s22 2.42).
SOL:
Primero se establecen los grados de libertad. Como en el numerador est la
poblacin uno y en el denominador la poblacin dos, entonces los grados de
libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19.

Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y


se observa que no estn, por lo tanto se tiene que interpolar entre 15 y 20
grados de libertad, buscando el valor de fisher que quedara:

Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con


15 grados de libertad dos, y se encuentra los siguiente:
Area
0.90
2.09
0.95
2.59
Al interpolar entre estos dos valores nos queda un rea de 0.933. Se
procede a hacer lo mismo pero con 20 grados de libertad dos:
Area
0.95
2.39
0.975 2.84
Al interpolar entre estos dos valores nos queda un rea de 0.9516. Ahora ya
se tienen las dos reas referentes a los grados de libertad dos, por lo que se
interpolar para ver cunto le corresponde a los grados libertad dos con un
valor de 19.
Area
15 0.933
20 0.9516
Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de
libertad dos con un valor de Fisher de 2.42 el rea a la izquierda es de
0.9478.

7.- Si s12 y s22 representan las varianzas de las muestras aleatorias


independientes de tamao n1= 25 y n2 = 31, tomadas de poblaciones
2
normales con varianzas
1 =10 y
2
2
2
2 = 15, respectivamente, encuentre P(s 1 /s2 > 1.26).

SOL:
Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24


grados de libertad uno. Cuando se este en esta posicin se busca adentro
de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de
este valor se obtiene un rea de 0.95, pero esta rea correspondera a la
probabilidad de que las relaciones de varianzas muestrales fueran menor a

1.26, por lo que se calcula su complemento que sera 0.05, siendo esta la
probabilidad de que s12/s22 > 1.26.

CONCLUSIONES
-

El clculo de probabilidad en una distribucin muestral de varianzas


nos sirve para saber cmo se va a comportar la varianza o desviacin
estndar en una muestra que proviene de una distribucin normal.

El empleo de la simulacin para verificar un resultado terico es, hoy


en da, una prctica regular Y necesaria, gracias al desarrollo de los
ordenadores que permiten obtener, rpida y fcilmente, nmeros
aleatorios de cualquier distribucin. Esto ha supuesto una autntica
revolucin en el campo de la estadstica.

Para la toma de decisiones y proyectos inferenciales las ms


importantes son la distribucin chi-cuadrado , t student y la de Fisher

En la mayora de trabajos de investigacin, se plantea hiptesis, para


lo cual se debe tener mayor nfasis en la prueba de hiptesis afn de
generar conclusiones precisas.

El resultado para la media y la varianza de Z puede obtenerse de


manera directa a partir de las definiciones. La creacin de una nueva
variable

aleatoria

con

esta

transformacin

se

conoce

como

estandarizacin. La variable aleatoria Z representa la distancia de x a


partir de su medida en trminos de desviacin estndar

RECOMENDACIONES
-

Es necesario el uso de software por parte de los estudiantes, como


anova, stastics, minitab, etc para el dominio del curso y su mayor

facilidad de manejo.
Los conocimientos aprendidos en el presente se puede aplicar en
o Control Estadstico de la Calidad
o - Simulacin de sistemas (simular situaciones, ej. financieras,
para ver si vale la pena hacer una inversin, vender o comprar)
o - Muestreo
o - Estudio de mercados.
la informacin numrica est en todas partes. Por ejemplo en los
peridicos, revistas de noticias, revistas de negocios, revistas de
inters general, revistas del hogar, revistas deportivas, revistas de
coches,

noticias

de

televisin,

radio,etc.,se

encuentra

gran

informacin numrica que tiene que ser interpretada de manera


correcta
-

La distribucin de probabilidades nos va ayudar a seleccionar las


conclusiones generales ms adecuadas a partir de datos parciales y
representativos. Distinguiremos los tres campos bsicos de la
Estadstica: la estadstica descriptiva, el clculo de probabilidades y la
estadstica inferencial.

lo imprtate en el desarrollo de distribuciones se debe tener en


cuenta el redondeo de nmero es importante saber trabajar con ms
de 4 nmeros decimales.

BIBLIOGRAFIA

Leer ms: http://www.monografias.com/trabajos57/distribucionesprobabilidad/distribuciones-probabilidad2.shtml#ixzz33ZMTc5Ay


http://www.uv.es/ceaces/base/modelos%20de
%20probabilidad/modelos3.htm
Estadstica 10 edicin. Mario Triola
http://www.bioestadistica.uma.es/libro/node68.htm
Kolmogorov AN. Grundbegriffe der Wahrscheinlichtkeitsrechnung.
Berlin: Springer-Verlag;
1933. (Traducido al ingls: Morrison N. Foundations of the Theory of
Probability. New York:
Chelsea; 1956).
- Martn Pliego FJ, Ruiz-Maya L. Estadstica I: Probabilidad. Madrid:
Editorial AC; 1997.
- Meyer PL. Probabilidad y Aplicaciones Estadsticas. Mxico: AddisonWesley
Iberoamericana; 1986.
Pea D. Modelos y mtodos. 1. Fundamentos. Madrid: Alianza
Universidad Textos; 1993.
Katz DL. Epidemiology, Biostatistics and Preventive Medicine Review.
USA: W.B. Saunders Company; 1997.
Domnech JM. Mtodos Estadsticos en Ciencias de la Salud.
Barcelona: Signo; 1997.

Potrebbero piacerti anche