Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TEMA
6.1. INTRODUCCIN
A la Estadstica no le interesan los resultados individuales, su objetivo es el comportamiento en
masa o de las poblaciones. Esto significa que hay que visualizar la realizacin de un nmero muy
grande de experimentos aleatorios (o de muestras aleatorias) y sus posibles resultados asociados, para
informarse acerca de los parmetros o las explicaciones referidas a la poblacin de inters. En esta
seccin seguiremos avanzando para sentar las bases de la modelizacin de resultados sujetos al azar
que permitirn, a travs de la inferencia estadstica, enunciar ideas generales acerca de las poblaciones.
El concepto de experimento aleatorio, se utiliza para describir cualquier proceso mediante el cual
se generan observaciones cuyos resultados no se pueden predecir. La accin imaginaria de arrojar dos
monedas y observar el resultado ( 1 ) , as como la de sembrar tres semillas en una maceta y observar
lo que sucede con la su germinacin
un alumno
( 3 )
( 2)
( 4 ) , constituyen ejemplos de un experimento aleatorio. En los dos primeros casos, los espacios
muestrales asociados estarn conformados por resultados cualitativos
1 S1 ={ ( S , S ) ; ( C , S ) ; ( S ,C ) ; (C ,C ) }
2 S2 ={ ( N , N , N ) ; ( G, N , N ) ; ( N , G , N ) ; ( N , N , G ) ; ( G, G , N ) ; ( G , N ,G ) ; ( N ,G , G ) ; ( G , G ,G ) }
Por tanto, estos espacios muestrales son de naturaleza cualitativa, en ellos para el primer caso S denota
sello y C denota cara, y para el segundo G denota germinada y N denota no germinada. En los
otros dos experimentos el espacio muestral asociado es de naturaleza numrica, por ejemplo se puede
indicar lo siguiente
{ xx N 6 x 10}
x
S ={ R x 0 }
x
3 S 3=
4
Sin embargo, habra que notar que en los experimentos vinculados a espacios de naturaleza cualitativa,
estamos interesados ms bien en el nmero de veces que se presenta cierto resultado de inters esto
es, por ejemplo 0,1 2 caras o bien 0, 1, 2 3 semillas germinadas, es decir que interesan resultados
numricos.
S 1= {0,1,2 } S 2= {0,1,2,3 }
Una primera interpretacin que se le puede dar al concepto de variable aleatoria es la siguiente:
es una variable que toma valores numricos de acuerdo con los resultados de un experimento, y ms
formalmente se dice que
Una variable aleatoria es una funcin que a cada elemento del espacio muestral le hace
corresponder un nmero real.
1
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
X (s)
Primera tirada
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
(1,6)
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
(2,6)
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
(3,6)
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
(4,6)
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
(5,6)
(6,1)
(6,2)
(6,3)
(6,4)
(6,5)
(6,6)
Podramos interesarnos en la ocurrencia de un evento A definido como "la suma de los puntos es
igual a 9". En el espacio muestral del experimento (Tabla 6.1 y Grfico 6.1) puede verse que hay cuatro
puntos muestrales que cumplen con esa condicin: s63, s54, s45 y s36, referidos respectivamente a los
pares ordenados (6,3), (5,4), (4,5) y (3,6). Significa que el evento A, es un evento compuesto formado
por cuatro eventos simples. Si ahora consideramos el espacio de valores de la variable aleatoria
X:puntaje total obtenido (Grfico 6.2) vemos que el evento la variable aleatoria toma el valor nueve
(X=xi, xi =9) est formado por la coleccin de cuatro valores 9 asociados con los anteriores puntos
muestrales. Es por tal razn que se suele utilizar la notacin conjuntista {x=9}, a los efectos de denotar
que se tiene una coleccin de eventos simples y a cada uno de ellos les corresponde el valor de variable
aleatoria 9.
2
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
10
Grfico 6.3. Valor (7) que toma la variable aleatoria asociado a los eventos simples del espacio muestral S.
X:S
S X(s)
Al espacio constituido por el conjunto de todos los posibles valores de la variable aleatoria X, se
lo suele llamar recorrido de la VA y se lo simboliza como RX. En cierto sentido podemos considerar a
este recorrido como otro espacio muestral, como ya se haba visto esquemticamente. Insistimos:
mientras los puntos muestrales del espacio S son los resultados experimentales que pueden ser
observables o eventos simples si (de naturaleza numrica o no), el nuevo espacio muestral (creado
artificialmente) est asociado con los valores de la variable aleatoria X que siempre son numricos.
3
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
s2
s1
s3
s4
|
-2
-1
|
0
|
1
Rx
Una vez definida una variable aleatoria X y su recorrido RX, se pueden inducir probabilidades sobre
eventos asociados con RX, a partir de las que estn especificadas para los eventos equivalentes del
espacio muestral S.
S 1={ A 1 , A 2 , A 3 , A 4 }= { ( S , S ) ; ( C , S ) ; ( S , C ) ; ( C ,C ) }
La variable aleatoria X dada slo toma tres posibles valores, digamos x 1, x2 y x3 donde x1 =0,
x2=1 y x3=2, es decir:
4
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
RX
X(C,C)A4 = {C,C}
(C,C)
2
(C,S)
X(C,S)
(S,C)
X(S,C)A4 = {C,C}
(S,S)
X(S,S)
Para este ejemplo, si las monedas son equilibradas, se tendr que P(C,S)=P(S,C)=P(CS)= P(SC)=
.=1/4. Por lo tanto, el evento compuesto aparece slo una cara tiene una probabilidad de ,
obtenida segn :
P(una cara) = P{(C,S) U (S,C)}= (1/4) + (1/4) = 1/2.
Si la variable aleatoria X toma valor x=1, equivalente al evento A={(C,S) U (S,C)} , podemos calcular la
probabilidad del evento dado como:
P(X=1) = P{(C,S) U (S,C)}= .
Grficamente, esto es:
S
(C,C)
RX
1
(S,S)
X(A)
1
(S,C)
xi = 1
(C,S)
0
P (xi ) es una funcin, la funcin probabilidad: a cada valor x i de la VAD le hace corresponder un nmero
real entero entre cero y uno,
P(A1) = P(C,C) = . = = P (X = 2)
P (A2 U A 3)= P (C,S)U(S,C) = + = = P (X = 1)
P(A 4)= P (S,S) = . = = P(X = 0)
Hemos definido a una VA discreta y los resultados de la variable con sus respectivas
probabilidades. Con este soporte terico podremos calcular las probabilidades de que se produzcan
determinados valores de una variable aleatoria, mediante las denominadas funciones de probabilidad.
Grupo
Cantidad de alumnos
1
25
2
45
3
40
4
30
5
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Valor de x
Grupo 1
Grupo 2
Grupo 3
Grupo 4
0.4
p(x)
0.3
P(x)
0.2
0.1
Suma
Se observa:
x
1)
2) Slo cuatro posibles valores (x =1, 2, 3
4), por lo tanto entre ellos se distribuye la
probabilidad total unitaria (todos el resto de los valores en la recta numrica real, tienen
probabilidad igual a cero)
Cuando se tiene una distribucin de probabilidades para una variable aleatoria X, podemos
hablar del modelo de probabilidades que describe el comportamiento de esa variable en la poblacin
objetivo de estudio. Entonces, estaremos interesados en condensar esa informacin en algunas
medidas descriptivas, fundamentalmente la media de una distribucin de probabilidades y su varianza,
denominadas esperanza matemtica y varianza de una variable aleatoria, respectivamente.
Seguidamente se muestra un diagrama que resume los conceptos vertidos acerca de cmo se
llega a un modelo poblacional probabilstico.
Especificar el
Experimento
E
Reconocer
todos los
resultados
Espacio
muestra
l
S
Asignar un
nmero
Cada uno de los
resultados
Variable
aleatoria X
Determinar
la
probabilidad
p ( x i ) (xi)
p(x)
X
Distribucin de
probabilidades
Valor de la
Variable aleatoria
2
3
N de casos
favorables
1
2
Probabilidad
1/36
2/36
6
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
4
5
6
7
8
9
10
11
12
------
3
4
5
6
5
4
3
2
1
36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
1,00
Grfico 6.6. Distribucin de probabilidades para la suma de puntos al lanzar un par de dados
0.2
0.16
0.12
p(x)
0.08
0.04
0
0 1 2 3 4 5 6 7 8 9 10 11 12
x
A esta altura resulta conveniente analizar comparativamente el alcance de dos conceptos:
frecuencia relativa y funcin probabilidad. Tcnicamente, la diferencia consiste en que las frecuencias
son frecuencias instantneas acotadas a los resultados de una muestra, mientras que los valores de una
funcin de probabilidad pueden interpretarse como frecuencias relativas tericas a largo plazo para
todas las repeticiones concebibles de un experimento aleatorio. De este modo, las probabilidades se
relacionan con la poblacin. En la prctica, indican el porcentaje de veces respecto a un gran nmero de
observaciones en que se espera que se presenten los diferentes valores de una variable aleatoria.
Ntese que, dada una distribucin de probabilidad, es fcilmente evidente que algunos
resultados de una variable aleatoria sean ms probables que otros. Adems, la probabilidad de un
determinado resultado, o grupo de resultados, se puede determinar sin mucho esfuerzo. En trminos
prcticos, por lo general no es necesario molestarse en calcular cada una de las probabilidades para
obtener una distribucin probabilstica. Para ello se dispone de tablas y frmulas. En consecuencia, el
problema real no es cmo se derivan los valores?, sino cmo se utilizan las distribuciones para
resolver problemas?
F(x) = P(Xx) =
p (xi)
i =1,,k
Por lo tanto, en el caso discreto, una variable aleatoria X est caracterizada por la funcin de
probabilidad puntual p(x), la cual determina la probabilidad puntual de que X = x, y por la funcin de
distribucin acumulada F(x), la que representa la suma de las probabilidades puntuales hasta el valor x
de X, inclusive. Ntese que las definiciones anteriores son consistentes con los axiomas de probabilidad,
ya que esta funcin no es negativa para cualquier valor de la variable aleatoria y la suma de las
probabilidades para todos los valores de X es igual a uno.
Ejemplo 6.1. Considrese de nuevo el lanzamiento de dos dados. Si X es la variable aleatoria que
representa la suma de las caras, la funcin de probabilidad de X es
7
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
(1)
Con (1), pueden determinarse las probabilidades para varios valores de X contenidos en la tabla
6.4 y cuya grfica se muestra en el grfico 6.7. Adems, puede evaluarse la funcin de distribucin
acumulada de X de la siguiente forma:
F(1)= P (X 1) = 0
F(7)= P (X 7) =
21/36
F(2)= P (X 2) = 1/36
F(8)= P (X 8) =
26/36
F(3)= P (X 3) = 3/36
F(9)= P (X 9) =
30/36
F(4)= P (X 4) = 6/36
F(10)= P (X 10)= 33/36
F(5)= P (X 5) = 10/36
F(11)= P (X 11) = 35/36
F(6)= P (X 6) = 15/36
F(12)= P (X 12) = 1
Ntese que
P (X 7) = 1 F(7) = 15/36
P (X =7) = P (X 7) - P (X 6) = 6/36
P (4 X 9) = P (X 9) - P (X 3) = F(9) - F(3) = 27/36
En general, la funcin de distribucin acumulada F(x) de una variable aleatoria discreta es una funcin
no decreciente (o montona creciente) de los valores de X, de tal manera que cumple con las siguientes
propiedades:
1.
2.
3.
0 F ( x ) 1 para cualquier x
F ( x i ) F ( x j ) si xi > x j
P ( X > x )=1F ( x )
4.
5.
P ( X=x i ) =F ( x i )F ( x i1 )
P ( xi X x j ) =F ( x j ) F ( x i1 )
La grfica de la distribucin acumulada del ejemplo 6.1 se muestra en el grfico 6.7. En este
grfico es evidente que la funcin de distribucin acumulativa de una variable aleatoria discreta es una
funcin escaln, que toma un valor superior en cada salto.
Grfico 6.7. Representacin grfica de la funcin de distribucin acumulativa de la suma de las caras de dos dados
F(x)
10 11 12 13 14 15 16
Interpretacin
Se desprende que el concepto de frecuencia relativa acumulada y su representacin grfica, ya vistos,
tienen tambin su contrapartida en el estudio de las probabilidades. Una funcin acumulada describe
cmo se acumulan las probabilidades del mismo modo exactamente que la cuarta columna de la tabla
de distribucin de frecuencias describe la manera en que se acumulan las frecuencias relativas:
sumando todos los valores de estas frecuencias. El valor de la funcin acumulada es cualquier punto
dado xi, F(X = xi) representa la suma de todos los valores de la funcin de probabilidad correspondientes
a todos los valores de la variable aleatorias x que son menores o iguales a xi.
Ejemplo 6.2. Supngase que se lanza una moneda dos veces de tal forma que el espacio muestra es
S = {(C,C), (C,S), (S,C), (S,S)}. Represntese por X el nmero de caras que pueden resultar. Con cada
punto muestral podemos asociar un nmero para X como se muestra en la Tabla 6.5. As en el caso de
(C,C) (es decir 2 caras), x = 2 en tanto que para (S,C) (1 cara), x= 1. Se concluye que X es una variable
aleatoria.
Tabla 6.5: Correspondencia de los eventos simples de S del ejemplo 6.2 y los valores que toma la VAD X
Punto muestral
CC
CS
SC
SS
8
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Debe observarse que tambin podran definirse otras muchas variables aleatorias en este
espacio muestral, por ejemplo X1:el cuadrado del nmero de caras, X 2 X2: el nmero de caras
menos el nmero de sellos, etc.
Solucin
(a) Suponiendo que la moneda es legal tenemos
1
1
1
1
P { ( CC ) }= P { ( CS ) }= P { ( SC ) } = P {( SS ) }=
4
4
4
4
Luego
P ( X=0 )=P { ( SS ) }=
1
4
1 1 2
P ( X=1 )=P {( CS ) ( SC ) } =P {( CS ) }+ P {( SC ) }= + =
4 4 4
1
P ( X=2 ) =P {( CC ) }=
4
As, la funcin de probabilidad est dada en la Tabla 6.5.
xi
p(xi)
0
1/4
1
2/4
2
1/4
(b) La grfica de la funcin de probabilidad puede representarse como se indica en la Grfico 6.8
Grfico 6.8. Funcin de probabilidad del nmerod de caras al lanzar dos veces un moneda legal
0.75
0.5
p(x)
0.25
0
F(x)
1/4
0
-3
-2
-1
Los
aspectos
siguientes
acerca de la funcin de
distribucin anterior, que son verdaderos en general, deben notarse:
1. Las magnitudes de los saltos para p(x), en 0, 1, 2 son 1/4, 1/2, 1/4 que corresponden
exactamente a las ordenadas en la figura. Este hecho permite obtener la funcin de probabilidad a partir
de la funcin de distribucin.
2. Debido a la apariencia de la grfica 6.6 frecuentemente se la llama funcin escalera o
funcin escalonada o funcin paso.
9
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
E [ X ] , es el promedio o valor
E [ X ] == xi p ( xi ) i=1,2, , k
i=1
Varianza de X:
k
V [ X ] = = E [ ( X ) ] = x i p ( x i )
2
i=1
6.3
INTRODUCCIN
Se ha visto que las variables aleatorias se relacionan con los experimentos aleatorios, y que en todos los
casos se trata de variables numricas. En este captulo se desarrollarn modelos probabilsticos o
modelos estocsticos, que describen el comportamiento de variables aleatorias discretas y en el
prximo se introducirn modelos para el caso continuo. En ambos casos se trata de un tipo de modelo
formal que puede expresarse mediante una frmula, y que es muy utilizado en el mbito de las ciencias
aplicadas para explicar el comportamiento de los fenmenos aleatorios.
Un modelo probabilstico para el caso discreto, expresa la relacin entre los valores de una variable
aleatoria discreta y la probabilidad asociada a posibles valores de la misma. en cuyo caso tal regla de
correspondencia se denomina funcin de probabilidad. La informacin correspondiente se suele
10
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
En este curso se utilizarn los modelos uniforme y de Bernoulli para introducir algunos conceptos
bsicos, pero el inters se centrar en los modelos binomial y de Poisson.
6.4
DISTRIBUCIN UNIFORME
Se conoce que en el experimento de arrojar al aire un dado legal, todos los puntajes del 1 al 6, tienen la
misma probabilidad de aparecer, y que esta es igual a 1/6.
Se puede decir entonces que la distribucin uniforme se caracteriza porque todos los valores de un
Definicin 7.1. Distribucin uniforme discreta
Sea una variable aleatoria X, en la que cada uno de sus valores x1,x2,., tiene igual probabilidad de
ocurrencia. Luego, se dice que X es una variable aleatoria que se distribuye uniformemente sobre n
puntos cuya funcin de probabilidad es
1
P ( X=x )= p ( x )=u ( x ; k )= k siendok un nemro entero y x=x 1 , x 2 , , x k
0 en cualquier otro caso
sistema finito de valores posibles son igualmente probables.
Propiedades
Parmetros del modelo
Esperanza matemtica
o media
E [ X ] ==
k+1
2
2
Varianza
k 1
V [ X ] = =
12
Desviacin estndar
=V [ X ]
1
Jakob Bernoulli o Jacob Bernoulli (1654 - 1705), fue un matemtico y cientfico suizo cuya obra maestra fue Ars Conjectandi
(el Arte de la conjetura), un trabajo pionero en la teora de la probabilidad. Los trminos ensayo de Bernoulli y nmeros de
Bernoulli son resultado de su trabajo, publicado siete aos despus de su muerte.
2
Modelo descubierto por Simon-Denis Poisson (1781- 1840), un fsico y matemtico francs que se interes en el clculo de
las integrales y en la distribucin de las cargas elctricas sobre la superficie de los conductores. En 1837 public Recherches
sur la probabilit des jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de los juicios en
materias criminales y civiles), donde describi la probabilidad de acontecimientos fortuito ocurridos en un tiempo o intervalo de
espacio, cuando la probabilidad de ocurrencia es muy pequea, pero el nmero de intentos es muy grande.
11
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
p(x)
1/6
u (x;k= 6)
La expresin X u (x;k= 6) se lee: variable aleatoria X cuyos valores x siguen una distribucin de
probabilidades uniforme discreta con parmetro k=6.
1
Sea una variable aleatoria X, asociada a la presencia de obtener un xito cuando se realiza un nico
experimento con dos posibles resultados (xito o fracaso). Luego, se dice que X es una variable
aleatoria que se distribuye uniformemente sobre n puntos cuya funcin de probabilidad es
P ( X=x )= p ( x )=b ( x ; ) =
si x=1
1 si x=0
0 en cualquier otro caso
Propiedades
Parmetros del modelo
Esperanza matemtica
o media
E [ X ] ==
Varianza
V [ X ] = 2= (1)
Desviacin estndar
= V [ X ]
Ejemplo 7.2. la variable aleatoria X asociada al experimento de tirar una moneda una vez sigue una
distribucin Bernoulli, si cara es el evento xito y sello el evento fracaso, la probabilidad de xito es
p=0,5 y la probabilidad de fracaso es q = 1-p = 0,5. La media es 0,5 y la varianza 0,25.
p(x)
0,5
b (x; 0,5)
La expresin X b (x; 0,5) se lee: variable aleatoria X cuyos valores por siguen una distribucin
de probabilidades Bernoulli con parmetro = 0,5.
En forma anloga, el experimento de lanzar
0 un1 dado legal Xy considerar como evento xito la salida del
6, se asocia con una variable dicotmica, esto es S = {6, no 6}. La variable aleatoria X se referir a la
12
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Pero el resultado una sola de las tres unidades es defectuosa se corresponde con tres puntos del
espacio muestral.
2) Se debe determinar ahora el nmero total de puntos muestrales en el experimento que tiene x xitos
y (c-x) fracasos. Este nmero es igual al nmero combinatorio
( cx)
el caso sin reposicin y sin orden, que en este contexto recibe el nombre de coeficiente binomial.
Ilustracin: de esta manera las probabilidades asociadas a los valores posibles de la variable aleatoria
Por, de inters resultan ser
xi
0
P(X=x)=p(x
)
donde se observa que la probabilidad de dos artculos defectuosos calculada aplicando la funcin de
probabilidad es igual a
1
9
=
4 64
Definicin 7.5.
Sea X una variable aleatoria discreta que representa el nmero de xito en c ensayos y
probabilidad de xito con cualquiera de stos.
la
15
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
()
c!
x ( 1 )( c x ) para c entero ; 0 1
P ( X=x )= p ( x )=b ( x ; c , )= ( cx ) ! x !
0 para cualquier otro valor
donde
p(x): da la probabilidad de la ocurrencia de exactamente x veces el evento xito.
c: nmero fijo de pruebas
: probabilidad de xito en una sola prueba
: probabilidad de fracaso de una sola prueba
es el coeficiente binomial dado por
2) La probabilidad de que una variable aleatoria X sea menor o igual a un valor especfico de x, se
determina por la funcin de la distribucin acumulada
cx
P ( X x )=F ( x )=F ( x ; c , ) = c x ( 1 )( ) ; con i=1,2, (c +1)
x x xi
i
()
donde
F(x): da la probabilidad de la ocurrencia de x veces o menos del evento xito.
Propiedades
Parmetros del modelo
c ,
Esperanza matemtica
o media
E [ X ] ==c
Varianza
V [ X ] = 2=c (1 )
Desviacin estndar
= V [ X ]
p(xI)
16
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
(b)
(c)
Grfico 7.4. Distribuciones de probabilidad binomial para (a) c=10,
=0,50
1-
resulta
b)
c)
Ejemplo 7.5: Se inspeccionan los grandes lotes de productos que llegan a una planta manufacturera a
fin de encontrar artculos defectuosos, mediante un plan de muestreo. Se selecciona una muestra
aleatoria de n artculos de cada uno de los lotes y se inspeccionar la muestra, anotando el nmero x de
17
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Se ha especificado que el lote ser aceptado, cuando x sea menor o igual que al nmero de aceptacin
a=1. Por lo tanto, la probabilidad de aceptacin de un lote con estas caractersticas es:
Ejemplo 7.6: Una representacin grfica de la probabilidad de aceptacin del lote, contra la fraccin de
defectuosos
, se llama curva caracterstica de operacin de un plan de muestreo para aceptacin
de lotes. Calcular la probabilidad de aceptacin de lotes en el caso de un plan de muestreo con un
tamao muestral c=5 y un nmero de aceptacin a=0 para las fracciones de defectuosos del lote
considerando =0,1; 0,3 y 0,5.
Con los resultados se puede trazar la curva de operacin caracterstica para el plan de muestreo
(3 puntos intermedios de la curva). Adicionalmente se que la probabilidad de aceptacin tiene que ser
igual a 1 cuando
=1.
p
Grfico 7.6. Curva caracterstica de operacin para c=5 y a=0
1.2.1.
El clculo de probabilidades binomiales es un trabajo tedioso cuando c es grande. Para simplificar los
clculos, se recurre a una tabla de la funcin de distribucin F(x), que da la suma de las
probabilidades binomiales desde x=0 hasta x=c, para c = 5, 10, 15, 20 y 25, y diferentes valores de
Para mostrar como utilizar la tabla, supngase que se desea encontrar la suma de las probabilidades
binomiales desde x = 0 hasta x = 3, para un experimento binomial con c = 5 pruebas y
se quiere calcular
=0,3. Es decir,
donde
Para entrar en la tabla, primero hay que localizar a c=5. Luego, ya que los valores tabulares dan
, se busca el valor tabulado en la fila correspondiente a x=3 y en la interseccin con la columna
de
=0,3 se encuentra el valor tabulado buscado: 0,9692, que corresponde a la suma de las
=0,3), esto es
18
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
F(3) =
= 0,9692.
Tabla 7.1. Fragmento de una tabla de valores de la funcin de distribucin acumulada binomial
c
x
0.01
0.05
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
0.95
0.99
c
5
0
0
1
1
2
0,8369
---2
19
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
La tabla puede utilizarse tambin para encontrar una probabilidad binomial especfica, por ejemplo p(3)
para c=5,
Por lo tanto, un valor individual de p(x) es igual a la diferencia entre dos sumas que son entradas
adyacentes, dadas en una columna de la tabla.
Ejemplo 7.7. Obtener la media y la desviacin tpica para la distribucin de probabilidad binomial
relacionada con un experimento donde c=10 y
intervalo
El valor paramtrico de
es igual a
Esta probabilidad acumulada se encuentra en la tabla de la funcin de distribucin de la VAB para c=10,
p=0,1 y x=2, como 0,930.
Si consideramos la distribucin de probabilidad como una distribucin de frecuencias relativas para una
poblacin terica de valores x, entonces 93% de todas las observaciones en la poblacin caern en el
intervalo
. Este resultado concuerda con el Teorema de Tchebysheff y razonablemente bien con
la Regla Emprica.
Ejemplo 7.8. Suponga que un docente investiga sobre las caractersticas de los resultados de una
prueba de opcin (o eleccin) mltiple. Una calificacin de 0 en una prueba objetiva indica que el alumno
20
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
= c (1 )= (100)
( 16 )( 56 )=3,7
b) Por el conocimiento del Teorema de Tchebysheff y de la Regla Emprica 3 se puede esperar que la
mayora de las calificaciones de no conocimiento caigan en el intervalo
, o bien [16.7 2 x 3,7],
o sea desde 9,3 hasta 24,1. Este resultado puede compararse con la calificacin de cero para una
persona sin conocimiento que se somete a una prueba objetiva de recordar.
.
Muestra
3
Un histograma para p(x) con c=100, =1/6 tendr forma de pico de montaa. Por lo tanto, se esperara que la Regla Emprica
funcionara bien.
21
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Se llaman experimentos de Poisson a aquellos experimentos que arrojan valores numricos de una
variable aleatoria X referidos al nmero de ocurrencias durante un intervalo dado de espacio o tiempo. El
intervalo temporal puede tener cualquier longitud razonable al caso, como puede ser un minuto, un da,
una semana, un mes o incluso un ao, y el intervalo espacial podra corresponderse con un segmento
de una lnea, un rea o un volumen.
Definicin 7.6
Un experimento de Poisson se deriva del proceso de Poisson y tiene las siguientes propiedades:
El nmero de resultados que ocurren en un intervalo o regin especfica es independiente del nmero
que ocurre en cualquier otro intervalo o regin del espacio disjunto.
La probabilidad de que ocurra un solo resultado durante un intervalo muy corto o en una regin pequea
es proporcional a la longitud del intervalo o al tamao de la regin, y no depende del nmero de
resultados que ocurren fuera de este intervalo o regin.
La probabilidad de que ocurra ms de un resultado en tal intervalo corto o que caiga en tal regin
pequea es insignificante
Para utilizar la distribucin de Poisson en clculo de las probabilidades para modelar el comportamiento
de una VA, se requiere cumplir con cuatro supuestos bsicos:
1) debe ser posible dividir el intervalo de tiempo considerado en un nmero grande de pequeos
subintervalos, de manera que la probabilidad de ocurrencia en cada uno de ellos sea muy pequea.
2) la probabilidad de una ocurrencia en cada uno de los subintervalos debe permanecer constante a lo
largo del perodo que est considerndose.
3) la probabilidad de dos o ms ocurrencias en cada subintervalo tiene que ser suficientemente pequea
como para ignorarla.
4) una ocurrencia (o no ocurrencia) en un subintervalo no debe afectar a otra ocurrencia (o no
ocurrencia) en cualquiera de los otros subintervalos; es decir, las ocurrencias deben ser independientes.
Consideremos el nmero de llegadas por hora a un banco.
A continuacin se ilustran estos conceptos:
Suposicin
Ejemplo del banco
Es posible dividir el intervalo de tiempo considerado en pequeos subintervalos.
La probabilidad de una ocurrencia permanece constante a lo largo de los intervalos.
La probabilidad de dos o ms ocurrencias en un subintervalo es suficientemente pequea como para
ignorarla.
Las ocurrencias son independientes.
Puede dividirse la hora en subintervalos de un segundo cada uno.
Se elige una hora en la que es razonable prever que el flujo de clientes es constante.
Es imposible que dos personas entren al banco simultneamente (o sea, en el mismo segundo)
Las llegadas al banco no estn incluidas por las dimensiones de la cola.
Resulta importante identificar que la unidad de medicin de tiempo o de rea presenta caractersticas de
continuidad, pero que la variable aleatoria nmero de ocurrencias es discreta. Adems, cabe notar que
es imposible contar las ocurrencias del evento complementario, por ejemplo el nmero de accidentes
que no ocurrieron, el nmero de llamadas que no se realizaron o el nmero de defectos que no se
presentaron en un centmetro cuadrado.
22
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Definicin 7.7.
Sea X una variable aleatoria discreta que representa el nmero de ocurrencias con relacin a una
base temporal o espacial.
1) Se dice que X tiene una distribucin Poisson con funcin de probabilidad:
donde
p(x): da la probabilidad de que el evento x suceda exactamente k veces.
: es un parmetro positivo que representa una tasa media de veces que puede
ocurrencia de un fenmeno en el intervalo considerado
e: es la base de los logaritmos naturales (e = 2,71828 ...)
esperarse la
2) La probabilidad de que una variable aleatoria X sea menor o igual a un valor especfico de x, se
determina por la funcin de la distribucin acumulada
; para xi.= 0,1, 2, 3, .
(7.4)
donde
F(x): da la probabilidad de la ocurrencia de x veces o menos del evento xito.
Propiedades
Parmetros del modelo
Esperanza matemtica
o media
E [ X ] ==
Varianza
V [ X ] = 2=
Desviacin estndar
= V [ X ]
El nico parmetro necesario para caracterizar una poblacin descrita por la distribucin de Poisson es
la tasa media de ocurrencia de los sucesos, simbolizada con la letra griega lambda (). Puede definirse
lambda como la tasa media de ocurrencia por unidad de temporal o espacial considerada.
As, si =1,0 se refiere a la llegada de los clientes la un banco, la ley de probabilidad de Poisson est
indicando que a largo plazo se produce a razn de 1,0 clientes por minuto, con una varianza de llegadas
tambin igual a 1,0.
23
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
Debe notarse que an cuando se considera que la VAP toma un nmero infinito de valores, tal como
ocurre con todas las funciones de masa discretas slo un nmero discreto de valores de x tienen
probabilidades positivas, y los valores de probabilidad resultan muy pequeos a medida que los valores
de x se diferencian ms respecto a . Las grficas tpicas de las distribuciones de Poisson muestran una
asimetra marcadamente positiva, pero cuando no tiene un valor muy cercano a cero, la forma de la
distribucin de Poisson es bastante simtrica. Tambin por los axiomas de probabilidad se sabe que la
suma de las probabilidades correspondientes a todos los valores de x debe ser igual a 1,0. En casos
prcticos debido a que no se consideran infinitos valores de la variable, la suma solo resulta aproximada
a 1,0.
Para las aplicaciones prcticas del modelo Poisson, es necesario determinar empricamente la
tasa media a la que ocurren los sucesos. Esto es, hay que conocer el valor de , quiz sobre la base de
un estudio previo de la situacin (muestra). Una vez conocido el valor de , se pueden utilizar las
funciones de probabilidad de Poisson para determinar la probabilidad de que tengan lugar exactamente
x ocurrencias o sucesos en el intervalo de tiempo especificado o bien la de un evento compuesto (X<5,
etc.).
Muchas veces ms que interesarse en valores especficos, interesa obtener conocimiento sobre
el patrn de variabilidad de la VA vinculada con un fenmeno aleatorio de inters. En este caso el
estudio tambin se inicia con la toma de una muestra, la obtencin de su distribucin de frecuencias y el
clculo de los estadgrafos media y desviacin tpica. Luego se procede a realizar un ajustamiento del
modelo Poisson y se obtienen valores de frecuencias tericas, tratando de tomar alguna idea acerca de
la distribucin poblacional correspondiente a la poblacin de donde se extrajo la muestra. Con posterior
ayuda de herramientas que proporcionar la Inferencia Estadstica, se podr establecer una conclusin
probabilstica al respecto.
Ejemplo 7.10: Las observaciones durante un perodo muestras que la probabilidad de vida de un
cierto componente de la fauna silvestre en los primeros cinco aos de vida es de 0,2 ( ) . A partir
de este conocimiento, puede calcularse la probabilidad de que sobrevivan x animales en ese
perodo.
Ejemplo 7.11 Un zologo sabe por experiencia que en ciertas condiciones, la tasa media de insectos
xilfagos que puede encontrarse en rboles que presentan una incipiente podredumbre es de =600. Se
supone que los insectos van colonizando el fuste del forestal en forma constante a razn de 1 insecto
por unidad de volumen de madera. Se desea determinar la probabilidad de encontrar:
a) exactamente dos insectos en una unidad de volumen seleccionada al azar.
Siendo = 1 y x = 2, luego
f
n
(5)
x2
(6)
x2
f
n
0
0
0.01
0.00
0
0.00
1
8
0.08
0.08
1
0.08
2
19
0.19
0.38
4
0.76
3
23
0.23
0.69
9
2.07
4
17
0.17
0.68
16
2.72
5
15
0.15
0.75
25
3.75
6
8
0.08
0.48
36
2.88
7
3
0.03
0.21
49
1.47
8
3
0.03
0.24
64
1.92
9
25
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
p ( xi )
(4)
N de clientes esperados
La columna ltima de esta tabla contiene las frecuencias tericas ( n^ i ) , calculadas utilizando el
modelo Poisson. Esta serie de frecuencias debe compararse con las correspondientes frecuencias
observadas de la segunda columna (ni), Cuanto mayor sea la similitud, significa que se tiene ms
informacin emprica a favor de la suposicin planteada inicialmente, y contrariamente, si se observan
discrepancias notables se comenzar a sospechar que habr que describir el comportamiento de la
variable observada utilizando otro modelo para acercarse al conocimiento de la verdadera distribucin
de la poblacin de donde se extrajo la muestra.
Herramientas que proporcionar la Estadstica Inferencial permitirn dilucidar este problema y alcanzar
una conclusin en trminos probabilsticos acerca de la distribucin poblacional.
Tablas de probabilidad para la distribucin Poisson
En realidad, las tablas de la funcin de distribucin de Poisson, F(x), se utilizan de modo muy
semejante a las tablas binomiales, aunque a primera vista no lo parezcan. Como la distribucin de
26
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
La tabla proporciona sumas de probabilidades, al igual que la tabla binomial acumulativa, para x o
menos ocurrencias P(X x), dada la media del proceso ()4. Adems si bien da valores de probabilidad
para una funcin de distribucin acumulada, tambin puede utilizarse con criterios similares a los vistos
en el caso Poisson para encontrar una probabilidad Poisson especfica, P(X=x) = p(x).
Ilustracin. Probabilidades obtenidas a partir de la tabla acumulativa de Poisson
4
Hay bibliografa que utiliza el smbolo en lugar de
27
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014
28
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCuyo / Ciclo 2014