Sei sulla pagina 1di 6

PRACTICA 2a: Probabilidad y variables aleatorias.

1. Se dice que una variable aleatoria discreta es una variable de Poisson P ( ) , si su funcin de densidad es del tipo:
f ( x) e

x
x!

donde x 0,1,2,3,... Se puede probar que para una variable de este tipo, tanto la media como la desviacin tpica son iguales
a (el parmetro de la distribucin). Experimentalmente, se ha determinado que el nmero de veces que una planta de energa
nuclear emite gases radiactivos al cabo del ao responde a una variable de este tipo, con 3 .
a) Por trmino medio, cuntas emisiones radiactivas realizar la planta cada ao?
Tres (vase el prrafo anterior).
b) Cul es la probabilidad de que la planta no realice ninguna emisin, en un ao determinado? Y la de que realice
alguna emisin?
Descripcin + Distribuciones + Distribuciones de Probabilidad. Escogemos la distribucin de Poisson. Despus, botn derecho
+ opciones de Anlisis; introducimos la media de la variable, 3. La probabilidad de que no realice ninguna emisin es
P(X=0)=0,0497871 (aparece abajo, a la izquierda: probabilidad de masa), y la de que realice alguna emisin es
P(X>0)=0,950213 (rea de cola superior).
c) Cul es la probabilidad de que realice exactamente dos emisiones? Y de que realice entre 2 y 4 emisiones?
Botn derecho + opciones de ventana. Valores para la variable: 2. Con esto, P(X=2)= 0,224042 (probabilidad de masa). Para
calcular P (2 X 4) , tenemos en cuenta que esa probabilidad es igual a P(X<5)-P(X<2); as que pulsamos botn
derecho y aadimos 5: restando los reas de cola correspondientes a 2 y 5, tenemos 0,815263-0,199148 = 0,616115.
d) Se han contabilizado cincuenta plantas de este tipo en una zona de la Comunidad Europea. Cuntas de ellas se prev
que realizarn durante este ao entre dos y cuatro emisiones?
Basta calcular el 0,616115 * 100 = 61,6115 % de 50. Aproximadamente 31.
2. Los datos sobre las toneladas de CO 2 emitidas anualmente un cierto ao por los pases del planeta sugirieron que esta variable
se distribua normalmente con una media prxima a 14, y con una desviacin tpica de 047.
a) Qu porcentaje de pases emiti, dicho ao, entre 13 y 15 toneladas de CO2?
Descripcin + Distribuciones + Distribuciones de Probabilidad. Escogemos la distribucin normal. Botn derecho + opciones
de anlisis: introducimos la media (14) y la desviacin tpica (0,47). Despus, opciones de ventana, e introducimos los valores
13 y 15. Restando los reas de cola inferior para cada caso, 0,983317-0,0166825= 0,9666345. Por lo tanto, un 9666% de los
pases.
b) Qu porcentaje de pases emiti menos de 13,5 toneladas? Y una cantidad menor o igual de 13,5 toneladas?
Botn derecho + opciones de anlisis; introducimos 13,5; el rea de cola inferior es 0,143702; por lo tanto, 0,143702* 100 =
14,3702%. Los dos porcentajes pedidos coinciden porque lo hacen las dos probabilidades pedidas: en el caso de variables
continuas, la probabilidad de que la variable tome un valor concreto se considera nula (es, en un cierto sentido, una limitacin
de la teora).
c) Qu porcentaje de pases emiti ms de 16 toneladas?
Prcticamente 0%.
d) Por encima de qu niveles se encontraba el 10% de pases ms contaminante?
Botn amarillo + CDF inverso. Buscamos el valor por debajo del cul queda un rea de 0,9 en la funcin de densidad. El valor
pedido es 14,6023.

e) Por debajo de qu niveles se encontraba el 15% de pases ms respetuosos?


Desde la ventana anterior, botn derecho + opciones de ventana; introducimos 0,15. El valor pedido es 13,5129.
f)

Calcula los cuartiles y la mediana, e interprtalos.

El primer cuartil se calcula buscando el valor por debajo del cul queda un rea de 0,25; anlogamente para el tercero, con un
rea de 0,75, y para la mediana, con un rea de 0,5. Por lo tanto, el primer cuartil es 13,68, lo cul indica que el 25% de
pases menos contaminantes tenan tasas por debajo de 1368. El tercer cuartil es 14317; por lo tanto, el 25% de pases ms
contaminantes tenan tasas por encima de ese valor. Finalmente, la mediana, 14, nos indica que la mitad de los pases
estaban por debajo de esa tasa, y la otra mitad por encima.
g) Sobre una muestra aleatoria de 50 pases, cuntos cabra esperar que emitieran ms de 145 toneladas de CO2
si el comportamiento actual se distribuyera del mismo modo?
Procediendo como en el apartado c), calculamos que la probabilidad de emitir ms de 145 toneladas de CO 2 es 143702%.
Calculamos el 143702% de 50 y obtenemos un total de 7 pases.
3. La magnitud de los terremotos, medidos en la escala Richter, en una determinada regin sigue una distribucin exponencial de
parmetro 2 (se recuerda que la distribucin exponencial responde a una funcin de densidad del tipo f ( x) e x , donde
es el parmetro de la distribucin; se recuerda adems, que la media de esta variable es 1 / ).
a) Cul es la magnitud media de los sesmos que se producen en dicha regin?
Segn lo de arriba, la magnitud media es 1/2 = 0,5.
b) En qu porcentaje de ocasiones se registran sesmos de magnitud entre 1 y 2?
Descripcin + Distribuciones + Distribuciones de Probabilidad. Escogemos la distribucin exponencial. Botn derecho +
opciones de anlisis: introducimos la media (0,5). Despus, opciones de ventanta + valores para la variable = 1 y 2. Despus,
restando los correspondientes reas de cola inferior, tenemos 0,981684-0,864665 = 0,117019. Por lo tanto, 0,117019 * 100
=11,7019%.
c) En qu porcentaje de ocasiones se registran sesmos de magnitud superior a 2?
En la misma ventana P(X>2)= 0,0183156 (rea de cola superior). Por lo tanto, 1,83%.
d) Calcula los cuartiles, la mediana, y el percentil 90, e interprtalos.
Q1 = 0,143831; M=0,346574; Q3 = 0,693147. El percentil 90 es 1,15129. La interpretacin es anloga a la del ejercicio
anterior.
e) Por encima de qu magnitud se sita el 15% de sesmos ms fuertes?
Como el 2 e. La solucin es 09484.
4. Las poblaciones de dos especies animales en competicin, X e Y, pueden modelizarse a partir de distribuciones normales. En
concreto, X se comporta como una distribucin N(250, 30), e Y como N(300,10). Con qu probabilidad suceder que la poblacin
de X supere a la de Y? (NOTA: debes utilizar el hecho de que la resta de normales es tambin normal, es decir: si
X N ( 1 , 1 ) , Y N ( 2 , 2 ) , entonces X Y N ( 1 2 , 12 22 ) ; adems, en ese casto lo que necesitamos
calcular es P(X-Y>0))
La variable X-Y es normal de media 250-300= -50, y desviacin tpica 1000 . Calculamos entonces P(X-Y>0) (escogiendo la
distribucin normal, introduciendo los valores correspondientes para media y desviacin tpica, etc.) y obtenemos un valor de
5,69%.

5. Calcula los siguientes puntos crticos, visualizando la funcin de densidad de la distribucin correspondiente:

a) z 0 , 025
Se nos pide el valor que en la normal N(0,1) deja a la derecha un rea de 0,025 (por lo tanto, a la izquierda uno de 0,975). En la
opcin de CDF inverso introducimos 0,975, y obtenemos 1,95997.
b) t 0 '05;151
Buscamos el valor que en la t de Student de 151 grados de libertad, deja a la derecha un rea de 0,05 (a la izquierda uno de 0,95).
Elegimos entonces la t de Student, con botn derecho introducimos el nmero de grados de libertad y en la opcin CDF inverso
obtenemos 1,65501. Obsrvese que la t de Student proporciona un valor muy similar al de la normal.
2
c) 0 , 3;16

Buscamos el valor que en la chi-cuadrado de 16 grados de libertad deja a la derecha un rea de 0,3 (a la izquierda, uno de 0,7).
Elegimos la chi-cuadrado, introducimos el nmero de grados de libertad y en la opcin CDF inverso obtenemos 18,4179.
d) F0 '95; 20 ,15
Buscamos el valor que en la F de Snedecor de 20, 15 grados de libertad deja a la derecha un rea de 0,95 (grande!). Lo lgico
ser por lo tanto que est prximo a 0. Procediendo como antes, se obtiene 045387.
6. Visualiza la curva de densidad de una distribucin normal N(2,3).
a) Genera nmeros aleatorios que simulen una muestra de la poblacin, y gurdalos.
b) Compara (atendiendo a los parmetros estadsticos, el histograma, el diagrama de cajas, etc.) lo que obtienes con
las propiedades de la distribucin. En particular, podras considerar normales los datos que has generado?
Para el apartado a), elegimos una distribucin normal N(2,3). Despus, botn guardar + nmeros aleatorios. Podemos llamar
NORMAL a la nueva variable. Se genera una muestra de 100 datos que simula una muestra correspondiente a una poblacin
N(2,3). Para (b), si realizamos un anlisis descriptivo de los datos (Descripcin + Datos Numricos + Anlisis Unidimensional;
Datos = NORMAL), lo natural es que tanto los parmetros estadsticos (en concreto, coeficientes de asimetra y curtosis
tipificados) y los grficos (histogramas, diagramas de caja, etc.) avalen la normalidad de los datos generados.
7. A partir de una distribucin t de Student de 10 grados de libertad, genera nmeros aleatorios que simulen una muestra. Realiza
un anlisis descriptivo de los datos, y comprueba que en general posee una curtosis elevada. Repite el experimento tres veces, e
indica si en alguna ocasin los datos generados podran pasar por normales (a partir de los coeficientes de asimetra y curtosis
tipificados). Y si en vez de 10 grados de libertad, introduces 1000?
Puesto que los datos generados son aleatorios, cada alumno obtendr un resultado diferente. En general, en el caso de 10 grados
de libertad lo ms habitual es obtener muestras con curtosis elevada, aunque en ocasiones pueda quedar dentro del rango
admitido para normalidad. Sin embargo, segn se incrementa el nmero de grados de libertad, la t de Student se aproxima cada
vez ms a una normal. Por lo tanto, en el caso de 1000 grados de libertad lo habitual es obtener valores muy bajos de asimetra y
curtosis, como corresponde a una distribucin normal.

PRACTICA 2b: Probabilidad y variables aleatorias.

1. Se dice que una variable aleatoria X es una binomial, de parmetros n y p, abreviadamente X = B(n,p), si su funcin de
densidad es:
n
f ( x ) P ( X x ) p x q n x
x
donde q 1 p . Tpicamente, esta variable responde a la siguiente pregunta: dado un experimento que nicamente puede
tener dos resultados posibles, que denominamos xito (y que ocurre con probabilidad p) y fracaso (que ocurre por tanto con
probabilidad q=1-p), cul es la probabilidad de que al repetir n veces el experimento, obtengamos exactamente x xitos? Se
puede probar que la media de esta variable es np, y su varianza, npq.
a) Las palmeras de una zona sufren una plaga del escarabajo picudo rojo (Rhynchophorus ferrugineus). Se estima que hay
aproximadamente un 25% de palmeras enfermas. Si en un jardn hay 20 palmeras, cul es la probabilidad de que haya
entre 3 y 7 palmeras enfermas? Y ms de 3? Y menos de 7? (NOTA: reconoce previamente en el problema, el
esquema de la binomial; para Statgraphics, el valor de p recibe el nombre de probabilidad de evento, mientras que n es
el nmero de ensayos).
b) Cul es la cantidad de palmeras enfermas que cabra esperar encontrar en el jardn? Cul es la probabilidad de que el
nmero de palmeras enfermas sea efectivamente ese?
c) Tiene sentido temer que ms de la mitad de las palmeras del jardn estn enfermas? Por qu? (NOTA: argumenta la
respuesta calculando previamente una probabilidad).
a) Es una binomial, donde n = 200, p=0,25, es decir X=B(200,0.25), siendo X el nmero de palmeras enfermas dentro de un
grupo de 20 (las que hay en el jardn). La probabilidad de que X est entre 3 y 7 es P(X<8)-P(X<3)= 0,8981880,0912605 =
0,8069275 (80,69%). P(X>3)=0,774844 (77,48%), P(x<7)=0,785782.
b) El nmero medio de palmeras es np= 20 x 0,25 = 5. La probabilidad de que el nmero de palmeras enfermas sea 5 es
P(X=5)= 0,202331; en porcentaje, 20,23%.
c) La probabilidad de que eso pase (P(X>10) es escasa, 0,00394207. No tiene mucho sentido.
2. Se considera que el nmero de incendios y conatos anuales en una zona de Espaa sigue una distribucin normal de media 43
y desviacin tpica 12.
a) Con qu probabilidad podemos esperar ms de 50 incendios en dicha zona?
b) Con este modelo, ciertos servicios y ayudas se movilizan automticamente cuando el nmero de incendios supera el
percentil 85. Por encima de qu nmero de incendios se estara en esta situacin?
c) Cul es la probabilidad de que se registren entre 40 y 60 incendios? Y menos de 40?
d) Proporciona un intervalo que contenga el nmero de incendios que cabe esperar en el 90% de los casos?
(SUGERENCIA: un intervalo razonable que responde a la condicin que se pide, es el comprendido entre los percentiles
5 y 95; trata de entender por qu).
a) P(X>50)=0,279833.
b) A partir de 55 incendios.
c) P(40<X<60)= 0,92171-0,401292 = 0,520418. P(X<40)=0,40192. Por lo tanto, porcentajes de 52,04% y 40,192%,
respectivamente.
d) El percentil 95 es aprox. 63, y el percentil 5, 23. Por lo tanto, (23,63).
3. En una regin, se han observado determinadas subespecies X 1 y X2 de una especie vegetal X. Si el nmero de ejemplares de
X1 sigue una distribucin N (500,30) y el nmero de ejemplares de X2 sigue una N ( 400,20) :
a) Qu distribucin sigue el nmero de ejemplares de X? (NOTA: observa que el nmero de ejemplares de X es la suma de X 1 y
X2 y recuerda que la suma de normales es tambin normal; concretamente, si X N ( 1 , 1 ) , Y N ( 2 , 2 ) , entonces
X Y N ( 1 2 , 12 22 ) ).

Normal de media 900 y desviacin tpica

1300

b) Cul es la probabilidad de que la poblacin de X supere los 950 ejemplares?


8,275%.
c) Cul es la probabilidad de que la poblacin de X est por debajo de 800 ejemplares?
0,277%.
4. Calcula los siguientes puntos crticos, y responde en cada caso a la pregunta que se plantea. Para esto, visualiza la funcin de
densidad de la variable aleatoria correspondiente, y ten en cuenta su forma y caractersticas.
a) z0,5
Podras haber dado el valor sin recurrir a Statgraphics? Por qu?
0,5. Se podra haber dado directamente ya que la curva de densidad de N(0,1) es simtrica respecto al eje Y.
b) t0.95, 20
Por qu sale negativo el valor?
El valor es -1.72472. La curva de densidad de la t de Student es simtrica respecto del eje Y. Por lo tanto, si buscamos un valor
que deja a la derecha un rea de 0,95 (mayor de 0,5), el valor debe ser negativo.
2
c) 0.01, 20

Por qu sale tan grande?


37,5662. La chi-cuadrado tiene una cola muy larga a la derecha; buscamos el valor que deja a su derecha un rea de 0,01 (muy
pequeo), luego no es raro que quede un valor alto.
d) F0.05,1000 ,1000
Por qu sale un valor tan bajo?
1.1064. Siendo los grados de libertad tan altos, en la curva de densidad vemos que casi toda la probabilidad se concentra en torno
al 1.
5. La funcin de Weibull (http://en.wikipedia.org/wiki/Weibull_distribution) es otra variable aleatoria ms, que cabe aadir a la
coleccin de la que forman parte la normal, la exponencial, t de Student, chi-cuadrado, etc. Esta distribucin se ha utilizado en
meteorologa y en el llamado anlisis de supervivencia (http://en.wikipedia.org/wiki/Survival_analysis). La distribucin de Weibull
posee funcin de densidad
k
f ( x) 1 e ( x / )
donde , k son los parmetros de la distribucin (llamados respectivamente tasa de fallo o escala y parmetro de forma,
respectivamente).
a) Visualiza la funcin de densidad de una variable Weibull de parmetros 8 (forma) y 7 (escala). Es simtrica?

Weibull Distribucin
0,5

Forma,Escala
8,7

densidad

0,4
0,3
0,2
0,1
0
0

10

12

Es ligeramente asimtrica hacia la izquierda.


b) Genera, utilizando la opcin Guardar + Nmeros Aleatorios, un conjunto de nmeros aleatorios que imiten una muestra
tomada de una poblacin que siga la distribucin anterior.
Como en 6 a).
c) Realiza un anlisis descriptivo de los datos anteriores, visualizando asimismo el histograma y el diagrama de cajas de los
datos. Indica si los datos pueden considerarse normales a partir de los coeficientes de asimetra y curtosis
estandarizados. Anota el valor del coeficiente de variacin.
Puede suceder que los datos sean identificados como normales, o que no (cada uno generaris datos diferentes, y habr de
todo). Si se identifican como normales, no hay ningn error: un mismo conjunto de datos puede ser modelizado mediante
diferentes variables aleatorias (normal, Weibull, etc.)
d) Haz lo mismo para una variable Weibull de parmetros 2 y 9. Cul de las dos variables, la de ahora o la generada en el
apartado anterior, es ms dispersa? Explcalo a partir de los grficos de las respectivas curvas de densidad.
La curva de densidad de la primera distribucin (la del apartado anterior) est mucho ms concentrada en torno a la media
que la segunda (la de este apartado). En consecuencia, lo lgico es que el coeficiente de variacin de los datos generados en
este segundo caso sea mayor que el obtenido en el apartado anterior.

Potrebbero piacerti anche