Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ISBN: 978-956-356-020-6
Impreso en Chile/Printed in Chile
Departamento de Matemáticas
Probabilidad y Estadística
Ejercicios resueltos y propuestos
“Cálculo exacto para entrar en conocimiento de todas las cosas existentes y de todos los oscuros secretos y
misterios” así se inicia los escritos del papiro Rhind o Ahmes. El primer nombre es debido al egiptólogo Henry
Rhind que lo compró en Luxor, el segundo es el nombre del escriba autor del papiro que data del año 1650
A.C. El papiro es una colección de 87 problemas matemáticos escritos en hierático ( jeroglífico cursivo) con su
respectiva solución. Los problemas que ataca son referidas a cuestiones de aritméticas básicas, fracciones, cálculo
de áreas, volúmenes, progresiones, repartos proporcionales, reglas de tres, ecuaciones lineales y trigonometría
básica. Algunos creen que es un texto escolar o una especie de cuaderno de algún alumno. Hago mención de
este extraordinario documento para destacar que la valoración de la resolución de problemas en matemáticas es
muy antiguo. Para concretar un poco lo que en ese papiro está escrito extraigo de egiptologia.org el problema
siguiente:
Es claro que se enseñaba el uso de una herramienta nueva aplicada a cuestiones del tipo de repartición.
El libro “Ejercicios Propuestos y Resueltos de Probabilidad y Estadística” tiene el mismo objetivo que aquel
papiro: instruir a nuestros alumnos en ciertas técnicas para resolver problemas, en este caso, de estadística.
Los problemas están agrupados por tópicos y en cada tópico se agrupan los problemas, en término general, en
tres estratos:
1. Problemas que atañen a lo conceptual y a hacer que el estudiante ligue conceptos teóricos. Por ello se
usan los títulos como ”propiedades de las funciones de cuantía conjunta y sus medidas de centralidad” ó
“Relaciones entre índices”, etc...
2. Problemas que tienen un contexto y deben aplicar alguna definición o técnica o alguna relación determinada
en los ejercicios del primer tipo.
3. Problemas propuestos a los alumnos, para que ellos resuelvan usando las técnicas ofrecidas en los grupos
anteriores.
La subdivisión de los ejercicios de esa forma fue natural pues, como es una recopilación de problemas de guias de
talleres, éstas tenían objetivos bien definidos que eran que el estudiante relacionara conceptos teóricos, índice,
etc. y usara tales relaciones y conceptos en la resolución de un problema concreto.
1
Índice general
2. Regresión 17
2.1. Problemas de Relaciones entre índices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2. Problemas de ajuste de curvas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3. Ejercicios propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3. Equiprobabilidad 27
3.1. Ejercicios de conteo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2. Ejercicios de propiedades de probabilidad y equiprobabilidad. . . . . . . . . . . . . . . . . . . . . 32
3.3. Ejercicios de probabilidad condicional y teorema de Bayes. . . . . . . . . . . . . . . . . . . . . . . 37
3.4. Ejercicios Propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3
4 ÍNDICE GENERAL
El estudiante, previamente, aprenderá los conceptos de estadística univariada y bivariada para poder aplicarlas
en los ejercicios que se plantean.
Los problemas se pueden catalogar como:
I) Comprender o usar índices estadísticos en un contexto.
II) Encontrar o usar relaciones algebraicas entre nociones estadísticas.
Los problemas catalogados como ” Comprender o usar índices estadísticos en un contexto” se refieren a ejercicios
donde el estudiante debe reconocer qué índices usar o ,dado los índices, explicar porqué es adecuado, en términos
del contexto.
Los problemas catalogados como ” Encontrar o usar relaciones algebraicas entre nociones estadísticas” se refieren
a ejercicios donde el estudiante debe aplicar su cultura matemática con la finalidad de descubrir relaciones
algebraicas entre nociones estadísticas.
Nos ha parecido más apropiado poner primero los problemas del tipo II y luego los del tipo I con el fin de usar
estas relaciones en los problemas del tipo I.
1. En las tablas bivariadas , la variable X tiene r marcas de clases X1 , X2 , ..., Xr mientras que la variable Y
tiene s marcas de clases Y1 , Y2 , ...., Ys . Todas las clases- de X e Y- son marcas de clases numéricas.
Se define “la media de Y condicionada a la clase i de X”, que denotamos por X i , como
s
X s
X fij
Xi = Yj · fj/i = Yj ·
j=1 j=1
fi·
a) Explique esta expresión y, en particular, responda, por qué se multiplica cada marca de clase de Y
f
por fij
i·
Solución.
5
6 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA
a) La frecuencia relativa condicional fj/i es la frecuencia relativa cuando se consideran sólo los datos de
Ps
la clase i de X. Luego es claro que la media de Y condicionada a la clase i de X, es Xi = j=1 Yj ·fj/i =
Ps fij
j=1 Yj · fi·
2. Suponga que está haciendo un muestreo estratificado donde ha hecho N estratos de donde se sacan
n1 , n2 , ..., nN datos. Especifique una forma de determinar la media en este tipo de muestreo en términos
de las medias de cada estrato x1 , x2 , ...., xN . Asuma que la población tiene cardinalidad M . Explique
Solución.
Como se tiene las medias de cada estrato es posible pensar que la información quedó representada por
tales medias x1 , x2 , ...., xN . Por lo tanto, es factible pensar que la representación de la información sea la
ni
media ponderada de esas medias donde el peso asignado al estrato i es: M . Luego, la media que se asumirá
PN nk
es: X = k=1 M · xk
Solución.
Pr Ps
a) X = i=1 Xi · fi∗ Y = j=1 Yj · f∗j
Pr
b) Xj = i=1 Xi · fi/j
Ps
c) Yi = j=1 Yj · fj/i
Pr Pr Ps Ps Pr Ps
d) X = i=1 Xi · fi∗ = i=1 j=1 Xi · fij = j=1 f∗j · i=1 Xi · fi/j = j=1 Xj · f∗j
Ps Ps Pr Pr Ps Pr
e) Y = j=1 Yj · f∗j = j=1 j=1 Yj · fij = i=1 fi∗ · j=1 Yj · fi/j = i=1 Yi · fi∗
P P
f) V (X) = ri=1 (Xi − X)2 fi∗ ; V (Y ) = ri=1 (Yi − Y )2 f∗j
4. Sabiendo que en el ajuste de una recta, y = a · x + b ,entre los datos x1 , x2 , ..., xn independientes y los
dependientes y1 , y2 , ..., yn se obtiene que â = Cov(X,Y
S2
)
. Si r es la correlación muestral. Demuestre que
x
â·SX
r= SY .
Solución.
Cov(X,Y )
Dado que â = Sx2 y r = Cov(X,Y
SY ·SX
)
entonces completando con la expresión de â la expresión de r,
Cov(X,Y ) â·SX Cov(X,Y )
â · SX = SX , basta dividir por SY y se obtendrá r . Luego r = SY = SX ·SY
1.1. ENCONTRAR RELACIONES ALGEBRAICAS ENTRE ÍNDICES ESTADÍSTICOS. 7
n
1 X
T = · |Xk − XM |
n
k=1
2
P 1−(−1)n
donde XM : mediana de los datos. Probar que: T = −X + n · Xi >XM Xi + 2·n · XM
Solución.
Si n es impar la mediana es uno de los datos y tal sumando en T es 0.
# {Xk : Xk > XM } = # {Xk : Xk < XM } = n−12
1 P 1 P
T = n · Xk <Xm (−(Xk − XM )) + n Xk >XM (Xk − XM )
P P
T = −1
n ·
1 n−1
Xk <Xm Xk + n 2 XM + n1 Xk >XM Xk − n1 n−1
2 XM )
P P
T = −1
n ·
1
Xk <Xm Xk + n Xk >XM Xk
P P P P
T = n · Xk <Xm Xk − n · Xk >XM Xk + n1 · Xk >XM Xk + n1 Xk >XM Xk +
−1 1 1
n · XM − 1
n · XM
Pn 2 P
T = −1
n · k=1 Xk + n
1
Xk >XM Xk + n · XM
P
T = −X + n2 Xk >XM Xk + n1 · XM
Si n es par la mediana es la semisuma de los del medio, luego XM no es parte de los datos.
# {Xk : Xk > XM } = # {Xk : Xk < XM } = n2
P P
T = n1 · Xk <Xm (−(Xk − XM )) + n1 Xk >XM (Xk − XM )
P P
T = −1n ·
1 n
Xk <Xm Xk + n 2 XM + n
1 1 n
Xk >XM Xk − n 2 XM )
P 1 P
T = −1n · Xk <Xm Xk + n Xk >XM Xk
P P P P
−1
T = n · Xk <Xm Xk − n · Xk >XM Xk + n1 · Xk >XM Xk + n1 Xk >XM Xk
1
Pn P
T = −1n ·
2
k=1 Xk + n Xk >XM Xk
P
T = −X + n2 Xk >XM Xk
Luego la fórmula sería :
2 X 1 + (−1)n
T = −X + · Xi + · XM
n 2n
Xi >XM
n P P
X 2 · n2 · Xi ≥X X i − 2 · n1 · Xi <X Xi
|xi − x| =
i=1
n
donde n1 = # i : Xi ≥ X ; n2 = # i : Xi < X
Solución.
Pn P P
i=1 |xi − x| = − xi <X (xi − X) + xi ≥X (xi − X)
Pn P P
i=1 |xi − x| = − xi + n2 · X + xi ≥X xi − n1 · X
xi <X
Pn P P P P P P
i=1 |xi − x| = − xi <X xi + nn2 · ( xi <X xi + xi ≥X xi ) + xi ≥X xi − nn1 · ( xi <X xi + xi ≥X xi )
Pn P P P P
i=1 |xi − x| = − n−nn
2
· xi <X xi + nn2 xi ≥X xi ) + n−n
n
1
· xi ≥X xi − nn1 xi <X xi
Pn P P P P
i=1 |xi − x| = − nn1 · xi <X xi + nn2 xi ≥X xi ) + nn2 · xi ≥X xi − nn1 xi <X xi
Pn 2·n2 ·
P
Xi ≥X Xi −2·n1 ·
P
Xi <X Xi
i=1 |xi − x| = n
8 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA
Solución.
hP P i
|Xi −X |
Pn
i=1 1
MD = n = n Xi ≥X (Xi − X) − Xi <X (X i − X)
Si p = # Xi /Xi ≥ X entonces
hP P i
|Xi −X |
Pn
M D = i=1 n = n1 Xi ≥X X i − p · X − Xi <X X i + (n − p) · X
hP P i
|Xi −X |
Pn
M D = i=1 n = n1 Xi ≥X Xi − p · X − (n · X − Xi ≥X Xi ) + (n − p) · X
h P i
|Xi −X |
Pn
M D = i=1 n = n1 2 · Xi ≥X Xi − 2 · p · X
hP i
|Xi −X |
Pn
M D = i=1 n = n2 Xi ≥X (Xi − X)
SX
8. Demuestre que el coeficiente de variación CV = |x| no cambia si los datos {xi : i = 1, 2, ..., n}son trans-
formados por ui = r · xi ; r ∈]0, ∞[
Solución.
1 Pn Pn
SU2 = n· i=1 (ui − u)2 ; u = n1 · i=1 ui
Pn Pn
u = n1 · i=1 ui = n1 · i=1 r · xi = r · x
P P
SU2 = n1 · ni=1 (ui − u)2 = n1 · ni=1 (r · xi − r · x)2 = r2 · SX
2
SU r·SX SX
CV = |u| = r·|x| = |x|
a) Explique en qué forma esta expresión está involucrada como una medida del grado de independencia
de las variables X e Y .
b) En el interés de ver la influencia de la edad ( 1,2,3,4,5) en la sexualidad (Sin pareja; Con pareja ( sin
sexo); Con pareja ( con sexo)), se obtuvo la tabla bivariada.
1 2 3 4 5
sin pareja 21 21 14 13 8
con pareja (sin sexo) 8 9 6 8 2
con pareja (con sexo) 2 3 4 10 10
Solución.
a) La relación de independencia entre dos variables es fij = fi· · f·j , expresión que se logra con las
n ·n
frecuencias nij = i·N ·j . Por tanto χ2 ≃ 0 indicarían poca asociación o dependencia.
b) χ2 = 0, 09 poca asociación.
10. En marzo del 2013, 216 alumnos rindieron el test de diagnóstico de matemáticas con la intención de verificar
el grado de manejo del lenguaje básico en matemáticas. El test consta de 40 preguntas de selección múltiple
(A;B;C;D;E). Se pretende con este trabajo estudiar el test en cuanto a sus preguntas y ver cuál de ellas
deben ser cambiadas, o sus alternativas estudiadas.
Metodología.
De acuerdo a las notas logradas se extraen las 50 mejores notas , que constituyen el nivel superior, y las
50 peores notas, que constituyen el nivel inferior. Se definen las siguientes variables para cada pregunta :
AS: el número de alumnos que acertaron a la respuesta correcta- de la pregunta - en el nivel superior.
AI: el número de alumnos que acertaron a la respuesta correcta -de la pregunta- en el nivel inferior.
Se definen además los siguientes índices:
AS+AI
Indice de fácilidad: IF = total
AS−AI
Indice de Discriminación 1 : ID1 = T otaldelnivelsuperior
AS
Indice de discriminación 2 : ID2 = AS+AI
25 % INFERIOR 25 % SUPERIOR.
Solución.
a) Indice de fácilidad: Este índice mide el grado de dificultad de la pregunta. En la medida que se
acerque al valor 1 la pregunta es más fácil.
Indice de Discriminación 1: Este índice mide la diferencia entre la proporción de acertantes del nivel
superior con la proporción de acertantes en el nivel inferior. En la medida que sea positiva y mayor
indicará que la pregunta fue mayoritariamente respondida por el nivel superior. En la medida que sea
pequeño este índice indica que tales proporciones son muy parecidas, es decir, los acertantes inferior y
superior son muy similares por lo que la pregunta debería ser revisada, si el valor es negativo significa
que los acertantes estuvieron notablemente representados por el nivel inferior, por lo que debe ser
revisada la pregunta.
Indice de discriminación 2 : Este índice mide la proporción de acertantes en el nivel superior respecto
del total de acertantes. Es claro que si es próximo a 1 entonces la proporción de acertantes en el nivel
inferior es próximo a cero. Si el índice es 12 , entonces AI=AS y la pregunta debe ser revisada.
10 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA
b)
1 2 33
IF 0,91 0,85 0,38
ID1 0,18 0,22 0,76
ID2 0,55 0,57 1
La información arroja que las dos primeras preguntas son fáciles, muy poco discriminatorias y si
consideramos el índice de discriminación 2 iguala 12 entonces la proporción de acertantes inferior
y superior son próximos. Luego deben ser revisadas estas preguntas. La pregunta 3 es difícil, hay
una gran diferencia entre las proporción de acertantes en el nivel superior e inferior y casi todos los
aciertos son en el nivel superior, lo cual dice que son preguntas aceptables.
11. En dos autopistas se detectaron las siguientes velocidades de los automóviles ( en km/hr) :
a) ¿Qué se entenderá por andar a mayor velocidad en una autopista que en la otra?.
Se determinará una velocidad que se considerará alta: 100km/hr
b) Se hará una tabla para contabilizar los vehículos que anduvieron a mayor velocidad que 100km/hr
A B
]0, 100] 22 18
]100, ∞[ 8 12
12. Los resultados del análisis del plomo en agua de río realizado por 5 laboratorios fueron:
Solución.
Laboratorio 1 Laboratorio 2 Laboratorio 3 Laboratorio 4 Laboratorio 5
1 2,3 6,5 1,7 2,1 8,5
2 4,1 4 2,7 3,8 5,5
3 4,9 4,2 4,1 4,8 6,1
4 2,5 6,3 1,6 2,8 8,2
5 3,1 4,4 4,1 4,8
6 3,7 2,8 3,7
7 4,2
Media 3,43333 5,08 2,83333 3,7429 7,075
Varianza 0,82222 1,1816 1,005555 0,862449 1,681875
13. En una muestra aleatoria simple de 200 pacientes que reciben terapia en un centro de tratamiento contra
el abuso de drogas, el 60 % pertenecen al grupo étnico I y el resto pertenece al grupo étnico II.
De los miembros del grupo étnico I:
60 fueron tratados por abuso en el consumo de alcohol (A),
25 por el abuso en el consumo de marihuana (B),
20 por abuso en el consumo de heroína, metadona ilegal u otro opioide (C).
El resto fue tratado por abuso en el consumo de barbitúricos, cocaína, anfetaminas, alucinógenos, u otro
opioide además de marihuana (D).
En el grupo étnico II:
la categoría de consumo indiscriminado de drogas y el número de individuos involucrados es como sigue:
A: 28 B: 32 C: 13 y D: resto.
A B C D
I 60 25 20 15 120
II 28 32 13 7 80
88 57 33 22 200
A B C D
I 0,3 0,125 0,1 0,075 0,6
II 0,14 0,16 0,065 0,035 0,4
0,44 0,285 0,165 0,11 1
0, 285 · 0, 4 = 0, 1254 6= 0, 16
No son independientes.
12 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA
14. Cierta compañía desea realizar un estudio sobre el desempeño laboral y la edad de los trabajadores de los
talleres. La compañía posee 100 trabajadores a los cuales se registró su edad y desempeño. La información
obtenida se encuentra en la tabla siguiente:
20 30 40 50
Malo 6 12 2 10
Bueno 20 15 10 5
Excelente 4 8 7 1
20 30 40 50 fi∗
Malo 0,06 0,12 0,02 0,10 0,30
Bueno 0,20 0,15 0,10 0,05 0,50
Excelente 0,04 0,08 0,07 0,01 0,20
f∗j 0,30 0,35 0,19 0,16
f11 = 0, 06 6= f1∗ · f∗1 = 0, 3 · 0, 3 = 0, 09 por lo tanto, se puede afirmar que hay dependencia entre las
variables.
15. Se hizo el siguiente estudio en una ciudad española en la población de taxistas. Se concluyó que :
i) El 70 % tiene más de 40 años y de estos el 60 % es dueño del taxi.
ii) De los menores de 40 años el 30 % es dueño del taxi
a) Haga la tabla bivariada con las frecuencias relativas según la información dada.
b) Si un taxista es escogido al azar, ¿cuál es la probabilidad que sea dueño del taxi?.
c) ¿Cuál es la media de edad entre los taxistas.?
d ) ¿Son independientes las variables edad / situación?
Solución.
X − M oda
As =
S
4. Se tiene x1 , x2 , ..., xn datos ordenados de menor a mayor. Se llama percentil k , pk , al valor bajo el cual
k
esta el 100 de los datos.
De los datos :
5. La Empresa YOGULIN encarga permanentemente estudios de mercado para decidir cuál de sus productos
yoghurt requiere ser modificado, mayor publicidad o ser retirado del mercado. Como estudio preliminar
se determina el volumen de ventas mensual en miles de unidades. Los datos del último mes son:
7. En las tablas bivariadas , la variable X tiene r marcas de clases X1 , X2 , ..., Xr ; y la variable Y tiene s
marcas de clases Y1 , Y2 , ...., Ys . Todas las clases- de X e Y - son marcas de clases numéricas.
Se define “la media de X condicionada a la clasej de Y”, que denotamos por Y j , por:
r
X r
X fij
Yj = Xi · fi/j = Xi ·
i=1 i==1
f∗j
La “función varianza condicional de la clase i de X, dada la clase j de Y ” que denotamos por Si/j ,se
define por:
r
X
Si/j (θ) = (Xi − θ)2 · fi/j
i=1
8. Se conoce que los consumos familiares de bienes esenciales (CBE), están relacionados con los consumos
familiares de energía eléctrica (CEE) mediante la función: CBE = α · CEE − β
Si el promedio y la desviación estándar de los CEE se estiman en US$ 40 y US$ 15 respectivamente.
9. Un Agrónomo está interesado en averiguar el peso de una nueva variedad de manzanas. Elige una muestra
de manzanas obteniendo los siguientes resultados en gramos:
Determine qué porcentaje de las manzanas muestreadas tienen peso en los intervalos:
a) X − S, X + S
b) X − 2 · S, X + 2 · S
10. Una empresa lechera desea aumentar la producción de leche usando 4 tratamientos T1 ; T2 ;T3 ;T4 . Se tienen
vacas de raza Holsteins y Goldsteins de 2 tipos de edades ( Edad1 y Edad 2). ¿Cómo realizaría usted
este experimento para decidir qué tratamiento usar?. Explique con detalle. Invente los datos obtenidos y
determine una media y varianza para la producción de leche.
11. El % de permeabilidad en una tela es una medida de calidad de este producto. El encargado del Control
de Calidad tiene la sospecha de que este indicador se encuentra estrechamente relacionado con el % de
poliéster de la misma. La siguiente tabla muestra los análisis de una muestra de 120 telas.
% Poliéster
% permeabilidad 17.12 18,76 20,4 22,04 23,68
60,69 .... .... ... 2 4
61,82 ... .... ... 6 9
62,95 ... 1 2 8 1
64,08 .... 6 34 5 9
65,21 2 2 12 .... ....
66,34 ... 9 .... .... ....
67,47 15 1 .... ..... ....
a) Determine qué telas, considerando los distintos niveles de poliéster, tiene un % de permeabilidad más
homogéneos.
b) Si se quiere analizar la variabilidad total en el % de permeabilidad, ¿es razonable utilizar como variable
estratificadora el % de poliéster?.
Capítulo 2
Regresión
Hemos puesto este capítulo separado de la sección estadística univariada y bivariada, pues ella encierra una
técnica de lo que más tarde llamaremos estimación puntual.
La regresión es una herramienta que nos permite, usando información suficiente,
X x1 x2 ... xn
Y y1 y2 ... yn
predecir lo que ocurrirá o estimar un valor de Y, yk , que no haya sido dado por tal experiencia en un valor de
X, xk . Para ello, busca encontrar una curva que satisfaga que la suma de las distancias de los datos (xi , yi ) a
la curva sea mínima. La pregunta es ¿qué curva? La respuesta dependerá del experimento; pero si este no nos
dice nada probemos con la más simple de todas las curvas, la recta. Lo que esperamos es que los puntos de ella
conllevarán la tendencia de los valores de nuestros datos. Por lo tanto, si la recta es L : y = a · x + b , entonces
una estimación de yk , para el valor de X , xk , sería a · xk + b.
Este grupo de problemas podemos dividirlo en 2
(I) Problemas que encuentran o usan relaciones algebraicas entre índices estadísticos.
(II) Problemas que ajustan la mejor curva.
El primer grupo; usa la cultura matemática del alumno para encontrar o usar relaciones algebraicas entre los
índices estadísticos; usados en regresión
Estos índices son: Correlación, Coeficiente de determinación, Varianza de los errores, estimadores de la pendiente
y del intercepto de la recta ajustada.
El segundo grupo ajusta la curva, verifica si es la mejor curva a ajustar y si es posible ajustarla, y estima un
valor futuro con la curva ajustada
17
18 CAPÍTULO 2. REGRESIÓN
2. Se sabe que en el ajuste de una recta, y = a · x + b ,entre los datos x1 , x2 , ..., xn independientes y los
dependientes y1 , y2 , ..., yn se obtiene que a = Cov(X,Y
S2
)
si r es la correlación muestral. Demuestre que
x
a·S
r= SY .
Solución.
Cov(X,Y ) Cov(X,Y ) SX ·Cov(X,Y ) SX ·a
Corr(X, Y ) = SX SY y como a = SX2 entonces Corr(X, Y ) = SX2 ·S
Y
= SY
Pn 2
i=1 (ŷi −y) varianzaexplicadaporlarectaderegresión
3. Se sabe que R2 = Pn 2 = donde ŷi = â · xi + b̂. Sabiendo que
i=1 (yi −y) varianzaT otal
2 2
b̂ = y − â · x demuestre que R = r
Solución.
Pn Pn Pn Pn
i=1 (yˆi − y)2 = i=1 (â · xi + b̂ − y)2 = i=1 (â · xi + b̂ − b̂ − â · x)2 = (â)2 · i=1 (xi − x)2
Luego
(ŷi −y)2 (â)2 · n (x −x)2
Pn P 2
SX
R2 = Pi=1
n 2 = Pn i=1 i 2 = (â)2 · 2 = r2 ( por ejercicio anterior )
i=1 (yi −y) i=1 (y i −y) SY
Pn ∗ 2
i=1 (yi −yi )
4. Demuestre que la varianza residual Se2 = n ; yi∗ = â · xi + b̂; es equivalente con Se2 = (1 − r2 ) · SY2
; siendo SY2 la varianza de Y.
Solución
Pn ∗ 2 Pn 2
i=1 (yi −yi ) i=1 ((yi −y)−a·(xi −x))
Se2 = n = n
2
−2â·(xi −x)·(yi −y)+aˆ2 ·(xi −x)2 )
Pn
i=1 ((yi −y)
Se2 = n
((yi −y)2 −2â· n (xi −x)·(yi −y)+aˆ2 · n 2
Pn P P
i=1 (xi −x) )
Se2 = i=1 i=1
n
Cov(X,Y )2 Cov(X,Y )2 Cov(X,Y )2
Se2 = SY2 − 2 · 2
SX
+ 2
SX
= SY2 − 2
SX
= SY2 − r2 · SY2
ln(y) = ln(α) − βx
2. Se determinaron las siguientes mediciones del pulso a 40 personas saludables, de edad similar, y sexo
masculino, al serles inoculado un antibiótico que se estima provoca cierta alteración en el ritmo del pulso.
Se determinaron 4 medidas distintas 0.1ml , 0.2ml, 0.3ml, 0.4ml y los resultados fueron ( el ritmo normal
es de 60 pulsaciones por minuto)
0,1 53 65 54 55 60 65 58 59 60 63
0,2 51 67 68 58 59 54 57 65 68 69
0,3 56 52 57 59 60 66 65 64 53 58
0,4 54 65 66 68 69 70 52 51 50 69
2.2. PROBLEMAS DE AJUSTE DE CURVAS. 19
Solución. a) Realizando una tabla de contabilidad de los valores de pulsaciones normales y anormales
0,1 5 5
0,2 3 7
0,3 4 6
0,4 0 10
se observa que la columna ( tercera) de anormalidad tiene una tendencia a aumentar con lo cual da indicios
de que hay una tendencia a la anormalidad.
b) Haciendo el cálculo de correlación entre dosis y promedio de pulsaciones
0,1 59,2
0,2 61,6
0,3 59
0,4 61,4
el coeficiente de correlación ρ = 0, 37 es muy bajo para ajustar una recta.
230
3. El crecimiento de una colonia de abejas está determinado por y =
1 + α e−βt
donde y representa el número de abejas y t el tiempo en meses. Se obtuvieron los siguientes datos:
t 1 13 23 33 53 63
y 5,746 157,496 227,412 229,935 210 215
4. Una compañía de seguros considera que el número de vehículos y que circulan por una determinada
autopista a más de 120[km/h] puede ponerse en función del número x de accidentes que ocurren en ella.
Durante 5 días se recabó la información que se resume:
X = 4, 8, Y = 14, 2, SXY = 13, 64, SY = 4, 578, Se2 = 0, 20905689
Determine la ecuación de la recta ajustada y determine el número de vehículos correspondiente a 7
accidentes.
SX
Solución. â · SY =r
Usando el problema 4 r2 = 0, 99 o r = 0, 995
SXY r·SY
Luego SX = SY ·r = 2, 9944 y por tanto â = SX = 1, 5212 ; b̂ = y − â · x = 6, 8982
Por tanto la recta ajustada es : y = 1, 5212 · x + 6, 8982
Si x = 7 entonces y = 17, 5466
5. Se entrevistó a 48 familias. Los datos que están bajo los valores 1000,1500 y 2500 representan los gastos
de esas familias cuando su renta es 1000, 1500 y 2500 dólares.
Solución.
AHORRA NO AHORRA PROMEDIO
1000 12 4 900,29
1500 14 2 1248,24
2500 13 3 2109,59
2.2. PROBLEMAS DE AJUSTE DE CURVAS. 21
2
a) P (1500/no ahorra) = 8
Solución.
i) Transformación de la ecuación
αβ x = 1 − sen y1
ln(α) + x ln(β) = ln 1 − sen y1
ii) Transformación de los datos.
xi , ln 1 − sen y1i
1
8. Se tiene la curva y = . Si tuviera los datos (xi , yi ) explique cómo realizaría la determinación
ln(2 + αxβ )
de α y β del modelo.
Solución.
i) Transformación de la ecuación
1
α · xβ = −2 + e Y
1
ln(α) + β ln(x) = ln e Y − 2
ii) Transformación de los datos.
1
ln (xi ) , ln e yi − 2
1
9. Las variables X e Y están vinculadas por la expresión y = .
5 + αeβ·x
Si tuviera los datos (xi , yi ), explique cómo realizaría la determinación de α y β del modelo.
Solución.
i) Transformación de la ecuación.
22 CAPÍTULO 2. REGRESIÓN
1
α · eβx = y −5
ln(α) + β · x = ln( 1−5y
y )
10. En una práctica de laboratorio se midieron del péndulo simple los siguientes datos de longitudes y periodos.
Solución.
√
L 0,707 0,742 0,775 0,806 0,837
T 1,4 1,46 1.53 1.6 1.66
√ 2π 4π 2
Se ajustará la recta T = a · L donde a = √
g. Luego gb = a2 .
Por tanto, b
a = 1, 978888 y luego gb = 10, 081
11. En un determinado hotel, el responsable de la piscina del mismo debe añadir periódicamente un compuesto
de cloro al agua para mantenerla en buenas condiciones. Dicha persona ha observado la relación existente
entre el número de días que dura el efecto del producto (variable X) y los gramos de cloro empleado
(variable Y), obteniendo los siguientes resultados:
SXY = 5, 4 ; SY2 = 12 gr2
El porcentaje de varianza explicada por la regresión lineal de X sobre Y sería del 78,387 %.
A partir de la regresión lineal de X sobre Y , el valor estimado para 21 gramos de cloro sería de 4
días.
Y = 25 [gr]
A partir de esta información, determine rectas de regresión y, en función de ellas, calcule qué cantidad de
cloro habría que utilizar para que los efectos del producto durasen 7 días.
Solución.
SXY = 5, 4 ; SY2 = 12 gr2
SY = 3, 464 R2 = 78, 387 % ; r = 88, 54 %
sXY 5,4
r= SX ·SY = 0, 8854 , luego SX = 0,8854×3,464 = 1, 761
SY
â = SX · r = 1, 74 y = â · x + b̂ ; 21 = 1, 74 · 4 + b̂ ; b̂ = 14, 04
La curva a ajustar es : y = 1, 74x + 14, 04. Para x = 7 se obtiene y = 26, 22
2.3. EJERCICIOS PROPUESTOS. 23
!"#"#$%"&'
+((#
'!"# '!(#
'((#
%((#
%((# )&(#
)((#
"!"#
"((#
&'(#
*((#
&((#
!!"#
$%"#
!((#
$((#
!"#
(#
$+'*# $+'"# $+')# $+'%# $+''# $+'+# $++(# $++$# $++!#
2. El precio de vivienda en Utarek, Marte, crece rápidamente con respecto al tamaño - debido a la limitación
extrema de espacio. La siguiente tabla muestra el precio de vivienda en Zonares para varios tamaños de
domicilios.
3. Se han colgado sucesivamente del extremo de un resorte cinco masas (X), en gramos,y se ha registrado
los alargamientos (Y ), en milímetros, producidos por las cargas. He aquí la tabla.
X ( g) 3 4 5 6 7
Y(mm) 1.2 1.9 2.4 3 3.7
a) Dibuje la nube de puntos.
b) Encuentre la recta de regresión, el coeficiente de correlación lineal y deduzca lo que se estiraría el
muelle si colgáramos una masa de 15 gramos.
b
4. La demanda de un producto sigue la ecuación Q = ea− p , siendo p el precio y Q la demanda .
Si se tienen los siguientes datos:
24 CAPÍTULO 2. REGRESIÓN
¿Cuál seria la ecuación calculada de la demanda?. ¿Cuánto valdría la demanda para un precio de 3 y de
6 ?.
5. La siguiente tabla se refiere al número Y de bacterias por unidad de volumen presentes en un cultivo
después de X horas.
X 0 1 2 3 4 5 6
Y 32 47 65 92 132 190 275
a) ¿Cuál es el modelo a ajustar?
b) Verificar si el ajuste de la curva es aceptable.
c) ¿Cuántas bacterias habrá por unidad de volumen en X = 3,5hrs.?
i=1 (yi − y)
7. A continuación se presentan los valores experimentales de la presión de una cierta masa de gas y los valores
correspondientes al volumen.
De acuerdo a los principios termodinámicos, debería existir una relación entre las variables de la forma:
PV β = C
x 1 2 3 4
y 1.908 1.173 0.945 0,8223
1
10. Dada la curva y = ln(2+α·xβ )
verificar si es posible ajustarla a los datos
X Y
1 0,14
1,3 0,1098
1,5 0,1134
1,8 0,0912
2,23 0,0546
2,43 0,0345
5,78 0,000356
6,01 0,0002143
Capítulo 3
Equiprobabilidad
En esta sección se agrupan problemas diversos donde el método de conteo es una herramienta imprescindible y
la equiprobabilidad es la medida principal. Hay un grupo de problemas que tiene que ver con la probabilidad
condicional, medida que pretende medir el efecto que provoca un evento sobre otro.
Para los problemas de métodos de conteo es importante que se vea la diferencia entre permutación y combina-
toria. Para ello recordemos que la permutación es una ordenación generalmente lineal, y que la combinatoria es
el número de formas de extraer subconjuntos de k elementos de un conjunto de n elementos (n > k).
Si se tienen n elementos diferentes, alineados, el número de permutaciones es n!
!
n n!
Si un conjunto tiene n elementos, el número de subconjuntos de k elementos (k ≤ n) es = (n−k)!·k!
k
En los problemas 5, 6 , 7 y 8 se da un mismo problema con distintas formas de disponerlos. Es importante
analizar con detención tales problemas.
Para los problemas de equiprobabilidad es importante describir con claridad cuál es el espacio muestral Ω y
su cardinalidad #Ω y cuál es el evento a medir A con su respectiva cardinalidad #A. La equiprobabilidad es
definida por :
#A
P (A) =
#Ω
Para los problemas de probabilidad condicional no sólo es importante definir cuál es el espacio muestral Ω y
su cardinalidad, #Ω, y cuál es el evento a medir A con su respectiva cardinalidad #A; también se debe definir
cuál es el evento condicionante B y su cardinalidad #B. La probabilidad condicional de A dado el conjunto B
se define por:
P (A ∩ B)
P (A/B) =
P (B)
Para los problemas del uso del teorema de Bayes se precisa definir cuál es el espacio muestral Ω y su cardinalidad,
#Ω y cuál es el evento a medir A con su respectiva cardinalidad #A. Además se debe precisar si el espacio
muestral está particionado por eventos {Ei : i = 1, 2, 3..., n}. El teorema de Bayes mide el efecto que provoca el
evento A, un evento cualquiera, sobre una de las partes Ei . El teorema de Bayes establece:
P (A/Ei ) · P (Ei )
P (Ei /A) = Pn
j=1 P (A/Ej ) · P (Ej )
27
28 CAPÍTULO 3. EQUIPROBABILIDAD
1. La fórmula de Sturges se genera para ver cuál es el ancho de la!barra de un histograma. Asumiendo que k
k−1
es el número de clases y que en la clase i debe haber datos, de los n datos existentes, entonces
i
demuestre que k = 1 + 3, 32log(n) ( fórmula de Sturges).
Solución.
!
Pn n
Debemos recordar el teorema del binomio:(a + b)n = i=0 · ai · bn−i
i
!
n
Pn n
Luego si a = b = 1 el teorema del binomio queda 2 = i=0
i
! !
Pk−1 k−1 k−1
i=0 = n ; pues en cada intervalo hay y el número total de datos es n.
i i
Por el teorema del binomio.
!
Pk−1 k−1
i=0 = 2k−1
i
Luego se tiene n = 2k−1 , aplicando logaritmo en base 10, (k − 1)log(2) = log(n) por tanto k = 1 + log(n)
log(2) =
1 + 3, 32log(n).
2. El juego del Kino consiste en escoger 14 números de entre los primeros 25 números naturales({1,2,3,4...,25}).
Con ellos se genera una tarjeta con los números escogidos y ordenados de menor a mayor.Determinar el
número de cartillas con 14 números consecutivos.
Solución.
El cartón del Kino es similar a una matriz de 5x3 donde la celda correspondiente a la fila 5 columna
3 queda tachada, pues se ponen sólo 14 números. Como se deben sacar 14 números de los 25 primeros
números naturales el problema se resuelve con la combinatoria.
!
25
14
3. En el juego del Kino se sacan 14 números del conjunto {1, 2, 3, 4, ..., 25}. Teniendo como referencia el
cartón ganador, demostrar que el número de cartones que! se pueden formar con al menos 3 números del
25
cartón ganador del juego anterior es equivalente a
14
Solución.
n p q
En este problema usamos! el resultado del
! teorema del
! binomio. Si (a + 1) = (a + 1) · (a + 1) , con
n P p n−p
p + q = n entonces = kj=0 · ; k ∈ {0, 1, 2, .., n}y k − j ≤ (n − p)
k j k−j
El cartón ganador tiene 14 números, con lo cual nos quedan fuera 11 números. Si queremos construir una
cartilla de i números del cartón ganador,
! entonces debemos escoger i números del conjunto del cartón
14
ganador, lo cual lo hacemos de , y de los números fuera del cartón ganador escogemos 14 − i
i
3.1. EJERCICIOS DE CONTEO. 29
!
11
números , que los podemos escoger de . Luego, el número de formas de escoger i números del
14 − i
! !
14 11
cartón ganador es · .
i 14 − i
Ahora, como puede ser i ∈ {3, 4, ...., 14}entonces el número
! de formas
! de tener un cartón con i ∈
P14 14 11
{3, 4, ...., 14} números del cartón ganador es i=3 · .
i 14 − i
! ! !
n Pk p n−p
Veamos esta expresión a la luz de la expresión = j=0 ·
k j k−j
Aquí n = 25 ; i = j ; p = 14 = k ; n − p = 11; pero k − j ≤ 11; con lo cual j ≥ 3.
! ! ! ! ! !
n Pk p n−p P14 14 11 25
Luego = j=0 · se transforma en i=3 · =
k j k−j i 14 − i 14
4. El juego del Kino consiste en escoger 14 números de entre los primeros 25 números naturales({1,2,3,4...,25}).
Con ellos se genera una tarjeta con los números escogidos y ordenados de menor a mayor. Determinar el
número de cartillas con un 6 en la posición 4 y un 12 en la posición 8.
Solución. !
25
El espacio muestral es : Ω = {cartones del Kino}; #Ω =
14
El evento a calcular es su cardinalidad: son todos los cartones de la forma
6
12
!
5
En las tres primeras celdas van números del conjunto {1, 2, 3, 4, 5}:
3
!
5
En las celdas del medio van números del conjunto {7, 8, 9, 10, 11} :
3
!
13
En las 7 celdas finales van números del conjunto {13, 14, 15, ..., 25} :
7
! !
5 5
El resultado final: Por cada elección de las formas de escoger los tres primeros números hay
3 3
! !
5 5
formas de escoger los segundos números, por lo tanto tenemos · . Por cada una de estas
3 3
! ! !
5 5 13
· formas de llenar las 3 primeras y 3 del medio hay formas de llenar las últimas 7
3 3 7
! ! !
5 5 13
celdas. Luego, el resultado final es · · .
3 3 7
5. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero?.
30 CAPÍTULO 3. EQUIPROBABILIDAD
Solución. !
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
Número
! de formas
! de escoger
! los 7 libros de historia, 5 libros de matemáticas y 6 libros de química :
12 15 17
· ·
7 5 6
Número de formas de disponer linealmente 7 libros de historia, 5 libros de matemáticas y 6 libros de
química : 18!
Luego, el número total de formas
! de disponer
! linealmente
! 7 libros de historia, 5 libros de matemáticas y
12 15 17
6 libros de química es · · · 18!.
7 5 6
6. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero de tal forma que estén juntos por
temas( los de matemáticas juntos, los de química juntos y los de historia )?.
Solución. !
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
El número de formas de disponerlos linelamente
! tal que los!de historia estén
! primero, luego los de mate-
12 15 17
máticas y finalmente los de química es: · 7! · · 5! · · 6!.
7 5 6
Se debe considerar que pueden estar las materias en otro orden y eso se hace de 3! . Luego,
! el número
! de
12 15
formas de disponer en el librero de tal forma que estén juntos por temas es : · 7! · · 5! ·
7 5
!
17
· 6! · 3!.
6
7. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero de tal forma que estén juntos por temas(
los de matemáticas juntos, los de química juntos y los de historia juntos) y primero los de matemáticas,
luego los de química y finalmente los de historia?.
Solución.
Realizando lo hecho anteriormente:
3.1. EJERCICIOS DE CONTEO. 31
!
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
El número de formas de disponerlos linelamente
! tal que los!de matemáticas
! estén primero, luego los de
15 17 12
química y finalmente los de historia es: · 5! · · 6! · · 7!.
5 6 7
8. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero de tal forma que estén juntos por temas(
los de matemáticas juntos, los de química juntos, los de historia juntos) y primero los de matemáticas,
luego los de química y finalmente los de historia y, además, de esos grupos ordenados alfabéticamente
según los nombres de los autores.
Solución.
Realizando lo anteriormente hecho.
!
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
Como deben ir ordenados por materia, alfabéticamente según los nombres de los autores, sólo se puede
hacer de una forma. Para esto se deben juntar por materias y dentro de esas materias no se hace una
permutación, pues solo hay una sola forma de ordenarlos alfabéticamente dentro de cada materia. Como
se debe decidir qué
! materia! va primero
! y cuál después, eso se hace de 3! formas. Luego, el número de
15 17 12
formas es: · · · 3!.
5 6 7
9. A un evento se presentan n parejas formadas por padre e hija. Se sientan en 2n sillas dispuestas linealmente.
¿De cuántas formas se pueden sentar tal que padre e hija estén juntos?
Solución.
Se sientan las parejas, padre e hija juntos. La forma de hacerlo es de n! formas , pues hay n parejas.
Supongamos que fijamos una de esas n! formas y cada pareja se puede sentar (papá,hija) ó (hija,papá)
Además se debe considerar que pueden haber sólo 1 pareja, sólo 2 parejas, sólo 3 parejas,..., las n parejas
que se intercambien, respecto de la original.
Esto se logra de 2n formas. Por lo que se pueden sentar de 2n · n!
10. Se tienen 20 pares de guantes rojos y 10 pares de guantes blancos. Si se toman los guantes uno a uno sin
reponerlos, determine la probabilidad de que en la extracción k y k + 1 salgan seguidamente , por primera
vez, dos guantes del mismo color, siendo k impar. Asuma que se hacen a lo más 10 extracciones .
Solución.
32 CAPÍTULO 3. EQUIPROBABILIDAD
Estudiemos el caso que es el valor de k ∈ {1, 2, 3, ..., 30} y el color que se repetirá.
Sea el evento Bk : Sale blanco en las extracciones k y k + 1, con k impar.
Sea el evento Rk : Sale rojo en las extracciones k y k + 1, con k impar.
Caso Bk :
No puede empezar con rojo pues blanco saldría en las pares. Por lo tanto k − 1 sería blanco al igual que
k y k + 1, por lo tanto en k , k + 1 no saldría, por primera vez, el color blanco dos veces seguidas. Por lo
tanto, para este caso, se debe empezar con blanco, luego rojo, blanco y así sucesivamente.
Luego
10 20 9 19 10 − ( k−1
2 ) 20 − k−12
P (Bk ) = · · · · ... · · ,
30 29 28 27 30 − (k) 30 − (k + 1)
con k ∈ {1, 3, 5, 7, ..., 11}
Caso Rk :
Por el mismo argumento anterior
20 10 19 9 20 − ( k−1
2 ) 10 − k−12
P (Bk ) = · · · · ... · · ,
30 29 28 27 30 − (k) 30 − (k + 1)
Solución.
a) Los ángulos que interesan son [120◦ , 180◦ ] luego se obtiene por equiprobabilidad. El evento A es que
“cuerda tenga mayor longitud que el lado del triángulo”
180 − 120 1
P (A) = =
180 3
b) La porción de radio que interesa es 0, 21 luego por equiprobabilidad
1
2 −0 1
P (A) = =
1 2
Sumando, P (A ∩ B) + P (A ∩ B c ) = p · P (B) + q · P (B c )
P (A ∩ (B ∪ B c )) = p · P (B) + q · (1 − P (B)) ; pues (A ∩ B) y (A ∩ B c ) son disjuntos.
P (A) = (p − q) · P (B) + q
A A∩B B
17. Un estudiante debe dar tres exámenes: física, química y matemáticas. Los resultados de estos exámenes
son independientes. Si la probabilidad de aprobar matemáticas es 1/3, química 1/4 y física 2/5. ¿Cuál es
la probabilidad que sólo apruebe matemáticas?, ¿cuál es la probabilidad que repruebe las tres materias?
Solución.
Sean los eventos:
34 CAPÍTULO 3. EQUIPROBABILIDAD
1 3 3 3
P (M ∩ F c ∩ Qc ) = P (M ) · P (F c ) · P (Qc ) = 3 · 5 · 4 = 20
2 3 3 6 3
P (M c ∩ F c ∩ Qc ) = P (M c ) · P (F c ) · P (Qc ) = 3 · 5 · 4 = 20 = 10
Q3
18. a) Sean A1 , A2 , A3 tres eventos independientes, demuestre que P (A1 ∪ A2 ∪ A3 ) = 1 − i=1 (1 − P (Ai ))
Usted escoge una caja al azar, extrae una ficha y la devuelve a su caja. Si observó una ficha blanca,
en la segunda extracción se escoge la Caja 1; si observó una ficha negra , escoge la Caja 2 para la
segunda extracción. Si sabe que la primera ficha vino de la Caja 1, calcule la probabilidad que la
segunda ficha sea blanca.
Solución.
a) P (A1 ∪A2 ∪A3 ) = P (A1 )+ P (A2 )+ P (A3 )− P (A1 ∩A2 )− P (A1 ∩A3 )− P (A2 ∩A3 )+ P (A1 ∩A2 ∩A3 )
Q
(1−P (Ai )) = 1−P (A1 )−P (A2 )−P (A3 )+P (A1 ∩A2 )+P (A1 ∩A3 )+P (A2 ∩A3 )−P (A1 ∩A2 ∩A3 )
Q3
por tanto P (A1 ∪ A2 ∪ A3 ) = 1 − i=1 (1 − P (Ai ))
OTRA SOLUCION.
Q3
P (A1 ∪ A2 ∪ A3 ) = 1 − i=1 (1 − P (Ai )) = 1 − P (Ac1 )P (Ac2 )P (Ac3 ) = 1 − P (Ac1 ∩ Ac2 ∩ Ac3 ) =
1 − P ((A1 ∪ A2 ∪ A3 )c )
b) La figura siguiente representa la situación
Blanca
C1
c/(c+d)
Negra
b/(a+b)
C1
Blanca
a/(a+b)
Blanca
C2
a/(a+b)
bc a2
Se obtiene que la probabilidad pedida es : (a+b)·(c+d) + (a+b)2
19. Se tienen dos cajas iguales con tapa en cuyo interior hay un número de monedas. Llamaremos caja 1 a la
que contiene 5 monedas de $100 y 2 monedas de $500, y caja 2 a la que tiene 7 monedas de $100 y 5 de
3.2. EJERCICIOS DE PROPIEDADES DE PROBABILIDAD Y EQUIPROBABILIDAD. 35
$500. Se extrae una moneda de cada caja. Calcular la probabilidad que la suma de ambas monedas sea
$600.
Solución.
Se puede describir la información con una tabla:
100 500
C1 5 2
C2 7 5
El evento a medir :que la suma de los valores de las monedas sea de $600
20. En una baraja (naipe inglés) se han suprimido varias cartas. Entre las que quedan se da la siguiente
probabilidad de ser extraída: P (rey) = 0, 5 ; P (coraz ón) = 0,4 ; P (noseareynicoraz ón) = 0, 6
a) ¿Está entre ellas el Rey de corazón?. En caso afirmativo indique cuál es su probabilidad.
b) ¿Cuántas cartas hay?. Justifique.
Solución.
El espacio muestral: Ω = {cartas que quedaron}
Cardinalidad del espacio muestral: #Ω = n
n◦ de reyes que quedaron
P (Rey) = 0,5 = n ; n = total de cartas que quedaron.
n◦ de corazones que quedaron
P (coraz ón) = 0,4 = n ;n = total de cartas que quedaron.
21. El juego de Parker Brothers “Cluedo”, creado en 1944, es el clásico juego de “¿quién es el culpable?”. El
juego se basa en el asesinato de “Mr. Body” y hay seis sospechosos (la Sra. White, la Sra. Peacock, la
Srta. Scarlet, el Coronel Mustard, el Profesor Plum, y el Sr. Green), seis armas (cuchillo, revólver, tubo
de plomo, candelabro, soga y llave inglesa), y nueve habitaciones donde puede haber ocurrido el asesinato
(salón de baile, conservatorio, biblioteca, sala de billar, cocina, comedor, estudio, salón y vestíbulo). Hay
un naipe para cada sospechoso, arma y habitación, por un total de 21 naipes. Se selecciona al azar un
naipe de cada tipo y se los coloca en un sobre para crear la escena del crimen. Los 18 naipes restantes se
36 CAPÍTULO 3. EQUIPROBABILIDAD
mezclan y distribuyen entre los jugadores . Cada jugador elige ser un sospechoso y, en cada turno, cada
jugador adivina un escenario posible para el asesinato usando los naipes que recibió, con el fin de descartas
posibles escenarios. Cada vez que adivino una escena, mi oponente debe mostrar si en sus naipes tiene al
menos un sospechoso, un arma o una habitación que yo haya nombrado. El objetivo del juego es adivinar
la escena correcta antes de que lo haga el oponente. Si dos personas juegan :
¿Cuál es la probabilidad de acertar el sospechoso, el arma y el lugar sin ver mis cartas?
De los 18 naipes que quedan, mi oponente y yo recibimos nueve cada uno. En mi mano tengo las
siguientes cartas: soga, llave inglesa, Sr. Green, Sra. Peacock, Profesor Plum, vestíbulo, biblioteca,
salón y cocina. ¿Cuál es la probabilidad de acertar el sospechoso, el arma y el lugar?
Realice un estudio de qué es lo que debiera haber recibido para aumentar mis probabilidades de
acierto.
Solución.
a) El espacio muestral es
22. Se presentan 44 solicitudes a ciertos puestos de una empresa. De entre los solicitantes hay 29 ingenieros
mecánicos, 41 ingenieros entre mecánicos o eléctricos, 8 son ingenieros eléctricos y químicos, 9 son ingenie-
ros mecánicos y eléctricos, y 1 tiene la triple titulación. Se escoge un postulante, ¿cuál es la probabilidad
que tenga titulación única de ingeniero eléctrico?
Solución. Aquí una representación de la situación
1
Z
M
8
20-x
E
3.3. EJERCICIOS DE PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES. 37
|M ∪ E| = 41 = 29 + 7 + z
23. Usted lanza 10 monedas honestas y se contabiliza el número de caras. Defina el espacio muestral de este
experimento y determine la probabilidad que salgan k caras, con k ≤ 10. Solución.
El espacio muestral: los resultados de cada moneda
24. En un grupo de libros hay 10 de física, 15 de química y 12 de biología. Se sacan 12 libros ¿cuál es la
probabilidad de que 5 de ellos sean de química?.
Solución.
!
37
El espacio muestral Ω = {grupo de 12 libros}; #Ω =
12
! !
15 22
El evento a medir A = {grupos de Ω con 5 libros de quı́mica}; #A = ·
5 7
15 ·
22
5 7
Probabilidad del evento : P (A) =
37
12
Morena No Morena
Sudamericana 0,3
Centroamericana 0,2
Norteamericana 0,5
Morena No Morena
Sudamericana 0,21 0,09 0,3
Centroamericana 0,18 0,02 0,2
Norteamericana 0,2 0,3 0,5
0,59 0,41
26. Supongamos que cierta prueba para detectar la presencia de una enfermedad en un individuo da resultado
positivo ( detecta la enfermedad) en un individuo enfermo con probabilidad 0,99 y en un individuo sano
con probabilidad 0,02. Se supone, en base estudios previos, que la incidencia de esta enfermedad en cierta
población es 0,001. Se selecciona al azar un individuo de esa población, se le aplica la prueba y el resultado
es positivo, ¿cuál es la probabilidad de que en efecto padezca la enfermedad?
Solución.
El espacio muestral es: Ω =El conjunto de las personas de esa población.
La partición : E = {personas/estánenf ermas}; E c = {personas/N oestánenf ermas}
El evento a contrastar: P = {personas/dapositivo}
¿ Qué se quiere medir?: P (E/P )
Usando el Teorema de Bayes:
P (P/E)·P (E)
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c )
Información.
P (P/E) = 0, 99 ; P (P/E c ) = 0, 02; P (E) = 0, 001 . y P (E c ) = 0, 999
Luego:
P (P/E)·P (E) 0,99·0,001
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c ) = 0,99·0,001+0,02·0,999
27. En una empresa se sabe que el 1 % de los trabajadores es alcohólico. Después de un estudio se determinó
que el porcentaje de ausentes que se sabe son alcohólicos, duplica a los ausentes, que se sabe que no son
alcohólicos. Se escoge una persona y resulta estar ausente. Determinar la probabilidad que sea alcohólica.
Solución.
El espacio muestral es: Ω =, el conjunto de los trabajadores de esa empresa.
3.3. EJERCICIOS DE PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES. 39
Información.
P (P/E) = 2 · P (P/E c ) ; P (E) = 0, 01 . Se deduce P (E c ) = 0, 99
Luego:
P (P/E)·P (E) 2·P (P/E c )·P (E) 2·P (E) 2·0,01
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c ) = 2·P (P/E c )·P (E)+P (P/E c )·P (E c ) = 2·P (E)+P (E c ) = 2·0,01+0,99
28. En un monedero hay dos compartimentos. En el primero hay 3 monedas de $100 y 4 monedas de $500.
En el segundo compartimento hay 2 monedas de $500 y 5 monedas de $100. Se saca una moneda del
monedero y resulta ser de $100, ¿cuál es la probabilidad que haya sido sacada del compartimento 2?
Solución.
El espacio muestral es: Ω =, las monedas el monedero.
La partición : E = {monedas/compartimento1}; E c = {monedas/compartimento2}
El evento a contrastar: C = {monedas/$100}
¿Qué se quiere medir?: P (E/C)
Usando el Teorema de Bayes:
P (C/E c )·P (E c )
P (E C /C) = P (C/E)·P (E)+P (C/E c )·P (E c )
Información.
3 7 5 3
P (C/E) = 7 ; P (E) = 12 ; P (E c ) = 12 ; P (C/E c ) = 5
29. Hay 3 estados E1 , E2 , E3 por los que han de pasar un grupo de N individuos, y cada estado tiene los
mismos 4 niveles, Ni1 , Ni2 , Ni3 , Ni4 ; i = 1, 2, 3. Si se conocen: P (N2t /N1s ) = pst y P (N3t /N2s ) = qst ;
P4
s, t ∈ 1, 2, 3, 4, demostrar que P (N3l /N1s ) = k=1 P (N2k /N1s )P (N3l /N2k )
Solución.
P (N3l /N1s ) : significa el porcentaje de individuos que estando en el nivel s del estado 1 pasan al nivel l,
del estado 3
Si en el nivel s del estado 1 hay n1s individuos ( de los N ). De estos pasan al estado 2, nivel k, un número
igual a n1s · psk con k = 1, 2, 3, 4. De esos van al nivel l, del estado 3, un número igual a n1s · psk · qkl .
Luego el número total de individuos del nivel s, del estado 1 que van al nivel s del estado 3 es:
P4
k=1 n1s · psk · qkl
P4
Por tanto en porcentajes es k=1 psk · qkl , que es equivalente a
P
P (N3l /N1s ) = 4k=1 P (N2k /N1s )P (N3l /N2k )
30. Sea A un conjunto de 8 números naturales donde hay 5 números pares y 3 impares. En B hay 6 números
naturales, 2 pares y 4 impares. Se meten los números de A y B en una bolsa y una persona saca un número
al azar, que resulta ser par. ¿Cuál es la probabilidad que sea un número del conjunto A?
Solución.
- Espacio muestral : A ∪ B
40 CAPÍTULO 3. EQUIPROBABILIDAD
8 6
- Partición : A y B P (A) = 14 ; P (B) = 14
- Eventos P: par y P c :impar.
P (P/A)P (A)
- Qué se mide : P (A/P ) = P (P/A)P (A)+P (P/B)P (B)
5 4
P (P/A) = 8 P (P/B) = 6
P (P/A)P (A)
-Evaluar con esos datos P (A/P ) = P (P/A)P (A)+P (P/B)P (B)
31. Una compañía dedicada al transporte público trabaja tres líneas de una ciudad, de forma que el 60 % de
los autobuses cubre el servicio de la primera línea, el 30 % cubre la segunda y el 10 % cubre la tercera
línea. Se sabe que la probabilidad diaria de que un autobús se averíe es del 2 %, 4 % y 1 % respectivamente
para cada línea. Determine la probabilidad de que, en un día, un autobús sufra una avería. Sabemos que
un autobús un día ha sufrido una avería. ¿Cuál es la probabilidad de que sea de la línea dos?
Solución.
Li = {autobuses linea i} , i = 1, 2, 3. P (L1 ) = 0, 6 ; P (L2 ) = 0, 3 ; P (L3 ) = 0, 1
A = {autobuses con averı́a}; P (A/L1 ) = 0, 02 ; P (A/L2 ) = 0, 04 ; P (A/L3 ) = 0, 01
P (A) = P (A/L1 )P (L1 ) + P (A/L2 )P (L2 ) + P (A/L3 )P (L3 )
12+12+1 25 1
P (A) = 1000 = 1000 = 40
P (L2 /A) = P (A/L 2 )P (L2 )
P (A) = 12
25
2. Un estudiante lanza 10 monedas y contabiliza el número de caras en cada experiencia sus resultados fueron:
0 1 2 3 4 5 6 7 8 9 10
300 450 790 1000 1200 1260 1200 1000 790 450 300
De acuerdo con sus resultados y la información que dio el estudiante, ¿es posible asegurar que él hizo la
experiencia y no inventó los datos?. Explique y argumente su afirmación.
3. Es estimado que los hombres fumadores mayores de 40 años son 10 veces más proclives a contraer un
cáncer pulmonar que los hombres no fumadores. Asumiendo que en la población en estudio el 60 % de los
hombres son fumadores, ¿cuál es la probabilidad que un hombre que murió de cáncer haya sido fumador?
4. El aeropuerto al que llegan los aviones tienen 2 áreas , A y B, que pueden ser usadas.Se sabe que al área
A llega el 78 % de los vuelos. Se sabe que la probabilidad de que un avión que se dirige al área A tenga
problemas es tres veces mayor que en un avión que se dirige al área B.. Determinar la probabilidad que
un avión que viene con problemas use el área A.
3.4. EJERCICIOS PROPUESTOS. 41
5. En una reunión hay n personas. ¿Cuál es la probabilidad que al menos dos personas tengan la misma
fecha de cumpleaños?.
7. Un inversionista en bienes raíces quiere elegir entre tres opciones para invertir US$400.000: a1 : invertir
los 400.000 en un complejo de apartamentos de 50 unidades, a2 : invertir 200.000 en un complejo de
apartamentos de 20 unidades e invertir los otros 200.000 en un fondo monetario que proporcionará un
crédito promedio de 14 % y a3 : invertir los 400.000 en un fondo monetario que tendrá un crédito promedio
de 14 %. Según la opinión del inversionista, el éxito de la inversión en los apartamentos depende del estado
del mercado habitacional, medido por el número de personas por cada 1000 inquilinos con ingresos altos
que quisieran rentar un apartamento en uno de los dos complejos. El inversionista caracterizó estos estados
como sigue: s1 : 1 por cada 1000; s2 : 2 por cada 1000 s3 : 3 por cada 1000. La tabla elaborada por el
inversionista muestra las ganancias (en miles de dólares) basadas en los réditos para un período de 5 años
ajustado por impuestos. A partir de un análisis del mercado asignó esas probabilidades a los tres estados:
8. Hay 20 pares de guantes rojos y 10 pares de guantes blancos. Se van sacando guantes uno a uno, sin
reponerlos. Determinar la probabilidad que en la extracción k y k + 1 salgan, por vez primera, dos guantes
del mismo color .
9. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. Determinar la probabilidad que los libros estén ordenados por tema.
10. En el juego del póker se utilizan el mazo inglés, que consta de 4 pintas ( diamante, pick, trébol, corazón).
y cada pinta tiene asignado los números {1, 2, 3, 4, ..., 8, 9, 10, J, Q, K}. Luego consta de 52 cartas.
Se llama “mano” al conjunto de 5 cartas. Determinar el número de manos que se pueden generar.
11. En el juego del póker se llama “full” a una mano con un trio y un par. Determinar la probabilidad que en
una mano haya un “full”.
12. En el juego del póker se llama “póker” a una mano con cuatro cartas del mismo valor. Determinar la
probabilidad que en una mano haya un “póker”.
13. Dos personas juegan póker y una de ellas tiene un póker de 9 y la quinta carta es un 8. ¿Cuál es la
probabilidad que la segunda persona tenga un póker mayor ( las cuatro cartas, del mismo valor, deben
tener un valor mayor a 9)?
42 CAPÍTULO 3. EQUIPROBABILIDAD
14. El juego del Kino consiste en escoger 14 números de entre los primeros 25 números naturales ({1,2,3,4...,25}).
Con ellos se genera una tarjeta con los números escogidos y ordenados de menor a mayor.Determinar la
probabilidad de obtener un cartón con un 6 en la posición 4 y un 12 en la posición 8.
16. Para poder clasificar al mundial de Fútbol, la selección chilena depende de la calculadora . Chile tiene
que jugar 2 partidos, primero contra Colombia de visita y luego contra Ecuador de local: Un estudio de
expertos determinó que las probabilidades que Chile gane, empate o pierda con Ecuador son 0.5 + b, 0.3
+ b y 0.2 + b dónde b es un factor de ánimo que depende del resultado del partido anterior, y su valor es
0.05, 0 y -0.05 si Chile gana, empata o pierde con Colombia. Para clasificar, Chile deberá ganar sus dos
partidos. Si empata un partido y gana otro, entonces dependerá de los resultados de otros paises donde la
probabilidad De clasificar de Chile sería 0.30 si lograse los resultados anteriores. En caso de perder algún
partido, Chile queda completamente eliminado.
17. Consideremos una población en la que cada individuo es clasificado según dos criterios: es o no portador
de HIV y pertenece o no a cierto grupo de riesgo que denominaremos R. La correspondiente tabla de
probabilidades es:
a) Dado que una persona seleccionada al azar pertenece al grupo de riesgo R, ¿cuál es la probabilidad
de que sea portador?
b) Calcule ahora la probabilidad de que una persona sea portadora de HIV, dado que no pertenece al
grupo de riesgo R.
18. Supongamos que cierta prueba para detectar la presencia de una enfermedad en un individuo, da resultado
positivo (detecta la presencia de la enfermedad) en un individuo enfermo con probabilidad 0.99 y en un
individuo sano con probabilidad 0.02 (falso positivo). Por lo tanto, dicha prueba no detecta la enfermedad
en un individuo sano con probabilidad 0.98 y no la detecta en un individuo enfermo con probabilidad
0.01 (falso negativo). Se supone, en base a estudios previos, que la incidencia de esa enfermedad en cierta
población es 0.001, es decir que la probabilidad a priori de A es 0.001. Se selecciona al azar un individuo
de esa población, se le aplica la prueba y el resultado es positivo, ¿cuál es la probabilidad de que en efecto
padezca la enfermedad?
19. Una caja contiene 12 lámparas de las cuales 4 son defectuosas. Se toman al azar tres lámparas del lote una
tras otra. Hallar la probabilidad de que las tres lámparas no sean defectuosas. Estudie todos los posibles
casos, con reposición o sin reposición.
3.4. EJERCICIOS PROPUESTOS. 43
20. En un banco hay dos alarmas A y B. En caso de atraco, la probabilidad de que se activen A, B o ambas
es:
P (A) = 0, 75; P (B) = 0, 85; P (A ∩ B) = 0, 65
21. En un banco hay dos alarmas A y B. En caso de atraco, la probabilidad de que se activen A, B o ambas
es:
P (A) = 0, 75; P (B) = 0, 85; P (A ∩ B) = 0, 65
22. Sabiendo que la probabilidad de los sucesos siguientes es: P (A) = 0, 6; P (B) = 0, 9; P ((A ∩ B)c ) = 0, 46
¿Son independientes los sucesos A y B?
23. Una compañía dedicada al transporte público explota tres líneas de una ciudad, de forma que el 60 % de los
autobuses cubre el servicio de la primera línea, el 30 % cubre la segunda y el 10 % cubre la tercera línea. Se
sabe que la probabilidad de que diariamente, un autobús se averíe es del 2 %, 4 % y 1 % respectivamente,
para cada línea. Determina la probabilidad de que, en un día, un autobús sufra una avería. Sabemos que
un autobús un día ha sufrido una avería. ¿Cuál es la probabilidad de que sea de la línea dos?
24. La cuarta parte de las participantes en un congreso son españolas. La probabilidad de que una congresista
desayune té si es española es un octavo y la probabilidad de que tome té si es extranjera es un tercio. Si
se elige una congresista al azar:
25. En la sala de espera de un dentista hay 5 revistas del tipo A, 6 del tipo B y 4 del tipo C. Entran tres
pacientes de forma consecutiva y cada uno elige al azar una revista. Encuentra la probabilidad de que:
26. Una encuesta revela que el 30 % de la población tiene estudios, de los cuales el 12 % no tiene trabajo. Del
70 % que no tiene estudios se tiene que un 25 % no tiene trabajo. Calcule:
27. En un determinado almacén hay tres estanterías y en cada una de ellas dos tipos de productos A y B. En
la primera hay 140 productos y se sabe que el 25 % son del tipo A. En la segunda hay 130 productos y se
sabe que 91 son del tipo B. Y en la tercera hay 40 del tipo A y 80 del tipo B. Haz una tabla que recoja
la información dada y elegido un producto al azar, calcula la probabilidad de que:
28. Se extraen simultáneamente tres naipes de una baraja española de 40 cartas. Halla la probabilidad de
obtener:
a) Tres copas
b) Ninguna copa
c) Dos copas y un oro
d ) Al menos una copa.
Capítulo 4
En esta sección el concepto de marca de clase, de la estadística univariada para datos agrupados, se sofistica en
una función que se llamará variable aleatoria discreta. A esta variable se le asociará una función llamada función
de cuantía, que no es otra cosa que la noción funcional de frecuencia relativa. El estudiante puede verificar que
las propiedades que esta función debe cumplir son esencialmente las características de la frecuencia relativa.
Recordémosla:
Sea X una variable aleatoria discreta se le asocia una función, fX , llamada “función de cuantía” que satisface:
fX (x) ≥ 0 ; x ∈ Rec(X)
X
fX (x) = 1
x∈Rec(X)
De igual manera las medidas de centralidad y dispersión se calculan de manera similar que la media y varianza
cuando los datos están agrupados. Recordémosla para evidenciar su similaridad:
Sea X una variable aleatoria discreta con función de cuantía , fX , se definen:
X
E(X) = x · fX (x)
x∈Rec(X)
Varianza por:
V (X) = E(X 2 ) − E 2 (X)
Sea X una variable aleatoria discreta con función de cuantía , fX , se define la función generadora de
momentos por: X
ϕX (t) = E(ext ) = ext · fX (x)
x∈Rec(X)
45
46 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
entonces
P (X > m + n/X > m) = P (X > n)
Solución.
P (X > m + n; X > m) P (X > m + n)
P (X > m + n/X > m) = =
P (X > m) P (X > m)
P∞ k
k=m+n+1 p · (1 − p)
P (X > m + n/X > m) = P ∞ k
= (1 − p)n
k=m+1 p · (1 − p)
P∞ k
k=m+n+1 p · (1 − p) (1 − p)m+n+1
P (X > m + n/X > m) = P∞ = = (1 − p)n
k=m+1 p · (1 − p)
k (1 − p)m+1
∞
X
P (X > n) = p · (1 − p)k = (1 − p)n
k=n+1
Solución.
λn+k λk k!
P (X = k + n) = (n+k)! · e−λ = k! · e−λ · (n+k)! · λn
k!
luego: P (X = k + n) = (k+n)! · λn · P (X = k)
4.1. PROPIEDADES DE FUNCIÓN DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.47
Solución.
P∞ λn P∞ n n
a) eλ = n=0 n! ; e
−λ
= n=0 ((−1)n! )·λ
λ −λ P∞ x2n
cosh(λ) = e +e
2 = n=0 (2n)!
P∞ P∞ λ2n
b) P (X = par) = n=0 P (X = 2n) = n=0 2n! · e−λ =
e−λ cosh(λ)
4. Si X es una variable aleatoria que toma valores en {0, 1, 2, ...} demostrar que :
∞
X
E(X) = P (X > k)
k=0
Solución.
∞
X
E(X) = k · P (X = k)
k=0
∞
X
P (X > 0) = P (X = n)
n=1
∞
X
P (X > 1) = P (X = n)
n=2
∞
X
P (X > 2) = P (X = n)
n=3
∞
X
P (X > k) = P (X = n)
n=k+1
Probar que
m
P (X > m) = (P (X > 1))
48 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Luego,
m
X 1 − (1 − p)m
P (X > m) = 1 − P (X ≤ m) = 1 − p · (1 − p)k−1 = 1 − p ·
1 − (1 − p)
k=1
1 − (1 − p)m
P (X > m) = 1 − p · = (1 − p)m
1 − (1 − p)
Probar que
P (X > m + n/X > m) = P (X > n)
Solución.
P (X > m + n; X > m) P (X > m + n)
P (X > m + n/X > m) = =
P (X > m) P (X > m)
P (X > m + n) (1 − p)m+n
P (X > m + n/X > m) = = = (1 − p)n
P (X > m) (1 − p)m
Asumiendo que para n suficientemente grande np ∼ λ. Demostrar que para n grande la función f se
transforma en
λx −λ
· e · I{0,1,2,3,....}(x)
x!
Solución. x
n! λ λ
f (x) = · · (1 − )n−x · I{0,1,2,...,n} (x)
(n − x)!x! n n
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.49
n
(n − x + 1)(n − x + 2)(n − x + 3)...(n − x + x) λx λ
f (x) = · x · 1 − · I{0,1,2,...,n}(x)
x! · nx 1 − nλ n
Haciendo n → ∞
λx −λ
f (x) = · e · I{0,1,2,...} (x)
x!
P
8. Sea X v.a.d. con función de cuantía fX e Y = g(X), con g invertible. Demostrar que E(Y ) = x∈Rec(X) g(x)·
fX (x)
Solución. X
E(Y ) = y · fY (y)
y∈Rec(Y )
−1 −1
; ahora fY (y) = fX (g (y)) ; Y = g(X) ; x = g (y)
Luego fY (y) = fX (g −1 (y)) = fX (x)
X
E(Y ) = g(x) · fX (x)
x∈Rec(X)
9. Sea X v.a.d. con función de cuantía fX . Encontrar la función de cuantía de Z = g(X), con g invertible.
Solución.
fZ (z) = P (Z = z) = P (g(X) = z) = P (X = g −1 (z)) = fX (g −1 (z))
Solución.
P50 k P50 4k 1
a) n=1 5 + n=1 5 = 50k = 1 luego k = 50
P50 k P50
b) n=1 5 ·2· n + n=1 4k 2k 50·51
5 · (2 · n − 1) = 5 · 2 + 4k
5 · 50 · 50
251
E(X) = = 50, 2
5
P50 k
P50 4k
c) n=1 5 · 4 · n2 + n=1 5 · (2 · n − 1)2 = 3353, 2
11. Sea X una variable aleatoria con función de cuantía fX (x) = logn (1 + x1 ) · I{1,2,3,...,n−1}(x), con n ∈ N.
Demostrar que fX es una función de cuantía.
Solución.
Primera propiedad f (x) ≥ 0 ; x ∈ {1, 2, ..., n}
loga (x) > 0 ⇔ x > 1 y a > 1; como logn (1 + x1 ) > 0;pues (1 + x1 ) > 1, por tanto f (x) > 0 para todo
x ∈ {1, 2, ..., n}
P
Segunda propiedad x∈Rec(X) f (x) = 1
n−1
X n−1
X
1 x+1 3 4 n−1 n
logn (1 + ) = logn ( ) = logn (2 · · · ... · · ) = logn (n) = 1
x=1
x x=1
x 2 3 n − 2 n − 1
12. Hay 5 salas en el cine A y 3 salas en el cine B. Si la probabilidad de que las salas del cine A funcionen es
p y las salas del cine B q, calcule la probabilidad de que sólo tres salas estén funcionando. Asuma que las
salas funcionan independientemente.
Solución.
Si X: n◦ de salas que funcionan en A ;X ∼ Bin(5, p)
!
5
fX (x) = px (1 − p)5−x · I{0,1,2,3,4,5} (x)
x
Si Y : n◦ de salas que funcionan en A ; Y ∼ Bin(3, q)
!
3
fY (y) = q y (1 − q)3−y · I{0,1,2,3} (y)
y
!
5
i) Si tres salas en el cine A, son las que funcionan : p3 (1 − p)2
3
!
3
ii) Si las tres salas en el cine B, son las que funcionan: q 3 (1 − q)0 = q 3
3
iii) Si las tres salas repartidas entre A y B:
! !
5 3
2 salas en A y una en B: p2 (1 − p)3 · · q · (1 − q)2
2 1
! !
5 3
1 sala en A y dos en B: p · (1 − p)2 · · q 2 · (1 − q)
1 2
Todas esas opciones se suman, pues debe ser una u otra. En las tres situaciones se asume que el funciona-
miento de una sala es independiente de las otras.
13. El gerente de un restaurant que sólo da servicios mediante reservas sabe, por experiencia, que el 20 % de
las personas que reservan una mesa asistirán. Si el restaurant acepta 25 reservas pero sólo dispone de 20
mesas. ¿Cuál es la probabilidad de que todas las personas, que asistan al restaurant, se les asigne una
mesa?
Solución.
Sea el espacio muestral: Ω : conjunto de 25 personas que reservan en el restaurant.
Ak : el conjunto de las k personas de Ω que asisten al restaurante.
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.51
Y ∼ Bin(25; 0,2)
Calcular lo pedido
20 20
!
X X 25
P (Y ≤ 20) = P (Y = k) = (0,2)k · (0, 8)25−k
k=1 k=1
k
1
14. Sea X una v.a. discreta con función de cuantía fX (x) = n · I{1,2,...,n} (x)
a) Encontrar E(X).
b) Encontrar V (X).
Solución.
P
a) Usando la definición de primer momento E(X) = x∈Rec(X) x · fX (x)
Xn
i n(n + 1) n+1
E(X) = = =
i=1
n 2n 2
P
b) Usando la definición de segundo momento E(X 2 ) = x∈Rec(X) x
2
· fX (x)
n
X i2 n(n + 1) · (2n + 1) (n + 1)(2n + 1)
E(X 2 ) = = =
i=1
n 6n 6
(n + 1)(2n + 1) n2 + 2n + 1 n2 − 1
V (X) = − =
6 4 12
15. Una empresa electrónica observa que el número de componentes que fallan antes de cumplir las 100 horas
de funcionamientos es una v.a. Poisson. Si el número promedio de estos fallos es 8 :
Solución.
Se debe definir la variables aleatorias.
X : representa el número de fallos antes de las 100 horas
Se debe definir la función de cuantía.
X ∼ P (8) ;
8x −8
fX (x) = · e · I{0,1,2,3,....}(x)
x!
52 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
Calcular lo pedido
a) Como en 100 horas hay 8 fallas en promedio entonces en 25 horas hay 2 fallos en promedio.
x
X ∼ P (2) ; fX (x) = 2x! · e−2 · I{0,1,2,3,....} (x)
Luego
P (X = 1) = fX (1) = 2 · e−2
b) Como en 100 horas hay 8 fallas en promedio entonces en 125 horas hay 10 fallos en promedio
X ∼ P (10) ;
10x −10
fX (x) = ·e · I{0,1,2,3,....}(x)
x!
Luego
1010 −10
P (X = 10) = fX (10) = ·e
10!
16. En un grupo de libros hay 10 de física, 15 de química y 12 de biología. Se sacan 12 libros ¿cuál es la
probabilidad de que 5 de ellos sean de química? Use una variable aleatoria adecuada.
Solución.
Se debe definir la variables aleatorias.
P12
Xi :libro i-ésimo es de química ; Y = i=1 Xi siendo
(
1 Si el libro i es de quı́mica
Xi =
0 si no
17. Para completar la colección de pegatinas de un álbum de N pegatinas diferentes vamos cada mañana al
Kiosco y compramos un sobre.
Al inicio vamos teniendo diferentes pegatinas, pero en la medida que vamos completando el álbum las
pegatinas comienzan a repetirse.
Supongamos que tenemosj pegatinas y buscamos la pegatina j + 1 y para esto abrimos un sobre tras otro,
sin encontrarla, hasta que en el sobre m está.
(
1 si en el sobre i está la pegatina j + 1
i) Si Xi = ; con i ∈ {1, 2, 3, ..., m}
0 si no
a) Determinar P (Xi = 1)
j
b) Si Tj :número de sobres a abrir para obtener la pegatinas j + 1, demostrar que Tj ∼ Geo(1 − N)
Solución.
N −j
a) P (Xi = 1) = N
j m−1 N −j
b) P (Tj = m) = P (X1 = 0; ...; Xm−1 = 0; Xm = 1) = N ( N ) · I{1,2,3,...} (m)
18. Un libro tiene en promedio 1 error por cada hoja. Si la v.a. X se define por:
X: número de errores por hoja .
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.53
Solución.
a) Se debe definir las variables aleatorias.
X : representa el número de errores por hoja
Se debe definir la función de cuantía.
−1
X ∼ P (1) ; fX (x) = ex! · I{0,1,2,3,....} (x)
b) Calcular lo pedido
P (X > 2) = 1 − P (X = 1) = 1 − fX (1) = 1 − e−1
19. El 90 % de los árboles plantados en una campaña de reforestación sobrevive. ¿Cuál es la probabilidad
de que sobrevivan 8 o más árboles de 10 árboles que acaban de ser plantados? Determine la media de
sobrevivencia de tales árboles.
Solución.
Se debe definir la variables aleatorias.
P12
Xi : árbol i-ésimo ; Y = i=1 Xi números de árboles que sobreviven
(
1 Si el árbol i sobrevive
Xi =
0 si no
Se debe definir la función de cuantía.
Y ∼ Bin(10; 0,9)
Calcular lo pedido
!
P10 10 k
P (Y ≥ 8) = k=8 · (0, 9) · (0, 1)10−k
k
20. Un estudiante lanza 10 monedas para contabilizar el número de caras en cada experiencia y sus resultados
fueron:
N◦ de caras 0 1 2 3 4 5 6 7 8 9 10
frecuencia 300 450 790 1000 1200 1260 1200 1000 790 450 300
El estudiante asevera que las monedas que usó tenían una medida de 1/2 de salir cara. De acuerdo con
sus resultados y la información que dio el estudiante ¿es posible asegurar que él hizo la experiencia y no
inventó los datos?. Explique y argumente su afirmación.
Solución.
Se hicieron 8740 lanzamientos de la moneda. El valor teórico de que salgan 5 caras es :
!
10
5
= 0, 246
(210 )
Solución.
a) Ω: es el conjunto de todas las cartillas del Kino.
P
: se escoge el conjunto potencia (puede ser cualquier otro, pero deben probar que la función Xi sea
v.a.)
b) La probabilidad que un cartón tenga 10 números del cartón ganador es:
! !
14 11
·
10 4
p= ! = 0, 074
25
14
e−x
22. Sea la función f (x) = K · x! · I{0,1,2,3,...} (x).
Solución.
a) Se deben cumplir ambas propiedades de la función de cuantía. Con la segunda propiedad determina-
remos K y después probamos que la función es positiva.
P e−x e−1 −1 −x
K· ∞ x=0 x! = K · e = 1 luego K = e−e . y K > 0; ex! > 0.
b) Cálculo del primer momento:
∞
X X∞ X∞
e−x e−x e−y
E(X) = K ·x· =K· = K · e−1 · = e−1
x=1
x! x=1
(x − 1)! y=0
y!
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.55
"∞ ∞
#
X y · e−y X e−y
2 −1
E(X ) = K · e · + = e−1 · e−1 + 1 = e−2 + e−1
y=0
y! y=0
y!
Cálculo de la varianza:
V (X) = e−2 + e−1 − e−2 = e−1
Solución.
a) Usando la definición de función de cuantía.
fX (x) ≥ 0
X
fX (x) = 1
x∈Rec(X)
P∞ xk
Recordando además que ex = k=0 k!
P1 c −1
x=0 x! = 1 = c · e ; c = e
√
24. Sea X v.a.d. con función de cuantía Ber(p), encontrar la función de cuantía de Z = X
Solución.
√
fZ (z) = P (Z = z) = P ( X = z) = P (X = z 2 ) = fX (z 2 )
Z ∈ {0, 1} ; fX (x) = px (1 − p)1−x · I{0,1} (x)
2 2
fZ (z) = pz · (1 − p)1−z · I{0,1} (z 2 )
Luego Z ∼ Ber(p)
√
25. Sea X ∼ P (λ), encontrar la función de cuantía de Z = X
Solución.
√
fZ (z) = P (Z = z) = P ( X = z) = P (X = z 2 ) = fX (z 2 )
λx
fX (x) = x! · e−λ · I{0,1,2,3,...}(x)
2
λz
fZ (z) = (z 2 )! · e−λ · I{z/z=√x;x∈N ∪{0}} (z)
56 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
t
ϕXi (t) = eλ(e −1)
Pm m
Y t t
t t
ϕX (t) = E(ext ) = E(e i=1 xi · m
)= E(exi · m ) = (eλ(e m −1) )m = eλm(e m −1)
i=1
t
Si Y ∼ P (mλ) entonces ϕY (t) = eλm(e −1)
t
t
Luego ϕX (t) = eλm(e m −1) = ϕY ( m ) , por tanto X ∼ P (mλ)
Se pide :
P (Y2 = 1/X1 = 1) = P (Y1 = 1/X1 = 1)P (Y2 = 1/X2 = 1) + P (Y1 = 0/X1 = 1)P (Y2 = 1/X2 = 0)
a a b c
P (Y2 = 1/X1 = 1) = a+b · a+b + a+b · c+d
28. En un grupo de libros hay 10 de física, 15 de química y 12 de biología. Defina una variable aleatoria
adecuada para resolver la probabilidad de que, al sacar 12 libros, 5 de ellos sean de química. También
resuelva el problema usando equiprobabilidad y explique sus resultados.
Solución.
Según lo hecho en el problema 16.
4.3. PROBLEMAS PROPUESTOS. 57
Calcular lo pedido
!
12
15 5 22 7
P (Y = 5) = · 37 · ( 37 )
5
Ahora resolviéndolo como un problema de equiprobabilidad
!
37
Ω = {subconjuntos de 12 libros} ; #Ω =
12
! !
15 22
A = {subconjuntos de 12 libros con 5 de quı́mica}; #A = ·
5 7
15 ·
22
#A 5 7
P (A) = #Ω =
37
12
Los resultados son diferentes pues las sigma álgebras cambiaron.
−3 −3
E(Y ) = e−θ+e ·θ
= eθ·(e −1)
= ϕX (−3)
2. Se lleva a cabo el experimento de sacar n esferas de una urna que contiene r esferas rojas y b esferas
blancas ( numeradas del 1 a (r + b)). Se extraen n esferas, una a una, sin reposición. Si la v.a. Y mide el
número de esferas rojas en esas n esferas extraidas determine la función de cuantía asociada a la variable
aleatoria Y .
3. Un estadístico subdivide una piscina en la cual hay salmones por áreas donde no entra ni sale salmón
alguno dentro de tales áreas y tampoco hay muertes ni nacimientos. Si el número de áreas fue de 1600 y
se supone que ha asignado un número a cada salmón (en forma abstracta , no real) del 1 al N
a) Defina una variable aleatoria que defina que el salmón j está en el área k
b) Defina una variable aleatoria que defina el número de salmones en el área k
c) ¿Qué distribuciones tienen las variables aleatorias definidas en a) y b)? Explique
58 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA
d ) Si se sabe que hay 400 sectores sin salmón alguno, determine el número de salmones en la piscina.
4. Suponga que un predador tiene 40 % de posibilidades de tener éxito en cazar una cierta presa ¿cuántos
intentos debe realizar para cazar al menos una presa con una posibilidad de al menos 90 %?. Describa la
variable aleatoria y la función de cuantía asignada a este problema.
5. Un tratamiento para una enfermedad produce una cura del 75 % de los casos. Si seis pacientes son tratados.
6. El número de barcos que llegan al Puerto de Valparaíso sigue un proceso de Poisson con una tasa de
llegada de cinco por día.
a) ¿Cuál es la probabilidad de que transcurran más de seis horas sin que arribe ninguno?
b) Si el costo de operación “C” es función del tiempo ocioso X (entre llegadas), donde C = 1 − e−5x ,
encuentre el costo medio, donde C se mide en millones de pesos.
1 et −e(n+1)t
7. Sea X una v.a. discreta con función de cuantía fX (x) = n ·I{1,2,...,n} (x). Demostrar que ϕX (t) = n(1−et )
8. Sea X una v.a. discreta con función de cuantía fX (x) = k · θx · I{0,1,2,...,n} (x) ; θ > 1
a) Determinar el valor de k.
b) Calcular ϕX (t)
a) Determinar el valor de k.
b) Calcular ϕX (t)
10. Sea X una variable aleatoria con función de cuantía fX (x) = logn (1 + x1 ) · I{1,2,3,...,n−1}(x), con n ∈ N.
Demostrar que E(X) = n − logn (n!)
11. Una enfermedad se presenta con probabilidad 1/100000 en una ciudad de 500000 habitantes, ¿cuál es la
probabilidad que al menos 3 habitantes tengan la enfermedad? ( Use el problema resuelto 7 para agilizar
sus cálculos)
1
x=1
2
12. Sea X una variable aleatoria discreta con función densidad fX (x) = 1
x = 12
2
0 si no
14. Se sabe que el número de partículas emitidas por una sustancia radioactiva, con el tiempo, obedece una
ley de Poisson. Supongamos que la emisión ocurre a razón de 30 partículas por minuto. ¿Cuál es la
probabilidad que en el tiempo de 7,5 segundos sean emitidas exactamente 3 partículas?.
En esta sección se extienden los conceptos de variable aleatoria discreta a variable aleatoria contínua. El lector
puede ver que tal extensión es muy natural.
Recordemos algunos conceptos.
Sea X una variable aleatoria continua a la que se le asocia una función, fX , llamada ”función de densidad”, que
satisface:
x∈R
fX (x) ≥ 0
Z ∞
fX (x) · dx = 1
−∞
Varianza por:
V (X) = E(X 2 ) − E 2 (X)
61
62 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.
Sea X una variable aleatoria continua con función de densidad , fX , se define la función generadora de momentos
por: Z ∞
ϕX (t) = E(ext ) = ext · fX (x) · dt
−∞
Solución.
−1 −1
a) FY (y) = P (Y ≤ y) = P (X ≤ fX (y)) = FX (fX (y))
−1
−1 dfX (y)
fY (y) = fX (fX (y)) · dy · I]mı́n(fX ),máx(fX )[ (y)
−1
dfX (y)
fY (y) = y · dy · I]mı́n(fX ),máx(fX )[ (y)
−1
dfX (y) −1 −1 y2
b) y 2 = y · dy ; y · dy = dfX ; fX (y) =
+c 2
p
fX (x) = 2(x − c) · I]c,d[ (x) ; Se debe buscar d.
Rdp √
3
9
c
2(x − c)dx = 1; Por tanto, d = c + 2
p
fX (x) = 2(x − c) · I 9 (x) ; c > 0
√
3
]c,c+ 2 [
Rb dx t
c) ϕY (t) = E(eY t ) = a
eyt · b−a = e b−a
2. Sea N (t) : número de eventos que ocurren hasta el instante t que se distribuyen según :
(λt)k · e−λt
P (N (t) = k) = · I{0,1,2,...}(k)
k!
a) Demuestre que si T1 representa el primer instante en que ocurre un evento entonces P (N (t) = 0) =
P (T1 > t).
b) Encuentre la distribución de T1 .
Solución.
5.1. PROPIEDADES DE FUNCIÓN DE DENSIDAD Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.63
a) Si T1 representa el primer instante en que ocurre un evento eso significa que en el tiempo t < T1 no
ha ocurrido nada.
Es decir: Si t < T1 ←→ N (t) = 0
luego P (t < T1 ) = P (N (t) = 0)
b) Como FT1 (t) = P (T1 < t) entonces FT1 (t) = P (T1 < t) = 1−P (T1 > t) = 1−P (N (t) = 0) = 1−e−λt
dFT1
y como dt = fT1 (t) entonces fT1 (t) = λ · e−λ·t · I[0,∞[ (t)
3. Sea X una v.a. con función generadora de momentos ϕX . Se define φX (t) = ln(ϕX (t))
Demostrar que:
dφX
a) dt (0) = E(X)
2
d φX
b) dt2 (0) = V (X)
Solución.
a)
dφX ϕ′ (t)
= X
dt ϕX (t)
entonces
dφX
(0) = ϕ′X (0) = E(X)
dt
pues ϕX (0) = 1 ;
2
d 2 φX ϕ′′ ′
X (t)·ϕX (t)−(ϕX (t))
b) dt2 = (ϕX (t))2
2
ϕ′′ ′
X (0)·ϕX (0)−(ϕX (0))
V (X) = (ϕX (0))2
pues ϕ′X (0) = E(X) ; ϕ′′X (0) = E(X 2 )
Solución.
R∞
E(Y ) = −∞ y · fY (y) · dy ; y = g(x); x = g −1 (y)
dx dg−1
dy = dy luego dx = dg −1
−1
fY (y) = fX (g −1 (y)) · dgdy
R∞ R∞ dg−1
E(Y ) = −∞ y · fY (y) · dy = −∞ g(x) · fX (g −1 (y)) · dy · dy
R∞
E(Y ) = −∞ g(x) · fX (x) · dx
1−p
6. Una variable aleatoria X se le asigna una función densidad f (x) = p · λ · eλ·x · I]−∞,0[ (x) + b · I[0,b] (x)
con p ∈ [0, 1] y λ > 0
Solución.
R0 Rb λx 0 b
a) −∞p · λ · eλx· dx + 0 1−p
b · dx = p · e −∞
+ 1−p
b · [x]0 = p + (1 − p) = 1
R0 Rb
b) ϕX (t) = −∞ p · λ · ex(t+λ) · dx + 0 1−p
b ·e
t·x p·λ
· dx = t+λ + 1−p
b·t · (e
t·b
− 1) ; t > 0
c) Si x < 0 entonces 0 < Y < 1
Si 0 ≤ x ≤ b entonces 1 ≤ Y ≤ eλ·b
ln(y)
FY (y) = P (Y ≤ y) = P (X ≤ λ ) = FX ( ln(y)
λ )
fY (y) = fX ( ln(y)
λ )·
1
λ·y
ln(y)
Si 0 < Y < 1 entonces λ < 0 , λ > 0 entonces fX ( ln(y)
λ ) = p · λ · y · I]0,1[ (y)
ln(y)
Si 1 ≤ Y ≤ eλ·b entonces 0 ≤ λ ≤ b entonces fX ( ln(y)
λ )=
1−p
b · I[1,eb·λ ] (y)
1−p
Luego fY (y) = p · I]0,1[ (y) + b·λ·y · I[1,eλ·b ] (y)
ax+b
7. X es una v.a. con función generadora de momentos (f.g.m.) ϕX . Se define la v.a. Y = c con a, b, c ∈ R
t·b
y c 6= 0. Demuestre que ϕY (t) = e c · ϕX ( t·a
c )
Solución.
ax+b
·t bt at b·t a·t
ϕY (t) = E(e c ) = e c · E(ex· c ) = e c · ϕX ( )
c
8. Sea X ∼ exp(λ). Sea Y = FX ◦ X
Solución.
Rx x
a) FX (x) = 0
λ · e−λ·t · dt = −e−λt 0 = 1 − e−λ·x
b) 0 ≤ Y ≤ 1
−1 −1
c) FY (y) = P (Y ≤ y) = P (X ≤ FX (y)) = FX (FX (y)) = y
fY (y) = I[0,1] (y)
R1 1
d ) P (a ≤ Y ≤ 1) = 0, 9 = a dx = [x]a = 1 − a ; a = 0, 1
genera la ecuación:
−λx a
−e 0
= 0, 5 ó 1 − e−λa = 0, 5
−ln(0,5)
cuya solución es: ln(0, 5) = −λa ó a = λ
10. En la construcción de tablas de mortalidad y nacimiento se tienen en cuenta los siguientes supuestos:
1) la probabilidad que una persona muera durante el intervalo [t + △t, t] es igual a:
p(t, t + △t) = a(t) · △t + o(△t) ; lim△t→0 o(△t)
∆t = 0
Sugerencias.
i) Asuma que π(t) : probabilidad que una persona sobreviva hasta el tiempot.
ii) π(t + △t/t) : es la medida de probabilidad que dado que sobrevivió hasta la edad t, sobreviva a la edad
t + △t.
iii) Demuestre que π(t + △t) = π(t) · π(t + △t/t)
iv) Demuestre que π(t + △t, t) = 1 − p(t, t + △t)
v) Demuestre que π(t + △t) = π(t)(1 − a(t) · △t − o(△t))
dπ
vi) Haciendo △t → 0 demuestre que dt = −a(t) · π(t)
Solución.
π(t,t+△t)
π(t + △t/t) = π(t) ; π(t + △t, t) = π(t + △t)
Luego
π(t + △t) = π(t) · π(t + △t/t)
Luego
Con lo cual
dπ
= −π(t) · a(t)
dt
obteniéndose Rt
1 − e− 0
a(x)·dx
= p(t)
66 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.
11. Con el objetivo de establecer un plan de producción, una empresa ha estimado que la demanda aleatoria,
X, de sus potenciales clientes se comporta semanalmente, como la función densidad exponencial
f (x) = λe−λx · I[0,∞[ (x), donde x viene expresada en millones de unidades.
Demostrar que P (X > t + △t/X > t) = e−λ·△t
Solución.
pues
{w ∈ Ω/X(w) > t + △t} ∩ {w ∈ Ω/X(w) > t} = {w ∈ Ω/X(w) > t + △t}
Luego
R∞
P (X > t + △t) t+△t
λ · e−λx dx e−λ·(t+△t)
P (X > t + △t/X > t) = = R∞ = = e−λ·△t
P (X > t) t λ·e
−λx dx e−λt
12. La función generadora de probabilidad (F.G.P.) de una variable aleatoria discreta X es definida por :
∞
X
ϕX (t) = sk P (X = k)
k=0
con 0 ≤ ps ≤ 1
13. La función generadora de probabilidad (F.G.P.) de una variable aleatoria discreta X es definida por :
∞
X
ϕX (s) = sk P (X = k)
k=0
λ m λm m
ϕX (t) = ( t ) =( )
λ− m λm − t
β
a β+1
16. Se define la variable aleatoria de Pareto X si su función densidad f (x) = a x · I]a,∞[ (x)
a) Determinar qué valor debe tener a, β para que f sea función densidad
b) Determinar qué valor debe tener a para que existan E(X) y V (X)
c) Determinar la mediana M de X.
Solución
β
R∞ aβ+1 β −β
β −β
a) 1 = a · a xβ+1 · dx = a · aβ+1 · [ x−β ]∞
a = a ·a
β+1 a
· β ; β > 0; f (x) ≥ 0 entonces a > 0
R∞ β+1 R h −β+1 i∞
β aβ+1 ∞
b) E(X) = a a xβ+1
· x · dx = β·aa · a x−β · dx = β · aβ · x−β+1 β·a
= β−1 ; si β > 1
a
a2 ·β
Haciendo lo mismo se obtiene V (X) = (β−1)2 ·(β−2) ; si β > 2
R M β+1 √
c) P (X < M ) = 0, 5 = βa · a xaβ+1 · dx ; se obtiene que M = a · β 2
17. Un combustible para clientes va a contener cierto porcentaje X de un compuesto muy particular. Las
especificaciones determinan que X debe estar entre 30 % y 35 % . El fabricante tendría una utilidad neta
por galón de combustible que es función en términos de X:
U S$0, 10
; 30 < X < 35
T (x) = U S$0, 05 ; 35 < X < 40 o 25<X<30
−U S$0, 10 ; otros
Z 35 Z 40 Z 30 Z 25 Z 100
E(T ) = 0, 1· fx (x)dx+0, 05· fX (x)·dx+0, 05· fX (x)dx−0, 1· fX (x)·dx−0, 1· fX (x)·dx
30 35 25 0 40
18. Sean n datos los cuales debemos decidir si provienen de una distribución normal o no. Para ello se realiza
el siguiente procedimiento:
1) Se ordena la información dada x(i) : i = 1, 2, 3, ..., n
2) Se construyen los datos yi = Φ−1 ( i−0,375
n+0,25 ); Φ
−1
: distribución normal estándar inversa.
3) Se calcula la correlación entre los x(i) , yi
68 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.
4) Si tal correlación está en los rangos de aceptación entonces los datos se aceptan como provenientes de
una distribución normal.
Dados los siguientes datos que son 20 observaciones del voltaje de falla de una pieza de resina Epóxica (
IEEE trans. on Dielectrics and Elec. Insul., 1996, pp 43-55)
24.46; 25.61; 26.25; 26.42; 26.66; 27.15; 27.31; 27.54; 27.74; 27.94; 27.98; 28.04; 28.28; 28.49; 28.50; 28.87;
29.11; 29.13; 29.50, 30.88.
Solución.
24.46; 25.61; 26.25; 26.42; 26.66; 27.15; 27.31; 27.54; 27.74; 27.94; 27.98; 28.04; 28.28; 28.49; 28.50; 28.87;
29.11; 29.13; 29.50, 30.88.
i yi
1 -1,857140699
2 -1,389907519
3 -1,112733776
4 -0,901940252
5 -0,725159101
6 -0,56861086
7 -0,424932234
8 -0,289561272
9 -0,159318785
2) Determinación de yi 10 -0,031734798
11 0,095332621
12 0,22396465
13 0,356429437
14 0,495491579
15 0,644907175
16 0,810380505
17 1,001767916
18 1,239420338
19 1,580798793
20 2,493242733
3) Correlacion.
5.2. EJERCICIOS DE APLICACIONES 69
xi yi
24.46 -1,857140699
25.61 -1,389907519
26.25 -1,112733776
26.42 -0,901940252
26.66 -0,725159101
27.15 -0,56861086
27.31 -0,424932234
27.54 -0,289561272
27.74 -0,159318785
27.94 -0,031734798
27.98 0,095332621
28.04; 0,22396465
28.28 0,356429437
28.49 0,495491579
28.50 0,644907175
28.87 0,810380505
29.11 1,001767916
29.13 1,239420338
29.50 1,580798793
30.88 2,493242733
4) Conclusión.
Son normales los datos.
19. Los defectos de un producto son una variable aleatoria distribuida N(0, 0.0025). Si X < 1 entonces el
producto es defectuoso. Determinar
a) La función de cuantía del experimento que mide la probabilidad de que en la extracción k aparezca
por primera vez un defectuoso.
b) La probabilidad que en la quinta extracción aparezca, por vez primera, un defectuoso.
c) La probabilidad de que salga un defectuoso en alguna de las primeras 5 extracciones.
Solucion.
a)
(
1 sale en lanzamiento i
Xi =
0 si no
P (Xi = 1) = p ; P (Xi = 0) = 1 − p
P (X1 = 0; X2 = 0; ...; Xk−1 = 0; Xk = 1) = (1 − p)k−1 · p
fX (k) = p · (1 − p)k−1
b) fX (5) = p · (1 − p)4
P5 P5 k−1
c) k=1 fx (k) = p · k=1 (1 − p)
70 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.
20. Con el objetivo de establecer un plan de produccion, una empresa ha estimado que la demanda aleatoria
de sus potenciales clientes se comportara semanalmente, con la siguiente funcion densidad:
(
k · (4x − x2 ) 0<x<4
f (x) =
0 otro
a) Calcular la constante k.
b) Determinar la mediana y moda.
X−E(X)
c) Si X ∼ f . Determinar P ( √ < 1)
V (X)
Solución.
R4 3
a) 0 k · (4x − x2 ) · dx = 1 ; k = 32
√ √
b) P (X ≤ M ) = 12 ; M 3 − 6 · M 2 + 16 = 0 ; M = 2 ; M = 1 + 3 ; M =1− 3
Luego la mediana es M = 2.
3
Derivando f ′ (x) = 32 · (4 − 2x) = 0 entonces x = 2; Por tanto M o= 2
c)
Z 4
3
E(X) = · x · (4x2 − x3 ) · dx = 2
0 32
Z 4
3 24
E(X 2 ) = · x2 · (4x2 − x3 ) · dx =
0 32 5
4
V (X) = E(X 2 ) − E 2 (X) =
5
Z 2,89
X − E(X) p 3
P ( p < 1) = P (E(X) − V (X) < X < E(X) + V (X)) = · (4x − x2 ) · dx
V (X) 1,105 32
a) Determine el valor de k
b) Encuentre una expresión para determinar la mediana y si es posible calcúlela si θ = 5.
c) Calcule la moda cuando θ = 5.
Solución.
a) Z ∞
3 2 − x2
k· · x · e θ · dx = 1
0 θ
Z ∞ Z ′
∞
3 2 − x2 3 θ x2
k· · x · e θ · dx = k · · x · − · e− θ · dx
0 θ θ 0 2
Z Z ∞
∞
3 2 − x2 3 h − xθ
2 i∞ 3 θ − x2
k· ·x ·e θ · dx = k · · −x · e +k· · · e θ · dx
0 θ θ 0 θ 0 2
(1) Z Z ∞
∞
3 2 − x2 3 θ x2
k· ·x ·e θ · dx = k · · · e− θ · dx
0 θ θ 2 0
q q R ∞ − u2
haciendo u = 2θ · x ; du = 2θ · dx y sabiendo que √2·π
1
0 e
2 · du =
1
2
Z ∞ Z ∞
r r √ Z ∞ √
2
− xθ − u2
2 θ θ π u2 θ·π
e · dx = e · · du = ·√ · e− 2 · du =
0 0 2 2 π 0 2
entonces (1) queda :
Z ∞ Z ∞ √
3 x2 3 θ x2 3 θ·π
k · · x2 · e− θ · dx = k · · · e− θ · dx = k · · =1
0 θ θ 2 0 2 2
Luego
4
k= √
3· π·θ
b)
6k x2 6k x2
c) f ′ (x) = θ · x · e− 2 − x3 · e− θ
θ 2·
x2 2
√
6kx
f ′ (x) = 0 ssi θ · e− θ · 1 − xθ , luego x = 0 y x = ± θ
23. La calificación de una cierta prueba sigue una distribución N(54, 16) . Se toma la prueba a 45 alumnos
¿cuál es la probabilidad que el promedio de las notas esté entre 58 y 68?
Solución.
La función generadora de momentos de la calificación X.
1 2 2
ϕX (t) = e54·t+ 2 ·16·t = e54·t+8·t
8 2 1 16 2
ϕX (t) = e54·t+ n ·t = e54t+ 2 · n ·t
Luego por similitud a la función generadora de momentos de N (54, 16)
X ∼ N (54, 16
n)
Cálculo de P (58 ≤ X ≤ 68) = 0, 1584.
72 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.
25. Sea X una v.a.c. con función densidad f (x) = α · k · x−(α+1) · I]b,∞[ (x); b > 0; α > 0
a) Determine el valor de k y las condiciones de éste para que f sea función densidad.
b) Determine el valor de a tal que P (X > a) = 0, 99
c) Los ingresos mensuales X ( medidos en miles de dólares) de una familia se distribuyen según la
función densidad
En una gran población se considera que una familia es de clase media alta si X > 5. De una base de datos
se extraen ingresos de familias de esa población al azar. Si la v.a. Y representa el número de extracciones
que se han de hacer hasta que sale una familia de clase media alta determinar el valor de r tal que
P (Y ≤ r) > 0, 9
Solución.
R∞
a) b
α · k · x−(α+1) dx = −k · x−α ]∞
b = k·b
−α
= 1; k = bα ; α > 0 ; b > 0
Ra
b) P (X < a) = 0, 01 = b α · bα · x−(α+1) · dx = −bα · x−α ]ab = −bα a−α + 1
q
Luego a−1 = α 0,99 √b
bα ;a = α 0,99
R∞ 16
c) p = P (X > 5) = 5 64 · x−5 dx = 625 = 0, 0256
Y ∼ Geo(0, 0256); fY (y) = p(1 − p)y−1 I{1,2,3,....} (y)
r
X 1 − (1 − p)r
P (Y ≤ r) = p(1 − p)k−1 = p · = 1 − (1 − p)r
p
k=1
1 − (1 − p)r > 0, 9 ; 0, 1 > (1 − p)r , por tanto, r > 88, 79; es decir, después de r = 89.
Solución.
a) FY (y) = P (Y ≤ y) = P (ln(1 − X) ≤ y) = 1 − P (X ≤ 1 − ey ) = 1 − FX (1 − ey )
derivando:
fY (y) = 2 · e2y · I]−∞,0[ (y)
5.2. EJERCICIOS DE APLICACIONES 73
b)
Z 0
Yt 2
ϕY (t) = E(e ) = eyt · 2 · e2y · dy =
−∞ 2+t
n
Y n n
−Y t t
−yi · n 2 2n
ϕ−Y (t) = E(e ) = E( e )= t =
i=1
2− n
2n − t
Solución.
R∞ R∞ h i∞
α·aa x1−α
a) E(X) = a xα+1 · x · dx = αaa · a x−α · dx = αaα · 1−α
a
α −a1−α α·a
Si (1 − α) < 0 entonces E(X) = αa · 1−α = − 1−α
Si no E(X) no existe.
R∞ a R∞ h 2−α i∞
E(X 2 ) = a xα·a 2
a+1 · x · dx = α · a
α
· a x1−a · dx = α · aα · x2−α
a
2−a 2
Si (2 − α) < 0 entonces E(X 2 ) = α · aα · −a α·a
2−α = − 2−α ( la varianza da negativa pues f no es
densidad).
RM α M
b) P (X < M ) = 0, 5 = α · a xaα+1 · dx = − [aα · x−α ]a = −aa (M −a − a−α )
1 1−a
1 1−a
1
2 − 1 = −M · aa , luego M = 2·a a
74 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.
30. Si X tiene función generadora de momentos ϕ(t) = e−t , determinar E(X) y V (X).
Solución.
ϕ′ (t) = −e−t luego E(X) = ϕ′ (0) = −1
ϕ′′ (t) = e−t luego E(X 2 ) = ϕ′′ (0) = 1
V (X) = E(X 2 ) − E 2 (X) = 1 − 1 = 0 .
Solución.
Solución.
R∞ −
e√
x R∞ u2 √ dx
a) 0 k· 2
x
· dx = 1 = k · 0 2 · e− 2 · du ; haciendo u = x ; du = √
2· x
Luego k = √1 = 0, 3989
2·π
R∞ −
e√
x R∞ e−x( −t)1 √ q1 dx
q
1
b) ϕX (t) = 0 ext · 2
x
· dx = 0
√2
x
· dx ; haciendo u = x · 2 − t ; du = √
2· x
· 2 −t
Z ∞
1 2 u2 1
ϕX (t) = √ ·√ · e− 2 · du = √
1 − 2t 2π 0 1 − 2t
3
c) ϕ′X (t) = (1 − 2t)− 2 ; ϕ′X (0) = 1 = E(X) = µ
3 3
ϕ′′X (t) = 2 · (1 − 2t)− 2 · (−2) ; ϕ′′X (0) = 3 = E(X 2 )
Luego: V (X) = σ 2 = 3 − 1 = 2 = σ 2
P (0 < X < µ + c · σ) = P (0 < X < 1 + 2c) = 0, 8
P (0 < X < 1 + 2c) = 0, 8 = 2(φ(1 + 2c) − 0, 5)
φ(1 + 2c) = 0, 9 , c = 0, 14
33. Suponga que el radio de un cojinete de esferas está distribuido U [0, 2].
Solución.
5.3. EJERCICIOS PROPUESTOS 75
q q
a) FV (v) = P (V < v) = P ( 34 π · r3 < v) = P (0 < r < 3 3v
4π )
3v
= Fr ( 3 4π )
r − 23
3 3v 1 3v 3
fV (v) = fr ( )· · · · I 32 (v)
4π 3 4π 4π [0, 3 ·π]
r − 23
3 3v 3v 1
fV (v) = fr ( )· · · I 32 (v)
4π 4π 4π [0, 3 ·π]
− 23
3v 1
fV (v) = · · I 32 (v)
4π 8 · π [0, 3 ·π]
4·π
R 4·π 2
3v − 3 1
b) P (0 < V < 3 ) = 0
3
4π · 8π · dv
4·π 1
P (0 < V < )=
3 2
34. Sea X ∼ N (3, 9). Calcular
a) P (0 < X < 6)
b) P (|X| < 3)
c) P (X < a) = 0, 8
Solución.
a) P (0 < X < 6) = P (X < 6) − P (X < 0) = 0, 841 − 0, 1587 = 0, 6823
b) P (−3 < X < 3) = P (X < 3) − P (X < −3) = 0, 5 − 0, 0228 = 0, 4772
c) P (X < a) = 0, 8. Usando normal inversa se obtiene que a = 5, 525
1
b) Determinar la densidad de la variable aleatoria Y = X
x2
fX (x) = k · ( · I[0,2] (x) + e−x · I]2,∞[ (x))
2
a) Determinar el valor de k.
b) Determinar la f.g.m. de X
c) Encontrar V (X).
9. Se define la función
1
f (x) = k · · IR (x)
1 + x2
Encontrar la constante k. ¿Existe la esperanza y varianza?
10. a) Sea X ∼ U [− π2 , π2 ] encontrar la función densidad de Y = c·sen(x) para cualquier valor de c constante
positiva.
b) Sea X ∼ exp(λ), se define la variable Y = eX . Encontrar E(Y ) ; E(Y 2 ) ; E(Y 3 ) y ver cuáles son las
condiciones de la existencia de tales momentos. Estudie qué pasa con ϕY , la f.g.m. de Y .
X−µ
a) Si Y = σ encontrar ϕY .
5.3. EJERCICIOS PROPUESTOS 77
b) Calcular E(X 4 ).
14. Se define la función densidad delta de Dirac como la función δx0 (x) = δ(x − x0 ) que satisface
R∞
i) −∞ δ(x − x0 )dx = 1
Rb
ii) a δ(x − x0 ) · f (x) · dx = f (x0 ) con a ≤ x0 ≤ b
Demostrar:
a) Si X ∼ δx0 Calcular ϕX
b) Si X ∼ δx0 Calcular E(X) y V (X)
15. a) Sea X una variable aleatoria con función densidad fX y W = √1 . Demostrar que si fX es una
X
función par
4 1
fW (w) = 3 · fX ( 2 )
w w
b) ¿Puede una función densidad o cuantía tener en su recorrido valores mayores que 1? Justifique y
ejemplifique.
c) ¿Puede una función densidad ser impar? Justifique.
1 1
fW (w) = · fX ( )
w2 w
Capítulo 6
En esta sección los conceptos de matriz de frecuencias, de la estadística bivariada, se formalizan funcionalmente,
de la misma manera que se hizo para el caso univariado. Las variables que representan las dos características
de la población a medir han de ser variables intervalares y se formalizarán como un vector (X, Y ). Luego los
valores que se pondrán en cada celda, de la matriz, se describirán funcionalmente como la función f→ − (x, y),
X
llamada función de cuantía conjunta.
Recordemos algunas definiciones y propiedades importantes.
Función de cuantía conjunta.
→
−
− , que satisface las
Al vector X = (X, Y ) se le asocia una función llamada función de cuantía conjunta, f→
X
propiedades :
− (a, b)
P (X = a, Y = b) = f→
X
P
1. Se llama función de cuantía marginal de Y a la función fY (y) = x∈Rec(X)
− (x, y)
f→
X
P
2. Se llama función de cuantía marginal de X a la función fX (x) = y∈Rec(Y )
− (x, y)
f→
X
79
80 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS
f→
− (x,y0 )
2. Se llama función de cuantía condicional de X, dado Y = y0 , a la función fX/Y =yo = X
fY (y0 )
→
−
1. Se llama Esperanza del vector X = (X, Y ) a
→
−
E( X ) = (E(X), E(Y ))
→
−
2. Se llama Esperanza de una transformación del vector X a
X X
E(g(x, y)) = − (x, y)
g(x, y) · f→
X
x∈Rec(X) y∈Rec(Y )
V (Y /X = x0 ) = E(Y 2 /X = x0 ) − E 2 (Y /X = x0 )
→
−
7. Se llama Covarianza de X = (X, Y ) a
2. Problemas de aplicaciones.
Este conjunto de problemas hace referencias a aplicación de ciertas propiedades o definición misma de
funciones de cuantía conjunta particulares y cálculos de sus medidas de centralidad y dispersión.
X X
E(X · Y ) = − (x, y)
x · y · f→
X
x∈Rec(X) y∈Rec(Y )
X X
E(X · Y ) = x · y · fX (x) · fY (y)
x∈Rec(X) y∈Rec(Y )
X X
E(X · Y ) = x · fX (x) · y · fY (y) = E(X) · E(Y )
x∈Rec(X) y∈Rec(Y )
XX X X
E(h(x) · g(y)) = h(x) · g(y) · fX (x) · fY (y) = h(x) · fX (x) · g(y) · fY (y)
x y x Y
P (Y = y) = fY (y)
P (X/Y ) = fX/Y
− (x, y)
f→
X
fX/Y = = fX (x)
fY (y)
con lo cual
− (x, y) = fX (x) · fY (y)
f→
X
Solución.
X − (x, y)
f→
X
E(X/Y ) = x·
fY (y)
x∈Rec(X)
X X − (x, y)
f→
X
E(E(X/Y )) = x· · fy (y)
fY (y)
y∈Rec(Y ) x∈Rec(X)
X X X
E(E(X/Y )) = − (x, y) =
x · f→
X
x · fX (x)
x∈Rec(X) y∈Rec(Y ) x∈Rec(X)
E(E(X/Y )) = E(X)
Demuestre que
r X
X s
Cov(X, Y ) = Xi · Yj · fij − X · Y
i=1 j=1
Solución. s
r X
X
Cov(X, Y ) = (Xi − X)(Yj − Y ) · fij
i=1 j=1
r X
X s
Cov(X, Y ) = (Xi · Yj · fij − Xi · Y · fij − X · Yj · fij + X · Y · fij )
i=1 j=1
r X
X s r X
X s r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · Xi · fij − X · Yj · fij + X · Y
i=1 j=1 i=1 j=1 i=1 j=1
6.1. PROPIEDADES DE FUNCIÓN DE CUANTÍA CONJUNTA Y DE SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓ
r X
X s r X
X s r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · Xi · fij − X · Yj · fij + X · Y
i=1 j=1 i=1 j=1 i=1 j=1
r X
X s r
X s
X
Cov(X, Y ) = (Xi · Yj · fij ) − Y · Xi · fi∗ − X · Yj · f∗j + X · Y
i=1 j=1 i=1 j=1
r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · X − X · Y + X · Y
i=1 j=1
r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · X
i=1 j=1
n
Y t t
ϕX (t) = eθ(1−e n ) = enθ(1−e n )
i=1
t
Si Y ∼ P (n · θ) entonces ϕY (t) = en·θ·(1−e )
n
Y t t
t
ϕX (t) = eθ(1−e n ) = enθ(1−e n ) = ϕY ( )
i=1
n
Luego X ∼ P (nθ)
t
Si Y ∼ P (n · θ) entonces ϕY (t) = en·θ·(1−e )
3
Pn Qn −3 Qn −3 −3
E(Z) = E(e− n · i=1 Xi ) = i=1 E(e n ·Xi ) = i=1 (eθ(1−e n ) = enθ(1−e n ) = ϕY (− n3 )
9. Demostrar que
V (aX + bY ) = a2 · V (X) + b2 · V (Y ) + 2 · a · b · Cov(X, Y )
Solución.
V (aX + bY ) = E((aX + bY )2 ) − E 2 (aX + bY )
Solución.
Como
V (aX + bY ) = a2 · V (X) + b2 · V (Y ) + 2 · a · b · Cov(X, Y )
Solución.
El espacio muestral
Ω = {(X1 , X2 , X3 , X4 ) : Xi ∈ {1, 2, 3}}
#Ω = 81
1
a) i) X = 1 entonces hay sólo 1 , (1, 1, 1, 1) luego P (X = 1) = 81
ii) X = 2 entonces
1 dado con un 2 ,
4
P ({(X1 , X2 , X3 , X4 )/∃!Xi : Xi = 2}) =
81
2 dados con un 2,
6
P ({(X1 , X2 , X3 , X4 )/∃Xi , Xj : Xi = Xj = 2; i 6= j}) =
81
6.2. PROBLEMAS DE APLICACIÓN 85
3 dados con un 2,
4
P ({(X1 , X2 , X3 , X4 )/∃!Xi : Xi < 2}) =
81
4 dados con un 2,
1
P ({(X1 , X2 , X3 , X4 )/∀i : Xi = 2}) =
81
Luego
15
P (X = 2) =
81
iii) X = 3 entonces
1 dado con un 3 ,con ningún 2
4
P ({(X1 , X2 , X3 , X4 )/∃!i : Xi = 3 ∧ ∀j 6= i : Xj = 1}) =
81
1 dado con un 3 ,con un solo 2
12
P ({(X1 , X2 , X3 , X4 )/∃!i, j : Xi = 3, Xj = 2; i 6= j}) =
81
1 dado con un 3 ,con sólo dos 2
12
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k : Xi = 3, Xj = 2 = Xk ; i 6= j 6= k}) =
81
1 dado con un 3 ,con tres 2
4
P ({(X1 , X2 , X3 , X4 )/∃!i : Xi = 3 ∧ ∀j 6= i : Xj = 2}) =
81
2 dados con un 3 ,con ningún 2
6
P ({(X1 , X2 , X3 , X4 )/∃!i, j : Xi = Xj = 3 ∧ ∀k ∈
/ {i, j} : Xk = 1}) =
81
2 dados con un 3 ,con sólo un 2
12
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k : Xi = Xj = 3 ∧ Xk = 2, i 6= j 6= k}) =
81
2 dados con un 3 ,con dos 2
6
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k, l : Xi = Xl = 3, Xj = 2 = Xk ; i 6= j 6= k 6= l}) =
81
3 dados con un 3, y un dado con 1
4
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k, l : Xi = Xl = 3 = Xj ; Xk = 1; i 6= j 6= k 6= l}) =
81
3 dados con un 3 y un dado con 2
4
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k, l : Xi = Xl = 3 = Xj ; Xk = 2; i 6= j 6= k 6= l}) =
81
4 dados con 3
1
P ({(X1 , X2 , X3 , X4 )/∀i : Xi = 3}) =
81
Luego
65
P (X = 3) =
81
Por tanto
X X=1 X=2 X=3
P(X=x) 1/81 15/81 65/81
86 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS
4/81 k=2
8/81
k=3
P (X1 + X2 = k) = 12/81 k=4
8/81 k=5
4/81 k=6
luego
304
P (X1 + X2 = X3 + X4 ) =
6561
12. Sean X e Y iid Bin(m, p). Encontrar la función de cuantía de Z = X + Y .
Solución.
→
−
Z ∈ {0, 1, 2, 3, 4, 5, ..., 2m}; X = (X, Y )
! !
m m
− (x, y) = fX (x) · fY (y) =
f→
X
· px+y (1 − p)2m−(x+y) · I{0,1,2,...,m}2 (x, y)
x y
k
X
P (X + Y = k) = P (X = j)P (Y = k − j)
j=0
! !
m m
− (j, k − j) = fX (j) · fY (k − j) =
P (X = j)P (Y = k − j) = f→
X
· pk (1 − p)2m−k
j k−j
luego ! !
z
X m m
fZ (z) = P (X + Y = z) = · pz (1 − p)2m−z
j=0
j z−j
ahora ! ! !
z
X m m 2m
· =
j=0
j z−j z
luego !
2m
fZ (z) = P (X + Y = z) = p(1 − p)2m−z · I{0,1,2,3,...,2m} (z)
z
Por tanto,
Z ∼ Bin(2m, p)
6.2. PROBLEMAS DE APLICACIÓN 87
→
−
13. Sea X = (X1 , X2 , .., Xn ) un vector aleatorio que recoge los resultados de n lanzamientos de una moneda
( cada uno independiente del otro). Cada moneda con probabilidad p de que salga cara. Se define
Y = X1 + X2 + ... + Xn
a) Calcular P (X1 /Y = k)
b) E(X1 /Y = k)
Solución.
P (Xi = 1) = p ; P (Xi = 0) = 1 − p
De igual forma:
P (Y = k/X1 = 0) · P (X1 = 0) k
P (X1 = 0/Y = k) = =1−
P (Y = k) n
k
E(X1 /Y = k) = 1 · P (X1 = 1/Y = k) + 0 · P (X1 = 0/Y = k) =
n
14. Dos líneas de producción manufacturan cierto tipo de artículos. Suponga que la capacidad (en cualquier
día dado) es dos artículos para la línea I y 3 para la línea II. Con base en la tabla adjunta que muestra la
distribución de probabilidades conjunta:
I/II 0 1 2 3
0 0 0,04 0,12 0,09
1 0,02 0,14 0,21 0,14
2 0,07 0,06 0,06 0,05
a) Obtener las funciones marginales de X e Y .
b) Hallar la probabilidad que en la línea I se produzca más que en la II.
c) Halle la probabilidad que en total se produzcan 3 artículos.
d ) Hallar la probabilidad que en la línea I se produzca más que en la II dado que se producen 3 artículos.
Solución.
I marginal I
a)
0 0,25
1 0,51
2 0,24
II marginal II
0 0,09
1 0,24
2 0,39
3 0,28
b) P (I > II) = P (1, 0) + P (2, 1) + P (2, 0) = 0, 15
c) P (I + II = 3) = P (0, 3) + P (1, 2) + P (2, 1) = 0, 36
88 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS
P (2,1) 0,07
d ) P (I > II/I + II = 3) = 0,36 = 0,36
Luego
t
ϕZ (t) = E(ezt ) = E(e(x+y)t ) = E(ext · eyt ) = E(ext ) · E(eyt ) = e2θ·(1−e )
luego
Z ∼ P (2λ)
18. Sean
1
X ∼ fX (x) = · I{1,2,...,n} (x)
n
1
Y ∼ fY (y) =
· I{1,2,...,m}(y)
m
independientes. Encontrar la función generadora de momentos de Z = X + Y
Solución.
Debemos saber:
1 1 et −et(n+1)
(i) Si X ∼ fX (x) = n · I{1,2,...,n}(x) entonces ϕX (t) = n · 1−et
1 1 − e(n+1)t 1 − e(m+1)t
ϕZ (t) = E(e(x+y)t ) = E(ext ) · E(eyt ) = · ·
n·m 1 − et 1 − et
19. Sea la tabla bivariada
0 1
Y X 1 0,1 0,2
4 0,5 0,2
Calcular
Cov(3X + 4Y, 2X + 6Y )
Solución.
Debemos saber:
(i)
Cov(aX + bY, cX + dY ) = ac · V (X) + bd · V (Y ) + (ad + bc)Cov(X, Y )
1
− (x, y) =
f→
X
· I{1,2,3,...,n}×{1,2,3,...,m} (x, y)
nm
k
X k
X
P (X + Y = k) = P (X = j)P (Y = k − j) = − (j, k − j)
f→
X
j=1 j=1
a) Determine el valor de k.
b) Determine las funciones de cuantía marginales.
c) ¿ Son X e Y independientes? .
d ) ) Calcular E(X/Y = 3) .
→
−
3. Sea el vector aleatorio X = (X, Y ) donde X : el número de caras al lanzar 4 monedas Y : el número
obtenido al lanzar un dado.
4. Sea
− (x, y) = k · (x2 + x · y) · I{0,1,2,3}×{0,2,3} (x, y)
f→
X
a) Encontrar marginales
b) E(X); E(Y ); V (X) ; V (Y )
c) E(X/Y = 2) ; V (X/Y = 2)
d ) Correlación entre X e Y .
e) P (1 < x < 3/y > 2)
6. Suponga que el 47 % de los lectores de un país apoyó al candidato Álvarez, el 21 % al candidato Bastías,
el 18 % se abstuvo y los restantes lectores anularon el voto. Si se seleccionan al azar 100 electores, ¿cuál
es la probabilidad de que 50 de ellos haya apoyado a Álvarez, 18 a Bastías y 20 hayan anulado el voto?.
7. Demuestre que
X X
Cov(X, Y ) = − (x, y) = E(X · Y ) − E(X) · E(Y )
(X − E(X)) · (Y − E(Y )) · f→
X
x∈Rec(X) y∈Rec(Y )
8. Demuestre que
En esta sección los conceptos de vectores aleatorios discretos, se formalizan funcionalmente, de la misma manera
que se hizo para el caso univariado, de variable aleatoria discreta a contínua. Las variables que representan las
dos características de la población a medir han de ser variables intervalares y se formalizarán como un vector
(X, Y ). Se define la función de densidad conjunta, marginales, condicionales con las medidas de centralidad y
dispersión similarmenete que el caso discreto.
Recordemos algunas definiciones y propiedades importantes.
Función de densidad conjunta.
→
−
− , que satisface las
Al vector X = (X, Y ) se le asocia una función llamada función de densidad conjunta, f→
X
propiedades :
Z a Z b
− (a, b) =
F→
X
− (x, y) · dy · dx
f→
X
−∞ −∞
− (a, b)
P (X ≤ a, Y ≤ b) = F→
X
93
94 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
V (Y /X = x0 ) = E(Y 2 /X = x0 ) − E 2 (Y /X = x0 )
2. Problemas de aplicaciones.
Este conjunto de problemas hace referencias a aplicación de ciertas propiedades o definición misma de
funciones de densidad conjunta particulares y cálculos de sus medidas de centralidad y dispersión y
función generadora de momentos. El estudiante usará para su resolución, lo aprendido en los problemas
resueltos
σ2
se distribuye N (u, n )
Solución.
(por independencia ver ejercicio 4 , de esta sección).
n
Y n
Y
t
Pn tXk tXk
ϕX (t) = E(e n · k=1 Xk
) = E( e n )= E(e n )
k=1 k=1
1 2 2
ϕX (t) = eut+ 2 σ t
si X ∼ N (u, σ 2 ). Luego
n
Y tXk
ut σ2 t2 n σ2 t2
ϕX (t) = E(e n ) = e n + 2n2 = eut+ n
k=1
2
. Luego al tener la misma función generadora se obtiene X ∼ N (u, σn )
→
− 1 1 −1 t
2. Sea X = (X1 , X2 ) vector aleatorio binormal, f→
− (x, y) = √
X
·e− 2 ·(x−µ,y−ν)·Σ (x−µ,y−ν) ·IR×R (x, y).
2π·det(Σ)
1 − 21 ·( (x−µ)
2
+ (y−ν)
2
)
− (x, y) = √
f→
X
p p · e V (X) V (Y ) · IR×R (x, y)
2π · V (X) · V (Y )
Luego
1 1 (x−µ)2 1 (y−ν)
2
− (x, y) = √
f→
X
p p · e− 2 ·( V (X) ) · e− 2 ( V (Y ) ) · IR×R (x, y)
2π · V (X) · V (Y )
Luego
− (x, y) = fX (x) · fY (y)
f→
X
96 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
R∞ R∞ R∞
E(E(X/Y )) = −∞
x −∞
f (x, y) · dydx= −∞
x · f (x)dx = E(X)
4. Sabiendo que si X e Y son v.a.c independientes demostrar que g(X), h(Y ) son independientes, siendo g y
h integrables.
Solución. Z ∞ Z ∞
E(g(X) · h(Y )) = − (x, y) · dy · dx
g(x) · h(y) · f→
X
−∞ −∞
Z ∞ Z ∞
E(g(X) · h(Y )) = g(x) · h(y) · fX (x) · fY (y) · dy · dx
−∞ −∞
Z ∞ Z ∞
E(g(X) · h(Y )) = g(x) · fX (x) · dx · h(y) · fY (y) · dy
−∞ −∞
Cov(X, Y − E(Y /X)) = E(X · (Y − E(Y /X)) = E(X · Y ) − E(X · E(Y /X))
Ahora :
Z ∞ Z ∞ Z ∞
E(X · E(Y /X)) = X · E(Y /X) · fX (x) · dx = X · Y · fX/Y · fX (x) · dy · dx
−∞ −∞ −∞
Z ∞ Z ∞
E(X · E(Y /X)) = X · Y · f (x, y) · dy · dx = E(X · Y )
−∞ −∞
luego
Cov(X, Y − E(Y /X)) = E(X · Y ) − E(X · E(Y /X)) = E(X · Y ) − E(X · Y ) = 0
8. Demuestre que :
V (Y ) = E(V (Y /X)) + V (E(Y /X))
Solución.
E(V (Y /X)) = E(E(Y 2 /X) − E 2 (Y /X)) = E(E(Y 2 /X)) − E(E 2 (Y /X))
Luego:
E(V (Y /X)) + V (E(Y /X)) = E(Y 2 ) − E 2 (Y ) = V (Y )
9. Usando V (Y ) = E(V (Y /X)) + V (E(Y /X)), demuestre que si V (Y ) = E(V (Y /X)) entonces E(Y /X) es
constante.
Solución.
Como V (Y ) = E(V (Y /X)) + V (E(Y /X)) y V (Y ) = E(V (Y /X)), entonces V (E(Y /X)) = 0 lo cual
implica que E(Y /X) = c
Solución.
Z ∞ Z ∞ Z ∞
E(X · E(Y /X)) = X · E(Y /X) · fX (x) · dx = X · Y · fY /X · fX (x) · dx · dy
−∞ −∞ −∞
Z ∞ Z ∞
E(X · E(Y /X)) = X · Y · fY /X · fX (x) · dx · dy
−∞ −∞
Z ∞ Z ∞
E(X · E(Y /X)) = − (x, y) · dx · dy = E(X · Y )
X · Y · f→
X
−∞ −∞
98 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
Cov(E(Y /X), Y ) = E(E 2 (Y /X)) − (E(E(Y /X))2 = E(E 2 (Y /X)) − E 2 (E(Y /X))
13. Calcular
Cov(X, Y )
Cov(X − E(Y /X), Y − · X)
V (X)
Solución
Usando la multicolinealidad de la covarianza (esta es un producto punto)
Cov(X, Y ) Cov(X, Y )
Cov(X−E(Y /X), Y − ·X) = Cov(X, Y )−Cov(X, Y )−Cov(E(Y /X), Y )+ Cov(E(Y /X), X)
V (X) V (X)
Cov(X, Y ) Cov(X, Y )
Cov(X − E(Y /X), Y − · X) = −Cov(E(Y /X), Y ) + Cov(E(Y /X), X)
V (X) V (X)
(1)
Cov(E(Y /X), X) = E(X · E(Y /X)) − E(Y )E(X) = E(X · Y ) − E(Y ) · E(X) = Cov(X, Y )
Cov(E(Y /X), Y ) = E(E 2 (Y /X)) − (E(E(Y /X))2 = E(E 2 (Y /X)) − E 2 (E(Y /X))
(2)
Cov(E(Y /X), Y ) = V (E(Y /X))
Luego
Cov(X, Y ) Cov(X, Y )
Cov(X − E(Y /X), Y − · X) = −Cov(E(Y /X), Y ) + Cov(E(Y /X), X)
V (X) V (X)
Usando (1) y (2)
Cov(X, Y ) Cov 2 (X, Y )
Cov(X − E(Y /X), Y − · X) = −V (E(Y /X)) +
V (X) V (X)
7.1. PROBLEMAS REFERENTES A PROPIEDADES 99
Solución.
Cov(X, Y ) Cov 2 (X, Y ) Cov(X, Y )
Cov(Y −E(Y /X), Y − ·X) = V (Y )− −Cov(E(Y /X), Y )+ ·Cov(E(Y /X), X)
V (X) V (X) V (X)
Cov(X, Y )
Cov(Y − E(Y /X), Y − · X) = V (Y ) − V (E(Y /X)) = E(V (Y /X))
V (X)
como
E((Y − E(Y /X))2 ) = E(V (Y /X))
Cov(X, Y )
Cov(Y − E(Y /X), Y − · X) = E((Y − E(Y /X))2 )
V (X)
15. Demostrar que si X e Y son v.a.c entonces la función E((Y − θ)2 /X) se minimiza si θ = E(Y /X)
Solución. Z ∞
E((Y − θ)2 /X) = (y − θ)2 · fY /X · dy
−∞
Z ∞
∂ − (x, y)
f→
E((Y − θ)2 /X) = −2 · (y − θ) · X
· dy = 0
∂θ −∞ fX (x)
Z ∞ Z ∞ − (x, y)
f→
X
−2 · y · fY /X · dy + 2θ · · dy = 0
−∞ −∞ fX (x)
Pero Z ∞
−2 · y · fY /X · dy = −2 · E(Y /X)
−∞
Z ∞ − (x, y)
f→
X
2θ · · dy = 2θ
−∞ fX (x)
Luego
Z ∞ Z ∞ − (x, y)
f→
X
−2 · y · fY /X · dy + 2θ · · dy = 0
−∞ −∞ fX (x)
implica θ = E(Y /X)
Ahora veamos su segunda derivada.
∂2
E((Y − θ)2 /X) = 2 > 0
∂θ2
Luego E((Y − θ)2 /X) se minimiza si θ = E(Y /X)
100 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
→
−
16. Sea X = (X, Y ) ∼ f→− un vector aleatorio y W = g(Y ) , con g una función invertible con derivada de g −1
X
no nula en B ′ ⊆ R. Entonces Z
E(W/X) = g(y) · fY /X · dy
B
−1 ′
B= y=g (w)/w ∈ B
Solución.
1 0
−1 ∂(X,Y ) ∂g−1
Y =g (W ) ; X = U ; J = ∂(U,W ) = ∂g−1 = ∂w 6= 0 ( con derivada no nula en B ′ ⊆ R)
0 ∂w
−1
∂g
− (u, g −1 (w)) ·
− (u, w) = f→
f→
U X ∂w · IA×B ′ (u, w)
∂g−1 1 ∂g
∂w = ∂g ; dw = ∂y · dy
∂y
Z Z −1
∂g
fU (u) = − (u, w) · dw =
f→ − (u, g
f→ −1
(w)) · · IA (u) · dw
B′
U
B′
X ∂w
Z −1
∂g ∂g
fU (u) = − (x, y) ·
f→
X ∂w · ∂y IA (u) · dy = fX (x)
B
Z Z
− (u, g −1 (w)) ∂g −1
f→
E(W/X) = w · fW/U · dw = w· X
· · IA (u) · dw
B′ B′ fU (u) · IA (u) ∂w
Z Z
− (x, y) ∂g −1 ∂g
f→
E(W/X) = g(y) · X
· · · dy = g(y) · fY /X · dy
B fU (u) ∂w ∂y B
17. Sea {Xn } independientes con función densidad fX . Determinar la función densidad de M = máx {Xi }.
Solución.
FM (m) = P (X1 ≤ m, X2 ≤ m, ..., Xn ≤ m) = (FX (m))n
Derivando
fM (m) = n · (FX (m))n−1 · fX (m)
Solución.
a) Z Z Z Z
∞ ∞ ∞ ∞
1 x y
k e− 2 ·(x+y) dx · dy = 1 = k · e− 2 · dx · e− 2 dy = 4k
0 0 0 0
1
por tanto k = 4
7.2. PROBLEMAS DE APLICACIONES. 101
b)
Z ∞ Z x Z ∞
1· − x − y 1 x x
P (X > Y ) = e 2 · e 2 dy · dx = e− 2 (2 − 2 · e− 2 ) · dx
0 0 4 4 0
Z ∞ Z ∞
1 x 1 1 −x ∞ 1
P (X > Y ) = · e− 2 dx − · e−x · dx = 1 − · −e 0
=
2 0 2 0 2 2
c)
1 −x
fX (x) = · e 2 · I[0,∞[ (x)
2
y
1 −y
fY (y) = · e 2 · I[0,∞[ (y)
2
y es claro que f→
− (x, y) = fX (x) · fY (y)
X
19. Ciertas vigas tienen secciones rectangulares cuyas dimensiones, largo y ancho se pueden representar me-
diante una distribución Normal Bivariada con vector de medias y matriz de covarianzas , donde:
" # " #
10 1/2 0
µ= ,Σ=
15 0 1
Los límites de tolerancia para el largo de la viga son ]9, 8; 10, 3[ y para el ancho ]14, 7; 15, 6[. Una viga se
considera defectuosa si el largo o el ancho están fuera de los límites de tolerancia. Si toma una muestra
de 10 vigas, ¿cuál es la probabilidad de que 8 de estas no sean defectuosas?.
Solución.
El largo y ancho son independientes ( X e Y distribuidas N (u, σ 2 ) entonces Xe Y son independientes ssi
Cov(X, Y ) = 0)
L ∼ N (10, 21 ) ; A ∼ N (15, 1)
P (9, 8 ≤ L ≤ 10, 3) = p = 0, 14 Se calcula con la T.I
P (14, 7 ≤ A ≤ 15, 6) = q = 0, 346 Se calcula con la T.I
Si Z: número de vigas no defectuosas entonces Z ∼ Bin(10, pq)
!
10
Se calcula P (Z = 8) = (pq)8 (1 − pq)2
8
→
−
20. Sea X = (X1 , X2 , X3 ) vector
aleatorio normal con vector de medias (1, 2, 2) y matriz de varianza y
1 0 0
covarianzas Σ = 0 9 0 .
0 0 4
Si se definen Y1 = 3X1 + 2X2 − X3 e Y2 = 2X1 − X2 .
Determinar Corr(Y1 , Y2 ) .
Solución.
Cov(Y1 , Y2 )
Corr(Y1 , Y2 ) =
S Y1 · S Y2
Cov(Y1 ,Y2 )
Corr(Y1 , Y2 ) = = √ −12
√
SY1 ·SY2 61· 13
p
21. Sean Y1 , Y2 ∼ N (0, 1) independientes. Determinar la función densidad de U = Y12 + Y22
Solución.
−y
e 2
Y = X 2 tiene función distribución f (y) = √
2πy
· I(0,∞) (y)
−y
e
Z = U + V teniendo U y V la distribución f (y) = √ 2
2πy
· I(0,∞) (y) e independiente.
Se genera el vector (Z, W ) por T (U, V ) = (U + V, U ) = (Z, W )
0 < Z < ∞ ; 0 < W < Z ; Jacobiano:=1.
1 −z
f (z, w) = p · e 2 · I(0,∞)x[0,z] (z, w)
2π w(z − w)
1
22. Si f (Y /X) = 1−x · I[x,1] (y) y fX (x) = I[0,1] (x) encontrar fY
Solución.
1
f (x, y) = f (x/y) · fX (x) = · I[0,1]x[x,1]
1−x
y
1
f (x, y) = f (x/y) · fX (x) = · I[0,y]x[0,1]
1−x
Z y
1
fY (y) = · I[0,1] (y) · dx = −ln(1 − y) · I]0,1[ (y)
0 1−x
Solución.
b) La región de integración es
0 1 2 3 4
√
La región es x ∈ [0, ∞[ ; y ∈ [ x, ∞[
√ R ∞ R ∞ 2 −λ(x+y) R∞ ∞
P (Y > X) = 0 √x λ · e · dy · dx = 0 e−λx · λ · −e−λy √x dy
√ R∞ √ R∞ √ R∞ √ 1 2 λ
P (Y > X) = 0 λ · e−λx · e−λ· x · dx = λ · 0 e−λ(x+ x) dx = λ · 0 e−λ( x+ 2 ) · e 4 · dx
√ λ
√
P (Y > X) = √22λ − e− 4 (1 − φ( 2λ ))
1 1
c) Cov(U, V ) = E((X − Y )(X + Y )) − E(X + Y )E(X − Y ) = V (X) − V (Y ) = λ2 − λ2 =0
24. Un banco ha destinado una ventanilla para operaciones desde el automóvil y otra para personas a pie. En
un día seleccionado al azar se definen :
X = proporción del tiempo que la ventanilla para automovilistas da servicio
Y = proporción del tiempo que la ventanilla para clientes a pie da servicio .
Si suponemos que la función densidad conjunta es f (x, y) = 56 · y 2 + x I[0,1]×[0,1] (x, y)
a) ¿ Cuál es el porcentaje que la ventanilla de atención a clientes peatones está ocupada a lo sumo 50 %
del tiempo, dado que la ventanilla de clientes en auto ocupó un 80 % del tiempo?
b) Determinar la probabilidad que ninguna de las ventanillas esté más del 25 % del tiempo ocupado.
c) Calcule P (X > Y )
Solución.
R 0,5 6
f (Y <0,5;X=0,8) ·(y 2 +0,8)dy
a) f (y < 0, 5/X = 0, 8) = fX (0,8) = R 1 65
0
(y 2 +0,8)dy
0 5
R 0,25 R 0,25 6 2
b) P (X < 0, 25; Y < 0, 25) = 0 0 5 (y + x)dydx=0,0109
R1Rx 6 2
c) P (X > Y ) = 0 0 5 (y + x)dydx = 0, 5
→
−
25. Sea X = (X, Y ) un vector aleatorio continuo tal que:
ln(2y) − ln( 21 + y)
fY (y) = · I[ 1 ,1] (y)
ln(2) − 23 ln( 32 ) 2
y − 12
E(X/Y ) = −y
ln(2y) − ln( 21 + y)
1
;x∈ 2, y
Determinar E(X).
Solución.
104 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
Z ∞
E(X) = E(E(X/Y )) = E(X/Y ) · f (y) · dy
−∞
3
haciendo k = ln(2) − 2 · ln( 23 )
Z 1 Z 1
1 1 1 1
E(X) = · (y − ) · dy − · (y · ln(2y) − y · ln( + y)) · dy
k 1
2
2 k 1
2
2
1 3 1 3 3
E(X) = · ( − · ln(2) + · ln( ))
k 8 2 8 2
26. Sean {Xi } variables aleatorias independientes con función densidad
x x
fX (x, θ) = · e− θ · I[0,∞[ (x); θ > 0
θ2
a) Determinar la función generadora de momentos de una v.a X con función densidad fX
b) Determinar la función generadora de momentos de una v.a X con función densidad ( Chi cuadrado
con 1 g.l)
x x
g(x, θ) = √ · e− 2 · I[0,∞[ (x)
2πx
c) Determinar la función generadora de momentos de suma de 4n chi cuadrados independientes.
P3n
2 Xi
d ) Demuestre que, si Xi ∼ fX , i = 1, 2, ..., 3n entonces Q = i=1
θ se distribuye χ2(4n)
e) Determinar un intervalo de confianza para θ con γ % de confianza
Solución.
a) F.G.M de X ∼ fX
1
R∞ 1 1
ϕX (t) = E(ext ) = θ2 · 0
x · e−x( θ −t) dx = (1−θt)2 ; (1 − θt) > 0
b) F.G.M de una χ21
R∞√ 1
ϕX (t) = E(ext ) = √1 · x · e−x( 2 −t) dx = 1
3
2π 0 (1−2t) 2
c) F.G.M de 4n χ21
P4n
Xi t
Q4n 1 1
ϕY (t) = E(e i=1 )= i=1 3 = (1−2t)6n
(1−2t) 2
d ) F.G.M de Q.
2t
P3n Q3n 2t Q3n 1 1
ϕQ (t) = E(eQt ) = E(e θ · i=1 Xi
)= i=1 E(e θ ·Xi ) = i=1 (1−2t)2 = (1−2t)6n
Luego Q ∼ χ24n
P3n
2 Xi 6n·X3n
e) P (Q > c) = γ ; Q = i=1
θ > χ24n;(1−γ) luego 0 < θ < χ24n,(1−γ)
u
27. Sea X ∼ N (0, 1) e U ∼ fU (u) = √1 · e− 2 · I]0,∞[ (u) independientes.
2πu
√
a) Encontrar la función densidad de Y = U
→
−
b) Encontrar la función densidad de X = (X, Y )
X
c) Encontrar la función densidad de T = Y
Solución.
a) FY (y) = P (Y ≤ y) = P (U ≤ y 2 ) = FU (y 2 )
y2
fY (y) = √2 · e− 2 · I]0,∞[ (y)
2π
7.2. PROBLEMAS DE APLICACIONES. 105
2
1 1
+y 2 )
b) f→
− (x, y) =
X π · e− 2 ·(x · I]0,∞[ (y) · IR (x)
X
c) T = Y ;S=X
S
X =S ;Y = T , J = − TS2
Se define la transformación L : R2 → R2 , L(x, y) = (t, s) = ( xy , x) se observa que todo el eje Y ,
vectores de la forma (0, y); y 6= 0 va a parar al valor (0, 0), y los vectores de la forma (x, 0) se van al
infinito, pero el valor y = 0 no está en el dominio.
→
−
El dominio del vector aleatorio X = (X, Y ) es R×]0, ∞[
→
−
El dominio del vector aleatorio T = (t, s) es ] − ∞, 0[×] − ∞, 0[∪]0, ∞[×]0, ∞[
s2
·(1+ t12 ) |s|
Luego f→
− (t, s) =
T
1
π · e− 2 · t2 · (I]−∞,0[×]0,∞[ (t, s) + I]0,∞[×]0,∞[ (t, s))
Integrando respecto de s, se obtiene:
1 1
fT (t) = − π·(1+t2 ) · I]−∞,0[ (t) + π(1+t2 ) · I]0,∞[ (t)
a) Determinar fU (u, v)
b) Demostrar que U y V , son dependientes
c) Probar que Cov(U, V ) = 0
Solución.
− (x, y) = λ2 · e−λ(x+y) · I[0,∞[2 (x, y)
a) Por ser X, Y independientes f→
X
1 1
∂(X,Y ) 2
X = 2 ; Y = 2 ; J = ∂(U,V ) = 1 1 = 21
U+V V −U 2
−2 2
La transformación T : R2 → R2 es lineal y definida por: T (x, y) = (x − y, x + y) = (u, v)
T envía el primer cuadrante a la región entre las rectas y = x ; y = −x
→
−
Luego la región que define al vector U = (u, v) es:
Solución.
La región de integración
y=2x
R 1 R 2x R1
a) 0 0
K(x + y)dydx = 1 = K 0
(4x2 )dx = K ·4
3
3
Por lo tanto K = 4
b) La figura
R1R x
3 3
R1h ix
y2 2 3
R15
P (X > 2Y ) = 0 0
2
4 · (x + y)dydx = 4 · 0 xy + 2 0 = 4 · 0 8 · x2 dx
5
P (X > 2Y ) = 32
a) Determinar K, fX , fY .
b) Calcular E(X/Y = 1)
7.3. PROBLEMAS PROPUESTOS 107
c) Calcular P (X > Y )
Solución.
Gráfico :
y=x
y
y=5
y =1−x
R 12 R 5 R5R5 1913
a) 1 = 0 −x+1 K · (x + y)dydx + 12 x K · (x + y)dydx = k( 16 )
16
k = 1913
R5 16 2
fX (x) = −x+1 1913 · (x + y)dy = k · ( 3·x
2 + 3x + 13) si 0 ≤ x ≤ 2
1
R 5 16 2
fX (x) = x 1913 · (x + y)dy = k · ( −3·x
2 + 5x + 25 1
2 ) si 2 < x ≤ 5
Ry 16
fy (y) = −y+1 1913 · (x + y)dx = k · (2 · y 2 − 12 ) si 21 ≤ y ≤ 1
R y 16
fy (y) = 0 1913 · (x + y)dx = k · ( 3·y22 ) si 1 < y ≤ 5
f (x,1) (x+1) 2
b) fX/Y =1 = fY (1) = 3 = 3 (x + 1) · I[0,1] (x)
2
R1
E(X/Y = 1) = 0 23 (x + 1) · xdx = 95
R5R5 91
c) P (X > Y ) = 1 x K · (x + y)dydx = 8
2
a) Determinar el valor de k.
b) Encontrar la función densidad de Z = X + Y
3. Las barras provenientes de un tren de laminación tienen sección rectangular y sus lados X e Y tiene
1 1
longitudes variables con distribuciones uniformes independientes fX (x) = 0,1 · I]1,1,1[ (x) ; fY (y) = 0,2 ·
I]2,2,2[ (y). Determine la probabilidad de que el área de una barra sea superior a 2.2.
→
−
4. Suponga que X = (X, Y ) es Normal Bivariada tal que:
Cov(X, Y ) = 16
E(Y /X = 3) = 9
E(X/Y = 6) = 3
V (X) = 16 ; V (Y ) = 64
a) Encontrar el valor de k
b) ¿Son X e Y independientes?
c) Determinar la función densidad de Z = 2X + Y
→
− √ √
− (x, y) = 4xy · I[0,1]×[0,x1] (x, y) encontrar l función densidad de Z =
6. Si X = (X, Y ) ∼ f→
X
X+ Y
→
−
7. Si X = (X, Y ) ∼ f→
− (x, y) = k(x + y) · I[0,1]×[1,2] (x, y)
X
a) Encontrar el valor de k
1
b) Encontrar P (X ≥ 2 ·Y)
c) Encontrar E(Y /X)
11. Sea f (x, y) = k · IS (x, y) donde S es la región delimitada por las rectas S : x + y = 9; y − 2x = 6; y = 0.
Calcular P (X + Y > 3)
12. Suponga dos componentes T1 y T2 tienen distribución exponencial independientes exp(α) y exp(β) . De-
termine:
a) P (T1 > T2 )
b) P (T1 > 2 · T2 )
c) Determine la distribución de Z = min {T1 , T2 }
13. Sean X1 , X2 , ..., Xn variables aleatorias independientes con función densidad exp(λ). Demostrar que la
variable aleatoria
Xn
Y = Xi
i=1
14. Sea {Xn } independientes con función densidad fX . Demostrar que la función densidad de K = min {Xi }
es fK (k) = n · (1 − FX (k))n−1 · fX (k)
110 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
Capítulo 8
Estimación puntual.
En esta sección atendemos una pregunta que ha de hacerse el usuario cuando tiene sus datos y ya ha visto
de que tipo de distribución provienen pero desconoce sus parámetros. Por ejemplo, el problema 18 de variable
continua:
Sean n datos los cuales debemos decidir si provienen de una distribución normal o no. Para ello se realiza el
siguiente procedimiento:
(1) Se ordena la información dada x(i) : i = 1, 2, 3, ..., n
(2) Se construyen los datos yi = Φ−1 ( i−0,375
n+0,25 ); Φ
−1
: distribución normal estándar inversa.
(3) Se calcula la correlación entre los x(i) , yi
(4) Si tal correlación está en los rangos de aceptación entonces los datos se aceptan como provenientes de una
distribución normal.
Dados los datos siguientes que son 20 observaciones del voltaje de falla de una pieza de resina Epóxica ( IEEE
trans. on Dielectrics and Elec. Insul., 1996, pp 43-55)
24.46; 25.61; 26.25; 26.42; 26.66; 27.15; 27.31; 27.54; 27.74; 27.94; 27.98; 28.04; 28.28; 28.49; 28.50; 28.87; 29.11;
29.13; 29.50, 30.88.
Verificar si provienen de una distribución Normal.
Esta estrategia, llamada Ryan - Joiner, verifica que los datos provienen de una normal pero desconoce cuál es
la media y la varianza.
En este caso, debemos buscar métodos que nos permitan decidir cuáles son los parámetros:
(I) Método de los Momentos.
Sean X1 , X2 , X3 , ..., Xn ∼ fX (x, θ1 , θ2 , θ3 , ..., θp ) , los parámetros son θi
Pn
En este método se igualan los momentos muestrales ( n1 k=1 xri ; momento muestral de orden r) con los
momentos teóricos ( E(X r ) ; momento de orden r teórico). Si hay p parámetros y se tienen n datos entonces se
construyen p ecuaciones al igualar los momentos teóricos y muestrales de orden 1, 2, 3, ..., p
Es decir, para k = 1, 2, 3, ..., p
n
1 X k
E(X k ) = · x
n i=1 i
Los momentos teóricos son expresiones en términos de los parámetros, con lo cual se tienen p ecuaciones y p
incógnitas.
111
112 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.
n
Y
− (x1 , x2 , ..., xn ; θ1 , θ2 , ..., θp ) =
f→
Y
fY (xi ; θ1 , θ2 , ..., θp )
i=1
Se construye posteriormente la función de verosimilitud, que no es otra cosa que la evaluación de la función
densidad conjunta en los datos dados.
n
Y
− (y1 , y2 , ..., yn ; θ1 , θ2 , ..., θp ) =
f→
Y
fY (yi ; θ1 , θ2 , ..., θp )
i=1
d(ln(f (x)) 1 df
= ·
dx f (x) dx
que dice que las raices de la derivada de la función ln ◦f son los mismos que los de la derivada de f . Esta
propiedad agiliza la búsqueda de raices de la derivada de funciones que son generalmente exponenciales. Por
ello se construye la función log-verosímil, con la finalidad de linealizar.
n
Y
− (y1 , y2 , ..., yn ; θ1 , θ2 , ..., θp )) = ln(
ln(f→
Y
fY (yi ; θ1 , θ2 , ..., θp ))
i=1
Finalmente se busca para qué valores de θi , i = 1, 2, 3..., p la función log- verosímil se maximiza. De allí el
nombre del método.
(III) Método de Intevalos de Confianza.
En este método no se busca un estimador del parámetro sino que se busca una región en la cual, con una cierta
probabilidad, el parámetro esté. Explicaré, un poco más adelante, que los otros métodos en realidad hacen algo
similar.
Ejemplificaremos el método.
Imaginemos que se tienen lo datos X1 , X2 , X3 , ..., Xn provenientes de una N (u, σo2 ), σo2 conocida.
Paso1: Construcción de una variable aleatoria que dependa del parámetro, pero su función densidad o cuantía,
no.
σo2
Sabemos que X ∼ N (u, n ) . Luego la variable buscada (Pivote) es
X −u
Z= σo ∼ N (0, 1)
√
n
Paso2: Construcción de un intervalo simétrico para la variable Z , con una probabilidad de (1 − α).
Como Z tiene una distribución conocida y el área bajo la curva en el intervalo buscado es (1 − α) (α se llamará
nivel de significancia)
113
El valor de λ = z1− α2 es el máximo del intervalo ] − ∞, λ], en el cual el área bajo la curva es igual a 1 − α2 .
Por tanto, el intervalo para Z es
−z1− α2 ≤ Z ≤ z1− α2
entonces
X −u
−z1− α2 ≤ σo ≤ z1− α2
√
n
despejando u de la inecuación:
σo σo
X − z1− α2 · √ ≤ u ≤ X + z1− α2 · √
n n
Es el intervalo de confianza con 1 − α de nivel de significancia.
Sin embargo el estimador a ser escogido debe satisfacer las dos propiedades siguientes:
Insesgamiento.
Sea θ̂ un estimador de θ, parámetro de la función densidad o cuantía f (x, θ). Diremos que ” θ̂ es un
estimador insesgado de θ” sí y sólo sí
E(θ̂) = θ
Eficiencia.
Sea θ̂ , δ̂ dos estimadores de θdiremos que ” θ̂ es más eficiente que δ̂” sí y sólo sí V (θ̂) < V (δ̂).
La elección del estimador es que satisfaga ambas propiedades. Es decir, del conjunto de estimadores
insesgados se escoja el de menor varianza.
Para ello se tienen las dos estrategias siguientes para decidir la eficiencia de un estimador insegado.
114 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.
∂ln(f (−
→
x , θ)
= a(θ)(θ̂ − θ)
∂θ
1
V (θ̂) ≥ − 2
n· E( ∂ ln(f (x,θ)
∂θ 2 )
1
V (θ̂) = − 2
n· E( ∂ ln(f (x,θ)
∂θ 2 )
1
f (y; a, b) = · I[a,b] (y)
b−a
la función densidad conjunta de la variable aleatoria Y
1
f (−
→
y ; a, b) = · I[a,b]n (−
→
y)
(b − a)n
la función de verosimilitud
1
f (−
→
x ; a, b) = · I n (−
→
x)
(b − a)n [a,b]
Como tal función no es diferenciable, respecto de a y b, usaremos la noción primigenia: ”para qué valores
de a y b, la función de verosímilitud se maximiza”
Observamos que la función
1
f (−
→
x ; a, b) = · I[a,b]n (−
→
x)
(b − a)n
1
toma el valor 0 si alguno de los datos no está en [a, b]; y toma el valor (b−a) n , cuando todos los datos
están en [a, b]. Es claro que se obtendrá un máximo en esta última situación. Luego, como todos los datos
deben estar en ese intervalo es claro que
2. Sea X1 , X2 , ..., Xn i.i.d f (~x, θ) y sea θ̂ un estimador máximo verosímil de θ. Sea τ una función biyectiva
con derivada no nula. Demuestre que el estimador máximo verosimil de τd (θ), de τ (θ) ,es τ (θ̂).
Solución.
∂ln(f (x,τ (θ))
= ∂ln(f (x,τ (θ))
· ∂τ ˆ anula la parte izquierda entonces se anula en
= 0 lo que significa que τ (θ)
∂θ ∂τ (θ) ∂θ
la parte derecha τd
(θ) .
3. a) Pruebe que E(E(X/Y )) = E(X) y pruebe que V (Y ) = V (E(Y /X)) + E(V (Y /X))
b) Si θ̂ es un estimador insesgado de θ, demuestre que E(θ̂/T ) es un estimador insesgado de θ y que
satisface V (E(θ̂/T )) < V (θ̂) ( Use la parte b))
Solución.
R∞ R∞ x·f (x,y) R∞ R∞
a) E(E(X/Y )) = −∞ ( −∞ f (y) dx)f (y)dy = −∞ x · ( −∞ f (x, y)dy)dx = E(X)
V (E(Y /X)) = E(E 2 (Y /X)) − E (E(Y /X)) = E(E 2 (Y /X)) − E 2 (Y )
2
4. Sea X1 , X2 , ..., Xn i.i.d f (~x, θ) se define con ellas un estadístico T (función de tales variables aleatorias).
Se dice que T es suficiente para un parámetro θ ssi f (~x/T ) no depende de θ.
−1 P 2 Pn
Sea f (x, θ) = 1 n2 · e 2 · (xi −θ) y T = i=1 Xi . Pruebe que T es suficiente.
(2π)
Solución.
−1 2
f (T, θ) = 1
1 · e 2n2 ·(T −nθ)
(2π) 2
1
x2i −2θT +nθ 2 ) − 21 ( x2i )
P P
1 1
(2π)n · e− 2 ( (2π)n · e
f (~x/T ) = 1 2 −2θnT +(n·θ)2 )
= 1 2
√ 1 · e 2n (T √ 1 · e 2n (T )
2π·n 2π·n
que no depende de θ
116 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.
5. Si θ̂ es un estimador insesgado de θ y T un estadístico suficiente (vea ejercicios 11), demuestre que E(θ̂/T )
es un estimador insesgado de θ y que satisface V (E(θ̂/T )) < V (θ̂)
Solución.
E(E(θ̂/T )) = E(θ̂) = θ por 3b)
siendo Y = θb y X = T se obtiene V (θ)
b = V (E(θ̂/T )) + E(V (θ̂/T ))
− (−
6. Sean X1 , X2 , ..., Xn variables aleatorias con función densidad conjunta f→ →
x , θ)
X
2 → →
− 2
∂ lnf− (x,θ) ∂lnf→
− ( x ,θ)
Demuestre que E X
∂θ 2 = −E X
∂θ
Solución.
Se hará para un dato con el fin de no tener tantas integrales.
R∞
1 = −∞ fX (x, θ) · dx. Derivando y usando la regla de leibniz
R∞ R∞
0 = −∞ ∂fX∂θ(x,θ)
· dx = −∞ ∂lnf∂θ
X (x,θ)
· fX (x, θ) · dx
Derivando por segunda vez.
R∞ 2
0 = −∞ [ ∂ lnf∂θX2(x,θ) · fX (x, θ) + ∂lnf∂θX (x,θ)
· ∂fX∂θ
(x,θ)
] · dx
R∞ 2
0 = −∞ [ ∂ lnf∂θX2(x,θ) · fX (x, θ) + ( ∂lnf∂θ
X (x,θ) 2
) · fX (x, θ)] · dx
2
0 = E( ∂ lnf∂θX2(x,θ) ) + E ( ∂lnf∂θ
X (x,θ) 2
)
Luego
∂ 2 lnf→ →
− 2
− (x,θ) ∂lnf→
− ( x ,θ)
E X
∂θ 2 = −E X
∂θ
− (−
∂ln(f→ →
x , θ)
X
= a(θ) · θ̂ − θ
∂θ
∂ 2 lnf→
− (x,θ)
demuestre que E X
∂θ 2 = −a(θ) y que
1
V (θ̂) =
a(θ)
Solución.
Derivando con respecto a θ.
− (−
∂ln(f→ →
x , θ)
X
= a(θ) · θ̂ − θ
∂θ
Obtenemos:
∂ 2 ln(f→ →
−
− ( x , θ)
X
2
= a′ (θ) · θ̂ − θ − a(θ)
∂θ
Aplicando esperanza.
!
∂ 2 lnf→
− (x, θ)
E X
= a′ (θ) · (E(θ̂) − θ) − a(θ) = −a(θ)
∂θ2
8.2. PROBLEMAS DE APLICACIONES. 117
pues E(θ̂) = θ
Elevando al cuadrado
→
−
− ( x , θ)
∂ln(f→
X
= a(θ) · θ̂ − θ
∂θ
y tomando esperanza
− (−
∂ln(f→ →
x , θ) 2 2
E(( X
) ) = E(a2 (θ) · θ̂ − θ ) = a2 (θ) · E((θ̂ − θ)2 ) = a2 (θ) · V (θ̂)
∂θ
Como
! !2
∂ 2 lnf→
− (x, θ) − (−
∂lnf→ →
x , θ)
E X
= −E X
∂θ2 ∂θ
y !
∂ 2 lnf→
− (x, θ)
X
E = −a(θ)
∂θ2
Obtenemos:
a(θ) = a2 (θ) · V (θ̂)
1
V (θ̂) =
a(θ)
3 x2
f (x) = k · x2 e− θ I[o,∞[ (x)
θ
;θ>0
a) Encontrar el valor de k.
b) Encontrar un estimador M.V para θ.
Solución.
R∞ 3 x2
a) 0
k· θ · x2 · e− θ · dx = 1
R∞ x2
R∞ 2
′
3 3 θ − xθ
0 k· θ · x2 · e− θ · dx = k ·0 x
θ · ·− 2 · e · dx
R∞ x 2
h x 2
i∞ R∞ x2
0
k · θ3 · x2 · e− θ · dx = k · θ3 · −x · e− θ + k · 3θ · 0 2θ · e− θ · dx
0
R∞ 3 2 − xθ
2
3 θ
R ∞ − x2
0
k· θ ·x ·e · dx = k · θ · 2 · 0 e θ · dx (1)
q q R ∞ − u2
2 2 1 1
haciendo u = θ · x ; du = θ · dx y sabiendo que √2·π 0 e 2 · du = 2
R ∞ − x2 R ∞ − u2 q θ q √ R
θ √π ∞ − u2
√
θ·π
0
e θ · dx =
0
e 2 ·
2 · du = 2 · π
· 0
e 2 · du =
2
entonces (1) queda :
R∞ 3 2 − xθ
2
3 θ
R∞ x2 3
√
θ·π
0 k· θ ·x ·e · dx = k · θ · 2 · 0 e− θ · dx = k · 2 · 2 =1
Luego k = √4
3· π·θ
118 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.
b) La función de verosimilitud es
n Q P 2
f (−
→ · i=1 x2i · e− θ · I[0,∞[n (−
→
xi
n
x , θ) = θ·√4π·θ x)
La función log-verosímil es:
Q Pn
ln(f (−
→
x , θ) = n · ln(4) − n · ln(πθ) − n · ln(θ) + ln( x2 ) −
2 i
1
θ · i=1 x2i + ln(I[0,∞[n (−
→
x ))
Derivando la función log-verosímil queda:
∂ln(f (→
−
x ,θ) Pn Pn
∂θ = − nθ − 2θ
n
+ θ12 · i=1 x2i = − 2θ
3·n
2 · θ −
2
3·n · i=1 x2i
x2i
Pn
2·
luego θ̂ = k=1
3·n
9. Sean X1 , X2 , ..., Xn i.i.d exp(θ). Encontrar un estimador máximo verosímil para ekθ
Solución.
ln(u)
Si u = ekθ entonces θ = k , como Xi ∼ θ · e−θx · I[0,∞[ (x) se transforma en
ln(u) − ln(u) x
Xi ∼ · e k · I[0,∞[ (x)
k
luego la función de verosimilitud es :
n
ln(u)
f (→
− ln(u) P
x , u) = · e− k · Xi
k
de donde
ln(u) ln(u) X
ln(f (~x, u)) = n · ln( )− Xi
k k
Derivando con respecto a u se obtiene que
Pnk
û = e Xi
a) ¿Son insesgados?
b) ¿Cuál es más eficiente?
Solución.
Si X ∼ Ber(θ) entonces E(X) = θ ; V (X) = θ · (1 − θ)
P
a) E(T1 ) = n1 E(Xi ) = θ ; E(T2 ) = (n+1)·θ θ
n+2 + n+2 = θ
P
b) V (T1 ) = n12 · V (Xi ) = θ(1−θ)n
1
P θ(1−θ)
V (T2 ) = n2 (n+2) 2 · V (Xi ) = n(n+2) 2 ; V (T1 ) > V (T2 )
T2 es más eficiente.
Entonces Z ∞
3 t 2·t 3·t
E(φ̂3 ) = · t · (e− φ − 2 · e− φ + e− φ ) · dt
φ 0
11·φ
E(φ̂3 ) = 6 no es insesgado.
4 x2
f (x) = √ · x2 · e− θ · I[0,∞[ (x), θ>0
θ· π·θ
x2i
Pn
2·
Dado que un estimador M.V. de θ es θ̂ = k=1
3·n . ¿Es insegado?, ¿Es eficiente?
Solución.
2
Pn
E(θ̂) = 3n · i=1 E(Xi2 )
R∞ x2 R∞ x2
′
E(X 2 ) = √4 · x4 · e− θ · dx = √4 · x3 · − 2θ · e− θ · dx
0 θ· π·θ θ· π·θ 0
R ∞ x 2
Como θ·√4π·θ · 0 x2 · e− θ · dx = 1
3·θ
E(X 2 ) = 2
2
Pn 2 3·θ
Luego E(θ̂) = 3·n · k=1 E(Xi2 ) = 3·n ·n· 2 = θ es insesgado.
2
2θ
Es eficiente, alcanza la cota 3n pues
P
∂lnf (x, θ) −3n 2 · nk=1 x2i
= (θ − )
∂θ 2θ2 3n
Sugerencia:
2
1
·t2
-Use que la f.g.m. de una N (µ, σ 2 ) es ϕX (t) = eµ·t+ 2 σ .
2
- Use que X ∼ N (0, σn )
Solución.
a) Función de verosimilitud:
1 1 2
f (−
→
x , µ) = n · n · e
− 12 · xµ
· IRn (−
→
x)
(2π) 2 u 2
Estimador de verosimilitud:
n
1 X 2
σ̂ 2 = S 2 = · x
n i=1 i
1 Pn
b) E(σ̂ 2 ) = n · i=1 E(x2i ) = σ 2 es insesgado, pues Xi ∼ N (0, σ 2 ) ; luego V (Xi ) = E(Xi2 ) = σ 2
2 2 σ2 2 2 σ2
c) E(T ) = E(n · X ) = n · E(X ) = n · n = σ 2 , pues X ∼ N (0, σn ) ; luego V (X) = E(X ) = n
4
d ) V (T ) = E(T 2 ) − E 2 (T ) = n2 E(X ) − σ 4
(iv) σ8 4 7 1 2 2
ϕX = ( n32 σ 4 + 6 2 6
n3 t σ + n4 t σ ) · e2σ t
; ϕX (0) = 3 4
n2 σ
V (T ) = 3σ 4 − σ = 2σ ; 4 4
P Pn
V (S 2 ) = n1 · ni=1 V (Xi2 ) = 1
n
4
i=1 (E(Xi ) − E 2 (Xi2 ))
(iv) 1 2 2
ϕX = (3σ 4 + 6t2 σ 6 + σ t σ ) · e 2 σ
8 4 7 t
; ϕX (t) = 3σ 4
4
1 2·σ
V (S 2 ) = n2 · n · (3σ 4 − σ 4 ) = n ; V (S 2 ) < V (T )
S 2 es más eficiente.
14. Sea {xn }una muestra aleatoria proveniente de una familia con densidad:
1 −x
f (x, θ) = · e 2+θ · I[0,∞[ (x), θ > −2
2+θ
a) Determine un estimador M.V para θ.
b) ¿Es insesgado?, ¿Es eficiente?
c) Para n=100 se obtuvo un promedio de X = 5,5. Encuentre un I.C. del 95 % para θ.
Solución.
n −
Pn
i=1 xi
Pn
a) f (−
→ · I[0,∞[n (−
→
1 xi
x , θ) = 2+θ ·e 2+θ x ), θ̂ = i=1
n −2 ;
100
c) Usando el teorema del límite central I(θ) = (2+θ) 2
h i
luego IC = 5, 5 − 2 ± 1, 96 · √5,5
100
= [2,422; 4,578]
8.2. PROBLEMAS DE APLICACIONES. 121
15. En ocasiones la f.d.p. de Pareto se utiliza como un modelo, sobre todo en reclamaciones de seguros, donde
pueden haber muchas peticiones de pago pequeñas y unas pocas peticiones de pago enormes. Una de las
formas que adopta la f.d.p. de Pareto es:
1 1
fX (x, θ) = · (1 + x)−1− θ · I[o,∞[ (x)
θ
e) Usando T = θ̂θ , θ̂ del apartado a), encontrar la expresión que da el valor de a para el intervalo [0, a]
para T . A continuación deduzca un intervalo de confianza para θ, en términos de a, con (1 − α) % de
confiabilidad.
f ) Aplique e) con los datos Y1 = 2, 730 ; Y2 = 5, 124 ; Y3 = 0, 798 ; Y4 = 36, 215 , con 90 % de
confiabilidad y asumiendo que a = 3.
Solución.
Pn
ln(1+xi )
a) θ̂ = k=1
n
R∞ 1 1 ∂ln(f (→
−
x ,θ)
Pn
ln(1+xi )
b) E(ln(1 + X)) = 0
ln(1 + x) · θ · (1 + x)−1− θ dx = θ; ∂θ = − θn2 · (θ − i=1
n ) luego es
eficiente.
c) FY (y) = P (Y ≤ y) = P (X ≤ eyθ −1) = FX (eyθ −1) con lo cual fY (y) = fX (eyθ −1)·θ·eyθ ·I[0,∞[ (y) =
e−y · I[0,∞[ (y)
− (y1 , y2 ) = e−(y1 +y2 ) · I[0,∞[ (y1 ) · I[0,∞[ (y2 ) ;
d ) Y1 + Y2 = Z ; W = Y1 entonces f→
Y
− (z, w) = e−z I[0,∞[ (z) · I[0,z] (w) ; fZ (z) = z · e−z · I[0,∞[ (z)
f→
Z
− (z, y3 ) = z · e−(z+y3 ) · I[0,∞[2 (z, y3 )
Y1 + Y2 + Y3 = Z + Y3 = R ; W = Y3 ; f→
Z
− (r, w) = (r − w) · e−r I[0,∞[ (r) · I[0,r] (w) ; fR (r) = e−r · I[0,∞[ (w) · r2
f→
R 2
r2
Y1 + Y2 + Y3 + Y4 = R + Y4 = S ; W = Y4 ; f→
− (r, y4 ) =
R 2 · e−(r+y4 ) · I[0,∞[2 (r, y4 )
2 3
(s−w)
− (s, w) =
f→
S
· e−s I[0,∞[ (s) · I[0,s] (w) ; fS (s) = e−s · I[0,∞[ (w) · s6
2
Pn tn−1
En general se observa que T = i=1 Yi ∼ fT (t) = (n−1)! · e−t · I[0,∞[ (t)
Pn
ln(1+x ) R ∞ tn−1
e) Si T = θθ̂ = i=1 n·θ i . entonces P (T > a) = 1 − α = a (n−1)! · e−t · dt
R a
(1 − α)(n − 1)! = [e−a · an−1 ] + o (n − 1) · tn−2 · e−t · dt
Pn k−1
quedando la expresión (1 − α)(n − 1)! = e−a (an−1 + k=2 an−k · ⊓j=1 (n − j))
Pn
ln(1+xi )
Asumiendo que a está determinado, el intervalo es 0 ≤ θ ≤ k=1
n·a
16. Sean X1 , X2 , ..., Xn variables aleatorias distribuidas i.i.d. f (x, θ) = θ · e−θxI[0,∞[ (x)
Solución.
122 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.
a) u = e−kθ ; θ = − k1 · ln(u)
k k
E(X) = − = X, û = e− x
ln(u)
1
O se usa el problema 2, pues h(x) = ekx es biyectiva y diferenciable y si X ∼ exp(θ) entonces θ̂ = X
.
k
Luego un estimador de u = e−kθ es û = e −x
R∞ ∞
b) E(T ) = k θ · e−θx dx = −e−θx k = e−θk
Pn
c) E(T ) = n−1
n2 ·
n−1 1
k=1 E(Xk ) = n · θ . No es insesgado.
2 P n 2
V (T ) = (n−1)
n4 · k=1 V (Xk ) = (n−1)
n3 · θ12 ; no alcanza la cota de Cramer.-Rao.
3. Mediante un proceso se produce sal refinada. El contenido de las bolsas se distribuye normalmente con
una desviación estándar de 10 [kg]. El contenido de una muestra aleatoria de tamaño n=20 entregó una
media muestral de 200[kg].
a) Encuentre un intervalo de confianza al 95 % para los pesos medios de las bolsas producidas por el
proceso
b) Encuentre un I.C. al 99 % para los pesos medios de las bolsas producidas.
4. Se administraron dos nuevos medicamentos (distribuido normal) para la cura del cáncer. El primer me-
dicamento bajó la presión sanguínea de 46 pacientes en un promedio de 11 puntos con una desviación
estándar de 6 puntos. El segundo medicamento bajó la presión sanguínea de otros 51 pacientes en un
promedio de 12 puntos con una desviación de 8 puntos.
a) Encuentre un intervalo de confianza del 97 % para el promedio poblacional del primer medicamento.
b) Hacer el mismo procedimiento que el caso anterior para el segundo medicamento.
5. Para estimar la proporción de familias de una determinada ciudad que poseen microondas, se quiere
realizar una muestra aleatoria de medida n. Calcule el valor mínimo de n para garantizar que, a un nivel
de confianza del 95, el error en la estimación sea menor que 0, 05. (Como se desconoce la proporción, se
ha de tomar el caso más desfavorable, que será 0, 5)
6. En un determinado barrio se seleccionó al azar una muestra de 100 personas cuya media de ingresos
mensuales resultaba igual a 106,000 euros, con una desviación típica de 20,000 euros.
a) Si se toma un nivel de confianza del 95 %, ¿cuál es el intervalo de confianza para la media de los
ingresos mensuales de toda la población?
8.3. PROBLEMAS PROPUESTOS 123
b) Si se toma un nivel de significación igual a 0,01, ¿cuál es el tamaño muestral necesario para estimar
la media de ingresos mensuales con un error menor de 3,000 euros.?
7. Se desea estudiar el gasto semanal de fotocopias, en euros, de los estudiantes de bachillerato de Madrid.
Para ello, se ha elegido una muestra aleatoria de 9 de estos estudiantes, resultando los valores siguientes
para estos gastos:
Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de media desconocida
y de desviación típica igual a 12. Determine un intervalo de confianza del 95 % para la media del gasto
semanal en fotocopias por estudiante.
8. Sea X1 , X2 , ..., Xn i.i.d. con función densidad fX (x) = α · xα−1 · I[0,1] (x)
9. Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas, hechos por una
determinada máquina, dieron una media de 2 cm y una desviación típica de 0,1 cm. Hallar los intervalos
de confianza del :
68,26 %
95,44 %
99,73 %
12. En ocasiones la f.d.p. de Pareto se utiliza como un modelo, sobre todo en reclamaciones de seguros, donde
pueden haber muchas peticiones de pago pequeñas y unas pocas peticiones de pago enormes. Una de las
formas que adopta la f.d.p. de Pareto es:
1 1
fX (x, θ) = · (1 + x)−1− θ · I[o,∞[ (x)
θ
Aplique 15 e) con los datos Y1 = 2, 730 ; Y2 = 5, 124 ; Y3 = 0, 798 ; Y4 = 36, 215 , con 90 % de confiabilidad
y asumiendo que a = 3.
124 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.
Test de hipótesis.
En esta sección se intenta validar, sabiendo que los datos provienen de una normal, si los parámetros estimados
son aceptables o no. Para ello se construyen dos posiciones o hipótesis que se contrastan
H0 : θ ∈ Θ vs. HA : θ ∈
/Θ
θ hace referencia a un parámetro, la media o varianza. Θ es una región de aceptación. Esta región está ligada
a una probabilidad de error que se llama nivel de significancia y que se denota con la letra griega α. Tal error
se genera al considerar que la hipótesis nula, H0 , es verdadera cuando, en realidad, es falsa. Este error se llama
error del tipo I. Se debe hacer que este error sea muy pequeño. Es decir
Que se escribe
P (θ ∈
/ Θ/θ ∈ Θ) = α
Pθ0 (θ ∈
/ Θ) = α
La búsqueda de tal región se realiza a través de la construcción de un estadístico T definido por los datos de la
muestra y que resulta ser una variable aleatoria que depende del parámetro en cuestionamiento, pero su función
densidad o cuantía no depende de él.
Por ejemplo, para un conjunto de datos X1 , X2 , ..., Xn ∼ N (µ, a2 ); siendo a constante y conocido, y a través de
alguna información histórica o por alguna normativa la media es o ha sido µ0 , las hipótesis se transforman :
H0 : µ = µ0 vs. HA : µ < µ0
X̄−µ0
El estadístico de prueba es Z = √a
∼ N (0, 1), y si α es el nivel de significancia entonces la región se ha de
n
deducir de :
125
126 CAPÍTULO 9. TEST DE HIPÓTESIS.
Pθ0 (Z > z) = 1 − α
Y como Z tiene una función densidad concreta z = z1− α2 . La región de rechazo de H0 es Z > z1− α2 .
Generalmente el nivel de significancia es dado, pero en otras se utiliza el p-valor para llevar a cabo el test de
hipótesis. El p-valor es el nivel de significancia menor que se puede dar para rechazar la hipótesis nula.
Los ejercicios que se exponen tienen como único objetivo que el alumno se habilite en determinar:
Solución.
a) Ho : µ = 15 ; HA : µ0 > 15 Me dio rechazo Ho
b) To = 2, 10327 [14,97; 15,646] 15 está.
c) p-valor 1,54293E-13
11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1
La variación estándar especificada es de 1/2 onza. ¿Se cumple esta especificacion? Use el nivel de signifi-
cacion del 1 % y una prueba bilateral
Solución.
1 1
Ho : σ 2 = 2 ; Ha : σ 2 6= 2 α = 0, 01
χ212,0,995 = 28, 3 ; χ212,0,005 = 3, 074
Q0 = 3, 6 ; ¿Qo > 28, 3? No ; ¿Qo < 3, 074 ? No.
3. Se ha tomado una muestra aleatoria de 100 individuos a los que se ha medido el nivel de glucosa en sangre,
obteniéndose una media muestral de 110 mg/cc. Se sabe que la desviación típica de la población es de 20
mg/cc. Obtén un intervalo de confianza, al 90 %, para el nivel de glucosa en sangre en la población.
Solución.
9.1. PROBLEMAS RESUELTOS 127
h i
Se usa intervalo de confianza para la media con varianza desconocida. x ± √S · tn−1,1− α2 .
n
4. Una encuesta realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración de un
empleo en la misma es de 6,5 años, con una desviación típica de 4. ¿Sirve esta información para aceptar,
con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica es menor o igual que
6?. Justifica adecuadamente la respuesta.
Solución.
Datos :
X = 6, 5 ; S = 4 n = 64 ; Sn−1 = 4, 032
Hipótesis:
H0 : µ = 6 ; H A : µ > 6
Test : Para medias con desviación desconocida.
6,5−6
T0 = 4,032 = 0, 992 ; t63,0,95 = 1, 67
8
Decisión. ¿T0 > 1, 67 ? No, luego no hay evidencia para rechazar la hipótesis nula.
5. Uno de los factores utilizados para determinar la utilidad de un examen en particular, como una medida
de las capacidades de los estudiantes, es la cantidad de dispersión que se presenta en las calificaciones. Un
conjunto de resultados de la prueba tiene poco valor si la amplitud de variación de las calificaciones es
muy pequeña. Sin embargo, si la amplitud es muy grande, existe una diferencia definida en los porcentajes
logrados por los “ mejores” estudiantes y los alcanzados por los “peores” . Se ha determinado deseable
una desviación estándar de 12 puntos en un examen con un total de 100. Para decidir si se hizo un buen
examen a su grupo, se contrastó esta hipótesis al nivel de significancia de 0.05 utilizando los puntajes
de dicha prueba. Hubo 28 puntajes cuya desviación estándar fue igual a 10.5. Se tiene evidencia, al nivel
de significancia de 0.05 de que su examen no tiene la desviación estándar especificada. Especifique las
hipótesis a contrastar , el test a usar, y luego decida.
Solución.
Datos: n = 28 ; α = 0, 05 ; S = 10, 5 ; Sn−1 = 114, 33
Las hipótesis: Ho : σ = 12 ; Ha : σ < 12
27
Pivote: Q = 144 · 114, 33 = 21, 437 ; χ227,0,05 = 16, 1514
Conclusión: No hay evidencia para rechazar la hipótesis nula.
6. Se espera que en promedio dos operadores, produzcan el mismo número de piezas defectuosas por cada
250 piezas. Los siguientes datos corresponden al número de piezas defectuosas por trabajador en el lapso
de 7 semanas.
1 2 3 4 5 6 7
T1 12 11 14 16 13 10 15
T2 14 18 17 16 18 14 |17
Se sabe que el número de piezas fabricadas por cada trabajador durante una semana son 250.
a) ¿Se puede aseverar que la proporción de piezas defectuosas del segundo trabajador supera a la
proporción de piezas defectuosas del primer trabajador?
128 CAPÍTULO 9. TEST DE HIPÓTESIS.
b) ¿Se puede aseverar que la proporción de piezas defectuosas del segundo trabajador supera en 2 a la
proporción de piezas defectuosas del primer trabajador?
Solución.
a) Ho : p1 − p2 = 0 ; Ha : p1 − p2 < 0 usando test de proporciones realizar cálculos.
b) Ho : p2 − p1 = 2 ; Ha : p2 − p21 > 2 usando test de proporciones realizar cálculos.
7. Sean {Xi } variables aleatorias independientes con función densidad N (µ, 100)
Se generan las siguientes hipótesis :
H0 : µ = 5, Ha : µ < 5
Se definen las siguientes funciones :
L(µ) = P (aceptar H0 /µ) (función de operacion característica)
B(µ) = P (rechazar H0 /µ) (función de potencia)
Solución.
a) Usando P (A/B) = 1 − P (Ac /B)
b) X es un e.m.v. de µ . Aceptará Ho ssi X < c
Luego L(µ) = P (X < C/µ) = FX ( C−µ 100
10 ) ; con X ∼ N (µ, n )
√
n
C−µ
c) Sea µ < ν ; L(µ) = FX ( 10
√
) y L(ν) = FX ( C−ν
10 )
√
n n
C−µ
10
√
> C−ν
10
√
y como FX es creciente entonces ; FX ( C−µ
√
C−ν
10 ) > FX ( √
10 )
n n n n
2. El peso medio de una muestra aleatoria de 81 personas de una determinada población es de 63,6 kg. Se
sabe que la desviación típica poblacional es de 6 kg. Con un nivel de significación del 0,05, ¿hay suficientes
evidencias para rechazar la afirmación de que el peso medio poblacional es de 65 kg?.
9.2. PROBLEMAS PROPUESTOS 129
3. Se toman dos muestras independientes para comparar las medias de dos poblaciones. ¿Se puede concluir
que, al nivel del 0.02, la media de la población A ha de ser mayor que la de B?
muestra n X S
A 50 57,5 6,2
B 60 54,4 10,6
5. Un fabricante dedicado a la elaboración de alimento balanceado para cerdos, afirma que su producto
aumenta el peso promedio en 150 gr. En una muestra de 18 cerdos tomados al azar se obtuvo un aumento
de peso promedio de 125 gr. con una desviación de 25 gr. ¿Se puede suponer que la afirmación del fabricante
es correcta con un nivel de significación del 1 %?
6. Se llama p-valor al nivel de significancia menor que se puede dar para que con la muestra se rechace la
hipótesis nula.
Si Ho : θ = θ0 ; HA : θ > θo entonces p − valor = P (T > t/θo )
Si Ho : θ = θ0 ; HA : θ < θo entonces p − valor = P (T < t/θo )
Si Ho : θ = θ0 ; HA : θ 6= θo entonces
p − valor = min{2P (T > t/θo ); 2P (T < t/θo )}
Se define la variable X como “rentabilidad de cierto tipo de fondos de inversión tras una apreciación fuerte
del marco con respecto del dólar”. Se considera que la media de esta variable es 15. Un economista afirma
que dicha rentabilidad media ha variado, por lo que lleva a cabo un estudio sobre una muestra de 9 fondos
cuya media muestral resulta ser 15,308 y cuya varianza muestral corregida ( insesgada) es 0,193.
7. El peso de los pollos de un granja sigue una normal con media 2,6 kg. y desviación típica 0,5 kg. Se
experimenta un nuevo tipo de alimentación con 49 crías. Cuando se hacen adultas se les pesa, resultando
una media de 2,78 kg. ¿Puede afirmarse que el peso medio ha aumentado o por el contrario se ha mantenido,
con un nivel de significación del 1 %? Resalte lo siguiente:
8. Uno de los factores utilizados para determinar la utilidad de un examen en particular, como una medida
de las capacidades de los estudiantes, es la cantidad de dispersión que se presenta en las calificaciones. Un
conjunto de resultados de la prueba tiene poco valor si la amplitud de variación de las calificaciones es
muy pequeña. Sin embargo, si la amplitud es muy grande, existe una diferencia definida en los porcentajes
130 CAPÍTULO 9. TEST DE HIPÓTESIS.
logrados por los “mejores” estudiantes y los alcanzados por los “peores” . Se ha determinado deseable una
desviación estándar de 12 puntos en un examen con un total de 100. Para decidir si se hizo un buen
examen a su grupo, se contrastó esta hipótesis al nivel de significancia de 0.05 utilizando los puntajes
de dicha prueba. Hubo 28 puntajes cuya desviación estándar fue igual a 10.5. Se tiene evidencia, al nivel
de significancia de 0.05 de que su examen no tiene la desviación estándar especificada. Especifique las
hipótesis a contrastar , el test a usar, y luego decida.
9. Un fabricante de lámparas eléctricas sostiene que la duración media de las mismas (horas) es en promedio
superior a 1.300 h. Se toma una muestra de 17 lámparas siendo el resultado de la inspección el siguiente:
980; 1.350; 1.020; 1.140; 1.520; 1.390; 1.205; 1.180; 970; 1.420; 1.850; 1.300; 1.305; 1.040; 1.050; 1.520;
1.320
Verificar la hipótesis del fabricante con un coeficiente de significancia del 5 % (suponga que los datos
provienen de una distribución normal)
10. Suponga que se escogen dos grupos de animales de la misma especie; los primeros son tratados con una
dieta tipo A y los que siguen con una dieta tipo B (la tradicional). Luego de 6 meses de tratamiento
en cada grupo se observa el peso de los animales y el número de veces que debieron recibir tratamiento
veterinario por alguna patología asociada a su sistema digestivo. Los resultados fueron agrupados en dos
muestras aleatorias:
N◦ de animales tipo de dieta peso medio[Kg.] peso medio cuadrático[Kg2] N◦ animales con tratamiento
48 A 40 1800 4
38 B 36 1700 2
a) Estime con un 95 % de confianza la proporción de animales sometidos a la dieta A que debieron
recibir tratamiento veterinario por causa digestiva.
b) Se piensa que el peso medio de los animales sometidos a la dieta A supera en al menos 6[kg] al peso
medio de los sometidos a la dieta B. Opine con α = 0,01
11. Se tienen dos universidades independientes donde se ha aplicado un test a los alumnos de 4◦ año de carrera
de sicología, y a los cuales se les consulta sobre su evaluación a la gestión del ministerio de educación.
Para reducir los costos de consultar a todos los alumnos, sólo se escoge una muestra de 50 alumnos de la
universidad A y 40 de la universidad B. Además, por la gran cantidad de alumnos involucrados, podemos
suponer que ambas poblaciones son infinitas. Si estudios previos respecto de este tema nos indican que
ambas poblaciones son homocedásticas y que la varianza de la evaluación (en nota de 1 a 7) es 2:
12. En un establecimiento lechero, 18 vacas de raza Frisia, produjeron en promedio 70kg. En la tercera semana
luego del parto, con un desvío de 6kg. ¿Se puede asegurar (α = 0, 05 ) que la producción aumentó con
respecto a una media de 65kg.?
13. La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa es de 1,570h, con
una desviación típica de 120h. Si µ es la vida media de todos los productos de esa empresa, contrastar la
hipótesis de que µ = 1600h.
9.2. PROBLEMAS PROPUESTOS 131
14. Una muestra de 9 explotaciones agrícolas arrojó una media de 125 ha y un desvío de 25 ha. Comprobar si
se puede suponer con bastante confiabilidad que el promedio verdadero de la población de explotaciones
puede ser 135 ha
15. El Departamento de Control de Calidad de una empresa que fabrica computadoras estima que si la
longitud de una determinada pieza presenta una varianza mayor a 4 mm. irremediablemente se producirá
una inutilización de una plaqueta en el término de 6 meses de uso. Una muestra de 15 piezas arrojó una
longitud media de 5 mm. con una desviación estándar de 1,2 mm.. ¿Qué conclusiones puede obtener el
Departamento de Calidad de la empresa en cuanto a la calidad de la pieza analizada?
16. Se arroja una moneda al aire 200 veces, obteniéndose 90 veces caras.
Probar: H0 : p = 0, 5 contra la HA : p 6= 0, 5 a un nivel de significación del 5 %.
17. En una muestra al azar de 400 productores, el 65 % de ellos eran propietarios y el 33 % no. Verifique
la hipótesis de que la muestra proviene de una población de la que el 60 % son propietarios. Use una
probabilidad de cometer un error de tipo I del 5 %.
18. Se conoce por investigaciones ya realizadas que el 20 % de la población mayor de 15 años fuma. Después de
efectuar una fuerte campaña televisiva y radial durante 6 meses, se decide estudiar si la población adulta
ha disminuido el hábito de fumar. Para ello se selecciona una muestra aleatoria de 1000 personas adultas
a las que somete a una determinada encuesta. Resumida la información proporcionada por el trabajo de
campo, se observó que el 12 % de las personas encuestadas fumaba habitualmente. Probar la hipótesis que
la campaña publicitaria ha disminuido la cantidad de fumadores.
19. Las puntuaciones en un test de razonamiento abstracto siguen una distribución Normal de media 35 y
varianza 60. Para evaluar un programa de mejora de las capacidades intelectuales, a 101 individuos que
están realizando este programa se les pasa el test, obteniéndose una media de 50 puntos y una varianza
de 80 ¿Puede asegurarse, a un nivel de confianza del 90 %, que el programa incrementa la variabilidad en
esta variable?
20. Un estudiante lanza 10 monedas y contabiliza el número de caras en cada experiencia. Sus resultados
fueron:
N◦ de caras 0 1 2 3 4 5 6 7 8 9 10
frecuencia 300 450 790 1000 1200 1260 1200 1000 790 450 300
El estudiante asevera que las monedas que usó tenían una medida de 1/2 de salir cara. De acuerdo con sus
resultados y la información que dio el estudiantes posible asegurar que él hizo la experiencia y no inventó
los datos. Explique y argumente su afirmación.