Sei sulla pagina 1di 137

Probabilidad y Estadística,

Ejercicios resueltos y propuestos


Primera edición: noviembre de 2015

ISBN: 978-956-356-020-6
Impreso en Chile/Printed in Chile

Recopilado por: Enzo Hernández


Co-autores: Francisca González López
Diseño portada: Javiera Contreras

Editorial Universidad Técnica Santa María


Av. España 1680, Valparaíso, Valparaíso.

Impreso por Impreval


Universidad Técnica Federico Santa María

Departamento de Matemáticas

Probabilidad y Estadística
Ejercicios resueltos y propuestos

Recopilado por: Enzo Hernández y Francisca González López

Santiago, noviembre de 2015


Prefacio

“Cálculo exacto para entrar en conocimiento de todas las cosas existentes y de todos los oscuros secretos y
misterios” así se inicia los escritos del papiro Rhind o Ahmes. El primer nombre es debido al egiptólogo Henry
Rhind que lo compró en Luxor, el segundo es el nombre del escriba autor del papiro que data del año 1650
A.C. El papiro es una colección de 87 problemas matemáticos escritos en hierático ( jeroglífico cursivo) con su
respectiva solución. Los problemas que ataca son referidas a cuestiones de aritméticas básicas, fracciones, cálculo
de áreas, volúmenes, progresiones, repartos proporcionales, reglas de tres, ecuaciones lineales y trigonometría
básica. Algunos creen que es un texto escolar o una especie de cuaderno de algún alumno. Hago mención de
este extraordinario documento para destacar que la valoración de la resolución de problemas en matemáticas es
muy antiguo. Para concretar un poco lo que en ese papiro está escrito extraigo de egiptologia.org el problema
siguiente:

Repartir 6 barras de pan entre 10 hombres.


Solución.
Aquí Ahmes da como resultado 21 + 101
y así lo escribió:
1 ——->1/ 1/10
*2 ——->1 1/5
4 ——->2 1/3 1/15
*8 ——->4 2/3 1/10 1/30
10 ——–>6 luego el resultado es correcto.

Es claro que se enseñaba el uso de una herramienta nueva aplicada a cuestiones del tipo de repartición.
El libro “Ejercicios Propuestos y Resueltos de Probabilidad y Estadística” tiene el mismo objetivo que aquel
papiro: instruir a nuestros alumnos en ciertas técnicas para resolver problemas, en este caso, de estadística.
Los problemas están agrupados por tópicos y en cada tópico se agrupan los problemas, en término general, en
tres estratos:

1. Problemas que atañen a lo conceptual y a hacer que el estudiante ligue conceptos teóricos. Por ello se
usan los títulos como ”propiedades de las funciones de cuantía conjunta y sus medidas de centralidad” ó
“Relaciones entre índices”, etc...

2. Problemas que tienen un contexto y deben aplicar alguna definición o técnica o alguna relación determinada
en los ejercicios del primer tipo.

3. Problemas propuestos a los alumnos, para que ellos resuelvan usando las técnicas ofrecidas en los grupos
anteriores.

La subdivisión de los ejercicios de esa forma fue natural pues, como es una recopilación de problemas de guias de
talleres, éstas tenían objetivos bien definidos que eran que el estudiante relacionara conceptos teóricos, índice,
etc. y usara tales relaciones y conceptos en la resolución de un problema concreto.

1
Índice general

1. Estadística Univariada y Bivariada 5


1.1. Encontrar relaciones algebraicas entre índices estadísticos. . . . . . . . . . . . . . . . . . . . . . 5
1.2. Comprender o usar índices estadísticos en un contexto . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Problemas Propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Regresión 17
2.1. Problemas de Relaciones entre índices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2. Problemas de ajuste de curvas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3. Ejercicios propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3. Equiprobabilidad 27
3.1. Ejercicios de conteo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2. Ejercicios de propiedades de probabilidad y equiprobabilidad. . . . . . . . . . . . . . . . . . . . . 32
3.3. Ejercicios de probabilidad condicional y teorema de Bayes. . . . . . . . . . . . . . . . . . . . . . . 37
3.4. Ejercicios Propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4. Variable Aleatoria Discreta 45


4.1. Propiedades de función de cuantía y sus medidas de centralidad y dispersión. . . . . . . . . . . . 46
4.2. Aplicaciones de funciones de cuantía y sus medidas de centralidad y dispersión. . . . . . . . . . . 49
4.3. Problemas Propuestos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5. Variable Aleatoria Continua. 61


5.1. Propiedades de función de densidad y sus medidas de centralidad y dispersión. . . . . . . . . . . 62
5.2. Ejercicios de aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.3. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6. Vectores aleatorios Discretos 79


6.1. Propiedades de función de cuantía conjunta y de sus medidas de centralidad y dispersión . . . . 81
6.2. Problemas de aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.3. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

3
4 ÍNDICE GENERAL

7. Vectores aleatorios Continuos. 93


7.1. Problemas referentes a propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.2. Problemas de aplicaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
7.3. Problemas Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

8. Estimación puntual. 111


8.1. Problemas referentes a propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.2. Problemas de aplicaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.3. Problemas Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

9. Test de hipótesis. 125


9.1. Problemas Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
9.2. Problemas Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Capítulo 1

Estadística Univariada y Bivariada

El estudiante, previamente, aprenderá los conceptos de estadística univariada y bivariada para poder aplicarlas
en los ejercicios que se plantean.
Los problemas se pueden catalogar como:
I) Comprender o usar índices estadísticos en un contexto.
II) Encontrar o usar relaciones algebraicas entre nociones estadísticas.
Los problemas catalogados como ” Comprender o usar índices estadísticos en un contexto” se refieren a ejercicios
donde el estudiante debe reconocer qué índices usar o ,dado los índices, explicar porqué es adecuado, en términos
del contexto.
Los problemas catalogados como ” Encontrar o usar relaciones algebraicas entre nociones estadísticas” se refieren
a ejercicios donde el estudiante debe aplicar su cultura matemática con la finalidad de descubrir relaciones
algebraicas entre nociones estadísticas.
Nos ha parecido más apropiado poner primero los problemas del tipo II y luego los del tipo I con el fin de usar
estas relaciones en los problemas del tipo I.

1.1. Encontrar relaciones algebraicas entre índices estadísticos.

1. En las tablas bivariadas , la variable X tiene r marcas de clases X1 , X2 , ..., Xr mientras que la variable Y
tiene s marcas de clases Y1 , Y2 , ...., Ys . Todas las clases- de X e Y- son marcas de clases numéricas.
Se define “la media de Y condicionada a la clase i de X”, que denotamos por X i , como
s
X s
X fij
Xi = Yj · fj/i = Yj ·
j=1 j=1
fi·

a) Explique esta expresión y, en particular, responda, por qué se multiplica cada marca de clase de Y
f
por fij

b) ¿Cómo definiría “la media de X condicionada a la clase j de Y ”, Y j ?


c) Encuentre una relación entre Y y X 1 , X 2 , ..., X r

Solución.

5
6 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA

a) La frecuencia relativa condicional fj/i es la frecuencia relativa cuando se consideran sólo los datos de
Ps
la clase i de X. Luego es claro que la media de Y condicionada a la clase i de X, es Xi = j=1 Yj ·fj/i =
Ps fij
j=1 Yj · fi·

b) Siguiendo la misma modalidad que en a) “la media de X condicionada a la clase j de Y ”, que


denotamos por Y j , por
Xr
Yj = Xi · fi/j
i=1
Ps Ps Pr Pr Ps fij
c) Y = j=1 Yj · f∗j = j=1 Yj · i=1 fij = i=1 j=1 Yj · fi∗ · fi∗
Pr Ps fij Pr Ps Pr
Y = i=1 j=1 Yj · fi∗ · fi∗ = i=1 fi∗ · j=1 Yj · fj/i = i=1 fi∗ · Xi

2. Suponga que está haciendo un muestreo estratificado donde ha hecho N estratos de donde se sacan
n1 , n2 , ..., nN datos. Especifique una forma de determinar la media en este tipo de muestreo en términos
de las medias de cada estrato x1 , x2 , ...., xN . Asuma que la población tiene cardinalidad M . Explique
Solución.
Como se tiene las medias de cada estrato es posible pensar que la información quedó representada por
tales medias x1 , x2 , ...., xN . Por lo tanto, es factible pensar que la representación de la información sea la
ni
media ponderada de esas medias donde el peso asignado al estrato i es: M . Luego, la media que se asumirá
PN nk
es: X = k=1 M · xk

3. En una tabla bivariada de X e Y hay r clases de X y s clases de Y .

a) ¿Cómo definiría la media de X? ¿y la media de Y ?


b) ¿Cómo definiría la media de X condicionada a la clase j de Y , Xj ?
c) ¿Cómo definiría la media de Y condicionada a la clase i de X, Yi ?
d ) ¿Cómo definiría la media X en términos de las medias Xj ?
e) ¿Cómo definiría la media Y en términos de las medias Yi ?
f ) ¿Cómo determinaría la varianza V (X) de X? y ¿la de Y , V (Y )?

Solución.
Pr Ps
a) X = i=1 Xi · fi∗ Y = j=1 Yj · f∗j
Pr
b) Xj = i=1 Xi · fi/j
Ps
c) Yi = j=1 Yj · fj/i
Pr Pr Ps Ps Pr Ps
d) X = i=1 Xi · fi∗ = i=1 j=1 Xi · fij = j=1 f∗j · i=1 Xi · fi/j = j=1 Xj · f∗j
Ps Ps Pr Pr Ps Pr
e) Y = j=1 Yj · f∗j = j=1 j=1 Yj · fij = i=1 fi∗ · j=1 Yj · fi/j = i=1 Yi · fi∗
P P
f) V (X) = ri=1 (Xi − X)2 fi∗ ; V (Y ) = ri=1 (Yi − Y )2 f∗j

4. Sabiendo que en el ajuste de una recta, y = a · x + b ,entre los datos x1 , x2 , ..., xn independientes y los
dependientes y1 , y2 , ..., yn se obtiene que â = Cov(X,Y
S2
)
. Si r es la correlación muestral. Demuestre que
x
â·SX
r= SY .

Solución.
Cov(X,Y )
Dado que â = Sx2 y r = Cov(X,Y
SY ·SX
)
entonces completando con la expresión de â la expresión de r,
Cov(X,Y ) â·SX Cov(X,Y )
â · SX = SX , basta dividir por SY y se obtendrá r . Luego r = SY = SX ·SY
1.1. ENCONTRAR RELACIONES ALGEBRAICAS ENTRE ÍNDICES ESTADÍSTICOS. 7

5. Con el conjunto de datos X1 , X2 , ..., Xn se genera la medida de dispersión:

n
1 X
T = · |Xk − XM |
n
k=1

2
P 1−(−1)n
donde XM : mediana de los datos. Probar que: T = −X + n · Xi >XM Xi + 2·n · XM
Solución.
Si n es impar la mediana es uno de los datos y tal sumando en T es 0.
# {Xk : Xk > XM } = # {Xk : Xk < XM } = n−12
1 P 1 P
T = n · Xk <Xm (−(Xk − XM )) + n Xk >XM (Xk − XM )
P  P 
T = −1
n ·
1 n−1
Xk <Xm Xk + n 2 XM + n1 Xk >XM Xk − n1 n−1
2 XM )
P P
T = −1
n ·
1
Xk <Xm Xk + n Xk >XM Xk
P P P P
T = n · Xk <Xm Xk − n · Xk >XM Xk + n1 · Xk >XM Xk + n1 Xk >XM Xk +
−1 1 1
n · XM − 1
n · XM
Pn 2 P
T = −1
n · k=1 Xk + n
1
Xk >XM Xk + n · XM
P
T = −X + n2 Xk >XM Xk + n1 · XM
Si n es par la mediana es la semisuma de los del medio, luego XM no es parte de los datos.
# {Xk : Xk > XM } = # {Xk : Xk < XM } = n2
P P
T = n1 · Xk <Xm (−(Xk − XM )) + n1 Xk >XM (Xk − XM )
P  P 
T = −1n ·
1 n
Xk <Xm Xk + n 2 XM + n
1 1 n
Xk >XM Xk − n 2 XM )
P 1 P
T = −1n · Xk <Xm Xk + n Xk >XM Xk
P P P P
−1
T = n · Xk <Xm Xk − n · Xk >XM Xk + n1 · Xk >XM Xk + n1 Xk >XM Xk
1

Pn P
T = −1n ·
2
k=1 Xk + n Xk >XM Xk
P
T = −X + n2 Xk >XM Xk
Luego la fórmula sería :
2 X 1 + (−1)n
T = −X + · Xi + · XM
n 2n
Xi >XM

6. Verifique si es cierto o no que

n P P
X 2 · n2 · Xi ≥X X i − 2 · n1 · Xi <X Xi
|xi − x| =
i=1
n
 
donde n1 = # i : Xi ≥ X ; n2 = # i : Xi < X
Solución.
Pn P P
i=1 |xi − x| = − xi <X (xi − X) + xi ≥X (xi − X)
Pn P P
i=1 |xi − x| = − xi + n2 · X + xi ≥X xi − n1 · X
xi <X
Pn P P P P P P
i=1 |xi − x| = − xi <X xi + nn2 · ( xi <X xi + xi ≥X xi ) + xi ≥X xi − nn1 · ( xi <X xi + xi ≥X xi )
Pn P P P P
i=1 |xi − x| = − n−nn
2
· xi <X xi + nn2 xi ≥X xi ) + n−n
n
1
· xi ≥X xi − nn1 xi <X xi
Pn P P P P
i=1 |xi − x| = − nn1 · xi <X xi + nn2 xi ≥X xi ) + nn2 · xi ≥X xi − nn1 xi <X xi
Pn 2·n2 ·
P
Xi ≥X Xi −2·n1 ·
P
Xi <X Xi
i=1 |xi − x| = n
8 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA

7. Verifique si es cierto o no que :


Pn
Xi − X 2 X
i=1
MD = = · (Xi − X)
n n
Xi ≥X

Solución.
hP P i
|Xi −X |
Pn
i=1 1
MD = n = n Xi ≥X (Xi − X) − Xi <X (X i − X)

Si p = # Xi /Xi ≥ X entonces
hP P i
|Xi −X |
Pn
M D = i=1 n = n1 Xi ≥X X i − p · X − Xi <X X i + (n − p) · X
hP P i
|Xi −X |
Pn
M D = i=1 n = n1 Xi ≥X Xi − p · X − (n · X − Xi ≥X Xi ) + (n − p) · X
h P i
|Xi −X |
Pn
M D = i=1 n = n1 2 · Xi ≥X Xi − 2 · p · X
hP i
|Xi −X |
Pn
M D = i=1 n = n2 Xi ≥X (Xi − X)

SX
8. Demuestre que el coeficiente de variación CV = |x| no cambia si los datos {xi : i = 1, 2, ..., n}son trans-
formados por ui = r · xi ; r ∈]0, ∞[
Solución.
1 Pn Pn
SU2 = n· i=1 (ui − u)2 ; u = n1 · i=1 ui
Pn Pn
u = n1 · i=1 ui = n1 · i=1 r · xi = r · x
P P
SU2 = n1 · ni=1 (ui − u)2 = n1 · ni=1 (r · xi − r · x)2 = r2 · SX
2

SU r·SX SX
CV = |u| = r·|x| = |x|

1.2. Comprender o usar índices estadísticos en un contexto


9. En las tablas bivariadas , donde X e Y son las variables a estudiar, se utiliza la notación:
nij : frecuencia absoluta de la clase i deX y j de Y
ni· : frecuencia absoluta marginal de la clase i de X.
n·j : frecuencia absoluta marginal de la clase j de Y .
N : número total de datos.
 n ·n
2
Pr Ps nij − i·N ·j
Se define la expresión χ2 = i=1 j=1 ni· ·n·j
N

a) Explique en qué forma esta expresión está involucrada como una medida del grado de independencia
de las variables X e Y .
b) En el interés de ver la influencia de la edad ( 1,2,3,4,5) en la sexualidad (Sin pareja; Con pareja ( sin
sexo); Con pareja ( con sexo)), se obtuvo la tabla bivariada.

1 2 3 4 5
sin pareja 21 21 14 13 8
con pareja (sin sexo) 8 9 6 8 2
con pareja (con sexo) 2 3 4 10 10

Aplique la expresión χ2 y discuta el grado de asociación entre las variables X e Y .


1.2. COMPRENDER O USAR ÍNDICES ESTADÍSTICOS EN UN CONTEXTO 9

Solución.
a) La relación de independencia entre dos variables es fij = fi· · f·j , expresión que se logra con las
n ·n
frecuencias nij = i·N ·j . Por tanto χ2 ≃ 0 indicarían poca asociación o dependencia.
b) χ2 = 0, 09 poca asociación.

10. En marzo del 2013, 216 alumnos rindieron el test de diagnóstico de matemáticas con la intención de verificar
el grado de manejo del lenguaje básico en matemáticas. El test consta de 40 preguntas de selección múltiple
(A;B;C;D;E). Se pretende con este trabajo estudiar el test en cuanto a sus preguntas y ver cuál de ellas
deben ser cambiadas, o sus alternativas estudiadas.
Metodología.
De acuerdo a las notas logradas se extraen las 50 mejores notas , que constituyen el nivel superior, y las
50 peores notas, que constituyen el nivel inferior. Se definen las siguientes variables para cada pregunta :
AS: el número de alumnos que acertaron a la respuesta correcta- de la pregunta - en el nivel superior.
AI: el número de alumnos que acertaron a la respuesta correcta -de la pregunta- en el nivel inferior.
Se definen además los siguientes índices:
AS+AI
Indice de fácilidad: IF = total
AS−AI
Indice de Discriminación 1 : ID1 = T otaldelnivelsuperior
AS
Indice de discriminación 2 : ID2 = AS+AI

a) Explique, en el contexto, qué significa cada índice.


b) Se extraen 3 preguntas del test. Analícelas a la luz de esos índices:
1 2 33 1 2 33
A 0 3 0 A 0 2 38
B 4 1 0 B 0 0 0
C 4 1 0 C 0 0 0
D 0 37 0 D 0 48 2
E 41 3 1 E 50 0 10
CORRECTA E D A CORRECTA E D A

25 % INFERIOR 25 % SUPERIOR.

Solución.
a) Indice de fácilidad: Este índice mide el grado de dificultad de la pregunta. En la medida que se
acerque al valor 1 la pregunta es más fácil.
Indice de Discriminación 1: Este índice mide la diferencia entre la proporción de acertantes del nivel
superior con la proporción de acertantes en el nivel inferior. En la medida que sea positiva y mayor
indicará que la pregunta fue mayoritariamente respondida por el nivel superior. En la medida que sea
pequeño este índice indica que tales proporciones son muy parecidas, es decir, los acertantes inferior y
superior son muy similares por lo que la pregunta debería ser revisada, si el valor es negativo significa
que los acertantes estuvieron notablemente representados por el nivel inferior, por lo que debe ser
revisada la pregunta.
Indice de discriminación 2 : Este índice mide la proporción de acertantes en el nivel superior respecto
del total de acertantes. Es claro que si es próximo a 1 entonces la proporción de acertantes en el nivel
inferior es próximo a cero. Si el índice es 12 , entonces AI=AS y la pregunta debe ser revisada.
10 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA

b)
1 2 33
IF 0,91 0,85 0,38
ID1 0,18 0,22 0,76
ID2 0,55 0,57 1
La información arroja que las dos primeras preguntas son fáciles, muy poco discriminatorias y si
consideramos el índice de discriminación 2 iguala 12 entonces la proporción de acertantes inferior
y superior son próximos. Luego deben ser revisadas estas preguntas. La pregunta 3 es difícil, hay
una gran diferencia entre las proporción de acertantes en el nivel superior e inferior y casi todos los
aciertos son en el nivel superior, lo cual dice que son preguntas aceptables.

11. En dos autopistas se detectaron las siguientes velocidades de los automóviles ( en km/hr) :

78 76 89 90 110 120 88 98 110 110


79 77 69 89 90 90 67 90 88 89
110 90 112 78 119 110 78 77 90 90

112 112 120 89 56 106 86 89 98 110


76 110 67 56 110 78 99 100 118 90
120 77 120 82 96 106 119 67 89 89

¿En qué autopista se anduvo a mayor velocidad?. Explique.


Solución.

a) ¿Qué se entenderá por andar a mayor velocidad en una autopista que en la otra?.
Se determinará una velocidad que se considerará alta: 100km/hr
b) Se hará una tabla para contabilizar los vehículos que anduvieron a mayor velocidad que 100km/hr

A B
]0, 100] 22 18
]100, ∞[ 8 12

12. Los resultados del análisis del plomo en agua de río realizado por 5 laboratorios fueron:

Laboratorio 1 Laboratorio 2 Laboratorio 3 Laboratorio 4 Laboratorio 5


1 2,3 6,5 1,7 2,1 8,5
2 4,1 4 2,7 3,8 5,5
3 4,9 4,2 4,1 4,8 6,1
4 2,5 6,3 1,6 2,8 8,2
5 3,1 4,4 4,1 4,8
6 3,7 2,8 3,7
7 4,2

Determinar la variabilidad entre los laboratorios y dentro de los laboratorios.


1.2. COMPRENDER O USAR ÍNDICES ESTADÍSTICOS EN UN CONTEXTO 11

Solución.
Laboratorio 1 Laboratorio 2 Laboratorio 3 Laboratorio 4 Laboratorio 5
1 2,3 6,5 1,7 2,1 8,5
2 4,1 4 2,7 3,8 5,5
3 4,9 4,2 4,1 4,8 6,1
4 2,5 6,3 1,6 2,8 8,2
5 3,1 4,4 4,1 4,8
6 3,7 2,8 3,7
7 4,2
Media 3,43333 5,08 2,83333 3,7429 7,075
Varianza 0,82222 1,1816 1,005555 0,862449 1,681875

varianza intra (promedio ponderado de varianzas de cada laboratorio): 1,059


varianza inter (promedio ponderado de cuadrado de las diferencias entre medias de cada laboratorio y
media general): 1,8975

13. En una muestra aleatoria simple de 200 pacientes que reciben terapia en un centro de tratamiento contra
el abuso de drogas, el 60 % pertenecen al grupo étnico I y el resto pertenece al grupo étnico II.
De los miembros del grupo étnico I:
60 fueron tratados por abuso en el consumo de alcohol (A),
25 por el abuso en el consumo de marihuana (B),
20 por abuso en el consumo de heroína, metadona ilegal u otro opioide (C).
El resto fue tratado por abuso en el consumo de barbitúricos, cocaína, anfetaminas, alucinógenos, u otro
opioide además de marihuana (D).
En el grupo étnico II:
la categoría de consumo indiscriminado de drogas y el número de individuos involucrados es como sigue:

A: 28 B: 32 C: 13 y D: resto.

¿Son independientes las variables consumo y etnia? Explique.


Solución.

A B C D
I 60 25 20 15 120
II 28 32 13 7 80
88 57 33 22 200

A B C D
I 0,3 0,125 0,1 0,075 0,6
II 0,14 0,16 0,065 0,035 0,4
0,44 0,285 0,165 0,11 1
0, 285 · 0, 4 = 0, 1254 6= 0, 16
No son independientes.
12 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA

14. Cierta compañía desea realizar un estudio sobre el desempeño laboral y la edad de los trabajadores de los
talleres. La compañía posee 100 trabajadores a los cuales se registró su edad y desempeño. La información
obtenida se encuentra en la tabla siguiente:

20 30 40 50
Malo 6 12 2 10
Bueno 20 15 10 5
Excelente 4 8 7 1

¿Cree usted que el desempeño en el trabajo depende de la edad? Explique.


Solución.
La matriz de frecuencia es:

20 30 40 50 fi∗
Malo 0,06 0,12 0,02 0,10 0,30
Bueno 0,20 0,15 0,10 0,05 0,50
Excelente 0,04 0,08 0,07 0,01 0,20
f∗j 0,30 0,35 0,19 0,16

f11 = 0, 06 6= f1∗ · f∗1 = 0, 3 · 0, 3 = 0, 09 por lo tanto, se puede afirmar que hay dependencia entre las
variables.

15. Se hizo el siguiente estudio en una ciudad española en la población de taxistas. Se concluyó que :
i) El 70 % tiene más de 40 años y de estos el 60 % es dueño del taxi.
ii) De los menores de 40 años el 30 % es dueño del taxi

a) Haga la tabla bivariada con las frecuencias relativas según la información dada.
b) Si un taxista es escogido al azar, ¿cuál es la probabilidad que sea dueño del taxi?.
c) ¿Cuál es la media de edad entre los taxistas.?
d ) ¿Son independientes las variables edad / situación?

Solución.

Menos de 40 años Más de 40 años


a)
Dueño del taxi 0,09 0,42 0,51
No es dueño del taxi 0,21 0,28 0,49
0,3 0,7
b) P (dueñodeltaxi) = 0, 51
c) Considerando el evento menos de 40 años por [18, 40] su marca de clase es 29
Considerando el evento más de 40 años por [41, 70], su marca de clase es 45, 5
Luego la media de edad es 29 × 0, 3 + 45, 5 × 0, 7 = 40, 55.
La media está en los 41 años
d ) 0, 3 × 0, 51 = 0, 153 6= 0, 09. No son independientes.
1.3. PROBLEMAS PROPUESTOS. 13

1.3. Problemas Propuestos.


1. En una tabla bivariada de X e Y hay r clases de X y s clases de Y .

a) ¿Cómo definiría las varianzas condicionales de X respecto de la clase j de Y , Vj ?


b) ¿Cómo definiría las varianzas condicionales de Y respecto de la clase i de X, Vi ?
c) Demuestre que
s
X s
X
V (X) = Vj · f∗j + (X j − X)2 · f∗j
j=1 j=1

d ) Explique el significado de la parte c)

2. Las edades de un grupo de personas se reflejan en la tabla siguiente:

Clase [7,9[ [9,11[ [11,12[ [12,13[ [13,14[ [14,15[ [15,17[ [17,19[


Frecuencia 4 18 14 27 42 31 20 1
Pn 3
i=1 (xi −X)
Se tiene que la fórmula a3 = S3 y que:
si a3 < 0 se tiene asimetría negativa,
si a3 > 0 se tiene asimetría positiva.
Aplíquelo al conjunto de datos y dé una explicación de tal índice.

3. Explique por qué la siguiente fórmula es aceptable para medir asimetría:

X − M oda
As =
S

¿Qué pasa si AS > 0?, ¿qué pasa si AS < 0?


Determine usando los datos del problema 2.

4. Se tiene x1 , x2 , ..., xn datos ordenados de menor a mayor. Se llama percentil k , pk , al valor bajo el cual
k
esta el 100 de los datos.
De los datos :

1,2 3,5 5,6 7 1,1 3,3 2,6 1,2

a) Determinar el percentil 25;


b) Determinar el percentil 75.
c) Se define la media truncada por :
1 X
Xjk = · x
n
x∈[pj ,pk ]

donde pj : percentil j, pk : percentil k, n : número de datos en [pj , pk ]


Determinar la media truncada usando p25 y p75 .
d ) Compare esta media con la media usual, en términos de la sensibilidad a valores extremos.
e) Dé un ejemplo donde la media truncada sea aplicable y uno donde no lo sea.
14 CAPÍTULO 1. ESTADÍSTICA UNIVARIADA Y BIVARIADA

5. La Empresa YOGULIN encarga permanentemente estudios de mercado para decidir cuál de sus productos
yoghurt requiere ser modificado, mayor publicidad o ser retirado del mercado. Como estudio preliminar
se determina el volumen de ventas mensual en miles de unidades. Los datos del último mes son:

Tipo de yogurt Unidades Vendidas


Diet .......
Batido 72000
Gold 32000
Requetegurt 56000
Uno + Dos 44000
Se sabe que el 15 % de las ventas del último mes corresponden al yoghurt Diet.

a) ¿Cuántas unidades del yoghurt Diet se vendieron el último mes?.


b) Construya una tabla de frecuencias completa para las ventas del último mes.
c) Represente gráficamente los datos.
d ) ¿Es el yoghurt Diet la clase modal?.
1 Pn 2
6. Si x1 , x2 , ..., xn son datos dados demuestre que la función variabilidad S(x) = n· i=1 (xi −x) se minimiza
Pn
en x = n1 · i=1 xi

7. En las tablas bivariadas , la variable X tiene r marcas de clases X1 , X2 , ..., Xr ; y la variable Y tiene s
marcas de clases Y1 , Y2 , ...., Ys . Todas las clases- de X e Y - son marcas de clases numéricas.
Se define “la media de X condicionada a la clasej de Y”, que denotamos por Y j , por:
r
X r
X fij
Yj = Xi · fi/j = Xi ·
i=1 i==1
f∗j

La “función varianza condicional de la clase i de X, dada la clase j de Y ” que denotamos por Si/j ,se
define por:
r
X
Si/j (θ) = (Xi − θ)2 · fi/j
i=1

Demostrar que se minimiza en Y j .

8. Se conoce que los consumos familiares de bienes esenciales (CBE), están relacionados con los consumos
familiares de energía eléctrica (CEE) mediante la función: CBE = α · CEE − β
Si el promedio y la desviación estándar de los CEE se estiman en US$ 40 y US$ 15 respectivamente.

a) Calcule el coeficiente de variación para el CBE.


b) Se tomó una muestra de otra ciudad donde se constata un aumento en la media y varianza de un 25 %
y 30 % respectivamente. ¿Se modifica la medida anterior obtenida en a? Si su respuesta es afirmativa,
determine el nuevo valor del índice señalado en a).

9. Un Agrónomo está interesado en averiguar el peso de una nueva variedad de manzanas. Elige una muestra
de manzanas obteniendo los siguientes resultados en gramos:

180 190 170 185 195 200


200 170 240 204 165 238
210 160 230 150 235 150
215 220 175 170 243 185
1.3. PROBLEMAS PROPUESTOS. 15

Determine qué porcentaje de las manzanas muestreadas tienen peso en los intervalos:
 
a) X − S, X + S
 
b) X − 2 · S, X + 2 · S

10. Una empresa lechera desea aumentar la producción de leche usando 4 tratamientos T1 ; T2 ;T3 ;T4 . Se tienen
vacas de raza Holsteins y Goldsteins de 2 tipos de edades ( Edad1 y Edad 2). ¿Cómo realizaría usted
este experimento para decidir qué tratamiento usar?. Explique con detalle. Invente los datos obtenidos y
determine una media y varianza para la producción de leche.

11. El % de permeabilidad en una tela es una medida de calidad de este producto. El encargado del Control
de Calidad tiene la sospecha de que este indicador se encuentra estrechamente relacionado con el % de
poliéster de la misma. La siguiente tabla muestra los análisis de una muestra de 120 telas.

% Poliéster
% permeabilidad 17.12 18,76 20,4 22,04 23,68
60,69 .... .... ... 2 4
61,82 ... .... ... 6 9
62,95 ... 1 2 8 1
64,08 .... 6 34 5 9
65,21 2 2 12 .... ....
66,34 ... 9 .... .... ....
67,47 15 1 .... ..... ....
a) Determine qué telas, considerando los distintos niveles de poliéster, tiene un % de permeabilidad más
homogéneos.
b) Si se quiere analizar la variabilidad total en el % de permeabilidad, ¿es razonable utilizar como variable
estratificadora el % de poliéster?.
Capítulo 2

Regresión

Hemos puesto este capítulo separado de la sección estadística univariada y bivariada, pues ella encierra una
técnica de lo que más tarde llamaremos estimación puntual.
La regresión es una herramienta que nos permite, usando información suficiente,

X x1 x2 ... xn
Y y1 y2 ... yn
predecir lo que ocurrirá o estimar un valor de Y, yk , que no haya sido dado por tal experiencia en un valor de
X, xk . Para ello, busca encontrar una curva que satisfaga que la suma de las distancias de los datos (xi , yi ) a
la curva sea mínima. La pregunta es ¿qué curva? La respuesta dependerá del experimento; pero si este no nos
dice nada probemos con la más simple de todas las curvas, la recta. Lo que esperamos es que los puntos de ella
conllevarán la tendencia de los valores de nuestros datos. Por lo tanto, si la recta es L : y = a · x + b , entonces
una estimación de yk , para el valor de X , xk , sería a · xk + b.
Este grupo de problemas podemos dividirlo en 2
(I) Problemas que encuentran o usan relaciones algebraicas entre índices estadísticos.
(II) Problemas que ajustan la mejor curva.
El primer grupo; usa la cultura matemática del alumno para encontrar o usar relaciones algebraicas entre los
índices estadísticos; usados en regresión
Estos índices son: Correlación, Coeficiente de determinación, Varianza de los errores, estimadores de la pendiente
y del intercepto de la recta ajustada.
El segundo grupo ajusta la curva, verifica si es la mejor curva a ajustar y si es posible ajustarla, y estima un
valor futuro con la curva ajustada

2.1. Problemas de Relaciones entre índices.


1. Se tienen los datos x1 , x2 , ..., xn independientes y los dependientes y1 , y2 , ..., yn . Si se hace la transformación
ui = mxi + n y vi = myi + n , comparar los valores de corr(X, Y ) y corr(U, V ).
Solución.
P 2 P
Cov(U, V ) = n1 (mxi + N )(myi + N ) − (mx + N )(my + N ) = mn xi yi + mN x + mN y + N 2 −
1 P
m xy − mN x − mN y − N = m Cov(X, Y ) SU = n ((mxi + N ) − (mx + N ))2 = m2 SX
2 2 2 2 2
de igual forma
SV2 = m2 SY2 . Por lo tanto, Corr(U, V ) = Corr(X, Y )

17
18 CAPÍTULO 2. REGRESIÓN

2. Se sabe que en el ajuste de una recta, y = a · x + b ,entre los datos x1 , x2 , ..., xn independientes y los
dependientes y1 , y2 , ..., yn se obtiene que a = Cov(X,Y
S2
)
si r es la correlación muestral. Demuestre que
x
a·S
r= SY .

Solución.
Cov(X,Y ) Cov(X,Y ) SX ·Cov(X,Y ) SX ·a
Corr(X, Y ) = SX SY y como a = SX2 entonces Corr(X, Y ) = SX2 ·S
Y
= SY
Pn 2
i=1 (ŷi −y) varianzaexplicadaporlarectaderegresión
3. Se sabe que R2 = Pn 2 = donde ŷi = â · xi + b̂. Sabiendo que
i=1 (yi −y) varianzaT otal
2 2
b̂ = y − â · x demuestre que R = r
Solución.
Pn Pn Pn Pn
i=1 (yˆi − y)2 = i=1 (â · xi + b̂ − y)2 = i=1 (â · xi + b̂ − b̂ − â · x)2 = (â)2 · i=1 (xi − x)2
Luego
(ŷi −y)2 (â)2 · n (x −x)2
Pn P 2
SX
R2 = Pi=1
n 2 = Pn i=1 i 2 = (â)2 · 2 = r2 ( por ejercicio anterior )
i=1 (yi −y) i=1 (y i −y) SY
Pn ∗ 2
i=1 (yi −yi )
4. Demuestre que la varianza residual Se2 = n ; yi∗ = â · xi + b̂; es equivalente con Se2 = (1 − r2 ) · SY2
; siendo SY2 la varianza de Y.
Solución
Pn ∗ 2 Pn 2
i=1 (yi −yi ) i=1 ((yi −y)−a·(xi −x))
Se2 = n = n
2
−2â·(xi −x)·(yi −y)+aˆ2 ·(xi −x)2 )
Pn
i=1 ((yi −y)
Se2 = n
((yi −y)2 −2â· n (xi −x)·(yi −y)+aˆ2 · n 2
Pn P P
i=1 (xi −x) )
Se2 = i=1 i=1
n
Cov(X,Y )2 Cov(X,Y )2 Cov(X,Y )2
Se2 = SY2 − 2 · 2
SX
+ 2
SX
= SY2 − 2
SX
= SY2 − r2 · SY2

2.2. Problemas de ajuste de curvas.


1. De las curvas y = αe−βx e y = ax + b donde y indica los metros cúbicos por hectárea por año del pinus
pseudostrobus y x su edad. ¿Cuál de las curvas resulta mejor ajustada a los datos que se presentan?
Determine los coeficientes de tal curva.
Solución
Aquí va una tabla jdjcjcdjss
Para el caso lineal sin considerar el primer dato : corr : −0, 973592939
Para el caso exponencial sin considerar el primer dato : corr : −0, 999999265 se ajusta mejor la exponencial.

ln(y) = ln(α) − βx

2. Se determinaron las siguientes mediciones del pulso a 40 personas saludables, de edad similar, y sexo
masculino, al serles inoculado un antibiótico que se estima provoca cierta alteración en el ritmo del pulso.
Se determinaron 4 medidas distintas 0.1ml , 0.2ml, 0.3ml, 0.4ml y los resultados fueron ( el ritmo normal
es de 60 pulsaciones por minuto)

0,1 53 65 54 55 60 65 58 59 60 63
0,2 51 67 68 58 59 54 57 65 68 69
0,3 56 52 57 59 60 66 65 64 53 58
0,4 54 65 66 68 69 70 52 51 50 69
2.2. PROBLEMAS DE AJUSTE DE CURVAS. 19

( Considere normalidad entre 60 + 3 pulsaciones por minuto )

a) Haga un estudio para decidir si tal antibiótico altera o no las pulsaciones.


b) Se puede ajustar una recta entre dosis y promedio de pulsaciones. Explique. De serlo encuéntrela.

Solución. a) Realizando una tabla de contabilidad de los valores de pulsaciones normales y anormales
0,1 5 5
0,2 3 7
0,3 4 6
0,4 0 10
se observa que la columna ( tercera) de anormalidad tiene una tendencia a aumentar con lo cual da indicios
de que hay una tendencia a la anormalidad.
b) Haciendo el cálculo de correlación entre dosis y promedio de pulsaciones
0,1 59,2
0,2 61,6
0,3 59
0,4 61,4
el coeficiente de correlación ρ = 0, 37 es muy bajo para ajustar una recta.
230
3. El crecimiento de una colonia de abejas está determinado por y =
1 + α e−βt
donde y representa el número de abejas y t el tiempo en meses. Se obtuvieron los siguientes datos:

t 1 13 23 33 53 63
y 5,746 157,496 227,412 229,935 210 215

Determine una estimación de α y β.


Solución.
Despejando αe−βt en términos de y se obtiene
230
αe−βt = −1
y
 
230
aplicando logaritmo natural se obtiene la recta ln(α) − βt = ln y −1
 
Transformando los datos de y por ln 230y − 1 y t por −t

t -1 -13 -23 -33 -53 -63


 y  5,746 157,496 227,412 229,935 210 215
230
ln y
−1 3,6643 -0,7758 -4,4759 -8,1712 -2,3514 -2,6626

La correlación es : 0, 62 , con lo que aceptaremos el ajuste.


La pendiente : 18275,95
El intercepto : 392,64
Luego β = 18275, 95 y α = e392,64
20 CAPÍTULO 2. REGRESIÓN

4. Una compañía de seguros considera que el número de vehículos y que circulan por una determinada
autopista a más de 120[km/h] puede ponerse en función del número x de accidentes que ocurren en ella.
Durante 5 días se recabó la información que se resume:
X = 4, 8, Y = 14, 2, SXY = 13, 64, SY = 4, 578, Se2 = 0, 20905689
Determine la ecuación de la recta ajustada y determine el número de vehículos correspondiente a 7
accidentes.
SX
Solución. â · SY =r
Usando el problema 4 r2 = 0, 99 o r = 0, 995
SXY r·SY
Luego SX = SY ·r = 2, 9944 y por tanto â = SX = 1, 5212 ; b̂ = y − â · x = 6, 8982
Por tanto la recta ajustada es : y = 1, 5212 · x + 6, 8982
Si x = 7 entonces y = 17, 5466

5. Se entrevistó a 48 familias. Los datos que están bajo los valores 1000,1500 y 2500 representan los gastos
de esas familias cuando su renta es 1000, 1500 y 2500 dólares.

N ◦ muestra 1000 1500 2500


1 716 1268 2611
2 937 1123 1911
3 782 1061 2099
4 1835 1509 2050
5 1082 1205 1905
6 1012 1332 2581
7 701 1133 1972
8 834 1119 1836
9 864 1296 1856
10 811 1176 2001
11 798 1134 2574
12 714 1568 2046
13 801 1227 2002
14 797 1246 1791
15 759 1123 2208
16 862 1200 1920

a) Diremos que una persona es de riesgo si su porcentaje de ahorro es menor al 10 % de su ingreso.


Determinar con la información arriba entregada la probabilidad que una persona que no ahorre,
tenga un ingreso de US$1500.
b) Respecto a la opinion de que ”mientras más se gane, hay una tendencia a gastar más y, por lo tanto,
a ser una persona de gran riesgo”. ¿Qué opinión tiene a la luz de la información entregada?.
c) ¿Es posible ajustar una recta entre el ingreso y el promedio de los gastos? Explique. De poder hacerse,
determine el promedio del gasto para una familia con un ingreso de US$3500.

Solución.
AHORRA NO AHORRA PROMEDIO
1000 12 4 900,29
1500 14 2 1248,24
2500 13 3 2109,59
2.2. PROBLEMAS DE AJUSTE DE CURVAS. 21

2
a) P (1500/no ahorra) = 8

b) Mirando la tabla se observa que hay una tendencia a ahorrar, igual.


c) r = 0, 998737637; la correlación es alta y luego es posible obtener un buen ajuste y = 66, 49 + 0, 802 ·x
.
Si x = 3500 el monto de ahorro es y = 2875

6. En un experimento, X es la variable independiente e Y la dependiente. Se sabe la siguiente información


con los datos (Xi , Yi ) i = 1, 2, ..n :

r = 0, 9, ln(X) = 3, 5, ln(Y ) = 7, 6, Sln(X) = 1, 3, Sln(Y ) = 0, 22

al ajustar una curva de la forma y = αxβ .


Determinar los parámetros α, β.
Solución.
Cov(ln(x),ln(y)) Sln(y) 0,22
ln(y) = ln(α) + β ln(x) ; luego β̂ = 2
Sln(x)
=r· Sln(x) = 0, 9 · 1,3 = 0, 152

ln(α) = ln(y) − β̂ · ln(X) = 7, 6 − 0, 152 · 3, 5 = 7, 068


Por tanto, α̂ = e7,068
1
7. Se tiene la curva y = arc sen(1−αβ x ) . Si tuviere los datos (xi , yi ), explique cómo realizaría la determinación
de α y β del modelo

Solución.
i) Transformación de la ecuación
 
αβ x = 1 − sen y1
  
ln(α) + x ln(β) = ln 1 − sen y1
ii) Transformación de los datos.
   
xi , ln 1 − sen y1i

1
8. Se tiene la curva y = . Si tuviera los datos (xi , yi ) explique cómo realizaría la determinación
ln(2 + αxβ )
de α y β del modelo.
Solución.
i) Transformación de la ecuación
1
α · xβ = −2 + e Y
 1 
ln(α) + β ln(x) = ln e Y − 2
ii) Transformación de los datos.
  1 
ln (xi ) , ln e yi − 2

1
9. Las variables X e Y están vinculadas por la expresión y = .
5 + αeβ·x
Si tuviera los datos (xi , yi ), explique cómo realizaría la determinación de α y β del modelo.
Solución.
i) Transformación de la ecuación.
22 CAPÍTULO 2. REGRESIÓN

1
α · eβx = y −5
ln(α) + β · x = ln( 1−5y
y )

ii) Transformación de los datos.


(xi , 1−5y
yi )
i

10. En una práctica de laboratorio se midieron del péndulo simple los siguientes datos de longitudes y periodos.

Longitud ( L) en metros 0,50 0,55 0,60 0,65 0,70


Periodo (T ) en segundos 1,40 1,46 1,53 1,60 1,66
q
L
A partir de estos datos, obtener el valor estimado de g usando T = 2π g

Solución.

L 0,707 0,742 0,775 0,806 0,837
T 1,4 1,46 1.53 1.6 1.66
√ 2π 4π 2
Se ajustará la recta T = a · L donde a = √
g. Luego gb = a2 .

Por tanto, b
a = 1, 978888 y luego gb = 10, 081

11. En un determinado hotel, el responsable de la piscina del mismo debe añadir periódicamente un compuesto
de cloro al agua para mantenerla en buenas condiciones. Dicha persona ha observado la relación existente
entre el número de días que dura el efecto del producto (variable X) y los gramos de cloro empleado
(variable Y), obteniendo los siguientes resultados:
 
SXY = 5, 4 ; SY2 = 12 gr2
El porcentaje de varianza explicada por la regresión lineal de X sobre Y sería del 78,387 %.
A partir de la regresión lineal de X sobre Y , el valor estimado para 21 gramos de cloro sería de 4
días.
Y = 25 [gr]

A partir de esta información, determine rectas de regresión y, en función de ellas, calcule qué cantidad de
cloro habría que utilizar para que los efectos del producto durasen 7 días.
Solución.
 
SXY = 5, 4 ; SY2 = 12 gr2
SY = 3, 464 R2 = 78, 387 % ; r = 88, 54 %
sXY 5,4
r= SX ·SY = 0, 8854 , luego SX = 0,8854×3,464 = 1, 761
SY
â = SX · r = 1, 74 y = â · x + b̂ ; 21 = 1, 74 · 4 + b̂ ; b̂ = 14, 04
La curva a ajustar es : y = 1, 74x + 14, 04. Para x = 7 se obtiene y = 26, 22
2.3. EJERCICIOS PROPUESTOS. 23

2.3. Ejercicios propuestos.


1. La siguiente tabla muestra el beneficio neto, en millones de dólares, de la empresa Disney durante los años
1984-1992.

!"#"#$%"&'
+((#
'!"# '!(#
'((#
%((#
%((# )&(#
)((#
"!"#
"((#
&'(#
*((#

&((#
!!"#
$%"#
!((#

$((#
!"#
(#
$+'*# $+'"# $+')# $+'%# $+''# $+'+# $++(# $++$# $++!#

a) ¿ Es posible ajustar una recta a esta información?


b) ¿ Cuál es el beneficio neto estimado al año 2005?

2. El precio de vivienda en Utarek, Marte, crece rápidamente con respecto al tamaño - debido a la limitación
extrema de espacio. La siguiente tabla muestra el precio de vivienda en Zonares para varios tamaños de
domicilios.

Tamaño x (cien m2) 4.4 8.2 10.3 15.3 19 30.2


Precio y (millón) 0.3 0.57 0.93 1.48 2.42 4.07
¿Se puede ajustar una recta?. Explique.

3. Se han colgado sucesivamente del extremo de un resorte cinco masas (X), en gramos,y se ha registrado
los alargamientos (Y ), en milímetros, producidos por las cargas. He aquí la tabla.

X ( g) 3 4 5 6 7
Y(mm) 1.2 1.9 2.4 3 3.7
a) Dibuje la nube de puntos.
b) Encuentre la recta de regresión, el coeficiente de correlación lineal y deduzca lo que se estiraría el
muelle si colgáramos una masa de 15 gramos.
b
4. La demanda de un producto sigue la ecuación Q = ea− p , siendo p el precio y Q la demanda .
Si se tienen los siguientes datos:
24 CAPÍTULO 2. REGRESIÓN

Año Oferta precio


1990 10 1
1991 11 2
1992 13 4
1993 14 4
1994 17 5

¿Cuál seria la ecuación calculada de la demanda?. ¿Cuánto valdría la demanda para un precio de 3 y de
6 ?.

5. La siguiente tabla se refiere al número Y de bacterias por unidad de volumen presentes en un cultivo
después de X horas.

X 0 1 2 3 4 5 6
Y 32 47 65 92 132 190 275
a) ¿Cuál es el modelo a ajustar?
b) Verificar si el ajuste de la curva es aceptable.
c) ¿Cuántas bacterias habrá por unidad de volumen en X = 3,5hrs.?

6. A continuación se entrega una tabla en la que se muestra la información de 12 Proyectos:

Tamaño del proyecto 20 5 27 3 14 12 7 34 12 21 7 9


Horas hombre 1200 720 820 400 390 900 257 120 790 890 450 710
a) ¿Se puede ajustar una recta?. De serlo, ajústela.
b) Se llama coeficiente de determinación a la expresión:
Pn 2
e
R = 1 − Pn i=1 i 2
2

i=1 (yi − y)

Determínelo y explique su significado respecto del ajuste

7. A continuación se presentan los valores experimentales de la presión de una cierta masa de gas y los valores
correspondientes al volumen.

Volumen (V) (in2 ) 54.3 61.8 72.4 88.7 118.6 194


Presión (P) (lb/in2 ) 61.2 49.5 37.6 28.4 19.2 10.1

De acuerdo a los principios termodinámicos, debería existir una relación entre las variables de la forma:

PV β = C

Encuentre los valores de C y β - para determinar la ecuación anterior.

8. En un experimento se obtienen los siguientes datos:

x 3,141592654 1,570796327 1,047197551 0,785398163 0,523598776


y 11,09876 9,0158529015 6,64718003 6,200302306 3,958651015
2.3. EJERCICIOS PROPUESTOS. 25

Determine si es posible ajustar una curva como


x
y = 10 · ln(asen( ) + b)
2
De serlo, determine a y b.
1
9. Se tiene la curva y = arcsen(1−α·β x ) verificar si es posible ajustarla según los datos

x 1 2 3 4
y 1.908 1.173 0.945 0,8223

1
10. Dada la curva y = ln(2+α·xβ )
verificar si es posible ajustarla a los datos

x 0,1 0,3 0,5 1


y 1,435 0,357 1,24 0,9

11. Las variables X e Y están vinculadas por la expresión


1
y=
5 + αeβ·x
Determinar los valores de α y β con los valores experimentales siguientes:

X Y
1 0,14
1,3 0,1098
1,5 0,1134
1,8 0,0912
2,23 0,0546
2,43 0,0345
5,78 0,000356
6,01 0,0002143
Capítulo 3

Equiprobabilidad

En esta sección se agrupan problemas diversos donde el método de conteo es una herramienta imprescindible y
la equiprobabilidad es la medida principal. Hay un grupo de problemas que tiene que ver con la probabilidad
condicional, medida que pretende medir el efecto que provoca un evento sobre otro.
Para los problemas de métodos de conteo es importante que se vea la diferencia entre permutación y combina-
toria. Para ello recordemos que la permutación es una ordenación generalmente lineal, y que la combinatoria es
el número de formas de extraer subconjuntos de k elementos de un conjunto de n elementos (n > k).
Si se tienen n elementos diferentes, alineados, el número de permutaciones es n!
!
n n!
Si un conjunto tiene n elementos, el número de subconjuntos de k elementos (k ≤ n) es = (n−k)!·k!
k
En los problemas 5, 6 , 7 y 8 se da un mismo problema con distintas formas de disponerlos. Es importante
analizar con detención tales problemas.
Para los problemas de equiprobabilidad es importante describir con claridad cuál es el espacio muestral Ω y
su cardinalidad #Ω y cuál es el evento a medir A con su respectiva cardinalidad #A. La equiprobabilidad es
definida por :
#A
P (A) =
#Ω

Para los problemas de probabilidad condicional no sólo es importante definir cuál es el espacio muestral Ω y
su cardinalidad, #Ω, y cuál es el evento a medir A con su respectiva cardinalidad #A; también se debe definir
cuál es el evento condicionante B y su cardinalidad #B. La probabilidad condicional de A dado el conjunto B
se define por:
P (A ∩ B)
P (A/B) =
P (B)

Para los problemas del uso del teorema de Bayes se precisa definir cuál es el espacio muestral Ω y su cardinalidad,
#Ω y cuál es el evento a medir A con su respectiva cardinalidad #A. Además se debe precisar si el espacio
muestral está particionado por eventos {Ei : i = 1, 2, 3..., n}. El teorema de Bayes mide el efecto que provoca el
evento A, un evento cualquiera, sobre una de las partes Ei . El teorema de Bayes establece:

P (A/Ei ) · P (Ei )
P (Ei /A) = Pn
j=1 P (A/Ej ) · P (Ej )

27
28 CAPÍTULO 3. EQUIPROBABILIDAD

3.1. Ejercicios de conteo.

1. La fórmula de Sturges se genera para ver cuál es el ancho de la!barra de un histograma. Asumiendo que k
k−1
es el número de clases y que en la clase i debe haber datos, de los n datos existentes, entonces
i
demuestre que k = 1 + 3, 32log(n) ( fórmula de Sturges).
Solución.
!
Pn n
Debemos recordar el teorema del binomio:(a + b)n = i=0 · ai · bn−i
i
!
n
Pn n
Luego si a = b = 1 el teorema del binomio queda 2 = i=0
i
! !
Pk−1 k−1 k−1
i=0 = n ; pues en cada intervalo hay y el número total de datos es n.
i i
Por el teorema del binomio.
!
Pk−1 k−1
i=0 = 2k−1
i

Luego se tiene n = 2k−1 , aplicando logaritmo en base 10, (k − 1)log(2) = log(n) por tanto k = 1 + log(n)
log(2) =
1 + 3, 32log(n).

2. El juego del Kino consiste en escoger 14 números de entre los primeros 25 números naturales({1,2,3,4...,25}).
Con ellos se genera una tarjeta con los números escogidos y ordenados de menor a mayor.Determinar el
número de cartillas con 14 números consecutivos.
Solución.
El cartón del Kino es similar a una matriz de 5x3 donde la celda correspondiente a la fila 5 columna
3 queda tachada, pues se ponen sólo 14 números. Como se deben sacar 14 números de los 25 primeros
números naturales el problema se resuelve con la combinatoria.
!
25
14

3. En el juego del Kino se sacan 14 números del conjunto {1, 2, 3, 4, ..., 25}. Teniendo como referencia el
cartón ganador, demostrar que el número de cartones que! se pueden formar con al menos 3 números del
25
cartón ganador del juego anterior es equivalente a
14

Solución.
n p q
En este problema usamos! el resultado del
! teorema del
! binomio. Si (a + 1) = (a + 1) · (a + 1) , con
n P p n−p
p + q = n entonces = kj=0 · ; k ∈ {0, 1, 2, .., n}y k − j ≤ (n − p)
k j k−j
El cartón ganador tiene 14 números, con lo cual nos quedan fuera 11 números. Si queremos construir una
cartilla de i números del cartón ganador,
! entonces debemos escoger i números del conjunto del cartón
14
ganador, lo cual lo hacemos de , y de los números fuera del cartón ganador escogemos 14 − i
i
3.1. EJERCICIOS DE CONTEO. 29
!
11
números , que los podemos escoger de . Luego, el número de formas de escoger i números del
14 − i
! !
14 11
cartón ganador es · .
i 14 − i
Ahora, como puede ser i ∈ {3, 4, ...., 14}entonces el número
! de formas
! de tener un cartón con i ∈
P14 14 11
{3, 4, ...., 14} números del cartón ganador es i=3 · .
i 14 − i
! ! !
n Pk p n−p
Veamos esta expresión a la luz de la expresión = j=0 ·
k j k−j
Aquí n = 25 ; i = j ; p = 14 = k ; n − p = 11; pero k − j ≤ 11; con lo cual j ≥ 3.
! ! ! ! ! !
n Pk p n−p P14 14 11 25
Luego = j=0 · se transforma en i=3 · =
k j k−j i 14 − i 14

4. El juego del Kino consiste en escoger 14 números de entre los primeros 25 números naturales({1,2,3,4...,25}).
Con ellos se genera una tarjeta con los números escogidos y ordenados de menor a mayor. Determinar el
número de cartillas con un 6 en la posición 4 y un 12 en la posición 8.
Solución. !
25
El espacio muestral es : Ω = {cartones del Kino}; #Ω =
14
El evento a calcular es su cardinalidad: son todos los cartones de la forma

6
12

!
5
En las tres primeras celdas van números del conjunto {1, 2, 3, 4, 5}:
3
!
5
En las celdas del medio van números del conjunto {7, 8, 9, 10, 11} :
3
!
13
En las 7 celdas finales van números del conjunto {13, 14, 15, ..., 25} :
7
! !
5 5
El resultado final: Por cada elección de las formas de escoger los tres primeros números hay
3 3
! !
5 5
formas de escoger los segundos números, por lo tanto tenemos · . Por cada una de estas
3 3
! ! !
5 5 13
· formas de llenar las 3 primeras y 3 del medio hay formas de llenar las últimas 7
3 3 7
! ! !
5 5 13
celdas. Luego, el resultado final es · · .
3 3 7
5. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero?.
30 CAPÍTULO 3. EQUIPROBABILIDAD

Solución. !
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
Número
! de formas
! de escoger
! los 7 libros de historia, 5 libros de matemáticas y 6 libros de química :
12 15 17
· ·
7 5 6
Número de formas de disponer linealmente 7 libros de historia, 5 libros de matemáticas y 6 libros de
química : 18!
Luego, el número total de formas
! de disponer
! linealmente
! 7 libros de historia, 5 libros de matemáticas y
12 15 17
6 libros de química es · · · 18!.
7 5 6

6. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero de tal forma que estén juntos por
temas( los de matemáticas juntos, los de química juntos y los de historia )?.
Solución. !
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
El número de formas de disponerlos linelamente
! tal que los!de historia estén
! primero, luego los de mate-
12 15 17
máticas y finalmente los de química es: · 7! · · 5! · · 6!.
7 5 6
Se debe considerar que pueden estar las materias en otro orden y eso se hace de 3! . Luego,
! el número
! de
12 15
formas de disponer en el librero de tal forma que estén juntos por temas es : · 7! · · 5! ·
7 5
!
17
· 6! · 3!.
6

7. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero de tal forma que estén juntos por temas(
los de matemáticas juntos, los de química juntos y los de historia juntos) y primero los de matemáticas,
luego los de química y finalmente los de historia?.
Solución.
Realizando lo hecho anteriormente:
3.1. EJERCICIOS DE CONTEO. 31
!
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
El número de formas de disponerlos linelamente
! tal que los!de matemáticas
! estén primero, luego los de
15 17 12
química y finalmente los de historia es: · 5! · · 6! · · 7!.
5 6 7

8. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. ¿De cuántas formas se pueden disponer en el librero de tal forma que estén juntos por temas(
los de matemáticas juntos, los de química juntos, los de historia juntos) y primero los de matemáticas,
luego los de química y finalmente los de historia y, además, de esos grupos ordenados alfabéticamente
según los nombres de los autores.
Solución.
Realizando lo anteriormente hecho.
!
12
Número de formas de escoger los 7 libros de historia :
7
!
15
Número de formas de escoger los 5 libros de matemáticas :
5
!
17
Número de formas de escoger los 6 libros de química :
6
Como deben ir ordenados por materia, alfabéticamente según los nombres de los autores, sólo se puede
hacer de una forma. Para esto se deben juntar por materias y dentro de esas materias no se hace una
permutación, pues solo hay una sola forma de ordenarlos alfabéticamente dentro de cada materia. Como
se debe decidir qué
! materia! va primero
! y cuál después, eso se hace de 3! formas. Luego, el número de
15 17 12
formas es: · · · 3!.
5 6 7

9. A un evento se presentan n parejas formadas por padre e hija. Se sientan en 2n sillas dispuestas linealmente.
¿De cuántas formas se pueden sentar tal que padre e hija estén juntos?
Solución.
Se sientan las parejas, padre e hija juntos. La forma de hacerlo es de n! formas , pues hay n parejas.
Supongamos que fijamos una de esas n! formas y cada pareja se puede sentar (papá,hija) ó (hija,papá)
Además se debe considerar que pueden haber sólo 1 pareja, sólo 2 parejas, sólo 3 parejas,..., las n parejas
que se intercambien, respecto de la original.
Esto se logra de 2n formas. Por lo que se pueden sentar de 2n · n!

10. Se tienen 20 pares de guantes rojos y 10 pares de guantes blancos. Si se toman los guantes uno a uno sin
reponerlos, determine la probabilidad de que en la extracción k y k + 1 salgan seguidamente , por primera
vez, dos guantes del mismo color, siendo k impar. Asuma que se hacen a lo más 10 extracciones .
Solución.
32 CAPÍTULO 3. EQUIPROBABILIDAD

Estudiemos el caso que es el valor de k ∈ {1, 2, 3, ..., 30} y el color que se repetirá.
Sea el evento Bk : Sale blanco en las extracciones k y k + 1, con k impar.
Sea el evento Rk : Sale rojo en las extracciones k y k + 1, con k impar.
Caso Bk :
No puede empezar con rojo pues blanco saldría en las pares. Por lo tanto k − 1 sería blanco al igual que
k y k + 1, por lo tanto en k , k + 1 no saldría, por primera vez, el color blanco dos veces seguidas. Por lo
tanto, para este caso, se debe empezar con blanco, luego rojo, blanco y así sucesivamente.
Luego 
10 20 9 19 10 − ( k−1
2 ) 20 − k−12
P (Bk ) = · · · · ... · · ,
30 29 28 27 30 − (k) 30 − (k + 1)
con k ∈ {1, 3, 5, 7, ..., 11}
Caso Rk :
Por el mismo argumento anterior

20 10 19 9 20 − ( k−1
2 ) 10 − k−12
P (Bk ) = · · · · ... · · ,
30 29 28 27 30 − (k) 30 − (k + 1)

con k ∈ {1, 3, 5, 7, ..., 11}

3.2. Ejercicios de propiedades de probabilidad y equiprobabilidad.


11. En este ejercicio veremos que un evento puede tener diferente medida de probabilidad al cambiar la sigma
álgebra.. Lo que veremos se llama la Paradoja de Bertrand.
Se tiene un triángulo equilátero inscrito en una circunferencia de radio 1. La pregunta es ¿cuál es la medida
de la probabilidad de que una cuerda, al ser trazada en la circunferencia, tenga una medida mayor al lado
del triángulo equilátero?.

a) Use la proporción de ángulos para medir probabilidades ( definiéndola como equiprobabilidad)


b) Use la proporción de medida respecto del radio ( idem)

Solución.
a) Los ángulos que interesan son [120◦ , 180◦ ] luego se obtiene por equiprobabilidad. El evento A es que
“cuerda tenga mayor longitud que el lado del triángulo”
180 − 120 1
P (A) = =
180 3
 
b) La porción de radio que interesa es 0, 21 luego por equiprobabilidad
1
2 −0 1
P (A) = =
1 2

12. Si P (A/B) = p y P (A/B c ) = q demostrar que P (A) = P (B)(p − q) + q


Solución.
P (A∩B)
P (A/B) = p = P (B) , luego P (A ∩ B) = p · P (B)
c
P (A∩B )
P (A/B c ) = q = P (B c ) , luego P (A ∩ B c ) = q · P (B c )
3.2. EJERCICIOS DE PROPIEDADES DE PROBABILIDAD Y EQUIPROBABILIDAD. 33

Sumando, P (A ∩ B) + P (A ∩ B c ) = p · P (B) + q · P (B c )
P (A ∩ (B ∪ B c )) = p · P (B) + q · (1 − P (B)) ; pues (A ∩ B) y (A ∩ B c ) son disjuntos.
P (A) = (p − q) · P (B) + q

13. Demostrar que


P (AB)
Solución.
P (Ω∩B) P ((A∪Ac )∩B) P (A∩B)+P (Ac ∩B)
P (Ω/B) = P (B) =1= P (B) = P (B) = P (A/B) + P (Ac /B)

14. Probar que: P (B − A) ≥ P (B) − P (A)


Solución.

A A∩B B

Usando este diagrama de Venn


B = (B − A) ∪ (A ∩ B)
P (B) = P ((B − A) ∪ (A ∩ B)) = P (B − A) + P (A ∩ B)
, pues (B − A) ∩ (A ∩ B) = Φ
Por tanto, como P (A ∩ B) ≤ P (A) ( ¿por qué?, ver problema 6 de los propuestos)
P (B) = P ((B − A) ∪ (A ∩ B)) = P (B − A) + P (A ∩ B) ≤ P (B − A) + P (A)
Luego P (B) − P (A) ≤ P (B − A)

15. Si P (A/B) = 0, 34 y P (A/B c ) = 0, 22 y P (B) = 0, 45 demostrar que P (A) = 0, 274 Solución.


P (A∩B)
P (A/B) = 0, 34 = P (B) ; P (A ∩ B) = 0, 34 × 0, 45
c
P (A∩B )
P (A/B c ) = 0, 22 = P (B c ) ; P (A ∩ B c ) = 0, 22 × 0, 55
P (A) = P ((A ∩ B) ∪ (A ∩ B c )) = P (A ∩ B) + P (A ∩ B c ) = 0, 34 · 0, 45 + 0, 22 · 0, 55
P (A) = 0, 274

16. Demuestre que si A, B ⊆ Ω son independientes, entonces Ac y B son independientes.


Solución.
P (B c /A) = 1 − P (B/A) = 1 − P (B) = P (B c ) luego Ac y B son independientes.

17. Un estudiante debe dar tres exámenes: física, química y matemáticas. Los resultados de estos exámenes
son independientes. Si la probabilidad de aprobar matemáticas es 1/3, química 1/4 y física 2/5. ¿Cuál es
la probabilidad que sólo apruebe matemáticas?, ¿cuál es la probabilidad que repruebe las tres materias?
Solución.
Sean los eventos:
34 CAPÍTULO 3. EQUIPROBABILIDAD

F: aprobar Física ; Q: aprobar química ; M. aprobar matemáticas.

1 3 3 3
P (M ∩ F c ∩ Qc ) = P (M ) · P (F c ) · P (Qc ) = 3 · 5 · 4 = 20
2 3 3 6 3
P (M c ∩ F c ∩ Qc ) = P (M c ) · P (F c ) · P (Qc ) = 3 · 5 · 4 = 20 = 10
Q3
18. a) Sean A1 , A2 , A3 tres eventos independientes, demuestre que P (A1 ∪ A2 ∪ A3 ) = 1 − i=1 (1 − P (Ai ))

b) Considere que tiene dos cajas con fichas:

Caja 1: a blancas y b negras

Caja 2: c blancas y d negras

Usted escoge una caja al azar, extrae una ficha y la devuelve a su caja. Si observó una ficha blanca,
en la segunda extracción se escoge la Caja 1; si observó una ficha negra , escoge la Caja 2 para la
segunda extracción. Si sabe que la primera ficha vino de la Caja 1, calcule la probabilidad que la
segunda ficha sea blanca.
Solución.
a) P (A1 ∪A2 ∪A3 ) = P (A1 )+ P (A2 )+ P (A3 )− P (A1 ∩A2 )− P (A1 ∩A3 )− P (A2 ∩A3 )+ P (A1 ∩A2 ∩A3 )
Q
(1−P (Ai )) = 1−P (A1 )−P (A2 )−P (A3 )+P (A1 ∩A2 )+P (A1 ∩A3 )+P (A2 ∩A3 )−P (A1 ∩A2 ∩A3 )
Q3
por tanto P (A1 ∪ A2 ∪ A3 ) = 1 − i=1 (1 − P (Ai ))
OTRA SOLUCION.
Q3
P (A1 ∪ A2 ∪ A3 ) = 1 − i=1 (1 − P (Ai )) = 1 − P (Ac1 )P (Ac2 )P (Ac3 ) = 1 − P (Ac1 ∩ Ac2 ∩ Ac3 ) =
1 − P ((A1 ∪ A2 ∪ A3 )c )
b) La figura siguiente representa la situación

Blanca
C1
c/(c+d)

Negra

b/(a+b)

C1

Blanca
a/(a+b)

Blanca
C2
a/(a+b)

bc a2
Se obtiene que la probabilidad pedida es : (a+b)·(c+d) + (a+b)2

19. Se tienen dos cajas iguales con tapa en cuyo interior hay un número de monedas. Llamaremos caja 1 a la
que contiene 5 monedas de $100 y 2 monedas de $500, y caja 2 a la que tiene 7 monedas de $100 y 5 de
3.2. EJERCICIOS DE PROPIEDADES DE PROBABILIDAD Y EQUIPROBABILIDAD. 35

$500. Se extrae una moneda de cada caja. Calcular la probabilidad que la suma de ambas monedas sea
$600.
Solución.
Se puede describir la información con una tabla:

100 500
C1 5 2
C2 7 5

El evento a medir :que la suma de los valores de las monedas sea de $600

{(500, 100), (100, 500)}

donde la primera coordenada es la moneda extraída de la caja 1 y la segunda coordenada es la moneda


extraída en la caja 2. En la extracción de la moneda en la caja 1 es independiente de la extracción
de la moneda de la caja 2. Por lo tanto P (500, 100) = P (500)P (100) = 72 · 12
7
= 16 ; P (100, 500) =
5 5 25
P (100)P (500) = 7 · 12 = 84 . Como solo puede ocurrir o una u otra, la respuesta es P (500, 100) +
25
P (100, 500) = 16 + 84 = 39
84

20. En una baraja (naipe inglés) se han suprimido varias cartas. Entre las que quedan se da la siguiente
probabilidad de ser extraída: P (rey) = 0, 5 ; P (coraz ón) = 0,4 ; P (noseareynicoraz ón) = 0, 6

a) ¿Está entre ellas el Rey de corazón?. En caso afirmativo indique cuál es su probabilidad.
b) ¿Cuántas cartas hay?. Justifique.

Solución.
El espacio muestral: Ω = {cartas que quedaron}
Cardinalidad del espacio muestral: #Ω = n
n◦ de reyes que quedaron
P (Rey) = 0,5 = n ; n = total de cartas que quedaron.
n◦ de corazones que quedaron
P (coraz ón) = 0,4 = n ;n = total de cartas que quedaron.

a) P (coraz ónc ∧ Rey c) = 0,6 = 1 − P (rey ∨ coraz ón)


Nos piden P (Rey ∧ coraz ón). Tenemos P (Rey ∨ Coraz ón) = 0, 4
P (Rey ∨ Coraz ón) = 0, 4 = P (Rey) + P (coraz ón) − P (Rey ∧ Coraz ón)
Luego : P (Rey ∧ coraz ón) = 0, 5 + 0, 4 − 0, 4 = 0, 5 . Luego hay un 50 % de que haya un rey de
corazón.
N ◦ de reyes corazón
b) Hay una incompatibilidad , pues como P (Rey ∧ coraz ón) = 0, 5 = n
n◦ de corazones que quedaron
implica que n =2 . Más, P (coraz ón) = 0,4 = n implicaría que n◦ de corazones
que quedaron es 0,8, lo cual no es un entero.

21. El juego de Parker Brothers “Cluedo”, creado en 1944, es el clásico juego de “¿quién es el culpable?”. El
juego se basa en el asesinato de “Mr. Body” y hay seis sospechosos (la Sra. White, la Sra. Peacock, la
Srta. Scarlet, el Coronel Mustard, el Profesor Plum, y el Sr. Green), seis armas (cuchillo, revólver, tubo
de plomo, candelabro, soga y llave inglesa), y nueve habitaciones donde puede haber ocurrido el asesinato
(salón de baile, conservatorio, biblioteca, sala de billar, cocina, comedor, estudio, salón y vestíbulo). Hay
un naipe para cada sospechoso, arma y habitación, por un total de 21 naipes. Se selecciona al azar un
naipe de cada tipo y se los coloca en un sobre para crear la escena del crimen. Los 18 naipes restantes se
36 CAPÍTULO 3. EQUIPROBABILIDAD

mezclan y distribuyen entre los jugadores . Cada jugador elige ser un sospechoso y, en cada turno, cada
jugador adivina un escenario posible para el asesinato usando los naipes que recibió, con el fin de descartas
posibles escenarios. Cada vez que adivino una escena, mi oponente debe mostrar si en sus naipes tiene al
menos un sospechoso, un arma o una habitación que yo haya nombrado. El objetivo del juego es adivinar
la escena correcta antes de que lo haga el oponente. Si dos personas juegan :

¿Cuál es la probabilidad de acertar el sospechoso, el arma y el lugar sin ver mis cartas?
De los 18 naipes que quedan, mi oponente y yo recibimos nueve cada uno. En mi mano tengo las
siguientes cartas: soga, llave inglesa, Sr. Green, Sra. Peacock, Profesor Plum, vestíbulo, biblioteca,
salón y cocina. ¿Cuál es la probabilidad de acertar el sospechoso, el arma y el lugar?
Realice un estudio de qué es lo que debiera haber recibido para aumentar mis probabilidades de
acierto.

Solución.

a) El espacio muestral es

Ω = {{a, b, c} /a : sospechoso; b : arma; c : lugar}

donde #Ω = 6 · 6 · 9 = 324; A = {x, y, z};#A = 1; P (A) = 1/324


b) Con lo que recibí mi espacio muestral queda #Ω = 4 · 3 · 5 = 60
A = {x, y, z};#A = 1; P (A) = 1/60
c) En la medida que se tenga más información de la categoría menor y menos de la mayor aumenta la
probabilidad de acertar con el sospechoso

22. Se presentan 44 solicitudes a ciertos puestos de una empresa. De entre los solicitantes hay 29 ingenieros
mecánicos, 41 ingenieros entre mecánicos o eléctricos, 8 son ingenieros eléctricos y químicos, 9 son ingenie-
ros mecánicos y eléctricos, y 1 tiene la triple titulación. Se escoge un postulante, ¿cuál es la probabilidad
que tenga titulación única de ingeniero eléctrico?
Solución. Aquí una representación de la situación

1
Z
M
8
20-x
E
3.3. EJERCICIOS DE PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES. 37

LOS MÉCANICOS Y ELÉCTRICOS TIENE CARDINALIDAD

|M ∪ E| = 41 = 29 + 7 + z

El número de ingenieros eléctricos con titulación única es z = 5


Como en total son 44, entonces : 29 + w + 7 + z = 44 .
Con lo cual el número de ingenieros químicos con titulación única w = 3, luego P (W ) = 3/44 .

23. Usted lanza 10 monedas honestas y se contabiliza el número de caras. Defina el espacio muestral de este
experimento y determine la probabilidad que salgan k caras, con k ≤ 10. Solución.
El espacio muestral: los resultados de cada moneda

Ω = {(x1 , x2 , ..., x10 ) : xi ∈ {C, S}}

El evento a medir: Ak = {(x1 , x2 , ..., x10 ) : existen k monedas xi = C}


El número de elementos de Ω: #Ω = 210
!
10
El número de elementos de Ak : #Ak =
k
 

10 
#Ak k
La probabilidad pedida: P (Ak ) = #Ω = 210

24. En un grupo de libros hay 10 de física, 15 de química y 12 de biología. Se sacan 12 libros ¿cuál es la
probabilidad de que 5 de ellos sean de química?.
Solución.
!
37
El espacio muestral Ω = {grupo de 12 libros}; #Ω =
12
! !
15 22
El evento a medir A = {grupos de Ω con 5 libros de quı́mica}; #A = ·
5 7
  

15 ·
22 
5 7
Probabilidad del evento : P (A) =  

37 
12

3.3. Ejercicios de probabilidad condicional y teorema de Bayes.


25. Supongamos que la probabilidad de que una mujer de sudamérica sea morena es 0,7; que tal mujer al ser
de centroamérica, tenga una probabilidad de ser morena es 0,9. Y que tal mujer si es de norteamérica ,
la probabilidad de que sea morena es 0,4. Se realiza un concurso de belleza para elegir a Miss América.
De los participantes el 30 % son sudamericanas, el 20 % son de centroamérica y el 50 %, restante, son de
norteamérica. Haga una tabla bivariada con la información dada y concluya si ser morena y el continente
de origen son independientes. Si de las concursantes se escoge una que resulta ser morena, ¿de qué parte
del continente es más probable que provenga?.
Solución.
38 CAPÍTULO 3. EQUIPROBABILIDAD

Morena No Morena
Sudamericana 0,3
Centroamericana 0,2
Norteamericana 0,5

P (M/S) = 0, 7 ; P (M/N ) = 0, 4 ; P (M/C) = 0, 9


P (M/S) = 0, 7 entonces P (M ∩ S) = 0, 3 · 0, 7 = 0, 21
P (M/N ) = 0, 4 entonces P (M ∩ N ) = 0, 4 · 0, 5 = 0, 20
P (M/C) = 0, 9 entonces P (M ∩ C) = 0, 9 · 0, 2 = 0, 18

Morena No Morena
Sudamericana 0,21 0,09 0,3
Centroamericana 0,18 0,02 0,2
Norteamericana 0,2 0,3 0,5
0,59 0,41

Son dependientes pues P (M ) · P (S) = 0, 59 · 0, 3 = 0, 177 6= 0, 21


0,18 0,21 0,2
P (C/M ) = 0,59 = 0, 3051 ; P (S/M ) = 0,59 = 0, 3559 ; P (N/M ) = 0,59 = 0, 3390
Es más probable que sea sudamericana.

26. Supongamos que cierta prueba para detectar la presencia de una enfermedad en un individuo da resultado
positivo ( detecta la enfermedad) en un individuo enfermo con probabilidad 0,99 y en un individuo sano
con probabilidad 0,02. Se supone, en base estudios previos, que la incidencia de esta enfermedad en cierta
población es 0,001. Se selecciona al azar un individuo de esa población, se le aplica la prueba y el resultado
es positivo, ¿cuál es la probabilidad de que en efecto padezca la enfermedad?
Solución.
El espacio muestral es: Ω =El conjunto de las personas de esa población.
La partición : E = {personas/estánenf ermas}; E c = {personas/N oestánenf ermas}
El evento a contrastar: P = {personas/dapositivo}
¿ Qué se quiere medir?: P (E/P )
Usando el Teorema de Bayes:
P (P/E)·P (E)
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c )

Información.
P (P/E) = 0, 99 ; P (P/E c ) = 0, 02; P (E) = 0, 001 . y P (E c ) = 0, 999
Luego:
P (P/E)·P (E) 0,99·0,001
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c ) = 0,99·0,001+0,02·0,999

27. En una empresa se sabe que el 1 % de los trabajadores es alcohólico. Después de un estudio se determinó
que el porcentaje de ausentes que se sabe son alcohólicos, duplica a los ausentes, que se sabe que no son
alcohólicos. Se escoge una persona y resulta estar ausente. Determinar la probabilidad que sea alcohólica.
Solución.
El espacio muestral es: Ω =, el conjunto de los trabajadores de esa empresa.
3.3. EJERCICIOS DE PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES. 39

La partición : E = {personas/alcohólicas}; E c = {personas/N oalcohólicas}


El evento a contrastar: P = {personas/ausente}
¿Qué se quiere medir?: P (E/P )
Usando el Teorema de Bayes:
P (P/E)·P (E)
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c )

Información.
P (P/E) = 2 · P (P/E c ) ; P (E) = 0, 01 . Se deduce P (E c ) = 0, 99
Luego:
P (P/E)·P (E) 2·P (P/E c )·P (E) 2·P (E) 2·0,01
P (E/P ) = P (P/E)·P (E)+P (P/E c )·P (E c ) = 2·P (P/E c )·P (E)+P (P/E c )·P (E c ) = 2·P (E)+P (E c ) = 2·0,01+0,99

28. En un monedero hay dos compartimentos. En el primero hay 3 monedas de $100 y 4 monedas de $500.
En el segundo compartimento hay 2 monedas de $500 y 5 monedas de $100. Se saca una moneda del
monedero y resulta ser de $100, ¿cuál es la probabilidad que haya sido sacada del compartimento 2?
Solución.
El espacio muestral es: Ω =, las monedas el monedero.
La partición : E = {monedas/compartimento1}; E c = {monedas/compartimento2}
El evento a contrastar: C = {monedas/$100}
¿Qué se quiere medir?: P (E/C)
Usando el Teorema de Bayes:
P (C/E c )·P (E c )
P (E C /C) = P (C/E)·P (E)+P (C/E c )·P (E c )

Información.
3 7 5 3
P (C/E) = 7 ; P (E) = 12 ; P (E c ) = 12 ; P (C/E c ) = 5

29. Hay 3 estados E1 , E2 , E3 por los que han de pasar un grupo de N individuos, y cada estado tiene los
mismos 4 niveles, Ni1 , Ni2 , Ni3 , Ni4 ; i = 1, 2, 3. Si se conocen: P (N2t /N1s ) = pst y P (N3t /N2s ) = qst ;
P4
s, t ∈ 1, 2, 3, 4, demostrar que P (N3l /N1s ) = k=1 P (N2k /N1s )P (N3l /N2k )
Solución.
P (N3l /N1s ) : significa el porcentaje de individuos que estando en el nivel s del estado 1 pasan al nivel l,
del estado 3
Si en el nivel s del estado 1 hay n1s individuos ( de los N ). De estos pasan al estado 2, nivel k, un número
igual a n1s · psk con k = 1, 2, 3, 4. De esos van al nivel l, del estado 3, un número igual a n1s · psk · qkl .
Luego el número total de individuos del nivel s, del estado 1 que van al nivel s del estado 3 es:
P4
k=1 n1s · psk · qkl
P4
Por tanto en porcentajes es k=1 psk · qkl , que es equivalente a
P
P (N3l /N1s ) = 4k=1 P (N2k /N1s )P (N3l /N2k )

30. Sea A un conjunto de 8 números naturales donde hay 5 números pares y 3 impares. En B hay 6 números
naturales, 2 pares y 4 impares. Se meten los números de A y B en una bolsa y una persona saca un número
al azar, que resulta ser par. ¿Cuál es la probabilidad que sea un número del conjunto A?
Solución.
- Espacio muestral : A ∪ B
40 CAPÍTULO 3. EQUIPROBABILIDAD

8 6
- Partición : A y B P (A) = 14 ; P (B) = 14
- Eventos P: par y P c :impar.
P (P/A)P (A)
- Qué se mide : P (A/P ) = P (P/A)P (A)+P (P/B)P (B)
5 4
P (P/A) = 8 P (P/B) = 6
P (P/A)P (A)
-Evaluar con esos datos P (A/P ) = P (P/A)P (A)+P (P/B)P (B)

31. Una compañía dedicada al transporte público trabaja tres líneas de una ciudad, de forma que el 60 % de
los autobuses cubre el servicio de la primera línea, el 30 % cubre la segunda y el 10 % cubre la tercera
línea. Se sabe que la probabilidad diaria de que un autobús se averíe es del 2 %, 4 % y 1 % respectivamente
para cada línea. Determine la probabilidad de que, en un día, un autobús sufra una avería. Sabemos que
un autobús un día ha sufrido una avería. ¿Cuál es la probabilidad de que sea de la línea dos?
Solución.
Li = {autobuses linea i} , i = 1, 2, 3. P (L1 ) = 0, 6 ; P (L2 ) = 0, 3 ; P (L3 ) = 0, 1
A = {autobuses con averı́a}; P (A/L1 ) = 0, 02 ; P (A/L2 ) = 0, 04 ; P (A/L3 ) = 0, 01
P (A) = P (A/L1 )P (L1 ) + P (A/L2 )P (L2 ) + P (A/L3 )P (L3 )
12+12+1 25 1
P (A) = 1000 = 1000 = 40
P (L2 /A) = P (A/L 2 )P (L2 )
P (A) = 12
25

3.4. Ejercicios Propuestos.


1. Un test rápido realizado por la Guardia Civil en la carretera sobre el contenido alcohólico de la sangre de
un conductor da correcto sólo en un a % de las veces ( es decir, da respuesta positiva cuando el contenido
es alto y negativa cuando es bajo ). Los sospechosos de conducir embriagados son sometidos por un médico
a un segundo test más preciso y detallado. El nuevo test, evidentemente, nunca falla con un conductor
sobrio, pero posee un porcentaje b % de error en los embriagados debido al tiempo transcurrido entre los
dos test. Ambos test se suponen independientes. Por último se conoce que de los detenidos en carretera, un
g % están embriagados. Se pide: ¿Qué proporción de conductores detenidos por la G.C no serán sometidos
a un segundo test?, ¿Qué proporción de conductores detenidos por la G.C serán sometidos por el médico
a un segundo test que no detecte el alcohol ?, ¿ Cuál es la probabilidad de que tal conductor tuviese en
realidad un contenido en alcohol en la sangre mayor que el legal en el momento de ser detenido?

2. Un estudiante lanza 10 monedas y contabiliza el número de caras en cada experiencia sus resultados fueron:

0 1 2 3 4 5 6 7 8 9 10
300 450 790 1000 1200 1260 1200 1000 790 450 300
De acuerdo con sus resultados y la información que dio el estudiante, ¿es posible asegurar que él hizo la
experiencia y no inventó los datos?. Explique y argumente su afirmación.

3. Es estimado que los hombres fumadores mayores de 40 años son 10 veces más proclives a contraer un
cáncer pulmonar que los hombres no fumadores. Asumiendo que en la población en estudio el 60 % de los
hombres son fumadores, ¿cuál es la probabilidad que un hombre que murió de cáncer haya sido fumador?

4. El aeropuerto al que llegan los aviones tienen 2 áreas , A y B, que pueden ser usadas.Se sabe que al área
A llega el 78 % de los vuelos. Se sabe que la probabilidad de que un avión que se dirige al área A tenga
problemas es tres veces mayor que en un avión que se dirige al área B.. Determinar la probabilidad que
un avión que viene con problemas use el área A.
3.4. EJERCICIOS PROPUESTOS. 41

5. En una reunión hay n personas. ¿Cuál es la probabilidad que al menos dos personas tengan la misma
fecha de cumpleaños?.

6. Probar si A ⊆ B entonces P (A) ≤ P (B)

7. Un inversionista en bienes raíces quiere elegir entre tres opciones para invertir US$400.000: a1 : invertir
los 400.000 en un complejo de apartamentos de 50 unidades, a2 : invertir 200.000 en un complejo de
apartamentos de 20 unidades e invertir los otros 200.000 en un fondo monetario que proporcionará un
crédito promedio de 14 % y a3 : invertir los 400.000 en un fondo monetario que tendrá un crédito promedio
de 14 %. Según la opinión del inversionista, el éxito de la inversión en los apartamentos depende del estado
del mercado habitacional, medido por el número de personas por cada 1000 inquilinos con ingresos altos
que quisieran rentar un apartamento en uno de los dos complejos. El inversionista caracterizó estos estados
como sigue: s1 : 1 por cada 1000; s2 : 2 por cada 1000 s3 : 3 por cada 1000. La tabla elaborada por el
inversionista muestra las ganancias (en miles de dólares) basadas en los réditos para un período de 5 años
ajustado por impuestos. A partir de un análisis del mercado asignó esas probabilidades a los tres estados:

s1 ;P (s1 ) = 0, 4 s2 ;P (s2) = 0, 4 s3 ;P (s3 ) = 0, 2


a1 −170 50 480
a2 −50 110 210
a3 105 105 105
a) ¿cuál es la ganancia promedio por inversión?, ¿cuál es la mejor inversión?
b) El inversionista, insatisfecho, encarga realizar un muestreo. El muestreo se hizo aleatoriamente a 3000
inquilinos con ingresos altos, en el área, y encontró que 6 de ellos afirmaron que rentarían uno de los
nuevo apartamentos cuando fueran construídos, con lo que determinó:
P (X = 6/s1 ) = 0, 05 P (X = 6/s2 ) = 0, 16 P (X = 6/s3 ) = 0, 09
Determinar P (si /X = 6) con i = 1, 2, 3.
¿Cuál será la ganancia promedio por inversión sabiendo que estos 6 inquilinos rentará uno de los
nuevos apartamentos?

8. Hay 20 pares de guantes rojos y 10 pares de guantes blancos. Se van sacando guantes uno a uno, sin
reponerlos. Determinar la probabilidad que en la extracción k y k + 1 salgan, por vez primera, dos guantes
del mismo color .

9. En una caja hay 12 libros de historia, 15 libros de matemáticas y 17 libros de química. Se deben disponer en
un librero linealmente y para ello se ha determinado que se escogerán 7 libros de historia, 5 de matemáticas
y 6 de química. Determinar la probabilidad que los libros estén ordenados por tema.

10. En el juego del póker se utilizan el mazo inglés, que consta de 4 pintas ( diamante, pick, trébol, corazón).
y cada pinta tiene asignado los números {1, 2, 3, 4, ..., 8, 9, 10, J, Q, K}. Luego consta de 52 cartas.
Se llama “mano” al conjunto de 5 cartas. Determinar el número de manos que se pueden generar.

11. En el juego del póker se llama “full” a una mano con un trio y un par. Determinar la probabilidad que en
una mano haya un “full”.

12. En el juego del póker se llama “póker” a una mano con cuatro cartas del mismo valor. Determinar la
probabilidad que en una mano haya un “póker”.

13. Dos personas juegan póker y una de ellas tiene un póker de 9 y la quinta carta es un 8. ¿Cuál es la
probabilidad que la segunda persona tenga un póker mayor ( las cuatro cartas, del mismo valor, deben
tener un valor mayor a 9)?
42 CAPÍTULO 3. EQUIPROBABILIDAD

14. El juego del Kino consiste en escoger 14 números de entre los primeros 25 números naturales ({1,2,3,4...,25}).
Con ellos se genera una tarjeta con los números escogidos y ordenados de menor a mayor.Determinar la
probabilidad de obtener un cartón con un 6 en la posición 4 y un 12 en la posición 8.

15. El 38 % de los aviones aterrizan en un sector A, de un pequeño aeropuerto. El 62 %, restante, aterriza en


un sector B, del mismo aeropuerto. Hay 3 aerolíneas que llegan exclusivamente a ese aeropuerto L, M y N.
El 15 % de la flota de L, el 30 % de la flota de M y el 55 % de la flota de N aterriza en ese aeropuerto.La
probabilidad de que un avión de L aterrice en A es de 38 %. La probabilidad que un avión de M aterrice
en B es 62 %. ¿Son independientes la aerolínea y el sector de aterrizaje?

16. Para poder clasificar al mundial de Fútbol, la selección chilena depende de la calculadora . Chile tiene
que jugar 2 partidos, primero contra Colombia de visita y luego contra Ecuador de local: Un estudio de
expertos determinó que las probabilidades que Chile gane, empate o pierda con Ecuador son 0.5 + b, 0.3
+ b y 0.2 + b dónde b es un factor de ánimo que depende del resultado del partido anterior, y su valor es
0.05, 0 y -0.05 si Chile gana, empata o pierde con Colombia. Para clasificar, Chile deberá ganar sus dos
partidos. Si empata un partido y gana otro, entonces dependerá de los resultados de otros paises donde la
probabilidad De clasificar de Chile sería 0.30 si lograse los resultados anteriores. En caso de perder algún
partido, Chile queda completamente eliminado.

a) ¿Cuál es la probabilidad de que Chile gane ambos partidos?


b) ¿Cuál es la probabilidad de que Chile clasifique?
c) Si Chile clasificó, ¿cuál es la probabilidad de que el partido con Colombia lo haya empatado?

17. Consideremos una población en la que cada individuo es clasificado según dos criterios: es o no portador
de HIV y pertenece o no a cierto grupo de riesgo que denominaremos R. La correspondiente tabla de
probabilidades es:

Portador (A) No portador (Ac)


Pertenece a R (B) 0,003 0,017
No pertenece a R (Bc) 0,003 0,977

a) Dado que una persona seleccionada al azar pertenece al grupo de riesgo R, ¿cuál es la probabilidad
de que sea portador?
b) Calcule ahora la probabilidad de que una persona sea portadora de HIV, dado que no pertenece al
grupo de riesgo R.

18. Supongamos que cierta prueba para detectar la presencia de una enfermedad en un individuo, da resultado
positivo (detecta la presencia de la enfermedad) en un individuo enfermo con probabilidad 0.99 y en un
individuo sano con probabilidad 0.02 (falso positivo). Por lo tanto, dicha prueba no detecta la enfermedad
en un individuo sano con probabilidad 0.98 y no la detecta en un individuo enfermo con probabilidad
0.01 (falso negativo). Se supone, en base a estudios previos, que la incidencia de esa enfermedad en cierta
población es 0.001, es decir que la probabilidad a priori de A es 0.001. Se selecciona al azar un individuo
de esa población, se le aplica la prueba y el resultado es positivo, ¿cuál es la probabilidad de que en efecto
padezca la enfermedad?

19. Una caja contiene 12 lámparas de las cuales 4 son defectuosas. Se toman al azar tres lámparas del lote una
tras otra. Hallar la probabilidad de que las tres lámparas no sean defectuosas. Estudie todos los posibles
casos, con reposición o sin reposición.
3.4. EJERCICIOS PROPUESTOS. 43

20. En un banco hay dos alarmas A y B. En caso de atraco, la probabilidad de que se activen A, B o ambas
es:
P (A) = 0, 75; P (B) = 0, 85; P (A ∩ B) = 0, 65

Calcule la probabilidad de que:

a) Se active alguna de las dos


b) No se active A
c) Se active sólo una de ellas
d ) No se active B
e) Se active sólo A
f ) Se active sólo B
g) No se active ninguna
h) No se activen las dos a la vez

21. En un banco hay dos alarmas A y B. En caso de atraco, la probabilidad de que se activen A, B o ambas
es:
P (A) = 0, 75; P (B) = 0, 85; P (A ∩ B) = 0, 65

Calcule la probabilidad de que:

a) Se active A, sabiendo que se ha activado B


b) Si se ha activado A, la probabilidad de que se active B

22. Sabiendo que la probabilidad de los sucesos siguientes es: P (A) = 0, 6; P (B) = 0, 9; P ((A ∩ B)c ) = 0, 46
¿Son independientes los sucesos A y B?

23. Una compañía dedicada al transporte público explota tres líneas de una ciudad, de forma que el 60 % de los
autobuses cubre el servicio de la primera línea, el 30 % cubre la segunda y el 10 % cubre la tercera línea. Se
sabe que la probabilidad de que diariamente, un autobús se averíe es del 2 %, 4 % y 1 % respectivamente,
para cada línea. Determina la probabilidad de que, en un día, un autobús sufra una avería. Sabemos que
un autobús un día ha sufrido una avería. ¿Cuál es la probabilidad de que sea de la línea dos?

24. La cuarta parte de las participantes en un congreso son españolas. La probabilidad de que una congresista
desayune té si es española es un octavo y la probabilidad de que tome té si es extranjera es un tercio. Si
se elige una congresista al azar:

a) ¿Cuál es la probabilidad de que desayune té?


b) ¿Cuál es la probabilidad de que no sea española si desayuna té?

25. En la sala de espera de un dentista hay 5 revistas del tipo A, 6 del tipo B y 4 del tipo C. Entran tres
pacientes de forma consecutiva y cada uno elige al azar una revista. Encuentra la probabilidad de que:

a) Los tres tomen una revista del tipo B


b) Los tres tomen una revista del mismo tipo
c) Dos lean una revista del tipo A y otra del tipo C
d ) Al menos uno lea una revista del tipo C
44 CAPÍTULO 3. EQUIPROBABILIDAD

26. Una encuesta revela que el 30 % de la población tiene estudios, de los cuales el 12 % no tiene trabajo. Del
70 % que no tiene estudios se tiene que un 25 % no tiene trabajo. Calcule:

a) El tanto por ciento de la población que no tiene trabajo.


b) La probabilidad de que tenga estudios una persona elegida al azar entre las que no tienen trabajo.

27. En un determinado almacén hay tres estanterías y en cada una de ellas dos tipos de productos A y B. En
la primera hay 140 productos y se sabe que el 25 % son del tipo A. En la segunda hay 130 productos y se
sabe que 91 son del tipo B. Y en la tercera hay 40 del tipo A y 80 del tipo B. Haz una tabla que recoja
la información dada y elegido un producto al azar, calcula la probabilidad de que:

a) Sea del tipo A


b) Sea de la segunda estantería
c) Sea del tipo B y de la 3a estantería
d ) Sabiendo que el producto elegido no pertenece a la primera estantería, sea del tipo B.

28. Se extraen simultáneamente tres naipes de una baraja española de 40 cartas. Halla la probabilidad de
obtener:

a) Tres copas
b) Ninguna copa
c) Dos copas y un oro
d ) Al menos una copa.
Capítulo 4

Variable Aleatoria Discreta

En esta sección el concepto de marca de clase, de la estadística univariada para datos agrupados, se sofistica en
una función que se llamará variable aleatoria discreta. A esta variable se le asociará una función llamada función
de cuantía, que no es otra cosa que la noción funcional de frecuencia relativa. El estudiante puede verificar que
las propiedades que esta función debe cumplir son esencialmente las características de la frecuencia relativa.
Recordémosla:
Sea X una variable aleatoria discreta se le asocia una función, fX , llamada “función de cuantía” que satisface:

fX (x) ≥ 0 ; x ∈ Rec(X)

X
fX (x) = 1
x∈Rec(X)

De igual manera las medidas de centralidad y dispersión se calculan de manera similar que la media y varianza
cuando los datos están agrupados. Recordémosla para evidenciar su similaridad:
Sea X una variable aleatoria discreta con función de cuantía , fX , se definen:

Primer momento, media o esperanza matemática por:

X
E(X) = x · fX (x)
x∈Rec(X)

Momento de orden r por: X


E(X r ) = xr · fX (x)
x∈Rec(X)

Varianza por:
V (X) = E(X 2 ) − E 2 (X)

Sea X una variable aleatoria discreta con función de cuantía , fX , se define la función generadora de
momentos por: X
ϕX (t) = E(ext ) = ext · fX (x)
x∈Rec(X)

45
46 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Los ejercicios se subdividen en:

1. Propiedades de función de cuantía y sus medidas de centralidad y dispersión.


En esta sección se ven propiedades inherentes a funciones de cuantía y sus medidas de centralidad y dis-
persión. Se incluyen propiedades de funciones generadoras de momento para variables aleatorias discretas.

2. Aplicaciones de tales funciones de cuantía y sus medidas de centralidad y dispersión.


En esta sección se enseña a distinguir cuando usar una u otra de las funciones de cuantía más regularmente
usadas.
Para el caso de una variable Bernoulli, esta variable aleatoria se reconoce por tener sólo dos valores que
determinan dos estados que son entre ellos incompatibles.
Para el caso Binomial, esta variable se reconoce como la representación de la suma de n variables Bernoulli
independientes.
Para el caso Poisson, esta se caracteriza por determinar una cierta característica con un promedio.

4.1. Propiedades de función de cuantía y sus medidas de centralidad


y dispersión.
1. Demostrar que si X ∼ Geo(p), es decir

fX (x) = p(1 − p)x−1 · I{1,2,3,...} (x)

entonces
P (X > m + n/X > m) = P (X > n)

Solución.
P (X > m + n; X > m) P (X > m + n)
P (X > m + n/X > m) = =
P (X > m) P (X > m)
P∞ k
k=m+n+1 p · (1 − p)
P (X > m + n/X > m) = P ∞ k
= (1 − p)n
k=m+1 p · (1 − p)

P∞ k
k=m+n+1 p · (1 − p) (1 − p)m+n+1
P (X > m + n/X > m) = P∞ = = (1 − p)n
k=m+1 p · (1 − p)
k (1 − p)m+1


X
P (X > n) = p · (1 − p)k = (1 − p)n
k=n+1

Comparando las últimas expresiones se obtiene la igualdad.

2. Demostrar que si X ∼ P (λ) , entonces


k!
P (X = k + n) = · λn · P (X = k)
(k + n)!

Solución.
λn+k λk k!
P (X = k + n) = (n+k)! · e−λ = k! · e−λ · (n+k)! · λn
k!
luego: P (X = k + n) = (k+n)! · λn · P (X = k)
4.1. PROPIEDADES DE FUNCIÓN DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.47

3. Si X es una v.a Poisson (X ∼ P (λ) ), demostrar que:


P x2n
a) cosh(λ) = ∞ n=0 (2n)!

b) La probabilidad que X sea par es e−λ cosh(λ)

Solución.
P∞ λn P∞ n n
a) eλ = n=0 n! ; e
−λ
= n=0 ((−1)n! )·λ
λ −λ P∞ x2n
cosh(λ) = e +e
2 = n=0 (2n)!
P∞ P∞ λ2n
b) P (X = par) = n=0 P (X = 2n) = n=0 2n! · e−λ =
e−λ cosh(λ)

4. Si X es una variable aleatoria que toma valores en {0, 1, 2, ...} demostrar que :

X
E(X) = P (X > k)
k=0

Solución.

X
E(X) = k · P (X = k)
k=0


X
P (X > 0) = P (X = n)
n=1


X
P (X > 1) = P (X = n)
n=2


X
P (X > 2) = P (X = n)
n=3


X
P (X > k) = P (X = n)
n=k+1

Hasta este punto P (X = 1) aparece 1 vez


Hasta este punto P (X = 2) aparece 2 veces
Hasta este punto P (X = 3) aparece 3 veces
Luego

X
E(X) = P (X > k)
k=0

5. Sea X una v.a. con función densidad geométrica

fX (x) = p · (1 − p)x−1 · I{1,2,3,4,,,}(x)

Probar que
m
P (X > m) = (P (X > 1))
48 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Solución. Recordemos algunas cosas de progresiones geométricas


n
X 1 − rn+1
Sn = a · rk = a ·
1−r
k=0

Luego,

m
X 1 − (1 − p)m
P (X > m) = 1 − P (X ≤ m) = 1 − p · (1 − p)k−1 = 1 − p ·
1 − (1 − p)
k=1

1 − (1 − p)m
P (X > m) = 1 − p · = (1 − p)m
1 − (1 − p)

Por otro lado


P (X > 1) = 1 − P (X = 1) = 1 − fX (1) = 1 − p

(P (X > 1))m = (1 − p)m


Por lo tanto
m
P (X > m) = (P (X > 1))

6. Sea X una v.a. con función densidad geométrica

fX (x) = p · (1 − p)x−1 · I{1,2,3,4,,,}(x)

Probar que
P (X > m + n/X > m) = P (X > n)

Solución.
P (X > m + n; X > m) P (X > m + n)
P (X > m + n/X > m) = =
P (X > m) P (X > m)

Usando el problema anterior (P (X > 1))m = (1 − p)m ; para cualquier m ∈ N

P (X > m + n) (1 − p)m+n
P (X > m + n/X > m) = = = (1 − p)n
P (X > m) (1 − p)m

Como P (X > n) = (1 − p)n


P (X > m + n/X > m) = P (X > n)

7. Sea la función de cuantía binomial


!
n
f (x) = px · (1 − p)n−x · I{0,1,2,...,n}(x)
x

Asumiendo que para n suficientemente grande np ∼ λ. Demostrar que para n grande la función f se
transforma en
λx −λ
· e · I{0,1,2,3,....}(x)
x!
Solución.  x
n! λ λ
f (x) = · · (1 − )n−x · I{0,1,2,...,n} (x)
(n − x)!x! n n
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.49

 n
(n − x + 1)(n − x + 2)(n − x + 3)...(n − x + x) λx λ
f (x) = · x · 1 − · I{0,1,2,...,n}(x)
x! · nx 1 − nλ n

1−x 2−x 3−x x−x  n


(1 − n )(1 − n )(1 − n )...(1 − n ) λx λ
f (x) = 
λ x
· · 1− · I{0,1,2,...,n}(x)
1− n x! n

Haciendo n → ∞
λx −λ
f (x) = · e · I{0,1,2,...} (x)
x!
P
8. Sea X v.a.d. con función de cuantía fX e Y = g(X), con g invertible. Demostrar que E(Y ) = x∈Rec(X) g(x)·
fX (x)
Solución. X
E(Y ) = y · fY (y)
y∈Rec(Y )

−1 −1
; ahora fY (y) = fX (g (y)) ; Y = g(X) ; x = g (y)
Luego fY (y) = fX (g −1 (y)) = fX (x)
X
E(Y ) = g(x) · fX (x)
x∈Rec(X)

9. Sea X v.a.d. con función de cuantía fX . Encontrar la función de cuantía de Z = g(X), con g invertible.
Solución.
fZ (z) = P (Z = z) = P (g(X) = z) = P (X = g −1 (z)) = fX (g −1 (z))

4.2. Aplicaciones de funciones de cuantía y sus medidas de cen-


tralidad y dispersión.
10. Se define la función
k 4k
f (x) = · I{x∈N/x=2n,n∈N ∧x≤100}(x) + · I{x∈N/x=2n−1,n∈N ∧x≤100}(x)
5 5
a) Determine el valor de k para que f sea función de cuantía.
b) Determine E(X).
c) Determine V (X).

Solución.
P50 k P50 4k 1
a) n=1 5 + n=1 5 = 50k = 1 luego k = 50
P50 k P50
b) n=1 5 ·2· n + n=1 4k 2k 50·51
5 · (2 · n − 1) = 5 · 2 + 4k
5 · 50 · 50

251
E(X) = = 50, 2
5
P50 k
P50 4k
c) n=1 5 · 4 · n2 + n=1 5 · (2 · n − 1)2 = 3353, 2

V (X) = 3353, 2 − (50, 2)2 = 833, 16


50 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

11. Sea X una variable aleatoria con función de cuantía fX (x) = logn (1 + x1 ) · I{1,2,3,...,n−1}(x), con n ∈ N.
Demostrar que fX es una función de cuantía.
Solución.
Primera propiedad f (x) ≥ 0 ; x ∈ {1, 2, ..., n}
loga (x) > 0 ⇔ x > 1 y a > 1; como logn (1 + x1 ) > 0;pues (1 + x1 ) > 1, por tanto f (x) > 0 para todo
x ∈ {1, 2, ..., n}
P
Segunda propiedad x∈Rec(X) f (x) = 1

n−1
X n−1
X
1 x+1 3 4 n−1 n
logn (1 + ) = logn ( ) = logn (2 · · · ... · · ) = logn (n) = 1
x=1
x x=1
x 2 3 n − 2 n − 1

12. Hay 5 salas en el cine A y 3 salas en el cine B. Si la probabilidad de que las salas del cine A funcionen es
p y las salas del cine B q, calcule la probabilidad de que sólo tres salas estén funcionando. Asuma que las
salas funcionan independientemente.
Solución.
Si X: n◦ de salas que funcionan en A ;X ∼ Bin(5, p)
!
5
fX (x) = px (1 − p)5−x · I{0,1,2,3,4,5} (x)
x
Si Y : n◦ de salas que funcionan en A ; Y ∼ Bin(3, q)
!
3
fY (y) = q y (1 − q)3−y · I{0,1,2,3} (y)
y
!
5
i) Si tres salas en el cine A, son las que funcionan : p3 (1 − p)2
3
!
3
ii) Si las tres salas en el cine B, son las que funcionan: q 3 (1 − q)0 = q 3
3
iii) Si las tres salas repartidas entre A y B:
! !
5 3
2 salas en A y una en B: p2 (1 − p)3 · · q · (1 − q)2
2 1
! !
5 3
1 sala en A y dos en B: p · (1 − p)2 · · q 2 · (1 − q)
1 2
Todas esas opciones se suman, pues debe ser una u otra. En las tres situaciones se asume que el funciona-
miento de una sala es independiente de las otras.

13. El gerente de un restaurant que sólo da servicios mediante reservas sabe, por experiencia, que el 20 % de
las personas que reservan una mesa asistirán. Si el restaurant acepta 25 reservas pero sólo dispone de 20
mesas. ¿Cuál es la probabilidad de que todas las personas, que asistan al restaurant, se les asigne una
mesa?
Solución.
Sea el espacio muestral: Ω : conjunto de 25 personas que reservan en el restaurant.
Ak : el conjunto de las k personas de Ω que asisten al restaurante.
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.51

Se debe definir la variables aleatorias.


Como deben asistir a lo más 20 personas y cada persona puede ir o no ir, se puede considerar a cada
persona como una Bernoulli.
(
1 si la persona i va
Xi =
0 si no va
Luego la variable aleatoria Y = X1 + X2 + ... + X25 representa el número de personas que asistirá.
Se debe determinar su función de cuantía.

Y ∼ Bin(25; 0,2)

Calcular lo pedido
20 20
!
X X 25
P (Y ≤ 20) = P (Y = k) = (0,2)k · (0, 8)25−k
k=1 k=1
k

1
14. Sea X una v.a. discreta con función de cuantía fX (x) = n · I{1,2,...,n} (x)

a) Encontrar E(X).
b) Encontrar V (X).

Solución.
P
a) Usando la definición de primer momento E(X) = x∈Rec(X) x · fX (x)

Xn
i n(n + 1) n+1
E(X) = = =
i=1
n 2n 2
P
b) Usando la definición de segundo momento E(X 2 ) = x∈Rec(X) x
2
· fX (x)
n
X i2 n(n + 1) · (2n + 1) (n + 1)(2n + 1)
E(X 2 ) = = =
i=1
n 6n 6

Usando la definición de varianza V (X) = E(X 2 ) − E 2 (X)

(n + 1)(2n + 1) n2 + 2n + 1 n2 − 1
V (X) = − =
6 4 12
15. Una empresa electrónica observa que el número de componentes que fallan antes de cumplir las 100 horas
de funcionamientos es una v.a. Poisson. Si el número promedio de estos fallos es 8 :

a) Determine la probabilidad que un componente falle en 25 horas.


b) ¿Cuál es la probabilidad que fallen por lo menos diez en 125 hrs?

Solución.
Se debe definir la variables aleatorias.
X : representa el número de fallos antes de las 100 horas
Se debe definir la función de cuantía.
X ∼ P (8) ;
8x −8
fX (x) = · e · I{0,1,2,3,....}(x)
x!
52 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

Calcular lo pedido
a) Como en 100 horas hay 8 fallas en promedio entonces en 25 horas hay 2 fallos en promedio.
x
X ∼ P (2) ; fX (x) = 2x! · e−2 · I{0,1,2,3,....} (x)
Luego
P (X = 1) = fX (1) = 2 · e−2
b) Como en 100 horas hay 8 fallas en promedio entonces en 125 horas hay 10 fallos en promedio
X ∼ P (10) ;
10x −10
fX (x) = ·e · I{0,1,2,3,....}(x)
x!
Luego
1010 −10
P (X = 10) = fX (10) = ·e
10!
16. En un grupo de libros hay 10 de física, 15 de química y 12 de biología. Se sacan 12 libros ¿cuál es la
probabilidad de que 5 de ellos sean de química? Use una variable aleatoria adecuada.
Solución.
Se debe definir la variables aleatorias.
P12
Xi :libro i-ésimo es de química ; Y = i=1 Xi siendo
(
1 Si el libro i es de quı́mica
Xi =
0 si no

Se debe definir la función de cuantía.


15
Y ∼ Bin(12; )
37
Calcular lo pedido !  
5
12 15 22
P (Y = 5) = · · ( )7
5 37 37

17. Para completar la colección de pegatinas de un álbum de N pegatinas diferentes vamos cada mañana al
Kiosco y compramos un sobre.
Al inicio vamos teniendo diferentes pegatinas, pero en la medida que vamos completando el álbum las
pegatinas comienzan a repetirse.
Supongamos que tenemosj pegatinas y buscamos la pegatina j + 1 y para esto abrimos un sobre tras otro,
sin encontrarla, hasta que en el sobre m está.
(
1 si en el sobre i está la pegatina j + 1
i) Si Xi = ; con i ∈ {1, 2, 3, ..., m}
0 si no

a) Determinar P (Xi = 1)
j
b) Si Tj :número de sobres a abrir para obtener la pegatinas j + 1, demostrar que Tj ∼ Geo(1 − N)

Solución.
N −j
a) P (Xi = 1) = N

j m−1 N −j
b) P (Tj = m) = P (X1 = 0; ...; Xm−1 = 0; Xm = 1) = N ( N ) · I{1,2,3,...} (m)

18. Un libro tiene en promedio 1 error por cada hoja. Si la v.a. X se define por:
X: número de errores por hoja .
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.53

a) ¿Cuál es la función de cuantía asignada?.


b) Calcular P (X > 2).

Solución.
a) Se debe definir las variables aleatorias.
X : representa el número de errores por hoja
Se debe definir la función de cuantía.
−1
X ∼ P (1) ; fX (x) = ex! · I{0,1,2,3,....} (x)
b) Calcular lo pedido
P (X > 2) = 1 − P (X = 1) = 1 − fX (1) = 1 − e−1

19. El 90 % de los árboles plantados en una campaña de reforestación sobrevive. ¿Cuál es la probabilidad
de que sobrevivan 8 o más árboles de 10 árboles que acaban de ser plantados? Determine la media de
sobrevivencia de tales árboles.
Solución.
Se debe definir la variables aleatorias.
P12
Xi : árbol i-ésimo ; Y = i=1 Xi números de árboles que sobreviven
(
1 Si el árbol i sobrevive
Xi =
0 si no
Se debe definir la función de cuantía.
Y ∼ Bin(10; 0,9)
Calcular lo pedido
!
P10 10 k
P (Y ≥ 8) = k=8 · (0, 9) · (0, 1)10−k
k

20. Un estudiante lanza 10 monedas para contabilizar el número de caras en cada experiencia y sus resultados
fueron:
N◦ de caras 0 1 2 3 4 5 6 7 8 9 10
frecuencia 300 450 790 1000 1200 1260 1200 1000 790 450 300
El estudiante asevera que las monedas que usó tenían una medida de 1/2 de salir cara. De acuerdo con
sus resultados y la información que dio el estudiante ¿es posible asegurar que él hizo la experiencia y no
inventó los datos?. Explique y argumente su afirmación.
Solución.
Se hicieron 8740 lanzamientos de la moneda. El valor teórico de que salgan 5 caras es :
!
10
5
= 0, 246
(210 )

El valor experimental : 1250/8740 = 0, 143


Por el número de lanzamientos, lo teórico no coincide con lo experimental. Inventó los datos.

21. Se sacan cartillas del kino y se define


(
1 Si la cartilla i tiene 10 números del cartón ganador
Xi =
0 Si no
54 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

a) Determine el espacio muestral y la σ − álgebra apropiada.


b) Determine la función de cuantía asociada al experimento de sacar 15 cartillas del kino y que dentro
de ellas haya k cartillas con 10 números del cartón ganador.
c) Si se sacan una a una las cartillas devolviéndolas, determinar la función de cuantía asociada al
experimento de sacar cartillas hasta dar con la que tiene 10 números del cartón ganador.

Solución.
a) Ω: es el conjunto de todas las cartillas del Kino.
P
: se escoge el conjunto potencia (puede ser cualquier otro, pero deben probar que la función Xi sea
v.a.)
b) La probabilidad que un cartón tenga 10 números del cartón ganador es:
! !
14 11
·
10 4
p= ! = 0, 074
25
14

La función de cuantía asociada al experimento es la binomial :


!
15
f (k) = pk (1 − p)15−k · I{0,1,2,3,...,15} (k)
k

c) La probabilidad que un cartón tenga 10 números del cartón ganador es:


! !
15 10
·
10 4
p= !
25
14

La función de cuantía asociada al experimento es la geométrica :

f (k) = p · (1 − p)k−1 · I{0,1,2,3,...}(k)

e−x
22. Sea la función f (x) = K · x! · I{0,1,2,3,...} (x).

a) DeterminarK, para que sea f una función de cuantía.


b) Si X ∼ f determinar E(X) y V (X)

Solución.
a) Se deben cumplir ambas propiedades de la función de cuantía. Con la segunda propiedad determina-
remos K y después probamos que la función es positiva.
P e−x e−1 −1 −x
K· ∞ x=0 x! = K · e = 1 luego K = e−e . y K > 0; ex! > 0.
b) Cálculo del primer momento:

X X∞ X∞
e−x e−x e−y
E(X) = K ·x· =K· = K · e−1 · = e−1
x=1
x! x=1
(x − 1)! y=0
y!
4.2. APLICACIONES DE FUNCIONES DE CUANTÍA Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.55

Cálculo del segundo momento:



X X∞ X∞
e−x x · e−x (y + 1)e−y
E(X 2 ) = K · x2 · =K· = K · e−1 ·
x=1
x! x=1
(x − 1)! y=0
y!

"∞ ∞
#
X y · e−y X e−y  
2 −1
E(X ) = K · e · + = e−1 · e−1 + 1 = e−2 + e−1
y=0
y! y=0
y!

Cálculo de la varianza:
V (X) = e−2 + e−1 − e−2 = e−1

23. Sea X una variable aleatoria con función de cuantía


c
fX (x) = · I{0,1,2,3,.....}(x)
x!
a) Demostrar que la constante c = e−1 .
b) Determinar E(X) y V (X)
c) Determinar ϕX (t)

Solución.
a) Usando la definición de función de cuantía.

fX (x) ≥ 0

X
fX (x) = 1
x∈Rec(X)
P∞ xk
Recordando además que ex = k=0 k!
P1 c −1
x=0 x! = 1 = c · e ; c = e

b) Si X ∼ P (λ) entonces E(X) = λ = V (X)


Como X ∼ P (1) , E(X) = 1 = V (X)
t
c) Si X ∼ P (λ) entonces ϕX (t) = eλ(e −1)
t
Como X ∼ P (1) entonces ϕX (t) = e(e −1)


24. Sea X v.a.d. con función de cuantía Ber(p), encontrar la función de cuantía de Z = X
Solución.

fZ (z) = P (Z = z) = P ( X = z) = P (X = z 2 ) = fX (z 2 )
Z ∈ {0, 1} ; fX (x) = px (1 − p)1−x · I{0,1} (x)
2 2
fZ (z) = pz · (1 − p)1−z · I{0,1} (z 2 )
Luego Z ∼ Ber(p)

25. Sea X ∼ P (λ), encontrar la función de cuantía de Z = X
Solución.

fZ (z) = P (Z = z) = P ( X = z) = P (X = z 2 ) = fX (z 2 )
λx
fX (x) = x! · e−λ · I{0,1,2,3,...}(x)
2
λz
fZ (z) = (z 2 )! · e−λ · I{z/z=√x;x∈N ∪{0}} (z)
56 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

26. Sea X1 , X2 , ..., Xm ∼ P (λ) i.i.d. Determinar la función de cuantía de X.


Solución.

t
ϕXi (t) = eλ(e −1)

Pm m
Y t t
t t
ϕX (t) = E(ext ) = E(e i=1 xi · m
)= E(exi · m ) = (eλ(e m −1) )m = eλm(e m −1)
i=1

t
Si Y ∼ P (mλ) entonces ϕY (t) = eλm(e −1)

t
t
Luego ϕX (t) = eλm(e m −1) = ϕY ( m ) , por tanto X ∼ P (mλ)

27. Considere que tiene dos cajas con fichas:


Caja 1: a blancas y b negras
Caja 2: c blancas y d negras
Usted escoge una caja al azar, extrae una ficha y la devuelve a su caja. Si observó una ficha blanca, en
la segunda extracción se escoge la Caja 1 si observó una ficha negra escoge la Caja 2 para la segunda
extracción. Si sabe que la primera ficha vino de la Caja 1, calcule la probabilidad que la segunda ficha sea
blanca, definiendo variables aleatorias adecuadas.
Solución.
Se definen las variables aleatorias :
Xi : {C1 , C2 } → {0, 1} ; Xi : la elección de la caja en la extracción i
Xi (C1 ) = 1 ; Xi (C2 ) = 0 i = 1, 2
P (X1 = 1) = P (X1 = 0) = 1/2
P (X2 = 1) = P (X2 = 1/Y1 = 1) · P (Y1 = 1)
Yi : {B, N } → {0, 1} ; Yi : la elección del color de la ficha en la extracción i
Yi (B) = 1 ; Yi (N ) = 0 i = 1, 2
P (Y1 = 1) = P (Y1 = 1/X1 = 1)P (X1 = 1) + P (Y1 = 1/X1 = 0)P (X1 = 0)
a c
P (Y1 = 1) = 2(a+b) + 2(c+d)

P (X2 = 1) = P (X2 = 1/Y1 = 1) · P (Y1 = 1) = P (Y1 = 1)


a c
P (X2 = 1) = P (Y1 = 1) = 2(a+b) + 2(c+d)

Se pide :
P (Y2 = 1/X1 = 1) = P (Y1 = 1/X1 = 1)P (Y2 = 1/X2 = 1) + P (Y1 = 0/X1 = 1)P (Y2 = 1/X2 = 0)
a a b c
P (Y2 = 1/X1 = 1) = a+b · a+b + a+b · c+d

28. En un grupo de libros hay 10 de física, 15 de química y 12 de biología. Defina una variable aleatoria
adecuada para resolver la probabilidad de que, al sacar 12 libros, 5 de ellos sean de química. También
resuelva el problema usando equiprobabilidad y explique sus resultados.
Solución.
Según lo hecho en el problema 16.
4.3. PROBLEMAS PROPUESTOS. 57

Se deben definir las variables aleatorias.


P12
Xi :libro i-ésimo es de química ; Y = i=1 Xi siendo
(
1 Si el libro i es de quı́mica
Xi = ; Xi ∼ Ber(p) independientes.
0 si no
Se debe definir la función de cuantía.
Y ∼ Bin(12; 15
37 )

Calcular lo pedido
!
12 
15 5 22 7
P (Y = 5) = · 37 · ( 37 )
5
Ahora resolviéndolo como un problema de equiprobabilidad
!
37
Ω = {subconjuntos de 12 libros} ; #Ω =
12
! !
15 22
A = {subconjuntos de 12 libros con 5 de quı́mica}; #A = ·
5 7
  

15 ·
22 
#A 5 7
P (A) = #Ω =  
37  
12
Los resultados son diferentes pues las sigma álgebras cambiaron.

29. Si X ∼ P (θ) e Y = e−3X demuestre que E(Y ) = ϕX (−3)


Solución. Usando el problema 8.
Pn θx Pn (e−3 ·θ)x −3
E(Y ) = x=0 e−3x · x! · e−θ = e−θ · x=0 x! = e−θ+e ·θ

−3 −3
E(Y ) = e−θ+e ·θ
= eθ·(e −1)
= ϕX (−3)

4.3. Problemas Propuestos.


1. Una caja contiene 12 lámparas de las cuales 4 son defectuosas. Se toman al azar tres lámparas, con
reposición, del lote una tras otra. Hallar la probabilidad de que las tres lámparas no sean defectuosas.
Defina una variable aleatoria adecuada para resolver tal problema. También resuelva el problema usando
equiprobabilidad, explique sus resultados.

2. Se lleva a cabo el experimento de sacar n esferas de una urna que contiene r esferas rojas y b esferas
blancas ( numeradas del 1 a (r + b)). Se extraen n esferas, una a una, sin reposición. Si la v.a. Y mide el
número de esferas rojas en esas n esferas extraidas determine la función de cuantía asociada a la variable
aleatoria Y .

3. Un estadístico subdivide una piscina en la cual hay salmones por áreas donde no entra ni sale salmón
alguno dentro de tales áreas y tampoco hay muertes ni nacimientos. Si el número de áreas fue de 1600 y
se supone que ha asignado un número a cada salmón (en forma abstracta , no real) del 1 al N

a) Defina una variable aleatoria que defina que el salmón j está en el área k
b) Defina una variable aleatoria que defina el número de salmones en el área k
c) ¿Qué distribuciones tienen las variables aleatorias definidas en a) y b)? Explique
58 CAPÍTULO 4. VARIABLE ALEATORIA DISCRETA

d ) Si se sabe que hay 400 sectores sin salmón alguno, determine el número de salmones en la piscina.

4. Suponga que un predador tiene 40 % de posibilidades de tener éxito en cazar una cierta presa ¿cuántos
intentos debe realizar para cazar al menos una presa con una posibilidad de al menos 90 %?. Describa la
variable aleatoria y la función de cuantía asignada a este problema.

5. Un tratamiento para una enfermedad produce una cura del 75 % de los casos. Si seis pacientes son tratados.

a) ¿Cuál es la probabilidad que todos sean curados?


b) ¿Cuál es la probabilidad que ninguno sea curado?
c) ¿Cuál es la probabilidad que sólo 4 sean curados?
d ) ¿Cuál es la probabilidad que al menos 4 sean curados?

6. El número de barcos que llegan al Puerto de Valparaíso sigue un proceso de Poisson con una tasa de
llegada de cinco por día.

a) ¿Cuál es la probabilidad de que transcurran más de seis horas sin que arribe ninguno?
b) Si el costo de operación “C” es función del tiempo ocioso X (entre llegadas), donde C = 1 − e−5x ,
encuentre el costo medio, donde C se mide en millones de pesos.
1 et −e(n+1)t
7. Sea X una v.a. discreta con función de cuantía fX (x) = n ·I{1,2,...,n} (x). Demostrar que ϕX (t) = n(1−et )

8. Sea X una v.a. discreta con función de cuantía fX (x) = k · θx · I{0,1,2,...,n} (x) ; θ > 1

a) Determinar el valor de k.
b) Calcular ϕX (t)

9. Sea X una v.a. discreta con función de cuantía fX (x) = k · x2 · I{0,1,2,...,n}(x).

a) Determinar el valor de k.
b) Calcular ϕX (t)

10. Sea X una variable aleatoria con función de cuantía fX (x) = logn (1 + x1 ) · I{1,2,3,...,n−1}(x), con n ∈ N.
Demostrar que E(X) = n − logn (n!)

11. Una enfermedad se presenta con probabilidad 1/100000 en una ciudad de 500000 habitantes, ¿cuál es la
probabilidad que al menos 3 habitantes tengan la enfermedad? ( Use el problema resuelto 7 para agilizar
sus cálculos)



1
x=1
 2
12. Sea X una variable aleatoria discreta con función densidad fX (x) = 1
x = 12


2
 0 si no

a) Determinar E(X) ; V (X)


b) Sea Y = ln(X) determinar fY
c) Determinar E(Y ) ; V (Y )
 
13. Se sabe que un líquido contiene ciertas bacterias a razón de 4 bacterias por cm3 .
 
a) Calcular la probabilidad de que una muestra de 1 cm3 no contenga bacteria alguna.
 
b) Calcular la probabilidad de que en una muestra de 0, 5 cm3 haya al menos una bacteria.
4.3. PROBLEMAS PROPUESTOS. 59

14. Se sabe que el número de partículas emitidas por una sustancia radioactiva, con el tiempo, obedece una
ley de Poisson. Supongamos que la emisión ocurre a razón de 30 partículas por minuto. ¿Cuál es la
probabilidad que en el tiempo de 7,5 segundos sean emitidas exactamente 3 partículas?.

15. Si X ∼ P (θ) e Y = e−3X , demuestre que E(Y 2 ) = ϕX (−6)


Capítulo 5

Variable Aleatoria Continua.

En esta sección se extienden los conceptos de variable aleatoria discreta a variable aleatoria contínua. El lector
puede ver que tal extensión es muy natural.
Recordemos algunos conceptos.
Sea X una variable aleatoria continua a la que se le asocia una función, fX , llamada ”función de densidad”, que
satisface:

x∈R
fX (x) ≥ 0

Z ∞
fX (x) · dx = 1
−∞

Las medidas de centralidad y dispersión se calculan de manera similar.


Sea X una variable aleatoria continua con función de densidad , fX , se definen:

Primer momento, media o esperanza matemática por:


Z ∞
E(X) = x · fX (x) · dx
−∞

Momento de orden r por:


Z ∞
E(X r ) = xr · fX (x) · dx
−∞

Varianza por:
V (X) = E(X 2 ) − E 2 (X)

Esperanza de una transformacion de una variable aleatoria:


Z ∞
E(g(X)) = g(x) · fX (x) · dx
−∞

61
62 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

Sea X una variable aleatoria continua con función de densidad , fX , se define la función generadora de momentos
por: Z ∞
ϕX (t) = E(ext ) = ext · fX (x) · dt
−∞

Los ejercicios se subdividen en:


1) Propiedades de función de densidad y sus medidas de centralidad y dispersión.
En esta sección, se ven propiedades inherentes a funciones de densidad y sus medidas de centralidad y dispersión.
Se incluyen propiedades de funciones generadoras de momento para variable aleatorias continuas.
2) Aplicaciones de tales funciones de densidad y sus medidas de centralidad y dispersión.
En esta sección se ven problemas concernientes a verificar si una función es de densidad y a cálculos de medidas
de centralidad y dispersión, además a la determinación de funciones densidad obtenidas por una transformación
de una variable aleatoria.

5.1. Propiedades de función de densidad y sus medidas de centralidad


y dispersión.
−1
1. Sea X ∼ fX e Y = fX ◦ X . Si fX existe y es derivable.
−1
dfX
a) Demostrar que fY (y) = y · dy · I]mı́n{fX },máx{fX }[ (y)
p
b) Si fY (y) = y 2 · I]mı́n{fX },máx{fX }[ (y) entonces demostrar que fX (x) = 2(x − c) · I √ 2 (x)
]c,c+( 34 2) 3 [
1
c) Si fX (x) = b−a · I[a,b] (x) determine ϕY , la f.g.m. de Y .

Solución.
−1 −1
a) FY (y) = P (Y ≤ y) = P (X ≤ fX (y)) = FX (fX (y))
−1
−1 dfX (y)
fY (y) = fX (fX (y)) · dy · I]mı́n(fX ),máx(fX )[ (y)
−1
dfX (y)
fY (y) = y · dy · I]mı́n(fX ),máx(fX )[ (y)
−1
dfX (y) −1 −1 y2
b) y 2 = y · dy ; y · dy = dfX ; fX (y) =
+c 2
p
fX (x) = 2(x − c) · I]c,d[ (x) ; Se debe buscar d.
Rdp √
3
9
c
2(x − c)dx = 1; Por tanto, d = c + 2
p
fX (x) = 2(x − c) · I 9 (x) ; c > 0

3
]c,c+ 2 [
Rb dx t
c) ϕY (t) = E(eY t ) = a
eyt · b−a = e b−a

2. Sea N (t) : número de eventos que ocurren hasta el instante t que se distribuyen según :

(λt)k · e−λt
P (N (t) = k) = · I{0,1,2,...}(k)
k!
a) Demuestre que si T1 representa el primer instante en que ocurre un evento entonces P (N (t) = 0) =
P (T1 > t).
b) Encuentre la distribución de T1 .

Solución.
5.1. PROPIEDADES DE FUNCIÓN DE DENSIDAD Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.63

a) Si T1 representa el primer instante en que ocurre un evento eso significa que en el tiempo t < T1 no
ha ocurrido nada.
Es decir: Si t < T1 ←→ N (t) = 0
luego P (t < T1 ) = P (N (t) = 0)
b) Como FT1 (t) = P (T1 < t) entonces FT1 (t) = P (T1 < t) = 1−P (T1 > t) = 1−P (N (t) = 0) = 1−e−λt
dFT1
y como dt = fT1 (t) entonces fT1 (t) = λ · e−λ·t · I[0,∞[ (t)

3. Sea X una v.a. con función generadora de momentos ϕX . Se define φX (t) = ln(ϕX (t))
Demostrar que:
dφX
a) dt (0) = E(X)
2
d φX
b) dt2 (0) = V (X)

Solución.

a)
dφX ϕ′ (t)
= X
dt ϕX (t)
entonces
dφX
(0) = ϕ′X (0) = E(X)
dt
pues ϕX (0) = 1 ;
2
d 2 φX ϕ′′ ′
X (t)·ϕX (t)−(ϕX (t))
b) dt2 = (ϕX (t))2
2
ϕ′′ ′
X (0)·ϕX (0)−(ϕX (0))
V (X) = (ϕX (0))2
pues ϕ′X (0) = E(X) ; ϕ′′X (0) = E(X 2 )

4. Sea X ∼ fX y además Y = g ◦ X . Demuestre que


Z ∞
E(Y ) = g(x) · fX (x) · dx
−∞

Solución.
R∞
E(Y ) = −∞ y · fY (y) · dy ; y = g(x); x = g −1 (y)
dx dg−1
dy = dy luego dx = dg −1
−1
fY (y) = fX (g −1 (y)) · dgdy
R∞ R∞ dg−1
E(Y ) = −∞ y · fY (y) · dy = −∞ g(x) · fX (g −1 (y)) · dy · dy
R∞
E(Y ) = −∞ g(x) · fX (x) · dx

5. Se ha definido ϕX (t) = E(ext ) como la función generadora de momentos de X. Si Y = aX + b encontrar


una expresión de ϕY (t) en términos de ϕX (t).
Solución.
ϕY (t) = E(eyt ) = E(eaxt+bt ) = ebt · E(exat )
Como ϕX (at) = E(eaxt ). Luego

ϕY (t) = E(eyt ) = E(eaxt+bt ) = ebt · E(exat ) = ebt · ϕX (at)


64 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

1−p
6. Una variable aleatoria X se le asigna una función densidad f (x) = p · λ · eλ·x · I]−∞,0[ (x) + b · I[0,b] (x)
con p ∈ [0, 1] y λ > 0

a) Verifique que f es una función densidad.


b) Determine la función generadora de momentos de X.
c) Si Y = eλx ; con λ > 0 ( el mismo de la función densidad de X) determinar la función densidad de Y.

Solución.
R0 Rb  λx 0 b
a) −∞p · λ · eλx· dx + 0 1−p
b · dx = p · e −∞
+ 1−p
b · [x]0 = p + (1 − p) = 1
R0 Rb
b) ϕX (t) = −∞ p · λ · ex(t+λ) · dx + 0 1−p
b ·e
t·x p·λ
· dx = t+λ + 1−p
b·t · (e
t·b
− 1) ; t > 0
c) Si x < 0 entonces 0 < Y < 1
Si 0 ≤ x ≤ b entonces 1 ≤ Y ≤ eλ·b
ln(y)
FY (y) = P (Y ≤ y) = P (X ≤ λ ) = FX ( ln(y)
λ )
fY (y) = fX ( ln(y)
λ )·
1
λ·y
ln(y)
Si 0 < Y < 1 entonces λ < 0 , λ > 0 entonces fX ( ln(y)
λ ) = p · λ · y · I]0,1[ (y)
ln(y)
Si 1 ≤ Y ≤ eλ·b entonces 0 ≤ λ ≤ b entonces fX ( ln(y)
λ )=
1−p
b · I[1,eb·λ ] (y)
1−p
Luego fY (y) = p · I]0,1[ (y) + b·λ·y · I[1,eλ·b ] (y)

ax+b
7. X es una v.a. con función generadora de momentos (f.g.m.) ϕX . Se define la v.a. Y = c con a, b, c ∈ R
t·b
y c 6= 0. Demuestre que ϕY (t) = e c · ϕX ( t·a
c )

Solución.
ax+b
·t bt at b·t a·t
ϕY (t) = E(e c ) = e c · E(ex· c ) = e c · ϕX ( )
c
8. Sea X ∼ exp(λ). Sea Y = FX ◦ X

a) Determinar la función distribución de X, FX


b) Determinar los valores que Y puede tomar
c) Determinar la función densidad de Y.
d ) Determinar a tal que P (a ≤ Y ≤ 1) = 0, 9

Solución.
Rx  x
a) FX (x) = 0
λ · e−λ·t · dt = −e−λt 0 = 1 − e−λ·x
b) 0 ≤ Y ≤ 1
−1 −1
c) FY (y) = P (Y ≤ y) = P (X ≤ FX (y)) = FX (FX (y)) = y
fY (y) = I[0,1] (y)
R1 1
d ) P (a ≤ Y ≤ 1) = 0, 9 = a dx = [x]a = 1 − a ; a = 0, 1

9. Sea X ∼ exp(λ) determinar en términos de λ la mediana de X.


Solución.
Se debe buscar un valor de a tal que :
P (X < a) = 0, 5
Es decir Z a
P (X < a) = λe−λx dx = 0, 5
0
5.1. PROPIEDADES DE FUNCIÓN DE DENSIDAD Y SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓN.65

genera la ecuación:
 −λx a
−e 0
= 0, 5 ó 1 − e−λa = 0, 5
−ln(0,5)
cuya solución es: ln(0, 5) = −λa ó a = λ

10. En la construcción de tablas de mortalidad y nacimiento se tienen en cuenta los siguientes supuestos:
1) la probabilidad que una persona muera durante el intervalo [t + △t, t] es igual a:
p(t, t + △t) = a(t) · △t + o(△t) ; lim△t→0 o(△t)
∆t = 0

donde a(t) es una función continua no negativa.


2) la muerte de una persona particular en un intervalo de tiempo ]t1 , t2 [ no depende de lo ocurrido previo
al tiempo t1 . 3) la probabilidad de muerte en el nacimiento es nula.
Demostrar que la probabilidad que una persona muera antes de tener la edad t. es:
Rt
1 − e− 0
a(x)·dx

Sugerencias.
i) Asuma que π(t) : probabilidad que una persona sobreviva hasta el tiempot.
ii) π(t + △t/t) : es la medida de probabilidad que dado que sobrevivió hasta la edad t, sobreviva a la edad
t + △t.
iii) Demuestre que π(t + △t) = π(t) · π(t + △t/t)
iv) Demuestre que π(t + △t, t) = 1 − p(t, t + △t)
v) Demuestre que π(t + △t) = π(t)(1 − a(t) · △t − o(△t))

vi) Haciendo △t → 0 demuestre que dt = −a(t) · π(t)
Solución.
π(t,t+△t)
π(t + △t/t) = π(t) ; π(t + △t, t) = π(t + △t)
Luego
π(t + △t) = π(t) · π(t + △t/t)

p(t, t + △t) = 1 − π(t + △t/t)

Luego

π(t + △t) = π(t) · π((t + △t)/t) = π(t)(1 − a(t) · △t − o(△t))

Con lo cual

π(t + △t) − π(t) = −π(t) · a(t) · △t − o(△t))

dividiendo por △t y haciendo tender △t → 0 se obtiene.


= −π(t) · a(t)
dt
obteniéndose Rt
1 − e− 0
a(x)·dx
= p(t)
66 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

11. Con el objetivo de establecer un plan de producción, una empresa ha estimado que la demanda aleatoria,
X, de sus potenciales clientes se comporta semanalmente, como la función densidad exponencial
f (x) = λe−λx · I[0,∞[ (x), donde x viene expresada en millones de unidades.
Demostrar que P (X > t + △t/X > t) = e−λ·△t
Solución.

P (X > t + △t; X > t)


P (X > t + △t/X > t) =
P (X > t)
Ahora
P (X > t + △t; X > t) = P (X > t + △t)

pues
{w ∈ Ω/X(w) > t + △t} ∩ {w ∈ Ω/X(w) > t} = {w ∈ Ω/X(w) > t + △t}

Luego
R∞
P (X > t + △t) t+△t
λ · e−λx dx e−λ·(t+△t)
P (X > t + △t/X > t) = = R∞ = = e−λ·△t
P (X > t) t λ·e
−λx dx e−λt

12. La función generadora de probabilidad (F.G.P.) de una variable aleatoria discreta X es definida por :

X
ϕX (t) = sk P (X = k)
k=0

Determinar F.G.P de X ∼ Geo(p)


Solución. ∞ ∞
X X ps
ϕX (s) = sk P (X = k) = sk · p(1 − p)k−1 =
1 − s + sp
k=1 k=1

con 0 ≤ ps ≤ 1

13. La función generadora de probabilidad (F.G.P.) de una variable aleatoria discreta X es definida por :

X
ϕX (s) = sk P (X = k)
k=0

Determinar F.G.P de X ∼ P (λ)


Solución ∞ ∞
X X λk · e−λ
ϕX (s) = sk P (X = k) = sk · = e−λ · eλs = e−λ(1−s)
k!
k=0 k=0

14. Sea X1 , X2 , ..., Xm ∼ exp(λ) i.i.d. Determinar la función de cuantía de X.


Solución.
λ
ϕXi (t) =
λ−t

λ m λm m
ϕX (t) = ( t ) =( )
λ− m λm − t

Luego X ∼ Γ(m, mλ)


5.2. EJERCICIOS DE APLICACIONES 67

5.2. Ejercicios de aplicaciones


15. Sea X una variable aleatoria con función densidad
1
f (x) = ·I (x)
2π(1 + x2 ) [0,∞[

Encontrar E(X) y V (X).


Solución.
R∞ kx k
 ∞
E(X) = 0 π·(1+x2 ) · dx = 2·π · ln(x2 + 1) 0 diverge, y V (X) diverge.

β

a β+1
16. Se define la variable aleatoria de Pareto X si su función densidad f (x) = a x · I]a,∞[ (x)

a) Determinar qué valor debe tener a, β para que f sea función densidad
b) Determinar qué valor debe tener a para que existan E(X) y V (X)
c) Determinar la mediana M de X.

Solución
β
R∞ aβ+1 β −β
β −β
a) 1 = a · a xβ+1 · dx = a · aβ+1 · [ x−β ]∞
a = a ·a
β+1 a
· β ; β > 0; f (x) ≥ 0 entonces a > 0
R∞ β+1 R h −β+1 i∞
β aβ+1 ∞
b) E(X) = a a xβ+1
· x · dx = β·aa · a x−β · dx = β · aβ · x−β+1 β·a
= β−1 ; si β > 1
a
a2 ·β
Haciendo lo mismo se obtiene V (X) = (β−1)2 ·(β−2) ; si β > 2
R M β+1 √
c) P (X < M ) = 0, 5 = βa · a xaβ+1 · dx ; se obtiene que M = a · β 2

17. Un combustible para clientes va a contener cierto porcentaje X de un compuesto muy particular. Las
especificaciones determinan que X debe estar entre 30 % y 35 % . El fabricante tendría una utilidad neta
por galón de combustible que es función en términos de X:


U S$0, 10
 ; 30 < X < 35
T (x) = U S$0, 05 ; 35 < X < 40 o 25<X<30


−U S$0, 10 ; otros

Si X ∼ N (33; 9) calcular E(T)


Solución.
1 x−33 2
√ · e− 2 ·( 3 ) · IR (x)
1
X ∼ fX (x) =
3 · 2π

Z 35 Z 40 Z 30 Z 25 Z 100
E(T ) = 0, 1· fx (x)dx+0, 05· fX (x)·dx+0, 05· fX (x)dx−0, 1· fX (x)·dx−0, 1· fX (x)·dx
30 35 25 0 40

Se usa una calculadora para determinar estas integrales

18. Sean n datos los cuales debemos decidir si provienen de una distribución normal o no. Para ello se realiza
el siguiente procedimiento:

1) Se ordena la información dada x(i) : i = 1, 2, 3, ..., n
2) Se construyen los datos yi = Φ−1 ( i−0,375
n+0,25 ); Φ
−1
: distribución normal estándar inversa.

3) Se calcula la correlación entre los x(i) , yi
68 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

4) Si tal correlación está en los rangos de aceptación entonces los datos se aceptan como provenientes de
una distribución normal.

Dados los siguientes datos que son 20 observaciones del voltaje de falla de una pieza de resina Epóxica (
IEEE trans. on Dielectrics and Elec. Insul., 1996, pp 43-55)

24.46; 25.61; 26.25; 26.42; 26.66; 27.15; 27.31; 27.54; 27.74; 27.94; 27.98; 28.04; 28.28; 28.49; 28.50; 28.87;
29.11; 29.13; 29.50, 30.88.

Verificar si provienen de una distribución Normal.

Solución.

1) Ordenar. Estaban ordenados.

24.46; 25.61; 26.25; 26.42; 26.66; 27.15; 27.31; 27.54; 27.74; 27.94; 27.98; 28.04; 28.28; 28.49; 28.50; 28.87;
29.11; 29.13; 29.50, 30.88.

i yi
1 -1,857140699
2 -1,389907519
3 -1,112733776
4 -0,901940252
5 -0,725159101
6 -0,56861086
7 -0,424932234
8 -0,289561272
9 -0,159318785
2) Determinación de yi 10 -0,031734798
11 0,095332621
12 0,22396465
13 0,356429437
14 0,495491579
15 0,644907175
16 0,810380505
17 1,001767916
18 1,239420338
19 1,580798793
20 2,493242733

3) Correlacion.
5.2. EJERCICIOS DE APLICACIONES 69

xi yi
24.46 -1,857140699
25.61 -1,389907519
26.25 -1,112733776
26.42 -0,901940252
26.66 -0,725159101
27.15 -0,56861086
27.31 -0,424932234
27.54 -0,289561272
27.74 -0,159318785
27.94 -0,031734798
27.98 0,095332621
28.04; 0,22396465
28.28 0,356429437
28.49 0,495491579
28.50 0,644907175
28.87 0,810380505
29.11 1,001767916
29.13 1,239420338
29.50 1,580798793
30.88 2,493242733
4) Conclusión.
Son normales los datos.

19. Los defectos de un producto son una variable aleatoria distribuida N(0, 0.0025). Si X < 1 entonces el
producto es defectuoso. Determinar

a) La función de cuantía del experimento que mide la probabilidad de que en la extracción k aparezca
por primera vez un defectuoso.
b) La probabilidad que en la quinta extracción aparezca, por vez primera, un defectuoso.
c) La probabilidad de que salga un defectuoso en alguna de las primeras 5 extracciones.

Solucion.

a)
(
1 sale en lanzamiento i
Xi =
0 si no

P (Xi = 1) = p ; P (Xi = 0) = 1 − p
P (X1 = 0; X2 = 0; ...; Xk−1 = 0; Xk = 1) = (1 − p)k−1 · p

fX (k) = p · (1 − p)k−1

b) fX (5) = p · (1 − p)4
P5 P5 k−1
c) k=1 fx (k) = p · k=1 (1 − p)
70 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

20. Con el objetivo de establecer un plan de produccion, una empresa ha estimado que la demanda aleatoria
de sus potenciales clientes se comportara semanalmente, con la siguiente funcion densidad:
(
k · (4x − x2 ) 0<x<4
f (x) =
0 otro

donde x viene expresada en millones de unidades.

a) Calcular la constante k.
b) Determinar la mediana y moda.

X−E(X)

c) Si X ∼ f . Determinar P ( √ < 1)
V (X)

Solución.
R4 3
a) 0 k · (4x − x2 ) · dx = 1 ; k = 32
√ √
b) P (X ≤ M ) = 12 ; M 3 − 6 · M 2 + 16 = 0 ; M = 2 ; M = 1 + 3 ; M =1− 3
Luego la mediana es M = 2.
3
Derivando f ′ (x) = 32 · (4 − 2x) = 0 entonces x = 2; Por tanto M o= 2
c)
Z 4
3
E(X) = · x · (4x2 − x3 ) · dx = 2
0 32
Z 4
3 24
E(X 2 ) = · x2 · (4x2 − x3 ) · dx =
0 32 5

4
V (X) = E(X 2 ) − E 2 (X) =
5

Z 2,89
X − E(X) p 3

P ( p < 1) = P (E(X) − V (X) < X < E(X) + V (X)) = · (4x − x2 ) · dx
V (X) 1,105 32

21. a) Sea X ∼ N (0, 1). Determinar la función densidad de Y = |X|


b) Calcular la f.g.m. de Y (de la parte a)
c) Determinar E(Y ) y V (Y )
Solución.
y2
a) FY (y) = P (|X| < y) = FX (y) − FX (−y) luego fY (y) = √22π · e− 2 · I]0,∞] (y)
R∞ 1 2 t2
b) ϕY (t) = √22π · 0 e− 2 (y+t) + 2 dy
t2 R∞ 1 2 t2
ϕY (t) = e 2 [ √22π · 0 e− 2 ·(y−t) · dy] = e 2 · (1 − FY (−t))
t2
c) ϕY (t) = e 2 · (1 − FY (−t))
t2 t2
ϕ′Y (t) = te 2 · (1 − FY (−t)) + e 2 · fY (−t)
t2 t2 t2 t2 t2
ϕ′′Y (t) = (e 2 + t2 · e 2 ) · (1 − FY (−t)) + te 2 · fY (−t) + te 2 · fY (−t) + e 2 · f ′ (−t)
Por tanto E(Y ) = 0 ; E(Y 2 ) = 1 ; V (Y ) = 1
x2
22. Sea X una v.a. con función densidad : f (x) = k · θ3 x2 e− θ I[o,∞[ (x) ; θ > 0
5.2. EJERCICIOS DE APLICACIONES 71

a) Determine el valor de k
b) Encuentre una expresión para determinar la mediana y si es posible calcúlela si θ = 5.
c) Calcule la moda cuando θ = 5.

Solución.
a) Z ∞
3 2 − x2
k· · x · e θ · dx = 1
0 θ
Z ∞  Z ′

3 2 − x2 3 θ x2
k· · x · e θ · dx = k · · x · − · e− θ · dx
0 θ θ 0 2
Z Z ∞

3 2 − x2 3 h − xθ
2 i∞ 3 θ − x2
k· ·x ·e θ · dx = k · · −x · e +k· · · e θ · dx
0 θ θ 0 θ 0 2
(1) Z Z ∞

3 2 − x2 3 θ x2
k· ·x ·e θ · dx = k · · · e− θ · dx
0 θ θ 2 0
q q R ∞ − u2
haciendo u = 2θ · x ; du = 2θ · dx y sabiendo que √2·π
1
0 e
2 · du =
1
2

Z ∞ Z ∞
r r √ Z ∞ √
2
− xθ − u2
2 θ θ π u2 θ·π
e · dx = e · · du = ·√ · e− 2 · du =
0 0 2 2 π 0 2
entonces (1) queda :
Z ∞ Z ∞ √
3 x2 3 θ x2 3 θ·π
k · · x2 · e− θ · dx = k · · · e− θ · dx = k · · =1
0 θ θ 2 0 2 2
Luego
4
k= √
3· π·θ
b)
6k x2 6k x2
c) f ′ (x) = θ · x · e− 2 − x3 · e− θ
θ 2·
x2 2
 √
6kx
f ′ (x) = 0 ssi θ · e− θ · 1 − xθ , luego x = 0 y x = ± θ

23. La calificación de una cierta prueba sigue una distribución N(54, 16) . Se toma la prueba a 45 alumnos
¿cuál es la probabilidad que el promedio de las notas esté entre 58 y 68?
Solución.
La función generadora de momentos de la calificación X.
1 2 2
ϕX (t) = e54·t+ 2 ·16·t = e54·t+8·t

La función generadora de momentos de la calificación X.


n
Y n
Y
t
Pn t t t2
ϕX (t) = E(e n · i=1 Xi
)= E(e n ·Xi ) = e54· n +8· n2
i=1 i=1

8 2 1 16 2
ϕX (t) = e54·t+ n ·t = e54t+ 2 · n ·t
Luego por similitud a la función generadora de momentos de N (54, 16)
X ∼ N (54, 16
n)
Cálculo de P (58 ≤ X ≤ 68) = 0, 1584.
72 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

24. Si R es el radio de una esfera con función densidad


1 1
f (R) = θ · (1 + R)−1− θ · I[0,∞[ (R)
determinar la función densidad de su superficie de área.
Solución.
Z = 4πR2
pz
FZ (z) = FR ( 4π ) − FR (0)
p z −1− θ1
fR (R) = 1θ · (1 + 4π ) · √1
2 4zπ
· I]0,∞[ (z)

25. Sea X una v.a.c. con función densidad f (x) = α · k · x−(α+1) · I]b,∞[ (x); b > 0; α > 0

a) Determine el valor de k y las condiciones de éste para que f sea función densidad.
b) Determine el valor de a tal que P (X > a) = 0, 99
c) Los ingresos mensuales X ( medidos en miles de dólares) de una familia se distribuyen según la
función densidad

f (x) = 64 · x−5 I[2,∞[ (x)

En una gran población se considera que una familia es de clase media alta si X > 5. De una base de datos
se extraen ingresos de familias de esa población al azar. Si la v.a. Y representa el número de extracciones
que se han de hacer hasta que sale una familia de clase media alta determinar el valor de r tal que
P (Y ≤ r) > 0, 9
Solución.
R∞
a) b
α · k · x−(α+1) dx = −k · x−α ]∞
b = k·b
−α
= 1; k = bα ; α > 0 ; b > 0
Ra
b) P (X < a) = 0, 01 = b α · bα · x−(α+1) · dx = −bα · x−α ]ab = −bα a−α + 1
q
Luego a−1 = α 0,99 √b
bα ;a = α 0,99
R∞ 16
c) p = P (X > 5) = 5 64 · x−5 dx = 625 = 0, 0256
Y ∼ Geo(0, 0256); fY (y) = p(1 − p)y−1 I{1,2,3,....} (y)

r
X 1 − (1 − p)r
P (Y ≤ r) = p(1 − p)k−1 = p · = 1 − (1 − p)r
p
k=1

1 − (1 − p)r > 0, 9 ; 0, 1 > (1 − p)r , por tanto, r > 88, 79; es decir, después de r = 89.

26. Sea X ∼ fX con fX (x) = 2(1 − x) · I]0,1[ (x).

a) Determine la función densidad de Y = ln(1 − X)


b) Si X1 , X2 , ..., Xn son i.i.d. según fX , e Yi = ln(1 − Xi ) , con i=1,2,...,n, determine la f.g.m. de −Y

Solución.
a) FY (y) = P (Y ≤ y) = P (ln(1 − X) ≤ y) = 1 − P (X ≤ 1 − ey ) = 1 − FX (1 − ey )
derivando:
fY (y) = 2 · e2y · I]−∞,0[ (y)
5.2. EJERCICIOS DE APLICACIONES 73

b)
Z 0
Yt 2
ϕY (t) = E(e ) = eyt · 2 · e2y · dy =
−∞ 2+t

n
Y  n  n
−Y t t
−yi · n 2 2n
ϕ−Y (t) = E(e ) = E( e )= t =
i=1
2− n
2n − t

27. Sea X una variable aleatoria con función densidad


K
f (x) = · I[0,∞[ (x)
π(1 + x2 )

Encontrar el valor de k para que f sea función densidad.


Solución. Z ∞
k k ∞ k
1= 2
· dx = · [arctan(x)]0 =
0 π · (1 + x ) π 2
k=2

28. a) Sea X ∼ N (0, 1) determinar la función densidad de Y = |X|


b) Calcular la f.g.m. de Y (de la parte a).
c) La vida media T de un fusible sigue la distribución de Y ( de la parte a). Si un fusible está defectuoso
entonces T < 2 (medido en meses). Si se extrae un fusible, determinar la probabilidad que sea
defectuoso.
Solución.
y2
a) FY (y) = P (|X| < y) = FX (y) − FX (−y) luego fY (y) = √22π · e− 2 · I]0,∞] (y)
R0 1 2 t2 R∞ 1 2 t2
b) ϕY (t) = √12π · −∞ e− 2 (x+t) + 2 dx + √12π · 0 e− 2 (x−t) + 2 dx
c) P (T < 2) = P (Y < 2) = FX (2) − FX (0) (se usa calculadora para determinar tal valor).

29. Se define la variable aleatoria de Pareto X si su función densidad


α  a α
f (x) = · · I]a,∞[ (x)
x x
con a > 0

a) Determinar E(X) y V (X)


b) Determinar la mediana M, de X.

Solución.
R∞ R∞ h i∞
α·aa x1−α
a) E(X) = a xα+1 · x · dx = αaa · a x−α · dx = αaα · 1−α
a
α −a1−α α·a
Si (1 − α) < 0 entonces E(X) = αa · 1−α = − 1−α
Si no E(X) no existe.
R∞ a R∞ h 2−α i∞
E(X 2 ) = a xα·a 2
a+1 · x · dx = α · a
α
· a x1−a · dx = α · aα · x2−α
a
2−a 2
Si (2 − α) < 0 entonces E(X 2 ) = α · aα · −a α·a
2−α = − 2−α ( la varianza da negativa pues f no es
densidad).
RM α M
b) P (X < M ) = 0, 5 = α · a xaα+1 · dx = − [aα · x−α ]a = −aa (M −a − a−α )
1 1−a
 1  1−a
1

2 − 1 = −M · aa , luego M = 2·a a
74 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

30. Si X tiene función generadora de momentos ϕ(t) = e−t , determinar E(X) y V (X).
Solución.
ϕ′ (t) = −e−t luego E(X) = ϕ′ (0) = −1
ϕ′′ (t) = e−t luego E(X 2 ) = ϕ′′ (0) = 1
V (X) = E(X 2 ) − E 2 (X) = 1 − 1 = 0 .

31. Una v.a. X tiene f.g.m. ϕX (t) = t + e−t

a) Determinar E(X) y V (X)


b) Si Y = X−E(X)
√ encontrar ϕY (t)
V (X)

Solución.

a) ϕ′X (t) = 1 − e−t ϕ′X (0) = 0 = E(X)


ϕ′′X (t) = e−t ϕ′′X (0) = 1 = E(X 2 )
V (X) = 1 − 0 = 1
X−0
b) Y = 1 = X por tanto ϕY (t) = ϕX (t)
−x
e√
32. Sea X ∼ f (x) = k · x
2
· I]0,∞[ (x)

a) Encontrar la constante k para que f sea función densidad


b) Encontrar la función generadora de momentos de f .
c) Encontrar c tal que P (0 < X < µ + c · σ) = 0, 8

Solución.
R∞ −
e√
x R∞ u2 √ dx
a) 0 k· 2
x
· dx = 1 = k · 0 2 · e− 2 · du ; haciendo u = x ; du = √
2· x
Luego k = √1 = 0, 3989
2·π
R∞ −
e√
x R∞ e−x( −t)1 √ q1 dx
q
1
b) ϕX (t) = 0 ext · 2
x
· dx = 0
√2
x
· dx ; haciendo u = x · 2 − t ; du = √
2· x
· 2 −t
Z ∞
1 2 u2 1
ϕX (t) = √ ·√ · e− 2 · du = √
1 − 2t 2π 0 1 − 2t
3
c) ϕ′X (t) = (1 − 2t)− 2 ; ϕ′X (0) = 1 = E(X) = µ
3 3
ϕ′′X (t) = 2 · (1 − 2t)− 2 · (−2) ; ϕ′′X (0) = 3 = E(X 2 )
Luego: V (X) = σ 2 = 3 − 1 = 2 = σ 2
P (0 < X < µ + c · σ) = P (0 < X < 1 + 2c) = 0, 8
P (0 < X < 1 + 2c) = 0, 8 = 2(φ(1 + 2c) − 0, 5)
φ(1 + 2c) = 0, 9 , c = 0, 14

33. Suponga que el radio de un cojinete de esferas está distribuido U [0, 2].

a) Encontrar la función densidad de la variable aleatoria volumen,V .


4·π
b) Encontrar P (0 < V < 3 )

Solución.
5.3. EJERCICIOS PROPUESTOS 75
q q
a) FV (v) = P (V < v) = P ( 34 π · r3 < v) = P (0 < r < 3 3v
4π )
3v
= Fr ( 3 4π )
r  − 23
3 3v 1 3v 3
fV (v) = fr ( )· · · · I 32 (v)
4π 3 4π 4π [0, 3 ·π]
r  − 23
3 3v 3v 1
fV (v) = fr ( )· · · I 32 (v)
4π 4π 4π [0, 3 ·π]
 − 23
3v 1
fV (v) = · · I 32 (v)
4π 8 · π [0, 3 ·π]
4·π
R 4·π  2
3v − 3 1
b) P (0 < V < 3 ) = 0
3
4π · 8π · dv

4·π 1
P (0 < V < )=
3 2
34. Sea X ∼ N (3, 9). Calcular

a) P (0 < X < 6)
b) P (|X| < 3)
c) P (X < a) = 0, 8

Solución.
a) P (0 < X < 6) = P (X < 6) − P (X < 0) = 0, 841 − 0, 1587 = 0, 6823
b) P (−3 < X < 3) = P (X < 3) − P (X < −3) = 0, 5 − 0, 0228 = 0, 4772
c) P (X < a) = 0, 8. Usando normal inversa se obtiene que a = 5, 525

5.3. Ejercicios Propuestos


1. Sea X una v.a. con función densidad :
3 x2
f (x) = k · x2 e− θ I[o,∞[ (x)
θ
conθ > 0.
X2
Se define Y = θ . Encontrar la función densidad de Y .

2. Sea X una v.a. con función densidad :


3 x2
f (x) = k · x2 e− θ I[o,∞[ (x)
θ
con θ > 0. Determine la f.g.m. ϕX (t)

3. Suponga que el radio de un cojinete de esferas está distribuido R ∼ exp(2).

a) Encontrar la función densidad de la variable Volumen.


b) Encontrar esperanza y varianza del volumen.
kθ k
4. Sea X ∼ fX donde fX (x) = xk+1
· I[θ,∞[ (x) ; θ > 0

a) Verifique que es una función densidad.


76 CAPÍTULO 5. VARIABLE ALEATORIA CONTINUA.

1
b) Determinar la densidad de la variable aleatoria Y = X

5. Sea X una v.a.c. con función densidad


k · θk
fX (x) = · I[θ,∞[ (x)
xk+1
con k una constante.

a) Determinar E(X), cuando k > 1.


b) Determinar V (X), cuando k > 2.
c) ¿Qué valor debe tener k, para que exista E(X r )?

6. La fiunción densidad de X viene dada por

x2
fX (x) = k · ( · I[0,2] (x) + e−x · I]2,∞[ (x))
2
a) Determinar el valor de k.
b) Determinar la f.g.m. de X
c) Encontrar V (X).

7. Sea X ∼ N (0, 1). Se define Y = eX , determinar fY .

8. Suponga que el radio de un cojinete de esferas está distribuido exp(2).

a) Encontrar la función densidad de la variable Volumen.


b) Encontrar esperanza y varianza del volumen.

9. Se define la función
1
f (x) = k · · IR (x)
1 + x2
Encontrar la constante k. ¿Existe la esperanza y varianza?

10. a) Sea X ∼ U [− π2 , π2 ] encontrar la función densidad de Y = c·sen(x) para cualquier valor de c constante
positiva.
b) Sea X ∼ exp(λ), se define la variable Y = eX . Encontrar E(Y ) ; E(Y 2 ) ; E(Y 3 ) y ver cuáles son las
condiciones de la existencia de tales momentos. Estudie qué pasa con ϕY , la f.g.m. de Y .

11. Sea X ∼ fX y además Y = g ◦ X . Demuestre que


Z ∞
E(Y ) = g(x) · fX (x) · dx
−∞

12. a) Sea X ∼ N (0, 1) encontrar la función densidad de Y = X 2 ; grafíquela.


b) Determinar E(Y ) ; V (Y ).
c) Encontrar la mediana de Y.
d ) Encontrar la función generadora de momentos de Y.

13. Sea X ∼ N (µ, σ 2 ). Sabiendo que


σ2 ·t2
ϕX (t) = eµ·t+ 2

X−µ
a) Si Y = σ encontrar ϕY .
5.3. EJERCICIOS PROPUESTOS 77

b) Calcular E(X 4 ).

14. Se define la función densidad delta de Dirac como la función δx0 (x) = δ(x − x0 ) que satisface
R∞
i) −∞ δ(x − x0 )dx = 1
Rb
ii) a δ(x − x0 ) · f (x) · dx = f (x0 ) con a ≤ x0 ≤ b
Demostrar:

a) Si X ∼ δx0 Calcular ϕX
b) Si X ∼ δx0 Calcular E(X) y V (X)

15. a) Sea X una variable aleatoria con función densidad fX y W = √1 . Demostrar que si fX es una
X
función par
4 1
fW (w) = 3 · fX ( 2 )
w w
b) ¿Puede una función densidad o cuantía tener en su recorrido valores mayores que 1? Justifique y
ejemplifique.
c) ¿Puede una función densidad ser impar? Justifique.

16. Sea X ∼ fX donde


kθk
fX (x) = ·I (x)
xk+1 [θ,∞[
θ > 0.
Verificar que si k > 2 entonces
kθ2
V (X) =
(k − 1)2 (k − 2)
1
17. Sea X ∼ fX ; X > 0. Demostrar que la función densidad de W = X es

1 1
fW (w) = · fX ( )
w2 w
Capítulo 6

Vectores aleatorios Discretos

En esta sección los conceptos de matriz de frecuencias, de la estadística bivariada, se formalizan funcionalmente,
de la misma manera que se hizo para el caso univariado. Las variables que representan las dos características
de la población a medir han de ser variables intervalares y se formalizarán como un vector (X, Y ). Luego los
valores que se pondrán en cada celda, de la matriz, se describirán funcionalmente como la función f→ − (x, y),
X
llamada función de cuantía conjunta.
Recordemos algunas definiciones y propiedades importantes.
Función de cuantía conjunta.


− , que satisface las
Al vector X = (X, Y ) se le asocia una función llamada función de cuantía conjunta, f→
X
propiedades :

− (x, y) ≥ 0 ; ∀(x, y) ∈ Rec(X) × Rec(Y )


f→
X
P P
x∈Rec(X) y∈Rec(Y )
− (x, y) = 1
f→
X

Función de distribución conjunta.




− , se llama función de distribución
Sea X = (X, Y ) un vector aleatorio con función de cuantía conjunta, f→
X
conjunta, F→− , a
X
P P
− (a, b) =
F→
X x≤a y≤b f X (x, y)

Función de Probabilidad conjunta.




− , se llama función de probabilidad
Sea X = (X, Y ) un vector aleatorio con función de cuantía conjunta, f→
X
conjunta, a
P P
P (X ≤ a, Y ≤ b) = x≤a y≤b f→ − (x, y)
X

− (a, b)
P (X = a, Y = b) = f→
X

Función de cuantía marginales.




Sea X = (X, Y ) un vector aleatorio con función de cuantía conjunta, f→

X

P
1. Se llama función de cuantía marginal de Y a la función fY (y) = x∈Rec(X)
− (x, y)
f→
X
P
2. Se llama función de cuantía marginal de X a la función fX (x) = y∈Rec(Y )
− (x, y)
f→
X

79
80 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS

Función de cuantía condicionales.




− y funciones de cuantía marginales fX
Sea X = (X, Y ) un vector aleatorio con función de cuantía conjunta, f→
X
, fY
f→
− (x0 ,y)
1. Se llama función de cuantía condicional de Y , dado X = x0 , a la función fY /X=xo = X
fX (x0 )

f→
− (x,y0 )
2. Se llama función de cuantía condicional de X, dado Y = y0 , a la función fX/Y =yo = X
fY (y0 )

Independencia de las variables X e Y.


− y marginales fX , fY se dirá que:
X e Y con función de cuantía conjunta f→
X
X e Y son independientes ssi fX/Y =yo = fX (x) ; fY /X=xo = fY (y)
Medidas de Centralidad y Dispersión.


− , y funciones de cuantía marginales fX
Sea X = (X, Y ) un vector aleatorio con función de cuantía conjunta f→
X
y fY .



1. Se llama Esperanza del vector X = (X, Y ) a


E( X ) = (E(X), E(Y ))



2. Se llama Esperanza de una transformación del vector X a
X X
E(g(x, y)) = − (x, y)
g(x, y) · f→
X
x∈Rec(X) y∈Rec(Y )

3. Se llama Esperanza Condicional de X dado Y = y0 a


X
E(X/Y = y0 ) = x · fX/Y =y0
x∈Rec(X)

4. Se llama Esperanza Condicional de Y dado X = x0 a


X
E(Y /X = x0 ) = y · fY /X=x0
y∈Rec(Y )

5. Se llama Varianza Condicional de Y dado X = x0 a

V (Y /X = x0 ) = E(Y 2 /X = x0 ) − E 2 (Y /X = x0 )

6. Se llama Varianza Condicional de X dado Y = y0 a

V (X/Y = y0 ) = E(X 2 /Y = y0 ) − E 2 (X/Y = y0 )



7. Se llama Covarianza de X = (X, Y ) a

Cov(X, Y ) = E(X · Y ) − E(X) · E(Y )

8. Se llama matriz de Varianzas - Covarianzas a


" #
X V (X) Cov(X, Y )
=
Cov(X, Y ) V (Y )
6.1. PROPIEDADES DE FUNCIÓN DE CUANTÍA CONJUNTA Y DE SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓ

Los problemas se separan en forma natural

1. Problemas referentes a propiedades


Este conjunto de problemas hace referencias a demostraciones de ciertas propiedades que cumplen ya sea
las funciones de cuantía conjunta o sus medidas de centralidad y dispersión.

2. Problemas de aplicaciones.
Este conjunto de problemas hace referencias a aplicación de ciertas propiedades o definición misma de
funciones de cuantía conjunta particulares y cálculos de sus medidas de centralidad y dispersión.

6.1. Propiedades de función de cuantía conjunta y de sus medidas de


centralidad y dispersión
1. Si X e Y son independientes entonces E(X · Y ) = E(X) · E(Y )
Solución.
− y marginales fX , fY entonces f→
Si X e Y son independientes con función de cuantía conjunta f→
X
− (x, y) =
X
fX (x) · fY (y)

X X
E(X · Y ) = − (x, y)
x · y · f→
X
x∈Rec(X) y∈Rec(Y )

X X
E(X · Y ) = x · y · fX (x) · fY (y)
x∈Rec(X) y∈Rec(Y )

X X
E(X · Y ) = x · fX (x) · y · fY (y) = E(X) · E(Y )
x∈Rec(X) y∈Rec(Y )

2. Si X e Y son v.a.d. independientes demostrar que h(x), g(y) también lo son.


Solución.
XX XX
E(h(x) · g(y)) = − (x, y) =
h(x) · g(y) · f→
X
h(x) · g(y) · fX (x) · fY (y)
x y x y

XX X X
E(h(x) · g(y)) = h(x) · g(y) · fX (x) · fY (y) = h(x) · fX (x) · g(y) · fY (y)
x y x Y

E(h(x) · g(y)) = E(h(x)) · E(g(y))

3. Si X e Y son v.a.d. independientes, con función de cuantía conjunta fX , demostrar que


− (x, y) = fX (x) · fY (y).
f→
X
Solución.
Como Xe Y son independientes
P (X/Y ) = P (X)
Ahora
P (X = x) = fX (x)
82 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS

P (Y = y) = fY (y)

P (X/Y ) = fX/Y

Por tanto: P (X/Y ) = P (X) es equivalente a

− (x, y)
f→
X
fX/Y = = fX (x)
fY (y)

con lo cual
− (x, y) = fX (x) · fY (y)
f→
X

4. Si X e Y v.a.d demostrar que


E(E(X/Y )) = E(X)

Solución.
X − (x, y)
f→
X
E(X/Y ) = x·
fY (y)
x∈Rec(X)

es una función de Y . Y como X


E(h(y)) = h(y) · fY (y)
y∈Rec(Y )

X X − (x, y)
f→
X
E(E(X/Y )) = x· · fy (y)
fY (y)
y∈Rec(Y ) x∈Rec(X)

X X X
E(E(X/Y )) = − (x, y) =
x · f→
X
x · fX (x)
x∈Rec(X) y∈Rec(Y ) x∈Rec(X)

E(E(X/Y )) = E(X)

5. La covarianza muestral se define por


r X
X s
Cov(X, Y ) = (Xi − X)(Yj − Y ) · fij
i=1 j=1

Demuestre que
r X
X s
Cov(X, Y ) = Xi · Yj · fij − X · Y
i=1 j=1

Solución. s
r X
X
Cov(X, Y ) = (Xi − X)(Yj − Y ) · fij
i=1 j=1

r X
X s
Cov(X, Y ) = (Xi · Yj · fij − Xi · Y · fij − X · Yj · fij + X · Y · fij )
i=1 j=1

r X
X s r X
X s r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · Xi · fij − X · Yj · fij + X · Y
i=1 j=1 i=1 j=1 i=1 j=1
6.1. PROPIEDADES DE FUNCIÓN DE CUANTÍA CONJUNTA Y DE SUS MEDIDAS DE CENTRALIDAD Y DISPERSIÓ

r X
X s r X
X s r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · Xi · fij − X · Yj · fij + X · Y
i=1 j=1 i=1 j=1 i=1 j=1

r X
X s r
X s
X
Cov(X, Y ) = (Xi · Yj · fij ) − Y · Xi · fi∗ − X · Yj · f∗j + X · Y
i=1 j=1 i=1 j=1

r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · X − X · Y + X · Y
i=1 j=1

r X
X s
Cov(X, Y ) = (Xi · Yj · fij ) − Y · X
i=1 j=1

6. X1 , X2 , ..., Xn ∼ P (θ) independientes demostrar que X ∼ P (nθ)


Solución.
t
Si X ∼ P (θ) entonces ϕX (t) = eθ·(1−e )
Qn t
Ahora ϕX (t) = E(ex·t ) = E( i=1 exi · n ) ; por ser independientes y usando problema 6
n
Y n
Y n
Y t
t t
ϕX (t) = E(ex·t ) = E( exi · n ) = E(exi · n ) = eθ(1−e n )
i=1 i=1 i=1

n
Y t t
ϕX (t) = eθ(1−e n ) = enθ(1−e n )
i=1

t
Si Y ∼ P (n · θ) entonces ϕY (t) = en·θ·(1−e )

n
Y t t
t
ϕX (t) = eθ(1−e n ) = enθ(1−e n ) = ϕY ( )
i=1
n

Luego X ∼ P (nθ)

7. Si X1 , X2 , ..., Xn ∼ P (θ) independientes ,Y ∼ P (n · θ) y Z = e−3X demuestre que E(Z) = ϕY (− n3 )


Solución.
t
Si Xi ∼ P (θ) entonces E(eXi t ) = ϕXi (t) = eθ·(1−e )

t
Si Y ∼ P (n · θ) entonces ϕY (t) = en·θ·(1−e )
3
Pn Qn −3 Qn −3 −3
E(Z) = E(e− n · i=1 Xi ) = i=1 E(e n ·Xi ) = i=1 (eθ(1−e n ) = enθ(1−e n ) = ϕY (− n3 )

8. Si X e Y son independientes entonces Cov(X, Y ) = 0


Solución.
Cov(X, Y ) = E(X · Y ) − E(X) · E(Y )
Por ser independientes y por el ejercicio 1.

E(X · Y ) = E(X) · E(Y )

Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ) = 0


84 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS

9. Demostrar que
V (aX + bY ) = a2 · V (X) + b2 · V (Y ) + 2 · a · b · Cov(X, Y )

Solución.
V (aX + bY ) = E((aX + bY )2 ) − E 2 (aX + bY )

E((aX + bY )2 ) = E(a2 X 2 + b2 Y 2 + 2ab · X · Y ) = a2 E(X 2 ) + b2 E(Y 2 ) + 2ab · E(X · Y )

E 2 (aX + bY ) = (aE(X) + bE(Y ))2 = a2 E 2 (X) + b2 E 2 (Y ) + 2ab · E(X) · E(Y )

V (aX + bY ) = E((aX + bY )2 ) − E 2 (aX + bY ) = a2 V (X) + b2 V (Y ) + 2ab · Cov(X, Y )

10. Si X e Y son independientes


V (aX + bY ) = a2 · V (X) + b2 · V (Y )

Solución.
Como
V (aX + bY ) = a2 · V (X) + b2 · V (Y ) + 2 · a · b · Cov(X, Y )

y si X e Y son independientes entonces Cov(X, Y ) = 0


Entonces
V (aX + bY ) = a2 · V (X) + b2 · V (Y )

6.2. Problemas de aplicación


11. Se lanzan 4 dados cada uno con dos caras 1, dos caras 2 y dos caras 3. Se define Xi : valor que toma el
dado i-ésimo ; i = 1, 2, 3, 4.

a) Se define X = máx {Xi : i = 1, 2, 3, 4}, encontrar la función de cuantía de X.


b) Si Tim lanza los dados X1 , X2 y Bill lanza los dados X3 , X4 . Encontrar la probabilidad que la suma
de los dados de Tim sea igual a la suma de los dados de Bill.

Solución.
El espacio muestral
Ω = {(X1 , X2 , X3 , X4 ) : Xi ∈ {1, 2, 3}}

#Ω = 81
1
a) i) X = 1 entonces hay sólo 1 , (1, 1, 1, 1) luego P (X = 1) = 81
ii) X = 2 entonces
1 dado con un 2 ,
4
P ({(X1 , X2 , X3 , X4 )/∃!Xi : Xi = 2}) =
81
2 dados con un 2,
6
P ({(X1 , X2 , X3 , X4 )/∃Xi , Xj : Xi = Xj = 2; i 6= j}) =
81
6.2. PROBLEMAS DE APLICACIÓN 85

3 dados con un 2,
4
P ({(X1 , X2 , X3 , X4 )/∃!Xi : Xi < 2}) =
81
4 dados con un 2,
1
P ({(X1 , X2 , X3 , X4 )/∀i : Xi = 2}) =
81
Luego
15
P (X = 2) =
81
iii) X = 3 entonces
1 dado con un 3 ,con ningún 2
4
P ({(X1 , X2 , X3 , X4 )/∃!i : Xi = 3 ∧ ∀j 6= i : Xj = 1}) =
81
1 dado con un 3 ,con un solo 2
12
P ({(X1 , X2 , X3 , X4 )/∃!i, j : Xi = 3, Xj = 2; i 6= j}) =
81
1 dado con un 3 ,con sólo dos 2
12
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k : Xi = 3, Xj = 2 = Xk ; i 6= j 6= k}) =
81
1 dado con un 3 ,con tres 2
4
P ({(X1 , X2 , X3 , X4 )/∃!i : Xi = 3 ∧ ∀j 6= i : Xj = 2}) =
81
2 dados con un 3 ,con ningún 2
6
P ({(X1 , X2 , X3 , X4 )/∃!i, j : Xi = Xj = 3 ∧ ∀k ∈
/ {i, j} : Xk = 1}) =
81
2 dados con un 3 ,con sólo un 2
12
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k : Xi = Xj = 3 ∧ Xk = 2, i 6= j 6= k}) =
81
2 dados con un 3 ,con dos 2
6
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k, l : Xi = Xl = 3, Xj = 2 = Xk ; i 6= j 6= k 6= l}) =
81
3 dados con un 3, y un dado con 1
4
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k, l : Xi = Xl = 3 = Xj ; Xk = 1; i 6= j 6= k 6= l}) =
81
3 dados con un 3 y un dado con 2

4
P ({(X1 , X2 , X3 , X4 )/∃!i, j, k, l : Xi = Xl = 3 = Xj ; Xk = 2; i 6= j 6= k 6= l}) =
81
4 dados con 3
1
P ({(X1 , X2 , X3 , X4 )/∀i : Xi = 3}) =
81
Luego
65
P (X = 3) =
81
Por tanto
X X=1 X=2 X=3
P(X=x) 1/81 15/81 65/81
86 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS

b) Los posibles valores de la suma de los dados es {2, 3, 4, 5, 6}


1 1 2 2 3 3
1 2 2 3 3 4 4
1 2 2 3 3 4 4
2 3 3 4 4 5 5
2 3 3 4 4 5 5
3 4 4 5 5 6 6
3 4 4 5 5 6 6

P (X1 + X2 = k; X3 + X4 = k) = P (X1 + X2 = k)P (X3 + X4 = k)



 4/81 k=2




 8/81
 k=3
P (X1 + X2 = k) = 12/81 k=4



 8/81 k=5




4/81 k=6
luego
304
P (X1 + X2 = X3 + X4 ) =
6561
12. Sean X e Y iid Bin(m, p). Encontrar la función de cuantía de Z = X + Y .
Solución.


Z ∈ {0, 1, 2, 3, 4, 5, ..., 2m}; X = (X, Y )
! !
m m
− (x, y) = fX (x) · fY (y) =
f→
X
· px+y (1 − p)2m−(x+y) · I{0,1,2,...,m}2 (x, y)
x y

k
X
P (X + Y = k) = P (X = j)P (Y = k − j)
j=0

! !
m m
− (j, k − j) = fX (j) · fY (k − j) =
P (X = j)P (Y = k − j) = f→
X
· pk (1 − p)2m−k
j k−j

luego ! !
z
X m m
fZ (z) = P (X + Y = z) = · pz (1 − p)2m−z
j=0
j z−j

ahora ! ! !
z
X m m 2m
· =
j=0
j z−j z

luego !
2m
fZ (z) = P (X + Y = z) = p(1 − p)2m−z · I{0,1,2,3,...,2m} (z)
z
Por tanto,
Z ∼ Bin(2m, p)
6.2. PROBLEMAS DE APLICACIÓN 87



13. Sea X = (X1 , X2 , .., Xn ) un vector aleatorio que recoge los resultados de n lanzamientos de una moneda
( cada uno independiente del otro). Cada moneda con probabilidad p de que salga cara. Se define

Y = X1 + X2 + ... + Xn

a) Calcular P (X1 /Y = k)
b) E(X1 /Y = k)

Solución.
P (Xi = 1) = p ; P (Xi = 0) = 1 − p

P (Y = k/X1 = 1) · P (X1 = 1) P (X2 + X3 + ... + Xn = k − 1)P (X1 = 1) k


P (X1 = 1/Y = k) = = =
P (Y = k) P (Y = k) n

De igual forma:
P (Y = k/X1 = 0) · P (X1 = 0) k
P (X1 = 0/Y = k) = =1−
P (Y = k) n

k
E(X1 /Y = k) = 1 · P (X1 = 1/Y = k) + 0 · P (X1 = 0/Y = k) =
n
14. Dos líneas de producción manufacturan cierto tipo de artículos. Suponga que la capacidad (en cualquier
día dado) es dos artículos para la línea I y 3 para la línea II. Con base en la tabla adjunta que muestra la
distribución de probabilidades conjunta:

I/II 0 1 2 3
0 0 0,04 0,12 0,09
1 0,02 0,14 0,21 0,14
2 0,07 0,06 0,06 0,05
a) Obtener las funciones marginales de X e Y .
b) Hallar la probabilidad que en la línea I se produzca más que en la II.
c) Halle la probabilidad que en total se produzcan 3 artículos.
d ) Hallar la probabilidad que en la línea I se produzca más que en la II dado que se producen 3 artículos.

Solución.
I marginal I
a)
0 0,25
1 0,51
2 0,24
II marginal II
0 0,09
1 0,24
2 0,39
3 0,28
b) P (I > II) = P (1, 0) + P (2, 1) + P (2, 0) = 0, 15
c) P (I + II = 3) = P (0, 3) + P (1, 2) + P (2, 1) = 0, 36
88 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS

P (2,1) 0,07
d ) P (I > II/I + II = 3) = 0,36 = 0,36

15. Sea la tabla bivariada


Y
0 1
X 1 0,1 0,2
4 0,5 0,2
Calcular V (3X + 4Y )
Solución.
0 1 Y
1 0,1 0,2 0,3
4 0,5 0,2 0,7
X 0,6 0,4
V (3X + 4Y ) = 9V (X) + 16V (Y ) + 24Cov(X, Y )
E(Y ) = 0, 4 ; E(Y 2 ) = 0, 4 ; V (Y ) = 0, 4 − 0, 16 = 0, 24
E(X) = 3, 1 ; E(X 2 ) = 11, 5 ; V (X) = 11, 5 − 9, 61 = 1, 89
Cov(X, Y ) = E(X · Y ) − E(X)E(Y )
E(X · Y ) = 0, 2 + 0, 8 = 1
Cov(X, Y ) = 1 − 3, 1 · 0, 4 = −0, 24
V (3X + 4Y ) = 9 · 1, 89 + 16 · 0, 24 + 24 · (−0, 24) = 15, 09

16. Sea la tabla bivariada


0 1
Y X 1 0,1 0,2
4 0,5 0,2
Calcular la matriz de varianza y covarianzas Σ
Solución.
E(Y ) = 0, 4 ; E(Y 2 ) = 0, 4 ; V (Y ) = 0, 4 − 0, 16 = 0, 24
E(X) = 3, 1 ; E(X 2 ) = 11, 5 ; V (X) = 11, 5 − 9, 61 = 1, 89
Cov(X, Y ) = E(X · Y ) − E(X)E(Y )
E(X · Y ) = 0, 2 + 0, 8 = 1
Cov(X, Y ) = 1 − 3, 1 · 0, 4 = −0, 24
" #
1, 89 −0, 24
Σ=
−0, 24 0, 24

17. Si X, Y ∼ P (λ) independientes calcular la función de cuantía conjunta de Z = X + Y


Solución.
Debemos saber:
t
(i) Si X ∼ P (θ) entonces ϕX (t) = eθ·(1−e )

(ii) Si X e Y son v.a.d independientes entonces h(X), g(Y ) también lo son.


(iii) Si X e Y son independientes entonces E(X · Y ) = E(X) · E(Y )
6.2. PROBLEMAS DE APLICACIÓN 89

Luego
t
ϕZ (t) = E(ezt ) = E(e(x+y)t ) = E(ext · eyt ) = E(ext ) · E(eyt ) = e2θ·(1−e )

luego
Z ∼ P (2λ)

18. Sean
1
X ∼ fX (x) = · I{1,2,...,n} (x)
n

1
Y ∼ fY (y) =
· I{1,2,...,m}(y)
m
independientes. Encontrar la función generadora de momentos de Z = X + Y
Solución.
Debemos saber:
1 1 et −et(n+1)
(i) Si X ∼ fX (x) = n · I{1,2,...,n}(x) entonces ϕX (t) = n · 1−et

(ii) Si X e Y son v.a.d independientes entonces h(X), g(Y ) también lo son.


(iii) Si X e Y son independientes entonces E(X · Y ) = E(X) · E(Y )

   
1 1 − e(n+1)t 1 − e(m+1)t
ϕZ (t) = E(e(x+y)t ) = E(ext ) · E(eyt ) = · ·
n·m 1 − et 1 − et
19. Sea la tabla bivariada
0 1
Y X 1 0,1 0,2
4 0,5 0,2
Calcular
Cov(3X + 4Y, 2X + 6Y )

Solución.
Debemos saber:
(i)
Cov(aX + bY, cX + dY ) = ac · V (X) + bd · V (Y ) + (ad + bc)Cov(X, Y )

Cov(3X + 4Y, 2X + 6Y ) = 6 · V (X) + 24 · V (Y ) + 26 · Cov(X, Y )


Por lo hecho en el problema 16. " #
1, 89 −0, 24
Σ=
−0, 24 0, 24

Cov(3X + 4Y, 2X + 6Y ) = 6 · 1, 89 + 24 · 0, 24 − 26 · 0, 24 = 10, 86

20. Si X ∼ fX (x) = n1 · I{1,2,...,n} (x) ; Y ∼ fY (y) = 1


m · I{1,2,...,m} (y) independientes encontrar la función de
cuantía conjunta de Z = X + Y .
Solución.
Debemos saber:
− (a, b)
P (X = a, Y = b) = f→
X
90 CAPÍTULO 6. VECTORES ALEATORIOS DISCRETOS

Si X e Y son v.a.d independientes con función de cuantía fx y fY respectivamente entonces f→


− (x, y) =
X
fX (x) · fY (y)

1
− (x, y) =
f→
X
· I{1,2,3,...,n}×{1,2,3,...,m} (x, y)
nm

k
X k
X
P (X + Y = k) = P (X = j)P (Y = k − j) = − (j, k − j)
f→
X
j=1 j=1

6.3. Problemas propuestos


1. Hay 15 personas donde 7 son hombres , 8 son mujeres. Se sacan 6 personas al azar. Si X: número de
mujeres e Y : número de hombres.


a) Determinar la función de cuantía conjunta de X = (X, Y )
b) Determinar P (X/Y = 3)
c) Determinar marginales.
d ) ¿Son X e Y independientes?

2. Se define la función de cuantía :


− (x, y) = x · y · I{1,2,3}×{1,2,3,4} (x, y)
f→
X

a) Determine el valor de k.
b) Determine las funciones de cuantía marginales.
c) ¿ Son X e Y independientes? .
d ) ) Calcular E(X/Y = 3) .


3. Sea el vector aleatorio X = (X, Y ) donde X : el número de caras al lanzar 4 monedas Y : el número
obtenido al lanzar un dado.

a) Determinar la función de cuantía conjunta f→


− (x, y)
X
b) Determinar E(X/Y = y)
c) Determinar P (X ≤ 3; Y ≤ 3)

4. Sea
− (x, y) = k · (x2 + x · y) · I{0,1,2,3}×{0,2,3} (x, y)
f→
X

a) Determinar k tal que f sea función de cuantía conjunta


b) Determinar P (X < 3; Y < 3)
c) Determinar E(X/Y = 2)
d ) Determinar E(E(X/Y )). ¿Qué observación puede hacer?


5. Sea U = (X, Y ) vector aleatorio discreto bidimensional con función de cuantía conjunta :
! ! !
20 30 10
· ·
x y 4−x−y
f (x, y) = !
60
4
Con x + y < 4; 0 < y < 4; 0 < x < 4
6.3. PROBLEMAS PROPUESTOS 91

a) Encontrar marginales
b) E(X); E(Y ); V (X) ; V (Y )
c) E(X/Y = 2) ; V (X/Y = 2)
d ) Correlación entre X e Y .
e) P (1 < x < 3/y > 2)

6. Suponga que el 47 % de los lectores de un país apoyó al candidato Álvarez, el 21 % al candidato Bastías,
el 18 % se abstuvo y los restantes lectores anularon el voto. Si se seleccionan al azar 100 electores, ¿cuál
es la probabilidad de que 50 de ellos haya apoyado a Álvarez, 18 a Bastías y 20 hayan anulado el voto?.

7. Demuestre que
X X
Cov(X, Y ) = − (x, y) = E(X · Y ) − E(X) · E(Y )
(X − E(X)) · (Y − E(Y )) · f→
X
x∈Rec(X) y∈Rec(Y )

8. Demuestre que

Cov(aX + bY, cX + dY ) = ac · V (X) + bd · V (Y ) + (ad + bc)Cov(X, Y )

− independientes y Z = X + Y demostrar que


9. Si X, Y ∼ f→
X

ϕZ (t) = ϕX (t) · ϕY (t)

10. Si X1 , X2 , ..., Xn independientes, demuestre que X1 y X2 + X3 + ... + Xn son independientes


Capítulo 7

Vectores aleatorios Continuos.

En esta sección los conceptos de vectores aleatorios discretos, se formalizan funcionalmente, de la misma manera
que se hizo para el caso univariado, de variable aleatoria discreta a contínua. Las variables que representan las
dos características de la población a medir han de ser variables intervalares y se formalizarán como un vector
(X, Y ). Se define la función de densidad conjunta, marginales, condicionales con las medidas de centralidad y
dispersión similarmenete que el caso discreto.
Recordemos algunas definiciones y propiedades importantes.
Función de densidad conjunta.


− , que satisface las
Al vector X = (X, Y ) se le asocia una función llamada función de densidad conjunta, f→
X
propiedades :

− (x, y) ≥ 0 ; ∀(x, y) ∈ R×R


f→
X
R R
R R fX (x, y) · dx · dy = 1

Función de distribución conjunta.




− , se llama función de distribución
Sea X = (X, Y ) un vector aleatorio con función de densidad conjunta, f→
X
− , a
conjunta, F→
X

Z a Z b
− (a, b) =
F→
X
− (x, y) · dy · dx
f→
X
−∞ −∞

Función de Probabilidad conjunta.




− , se llama función de probabilidad
Sea X = (X, Y ) un vector aleatorio con función de densidad conjunta, f→
X
conjunta, a

− (a, b)
P (X ≤ a, Y ≤ b) = F→
X

Función de densidad marginales.




Sea X = (X, Y ) un vector aleatorio con función de densidad conjunta, f→

X

1. Se llama función de densidad marginal deY a la función


Z ∞
fY (y) = − (x, y) · dx
f→X
−∞

93
94 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.

2. Se llama función de densidad marginal de X a la función


Z ∞
fX (x) = f→− (x, y) · dy
X
−∞

Función de cuantía condicionales.




− y funciones de densidad marginales
Sea X = (X, Y ) un vector aleatorio con función de densidad conjunta, f→
X
fX , fY

1. Se llama función de densidad condicional de Y , dado X = x0 , a la función


− (x0 , y)
f→
X
fY /X=xo =
fX (x0 )

2. Se llama función de densidad condicional de X, dado Y = y0 , a la función


− (x, y0 )
f→
X
fX/Y =yo =
fY (y0 )

Medidas de Centralidad y Dispersión.




− y funciones de densidad marginales
Sea X = (X, Y ) un vector aleatorio con función de densidad conjunta, f→
X
fX , fY

− →

1. Se llama Esperanza del vector X = (X, Y ) a E( X ) = (E(X), E(Y ))


2. Se llama Esperanza de una transformacion del vector X a
Z ∞Z ∞
E(g(x, y)) = − (x, y) · dx · dy
g(x, y) · f→
X
−∞ −∞

3. Se llama Esperanza Condicional de X dado Y = y0 a


Z ∞
E(X/Y = y0 ) = x · fX/Y =y0 · dx
−∞

4. Se llama Esperanza Condicional de Y dado X = x0 a


Z ∞
E(Y /X = x0 ) = y · fY /X=x0 · dy
−∞

5. Se llama Varianza Condicional de Y dado X = x0 a

V (Y /X = x0 ) = E(Y 2 /X = x0 ) − E 2 (Y /X = x0 )

6. Se llama Varianza Condicional de X dado Y = y0 a

V (X/Y = y0 ) = E(X 2 /Y = y0 ) − E 2 (X/Y = y0 )




7. Se llama Covarianza de X = (X, Y ) a

Cov(X, Y ) = E(X · Y ) − E(X) · E(Y )

8. Se llama matriz de Varianzas - Covarianzas a


" #
X V (X) Cov(X, Y )
=
Cov(X, Y ) V (Y )
7.1. PROBLEMAS REFERENTES A PROPIEDADES 95

Los problemas se separan en forma natural

1. Problemas referentes a propiedades


Este conjunto de problemas hace referencias a demostraciones de ciertas propiedades que cumplen ya sea
las funciones de densidad conjunta o sus medidas de centralidad y dispersión.

2. Problemas de aplicaciones.
Este conjunto de problemas hace referencias a aplicación de ciertas propiedades o definición misma de
funciones de densidad conjunta particulares y cálculos de sus medidas de centralidad y dispersión y
función generadora de momentos. El estudiante usará para su resolución, lo aprendido en los problemas
resueltos

7.1. Problemas referentes a propiedades


1. Sean X1 , X2 , ..., Xn distribuidos N (u, σ 2 ) independientes. Demostrar que
n
1 X
X= · Xi
n
k=1

σ2
se distribuye N (u, n )
Solución.
(por independencia ver ejercicio 4 , de esta sección).
n
Y n
Y
t
Pn tXk tXk
ϕX (t) = E(e n · k=1 Xk
) = E( e n )= E(e n )
k=1 k=1

1 2 2
ϕX (t) = eut+ 2 σ t
si X ∼ N (u, σ 2 ). Luego
n
Y tXk
 ut σ2 t2 n σ2 t2
ϕX (t) = E(e n ) = e n + 2n2 = eut+ n
k=1
2
. Luego al tener la misma función generadora se obtiene X ∼ N (u, σn )

− 1 1 −1 t
2. Sea X = (X1 , X2 ) vector aleatorio binormal, f→
− (x, y) = √
X
·e− 2 ·(x−µ,y−ν)·Σ (x−µ,y−ν) ·IR×R (x, y).
2π·det(Σ)

Demuestre que si Cov(X, Y ) = 0 entonces X e Y son independientes.


Solución. " # " #
1
V (X) 0 −1 V (X) 0
Como Cov(X, Y ) = 0 entonces Σ = y luego Σ = 1
0 V (Y ) 0 V (Y )
det(Σ) = V (X) · V (Y ) luego
(x − µ)2 (y − ν)2
(x − µ, y − ν) · Σ−1 (x − µ, y − ν)t = +
V (X) V (Y )

1 − 21 ·( (x−µ)
2
+ (y−ν)
2
)
− (x, y) = √
f→
X
p p · e V (X) V (Y ) · IR×R (x, y)
2π · V (X) · V (Y )
Luego
1 1 (x−µ)2 1 (y−ν)
2
− (x, y) = √
f→
X
p p · e− 2 ·( V (X) ) · e− 2 ( V (Y ) ) · IR×R (x, y)
2π · V (X) · V (Y )
Luego
− (x, y) = fX (x) · fY (y)
f→
X
96 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.

3. Si X e Y v.a.c demostrar que E(E(X/Y )) = E(X)


Solución.
Z ∞ Z ∞ Z ∞ Z ∞
f (x, y)
E(E(X/Y )) = x· · f (y)dxdy = x · f (x, y) · dy · dx
−∞ −∞ f (y) −∞ −∞

R∞ R∞ R∞
E(E(X/Y )) = −∞
x −∞
f (x, y) · dydx= −∞
x · f (x)dx = E(X)

4. Sabiendo que si X e Y son v.a.c independientes demostrar que g(X), h(Y ) son independientes, siendo g y
h integrables.
Solución. Z ∞ Z ∞
E(g(X) · h(Y )) = − (x, y) · dy · dx
g(x) · h(y) · f→
X
−∞ −∞

Como X e Y son v.a.c independientes

− (x, y) = fX (x) · fY (y)


f→
X

Z ∞ Z ∞
E(g(X) · h(Y )) = g(x) · h(y) · fX (x) · fY (y) · dy · dx
−∞ −∞

Z ∞ Z ∞
E(g(X) · h(Y )) = g(x) · fX (x) · dx · h(y) · fY (y) · dy
−∞ −∞

E(g(X) · h(Y )) = E(g(X)) · E(h(Y ))

5. Sean X e Y v.a.c. Demostrar Cov(X, Y − E(Y /X)) = 0


Solución.
Cov(X, Y − E(Y /X)) = E(X · (Y − E(Y /X)) − E(X)E(Y − E(Y /X))
como
E(E(Y /X)) = E(Y )

Cov(X, Y − E(Y /X)) = E(X · (Y − E(Y /X)) = E(X · Y ) − E(X · E(Y /X))
Ahora :
Z ∞ Z ∞ Z ∞
E(X · E(Y /X)) = X · E(Y /X) · fX (x) · dx = X · Y · fX/Y · fX (x) · dy · dx
−∞ −∞ −∞

Z ∞ Z ∞
E(X · E(Y /X)) = X · Y · f (x, y) · dy · dx = E(X · Y )
−∞ −∞

luego
Cov(X, Y − E(Y /X)) = E(X · Y ) − E(X · E(Y /X)) = E(X · Y ) − E(X · Y ) = 0

6. Sean X e Y v.a.c. Demostrar que E(Y · E(Y /X)) = E(E 2 (Y /X))


Solución
R∞ R∞
E(Y · E(Y /X)) = Y · E(Y /X) · f→
−∞ −∞
− (x, y)dy · dx
X
R∞ R∞
E(Y · E(Y /X)) = −∞ E(Y /X) −∞ Y · fY /X · fX (x) · dy · dx
R∞
E(Y · E(Y /X)) = −∞ E 2 (Y /X) · fX (x) · dx = E(E 2 (Y /X))
7.1. PROBLEMAS REFERENTES A PROPIEDADES 97

7. Sean X e Y v.a.c. Demostrar que E((Y − E(Y /X))2 ) = E(V (Y /X))


Solución.
E((Y − E(Y /X))2 ) = E(Y 2 − 2 · Y · E(Y /X) + E 2 (Y /X)) = E(Y 2 ) − 2 · E(Y · E(Y /X)) + E(E 2 (Y /X))
Usando que
E(Y · E(Y /X)) = E(E 2 (Y /X))

E((Y − E(Y /X))2 ) = E(Y 2 ) − 2 · E(E 2 (Y /X)) + E(E 2 (Y /X))


Luego:
E((Y − E(Y /X))2 ) = E(E(Y 2 /X)) − E(E 2 (Y /X)) = E(V (Y /X))

8. Demuestre que :
V (Y ) = E(V (Y /X)) + V (E(Y /X))

Solución.
E(V (Y /X)) = E(E(Y 2 /X) − E 2 (Y /X)) = E(E(Y 2 /X)) − E(E 2 (Y /X))

E(V (Y /X)) = E(Y 2 ) − E(E 2 (Y /X))

V (E(Y /X)) = E(E 2 (Y /X)) − E 2 (E(Y /X))

V (E(Y /X)) = E(E 2 (Y /X)) − E 2 (Y )

Luego:
E(V (Y /X)) + V (E(Y /X)) = E(Y 2 ) − E 2 (Y ) = V (Y )

9. Usando V (Y ) = E(V (Y /X)) + V (E(Y /X)), demuestre que si V (Y ) = E(V (Y /X)) entonces E(Y /X) es
constante.
Solución.
Como V (Y ) = E(V (Y /X)) + V (E(Y /X)) y V (Y ) = E(V (Y /X)), entonces V (E(Y /X)) = 0 lo cual
implica que E(Y /X) = c

10. Sean X e Y v.a.c. Demostrar que


E(X · E(Y /X)) = E(X · Y )

Solución.
Z ∞ Z ∞ Z ∞
E(X · E(Y /X)) = X · E(Y /X) · fX (x) · dx = X · Y · fY /X · fX (x) · dx · dy
−∞ −∞ −∞

Z ∞ Z ∞
E(X · E(Y /X)) = X · Y · fY /X · fX (x) · dx · dy
−∞ −∞

Z ∞ Z ∞
E(X · E(Y /X)) = − (x, y) · dx · dy = E(X · Y )
X · Y · f→
X
−∞ −∞
98 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.

11. Sean X e Y v.a.c. Demostrar que Cov(E(Y /X), X) = Cov(X, Y )


Solución
Cov(E(Y /X), X) = E(X · E(Y /X)) − E(Y )E(X)

Cov(E(Y /X), X) = E(X · Y ) − E(Y ) · E(X) = Cov(X, Y )

12. Sean X e Y v.a.c. Demostrar que Cov(E(Y /X), Y ) = V (E(Y /X))


Solución.
Cov(E(Y /X), Y ) = E(Y · E(Y /X)) − E 2 (Y ) = E(E 2 (Y /X)) − E 2 (Y )

Cov(E(Y /X), Y ) = E(E 2 (Y /X)) − E 2 (Y ) = E(E 2 (Y /X)) − (E(E(Y /X))2

Cov(E(Y /X), Y ) = E(E 2 (Y /X)) − (E(E(Y /X))2 = E(E 2 (Y /X)) − E 2 (E(Y /X))

Cov(E(Y /X), Y ) = V (E(Y /X))

13. Calcular
Cov(X, Y )
Cov(X − E(Y /X), Y − · X)
V (X)
Solución
Usando la multicolinealidad de la covarianza (esta es un producto punto)
Cov(X, Y ) Cov(X, Y )
Cov(X−E(Y /X), Y − ·X) = Cov(X, Y )−Cov(X, Y )−Cov(E(Y /X), Y )+ Cov(E(Y /X), X)
V (X) V (X)

Cov(X, Y ) Cov(X, Y )
Cov(X − E(Y /X), Y − · X) = −Cov(E(Y /X), Y ) + Cov(E(Y /X), X)
V (X) V (X)
(1)

Cov(E(Y /X), X) = E(X · E(Y /X)) − E(Y )E(X) = E(X · Y ) − E(Y ) · E(X) = Cov(X, Y )

Cov(E(Y /X), Y ) = E(Y · E(Y /X)) − E 2 (Y ) = E(E 2 (Y /X)) − E 2 (Y )

Cov(E(Y /X), Y ) = E(E 2 (Y /X)) − E 2 (Y ) = E(E 2 (Y /X)) − (E(E(Y /X))2

Cov(E(Y /X), Y ) = E(E 2 (Y /X)) − (E(E(Y /X))2 = E(E 2 (Y /X)) − E 2 (E(Y /X))
(2)
Cov(E(Y /X), Y ) = V (E(Y /X))
Luego
Cov(X, Y ) Cov(X, Y )
Cov(X − E(Y /X), Y − · X) = −Cov(E(Y /X), Y ) + Cov(E(Y /X), X)
V (X) V (X)
Usando (1) y (2)
Cov(X, Y ) Cov 2 (X, Y )
Cov(X − E(Y /X), Y − · X) = −V (E(Y /X)) +
V (X) V (X)
7.1. PROBLEMAS REFERENTES A PROPIEDADES 99

14. Demostrar que


Cov(X, Y )
Cov(Y − E(Y /X), Y − · X) = E((Y − E(Y /X))2 )
V (X)

Solución.
Cov(X, Y ) Cov 2 (X, Y ) Cov(X, Y )
Cov(Y −E(Y /X), Y − ·X) = V (Y )− −Cov(E(Y /X), Y )+ ·Cov(E(Y /X), X)
V (X) V (X) V (X)

Cov(X, Y ) Cov 2 (X, Y ) Cov 2 (X, Y )


Cov(Y − E(Y /X), Y − · X) = V (Y ) − − V (E(Y /X)) +
V (X) V (X) V (X)
Como
V (Y ) = E(V (Y /X)) + V (E(Y /X))

Cov(X, Y )
Cov(Y − E(Y /X), Y − · X) = V (Y ) − V (E(Y /X)) = E(V (Y /X))
V (X)
como
E((Y − E(Y /X))2 ) = E(V (Y /X))

Cov(X, Y )
Cov(Y − E(Y /X), Y − · X) = E((Y − E(Y /X))2 )
V (X)

15. Demostrar que si X e Y son v.a.c entonces la función E((Y − θ)2 /X) se minimiza si θ = E(Y /X)
Solución. Z ∞
E((Y − θ)2 /X) = (y − θ)2 · fY /X · dy
−∞

Z ∞
∂ − (x, y)
f→
E((Y − θ)2 /X) = −2 · (y − θ) · X
· dy = 0
∂θ −∞ fX (x)

Z ∞ Z ∞ − (x, y)
f→
X
−2 · y · fY /X · dy + 2θ · · dy = 0
−∞ −∞ fX (x)
Pero Z ∞
−2 · y · fY /X · dy = −2 · E(Y /X)
−∞

Z ∞ − (x, y)
f→
X
2θ · · dy = 2θ
−∞ fX (x)
Luego
Z ∞ Z ∞ − (x, y)
f→
X
−2 · y · fY /X · dy + 2θ · · dy = 0
−∞ −∞ fX (x)
implica θ = E(Y /X)
Ahora veamos su segunda derivada.

∂2
E((Y − θ)2 /X) = 2 > 0
∂θ2
Luego E((Y − θ)2 /X) se minimiza si θ = E(Y /X)
100 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.



16. Sea X = (X, Y ) ∼ f→− un vector aleatorio y W = g(Y ) , con g una función invertible con derivada de g −1
X
no nula en B ′ ⊆ R. Entonces Z
E(W/X) = g(y) · fY /X · dy
B
 −1 ′

B= y=g (w)/w ∈ B
Solución.
1 0
−1 ∂(X,Y ) ∂g−1
Y =g (W ) ; X = U ; J = ∂(U,W ) = ∂g−1 = ∂w 6= 0 ( con derivada no nula en B ′ ⊆ R)
0 ∂w

−1
∂g
− (u, g −1 (w)) ·
− (u, w) = f→
f→
U X ∂w · IA×B ′ (u, w)
∂g−1 1 ∂g
∂w = ∂g ; dw = ∂y · dy
∂y

Z Z −1
∂g
fU (u) = − (u, w) · dw =
f→ − (u, g
f→ −1
(w)) · · IA (u) · dw
B′
U
B′
X ∂w
Z −1
∂g ∂g
fU (u) = − (x, y) ·
f→
X ∂w · ∂y IA (u) · dy = fX (x)
B

Z Z
− (u, g −1 (w)) ∂g −1
f→
E(W/X) = w · fW/U · dw = w· X
· · IA (u) · dw
B′ B′ fU (u) · IA (u) ∂w

Z Z
− (x, y) ∂g −1 ∂g
f→
E(W/X) = g(y) · X
· · · dy = g(y) · fY /X · dy
B fU (u) ∂w ∂y B

17. Sea {Xn } independientes con función densidad fX . Determinar la función densidad de M = máx {Xi }.
Solución.
FM (m) = P (X1 ≤ m, X2 ≤ m, ..., Xn ≤ m) = (FX (m))n
Derivando
fM (m) = n · (FX (m))n−1 · fX (m)

7.2. Problemas de aplicaciones.




18. Sea X = (X, Y ) un vector aleatorio contínuo cuya función densidad conjunta es dada por f→
− (x, y) =
X
− 12 ·(x+y)
k·e · I[0,∞[x[0,∞[ (x, y)

− sea una función densidad conjunta.


a) Encontrar el valor de k para que f→
X
b) Determinar P (X > Y )
c) Verifique que f→
− (x, y) = fX (x) · fY (y)
X

Solución.

a) Z Z Z Z
∞ ∞ ∞ ∞
1 x y
k e− 2 ·(x+y) dx · dy = 1 = k · e− 2 · dx · e− 2 dy = 4k
0 0 0 0
1
por tanto k = 4
7.2. PROBLEMAS DE APLICACIONES. 101

b)
Z ∞ Z x Z ∞
1· − x − y 1 x x
P (X > Y ) = e 2 · e 2 dy · dx = e− 2 (2 − 2 · e− 2 ) · dx
0 0 4 4 0

Z ∞ Z ∞
1 x 1 1  −x ∞ 1
P (X > Y ) = · e− 2 dx − · e−x · dx = 1 − · −e 0
=
2 0 2 0 2 2
c)
1 −x
fX (x) = · e 2 · I[0,∞[ (x)
2
y
1 −y
fY (y) = · e 2 · I[0,∞[ (y)
2
y es claro que f→
− (x, y) = fX (x) · fY (y)
X

19. Ciertas vigas tienen secciones rectangulares cuyas dimensiones, largo y ancho se pueden representar me-
diante una distribución Normal Bivariada con vector de medias y matriz de covarianzas , donde:
" # " #
10 1/2 0
µ= ,Σ=
15 0 1
Los límites de tolerancia para el largo de la viga son ]9, 8; 10, 3[ y para el ancho ]14, 7; 15, 6[. Una viga se
considera defectuosa si el largo o el ancho están fuera de los límites de tolerancia. Si toma una muestra
de 10 vigas, ¿cuál es la probabilidad de que 8 de estas no sean defectuosas?.
Solución.
El largo y ancho son independientes ( X e Y distribuidas N (u, σ 2 ) entonces Xe Y son independientes ssi
Cov(X, Y ) = 0)
L ∼ N (10, 21 ) ; A ∼ N (15, 1)
P (9, 8 ≤ L ≤ 10, 3) = p = 0, 14 Se calcula con la T.I
P (14, 7 ≤ A ≤ 15, 6) = q = 0, 346 Se calcula con la T.I
Si Z: número de vigas no defectuosas entonces Z ∼ Bin(10, pq)
!
10
Se calcula P (Z = 8) = (pq)8 (1 − pq)2
8


20. Sea X = (X1 , X2 , X3 ) vector
 aleatorio normal con vector de medias (1, 2, 2) y matriz de varianza y
1 0 0
 
covarianzas Σ =  0 9 0 .
0 0 4
Si se definen Y1 = 3X1 + 2X2 − X3 e Y2 = 2X1 − X2 .
Determinar Corr(Y1 , Y2 ) .
Solución.
Cov(Y1 , Y2 )
Corr(Y1 , Y2 ) =
S Y1 · S Y2

Cov(Y1 , Y2 ) = E(Y1 Y2 ) − E(Y1 )E(Y2 )

Cov(Y1 , Y2 ) = 6E(X12 ) − 2E(X22 ) − 6E 2 (X1 ) + 2E 2 (X2 ) = 6 − 18 = −12


102 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.

V (Y1 ) = 9V (X1 ) + 4V (X2 ) + V (X3 ) = 9 + 36 + 4 = 49

V (Y2 ) = 4V (X1 ) + V (X2 ) = 4 + 9 = 13

Cov(Y1 ,Y2 )
Corr(Y1 , Y2 ) = = √ −12

SY1 ·SY2 61· 13
p
21. Sean Y1 , Y2 ∼ N (0, 1) independientes. Determinar la función densidad de U = Y12 + Y22
Solución.
−y
e 2
Y = X 2 tiene función distribución f (y) = √
2πy
· I(0,∞) (y)
−y
e
Z = U + V teniendo U y V la distribución f (y) = √ 2
2πy
· I(0,∞) (y) e independiente.
Se genera el vector (Z, W ) por T (U, V ) = (U + V, U ) = (Z, W )
0 < Z < ∞ ; 0 < W < Z ; Jacobiano:=1.

1 −z
f (z, w) = p · e 2 · I(0,∞)x[0,z] (z, w)
2π w(z − w)

Integrando con respecto a w.


z
f (z) = 12 e− 2 · I]0,∞[ (z) el cero se incluye
√ z
U = Z con Z distribuido f (z) = 12 e− 2 · I]0,∞[ (z)
Usando transformación de variable aleatoria

1 − u
f (u) = √ · e 2 · I]o,∞[ (u)
4 u

1
22. Si f (Y /X) = 1−x · I[x,1] (y) y fX (x) = I[0,1] (x) encontrar fY
Solución.
1
f (x, y) = f (x/y) · fX (x) = · I[0,1]x[x,1]
1−x
y
1
f (x, y) = f (x/y) · fX (x) = · I[0,y]x[0,1]
1−x

Z y
1
fY (y) = · I[0,1] (y) · dx = −ln(1 − y) · I]0,1[ (y)
0 1−x

23. Si X, Y ∼ exp(λ) independientes.

a) Encontrar f→− (x, y)


X

b) Calcular P (Y > X)
c) Si U = X − Y ; V = X + Y probar que Cov(U, V ) = 0

Solución.

− (x, y) = λ2 · e−λ(x+y) · I[0,∞[2 (x, y)


a) Por ser X, Y independientes f→
X
7.2. PROBLEMAS DE APLICACIONES. 103

b) La región de integración es

0 1 2 3 4


La región es x ∈ [0, ∞[ ; y ∈ [ x, ∞[
√ R ∞ R ∞ 2 −λ(x+y) R∞  ∞
P (Y > X) = 0 √x λ · e · dy · dx = 0 e−λx · λ · −e−λy √x dy
√ R∞ √ R∞ √ R∞ √ 1 2 λ
P (Y > X) = 0 λ · e−λx · e−λ· x · dx = λ · 0 e−λ(x+ x) dx = λ · 0 e−λ( x+ 2 ) · e 4 · dx
√ λ

P (Y > X) = √22λ − e− 4 (1 − φ( 2λ ))
1 1
c) Cov(U, V ) = E((X − Y )(X + Y )) − E(X + Y )E(X − Y ) = V (X) − V (Y ) = λ2 − λ2 =0

24. Un banco ha destinado una ventanilla para operaciones desde el automóvil y otra para personas a pie. En
un día seleccionado al azar se definen :
X = proporción del tiempo que la ventanilla para automovilistas da servicio
Y = proporción del tiempo que la ventanilla para clientes a pie da servicio .

Si suponemos que la función densidad conjunta es f (x, y) = 56 · y 2 + x I[0,1]×[0,1] (x, y)

a) ¿ Cuál es el porcentaje que la ventanilla de atención a clientes peatones está ocupada a lo sumo 50 %
del tiempo, dado que la ventanilla de clientes en auto ocupó un 80 % del tiempo?
b) Determinar la probabilidad que ninguna de las ventanillas esté más del 25 % del tiempo ocupado.
c) Calcule P (X > Y )

Solución.
R 0,5 6
f (Y <0,5;X=0,8) ·(y 2 +0,8)dy
a) f (y < 0, 5/X = 0, 8) = fX (0,8) = R 1 65
0
(y 2 +0,8)dy
0 5
R 0,25 R 0,25 6 2
b) P (X < 0, 25; Y < 0, 25) = 0 0 5 (y + x)dydx=0,0109
R1Rx 6 2
c) P (X > Y ) = 0 0 5 (y + x)dydx = 0, 5


25. Sea X = (X, Y ) un vector aleatorio continuo tal que:

ln(2y) − ln( 21 + y)
fY (y) = · I[ 1 ,1] (y)
ln(2) − 23 ln( 32 ) 2

y − 12
E(X/Y ) = −y
ln(2y) − ln( 21 + y)
1 
;x∈ 2, y

Determinar E(X).
Solución.
104 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.

Z ∞
E(X) = E(E(X/Y )) = E(X/Y ) · f (y) · dy
−∞

3
haciendo k = ln(2) − 2 · ln( 23 )
Z 1 Z 1
1 1 1 1
E(X) = · (y − ) · dy − · (y · ln(2y) − y · ln( + y)) · dy
k 1
2
2 k 1
2
2

1 3 1 3 3
E(X) = · ( − · ln(2) + · ln( ))
k 8 2 8 2
26. Sean {Xi } variables aleatorias independientes con función densidad
x x
fX (x, θ) = · e− θ · I[0,∞[ (x); θ > 0
θ2
a) Determinar la función generadora de momentos de una v.a X con función densidad fX
b) Determinar la función generadora de momentos de una v.a X con función densidad ( Chi cuadrado
con 1 g.l)
x x
g(x, θ) = √ · e− 2 · I[0,∞[ (x)
2πx
c) Determinar la función generadora de momentos de suma de 4n chi cuadrados independientes.
P3n
2 Xi
d ) Demuestre que, si Xi ∼ fX , i = 1, 2, ..., 3n entonces Q = i=1
θ se distribuye χ2(4n)
e) Determinar un intervalo de confianza para θ con γ % de confianza

Solución.
a) F.G.M de X ∼ fX
1
R∞ 1 1
ϕX (t) = E(ext ) = θ2 · 0
x · e−x( θ −t) dx = (1−θt)2 ; (1 − θt) > 0
b) F.G.M de una χ21
R∞√ 1
ϕX (t) = E(ext ) = √1 · x · e−x( 2 −t) dx = 1
3
2π 0 (1−2t) 2

c) F.G.M de 4n χ21
P4n
Xi t
Q4n 1 1
ϕY (t) = E(e i=1 )= i=1 3 = (1−2t)6n
(1−2t) 2

d ) F.G.M de Q.
2t
P3n Q3n 2t Q3n 1 1
ϕQ (t) = E(eQt ) = E(e θ · i=1 Xi
)= i=1 E(e θ ·Xi ) = i=1 (1−2t)2 = (1−2t)6n
Luego Q ∼ χ24n
P3n
2 Xi 6n·X3n
e) P (Q > c) = γ ; Q = i=1
θ > χ24n;(1−γ) luego 0 < θ < χ24n,(1−γ)

u
27. Sea X ∼ N (0, 1) e U ∼ fU (u) = √1 · e− 2 · I]0,∞[ (u) independientes.
2πu

a) Encontrar la función densidad de Y = U


b) Encontrar la función densidad de X = (X, Y )
X
c) Encontrar la función densidad de T = Y

Solución.
a) FY (y) = P (Y ≤ y) = P (U ≤ y 2 ) = FU (y 2 )
y2
fY (y) = √2 · e− 2 · I]0,∞[ (y)

7.2. PROBLEMAS DE APLICACIONES. 105

2
1 1
+y 2 )
b) f→
− (x, y) =
X π · e− 2 ·(x · I]0,∞[ (y) · IR (x)
X
c) T = Y ;S=X
S
X =S ;Y = T , J = − TS2
Se define la transformación L : R2 → R2 , L(x, y) = (t, s) = ( xy , x) se observa que todo el eje Y ,
vectores de la forma (0, y); y 6= 0 va a parar al valor (0, 0), y los vectores de la forma (x, 0) se van al
infinito, pero el valor y = 0 no está en el dominio.


El dominio del vector aleatorio X = (X, Y ) es R×]0, ∞[


El dominio del vector aleatorio T = (t, s) es ] − ∞, 0[×] − ∞, 0[∪]0, ∞[×]0, ∞[
s2
·(1+ t12 ) |s|
Luego f→
− (t, s) =
T
1
π · e− 2 · t2 · (I]−∞,0[×]0,∞[ (t, s) + I]0,∞[×]0,∞[ (t, s))
Integrando respecto de s, se obtiene:
1 1
fT (t) = − π·(1+t2 ) · I]−∞,0[ (t) + π(1+t2 ) · I]0,∞[ (t)

28. Sean X, Y ∼ exp(λ) independientes. Si U = X − Y ; V = X + Y

a) Determinar fU (u, v)
b) Demostrar que U y V , son dependientes
c) Probar que Cov(U, V ) = 0

Solución.
− (x, y) = λ2 · e−λ(x+y) · I[0,∞[2 (x, y)
a) Por ser X, Y independientes f→
X
1 1
∂(X,Y ) 2
X = 2 ; Y = 2 ; J = ∂(U,V ) = 1 1 = 21
U+V V −U 2
−2 2
La transformación T : R2 → R2 es lineal y definida por: T (x, y) = (x − y, x + y) = (u, v)
T envía el primer cuadrante a la región entre las rectas y = x ; y = −x



Luego la región que define al vector U = (u, v) es:

I]−∞,0]×[−u,∞[ (u, v) + I[0,∞[×[u,∞[ (u, v) (∗)

o también se puede definir por:

I[−v,v]×[0,∞[ (u, v) (∗∗)




Luego la función densidad conjunta de U es:
1
− (u, v) = λ2 · e−λv ·
f→ · (I]−∞,0]×[−u,∞[ (u, v) + I[0,∞[×[u,∞[ (u, v))
U 2
(por (*))
1
− (u, v) = λ2 · e−λv ·
f→ · (I[−v,v]×[0,∞[ (u, v))
U 2
(por (**))
106 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
R∞ R ∞ 2 −λv
b) fU (u) = 2
−u λ · e
−λv
· I]−∞,0] (u) · dv
2 + u λ ·e · I[0,∞[ (u) · dv
2
  ∞   ∞
fU (u) = λ2 −e−λv −u · I]−∞,0] (u) + λ2 · −e−λv u · I[0,∞[ (u)
fU (u) = λ2 · eλu · I]−∞,0] (u) + λ2 · e−λu · I[0,∞[ (u))
Rv
fV (v) = −v λ2 · e−λv · I[0,∞[ (v) · du 2
2 = λ ·e
−λv
· v · I[0,∞[ (v)
3 3
λ
fU (u) · fV (v) = 2 · e −λ(v−u)
· v · I]−∞,0]×[0,∞[ (u, v) + λ2 · e−λ(u+v) · v · I[0,∞[×[0,∞[ (u, v)

29. Sea f (x, y) = K · (x + y) · I[0,1]×[0,2x] (x, y)

a) Determinar el valor de k, para que sea función densidad.


b) Calcular P (X > 2Y )

Solución.
La región de integración

y=2x

R 1 R 2x R1
a) 0 0
K(x + y)dydx = 1 = K 0
(4x2 )dx = K ·4
3
3
Por lo tanto K = 4

b) La figura

R1R x
3 3
R1h ix
y2 2 3
R15
P (X > 2Y ) = 0 0
2
4 · (x + y)dydx = 4 · 0 xy + 2 0 = 4 · 0 8 · x2 dx
5
P (X > 2Y ) = 32

30. Sea f (x, y) = K · (x + y) · IR (x, y) ; siendo R : y = x; y = −x + 1; y = 5 con x > 0 e y > 0.

a) Determinar K, fX , fY .
b) Calcular E(X/Y = 1)
7.3. PROBLEMAS PROPUESTOS 107

c) Calcular P (X > Y )

Solución.
Gráfico :
y=x
y

y=5

y =1−x

R 12 R 5 R5R5 1913
a) 1 = 0 −x+1 K · (x + y)dydx + 12 x K · (x + y)dydx = k( 16 )
16
k = 1913
R5 16 2
fX (x) = −x+1 1913 · (x + y)dy = k · ( 3·x
2 + 3x + 13) si 0 ≤ x ≤ 2
1
R 5 16 2
fX (x) = x 1913 · (x + y)dy = k · ( −3·x
2 + 5x + 25 1
2 ) si 2 < x ≤ 5
Ry 16
fy (y) = −y+1 1913 · (x + y)dx = k · (2 · y 2 − 12 ) si 21 ≤ y ≤ 1
R y 16
fy (y) = 0 1913 · (x + y)dx = k · ( 3·y22 ) si 1 < y ≤ 5
f (x,1) (x+1) 2
b) fX/Y =1 = fY (1) = 3 = 3 (x + 1) · I[0,1] (x)
2
R1
E(X/Y = 1) = 0 23 (x + 1) · xdx = 95
R5R5 91
c) P (X > Y ) = 1 x K · (x + y)dydx = 8
2

7.3. Problemas Propuestos




1. Si X = (X, Y ) ∼ f→
− = k · I[0,1]×[0,x+1] (x, y)
X

a) Determinar el valor de k.
b) Encontrar la función densidad de Z = X + Y

2. Siendo Z y T independientes y distribuidas N (0, 1), se definen las variables aleatorias U = p + a · Z + b · T


; V = q + c · Z + d · T . Calcular Corr(U, V )
108 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.

3. Las barras provenientes de un tren de laminación tienen sección rectangular y sus lados X e Y tiene
1 1
longitudes variables con distribuciones uniformes independientes fX (x) = 0,1 · I]1,1,1[ (x) ; fY (y) = 0,2 ·
I]2,2,2[ (y). Determine la probabilidad de que el área de una barra sea superior a 2.2.


4. Suponga que X = (X, Y ) es Normal Bivariada tal que:

Cov(X, Y ) = 16
E(Y /X = 3) = 9
E(X/Y = 6) = 3
V (X) = 16 ; V (Y ) = 64

a) Encontrar P (X + Y > 129)


b) Encuentre α, β ∈ R, tales que V (αX + βY ) sea mínima, sujeta a la restricción E(αX + βY ) = 0


5. Si X = (X, Y ) ∼ f→
− (x, y) = k · I[0,1]×[−x,x] (x, y)
X

a) Encontrar el valor de k
b) ¿Son X e Y independientes?
c) Determinar la función densidad de Z = 2X + Y

− √ √
− (x, y) = 4xy · I[0,1]×[0,x1] (x, y) encontrar l función densidad de Z =
6. Si X = (X, Y ) ∼ f→
X
X+ Y


7. Si X = (X, Y ) ∼ f→
− (x, y) = k(x + y) · I[0,1]×[1,2] (x, y)
X

a) Encontrar el valor de k
1
b) Encontrar P (X ≥ 2 ·Y)
c) Encontrar E(Y /X)

8. Se define la función generadora de momentos bivariada por ϕ→ − (t, s) = E(ex·t+y·s ).


X


Si X = (X, Y ) un vector aleatorio continuo con función densidad f→ −.
X
Demostrar que :

− (t, s) = Cov(ext , eys ) + ϕX (t) · ϕY (s)


a) ϕ→
X
− (t, s) = Cov(ext , E(eys /X)) + ϕX (t) · ϕY (s)
b) ϕ→
X
− (t, s) = Cov(eys , E(ext /Y )) + ϕX (t) · ϕY (s)
c) ϕ→
X

9. a) Sea X1 , X2 i.i.d N (0, 1) encontrar la función densidad de la v.a Y = X12 + X22


b) Si X = (X, Y ) con función densidad

f (x, y) = θ(θ − 1)(x − y)θ−2 I[0,1]x[0,−x+1] (x, y)

con θ ∈ Z ; θ > 2 y par. Determinar la función densidad de Z = X + Y .

10. Sea f (x, y) = k · (x2 + y 2 ) · I[0,1]x[0,x] (x, y)

a) Encontrar el valor de k para que f sea una función densidad.


b) Calcular P (Y > X − 12 )
c) Determinar E(X/Y = 12 )
7.3. PROBLEMAS PROPUESTOS 109

11. Sea f (x, y) = k · IS (x, y) donde S es la región delimitada por las rectas S : x + y = 9; y − 2x = 6; y = 0.
Calcular P (X + Y > 3)

12. Suponga dos componentes T1 y T2 tienen distribución exponencial independientes exp(α) y exp(β) . De-
termine:

a) P (T1 > T2 )
b) P (T1 > 2 · T2 )
c) Determine la distribución de Z = min {T1 , T2 }

13. Sean X1 , X2 , ..., Xn variables aleatorias independientes con función densidad exp(λ). Demostrar que la
variable aleatoria
Xn
Y = Xi
i=1

se distribuye con función densidad Gamma(n, λ)

14. Sea {Xn } independientes con función densidad fX . Demostrar que la función densidad de K = min {Xi }
es fK (k) = n · (1 − FX (k))n−1 · fX (k)
110 CAPÍTULO 7. VECTORES ALEATORIOS CONTINUOS.
Capítulo 8

Estimación puntual.

En esta sección atendemos una pregunta que ha de hacerse el usuario cuando tiene sus datos y ya ha visto
de que tipo de distribución provienen pero desconoce sus parámetros. Por ejemplo, el problema 18 de variable
continua:
Sean n datos los cuales debemos decidir si provienen de una distribución normal o no. Para ello se realiza el
siguiente procedimiento:

(1) Se ordena la información dada x(i) : i = 1, 2, 3, ..., n
(2) Se construyen los datos yi = Φ−1 ( i−0,375
n+0,25 ); Φ
−1
: distribución normal estándar inversa.

(3) Se calcula la correlación entre los x(i) , yi
(4) Si tal correlación está en los rangos de aceptación entonces los datos se aceptan como provenientes de una
distribución normal.
Dados los datos siguientes que son 20 observaciones del voltaje de falla de una pieza de resina Epóxica ( IEEE
trans. on Dielectrics and Elec. Insul., 1996, pp 43-55)
24.46; 25.61; 26.25; 26.42; 26.66; 27.15; 27.31; 27.54; 27.74; 27.94; 27.98; 28.04; 28.28; 28.49; 28.50; 28.87; 29.11;
29.13; 29.50, 30.88.
Verificar si provienen de una distribución Normal.
Esta estrategia, llamada Ryan - Joiner, verifica que los datos provienen de una normal pero desconoce cuál es
la media y la varianza.
En este caso, debemos buscar métodos que nos permitan decidir cuáles son los parámetros:
(I) Método de los Momentos.
Sean X1 , X2 , X3 , ..., Xn ∼ fX (x, θ1 , θ2 , θ3 , ..., θp ) , los parámetros son θi
Pn
En este método se igualan los momentos muestrales ( n1 k=1 xri ; momento muestral de orden r) con los
momentos teóricos ( E(X r ) ; momento de orden r teórico). Si hay p parámetros y se tienen n datos entonces se
construyen p ecuaciones al igualar los momentos teóricos y muestrales de orden 1, 2, 3, ..., p
Es decir, para k = 1, 2, 3, ..., p
n
1 X k
E(X k ) = · x
n i=1 i

Los momentos teóricos son expresiones en términos de los parámetros, con lo cual se tienen p ecuaciones y p
incógnitas.

111
112 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

(II) Método de Máxima Verosimilitud.


Sean y1 , y2 , y3 , ..., yn , datos independientes provenientes de una distribución fY (x, θ1 , θ2 , θ3 , ..., θp ) . Los pará-
metros son θi .
Se construye la función densidad o cuantía conjunta del vector aleatorio Y = (Y1 , Y2 , Y3 , ..., Yn ), aprovechando
que son datos independientes

n
Y
− (x1 , x2 , ..., xn ; θ1 , θ2 , ..., θp ) =
f→
Y
fY (xi ; θ1 , θ2 , ..., θp )
i=1

Se construye posteriormente la función de verosimilitud, que no es otra cosa que la evaluación de la función
densidad conjunta en los datos dados.

n
Y
− (y1 , y2 , ..., yn ; θ1 , θ2 , ..., θp ) =
f→
Y
fY (yi ; θ1 , θ2 , ..., θp )
i=1

Dada la siguiente propiedad:

d(ln(f (x)) 1 df
= ·
dx f (x) dx

que dice que las raices de la derivada de la función ln ◦f son los mismos que los de la derivada de f . Esta
propiedad agiliza la búsqueda de raices de la derivada de funciones que son generalmente exponenciales. Por
ello se construye la función log-verosímil, con la finalidad de linealizar.

n
Y
− (y1 , y2 , ..., yn ; θ1 , θ2 , ..., θp )) = ln(
ln(f→
Y
fY (yi ; θ1 , θ2 , ..., θp ))
i=1

Finalmente se busca para qué valores de θi , i = 1, 2, 3..., p la función log- verosímil se maximiza. De allí el
nombre del método.
(III) Método de Intevalos de Confianza.
En este método no se busca un estimador del parámetro sino que se busca una región en la cual, con una cierta
probabilidad, el parámetro esté. Explicaré, un poco más adelante, que los otros métodos en realidad hacen algo
similar.
Ejemplificaremos el método.
Imaginemos que se tienen lo datos X1 , X2 , X3 , ..., Xn provenientes de una N (u, σo2 ), σo2 conocida.
Paso1: Construcción de una variable aleatoria que dependa del parámetro, pero su función densidad o cuantía,
no.
σo2
Sabemos que X ∼ N (u, n ) . Luego la variable buscada (Pivote) es

X −u
Z= σo ∼ N (0, 1)

n

Paso2: Construcción de un intervalo simétrico para la variable Z , con una probabilidad de (1 − α).
Como Z tiene una distribución conocida y el área bajo la curva en el intervalo buscado es (1 − α) (α se llamará
nivel de significancia)
113

P (−λ < Z < λ) = 1 − α

Usando una gráfica:

El valor de λ = z1− α2 es el máximo del intervalo ] − ∞, λ], en el cual el área bajo la curva es igual a 1 − α2 .
Por tanto, el intervalo para Z es

−z1− α2 ≤ Z ≤ z1− α2

Paso3: Construcción de un intervalo para u.


Como
−z1− α2 ≤ Z ≤ z1− α2

entonces
X −u
−z1− α2 ≤ σo ≤ z1− α2

n

despejando u de la inecuación:

σo σo
X − z1− α2 · √ ≤ u ≤ X + z1− α2 · √
n n
Es el intervalo de confianza con 1 − α de nivel de significancia.
Sin embargo el estimador a ser escogido debe satisfacer las dos propiedades siguientes:

Insesgamiento.
Sea θ̂ un estimador de θ, parámetro de la función densidad o cuantía f (x, θ). Diremos que ” θ̂ es un
estimador insesgado de θ” sí y sólo sí
E(θ̂) = θ

Eficiencia.
Sea θ̂ , δ̂ dos estimadores de θdiremos que ” θ̂ es más eficiente que δ̂” sí y sólo sí V (θ̂) < V (δ̂).
La elección del estimador es que satisfaga ambas propiedades. Es decir, del conjunto de estimadores
insesgados se escoja el de menor varianza.
Para ello se tienen las dos estrategias siguientes para decidir la eficiencia de un estimador insegado.
114 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

C orolario de Crämer - Rao.


Sea θ̂ un estimador máximo verosímil de θ insesgado, parámetro de la función densidad o cuantía f (x, θ).
Si la derivada de la función log-verosímil se puede escribir de la forma:

∂ln(f (−

x , θ)
= a(θ)(θ̂ − θ)
∂θ

donde a(θ) no puede depender de los datos, entonces θ̂ es un estimador eficiente.


T eorema de Cramer - Rao.
Sea θ̂ un estimador insesgado de θ, parámetro de la función densidad o cuantía f (x, θ). Entonces

1
V (θ̂) ≥ − 2
n· E( ∂ ln(f (x,θ)
∂θ 2 )

ˆ alcanza la cota de Cramer - Rao


Si V (θ)

1
V (θ̂) = − 2
n· E( ∂ ln(f (x,θ)
∂θ 2 )

Se dirá que es eficiente.


Ahora, analizando estas propiedades aceptamos como estimador aquellos que sean insesgados y de estos
los de varianza menor y, mejor, el que alcance la cota de Crämer Rao. Entonces, el estimador debe ser
centrado en el parámetro (por ser insesgado) y al tener varianza pequeña establece en cierta forma un
intervalo donde el estimador debe estar.

8.1. Problemas referentes a propiedades


1. Sean {Xn } v.a. independientes con función densidad U [a, b]. Encontrar un estimador máximo verosímil
para a y b.
Solución
La función densidad de la variable aleatoria Y ∼ U [a, b]

1
f (y; a, b) = · I[a,b] (y)
b−a
la función densidad conjunta de la variable aleatoria Y

1
f (−

y ; a, b) = · I[a,b]n (−

y)
(b − a)n

la función de verosimilitud

1
f (−

x ; a, b) = · I n (−

x)
(b − a)n [a,b]

La función log- verosímil.

x ; a, b)) = −n · ln(a + b) + ln(I[a,b]n (−


ln(f (−
→ →
x ))
8.1. PROBLEMAS REFERENTES A PROPIEDADES 115

Como tal función no es diferenciable, respecto de a y b, usaremos la noción primigenia: ”para qué valores
de a y b, la función de verosímilitud se maximiza”
Observamos que la función
1
f (−

x ; a, b) = · I[a,b]n (−

x)
(b − a)n
1
toma el valor 0 si alguno de los datos no está en [a, b]; y toma el valor (b−a) n , cuando todos los datos

están en [a, b]. Es claro que se obtendrá un máximo en esta última situación. Luego, como todos los datos
deben estar en ese intervalo es claro que

â = mı́n {Xi } ; b = máx {Xi }

los datos, al ser evaluados en ese intervalo, darán el valor


1
(b − a)n

2. Sea X1 , X2 , ..., Xn i.i.d f (~x, θ) y sea θ̂ un estimador máximo verosímil de θ. Sea τ una función biyectiva
con derivada no nula. Demuestre que el estimador máximo verosimil de τd (θ), de τ (θ) ,es τ (θ̂).
Solución.
∂ln(f (x,τ (θ))
= ∂ln(f (x,τ (θ))
· ∂τ ˆ anula la parte izquierda entonces se anula en
= 0 lo que significa que τ (θ)
∂θ ∂τ (θ) ∂θ
la parte derecha τd
(θ) .

3. a) Pruebe que E(E(X/Y )) = E(X) y pruebe que V (Y ) = V (E(Y /X)) + E(V (Y /X))
b) Si θ̂ es un estimador insesgado de θ, demuestre que E(θ̂/T ) es un estimador insesgado de θ y que
satisface V (E(θ̂/T )) < V (θ̂) ( Use la parte b))
Solución.
R∞ R∞ x·f (x,y) R∞ R∞
a) E(E(X/Y )) = −∞ ( −∞ f (y) dx)f (y)dy = −∞ x · ( −∞ f (x, y)dy)dx = E(X)
V (E(Y /X)) = E(E 2 (Y /X)) − E (E(Y /X)) = E(E 2 (Y /X)) − E 2 (Y )
2

E(V (Y /X)) = E(E(Y 2 /X)) − E(E 2 (Y /X)) = E(Y 2 ) − E(E 2 (Y /X))


V (E(Y /X)) + E(V (Y /X))= E(E 2 (Y /X)) − E 2 (Y ) + E(Y 2 ) − E(E 2 (Y /X)) = V (Y )
b) E(E(θ̂/T )) = E(θ̂) = θ. Por a)
Usando a) siendo Y = θb y X = T se obtiene V (θ)
b = V (E(θ̂/T )) + E(V (θ̂/T ))
y como E(V (θ̂/T )) > 0 ; V (E(θ̂/T )) < V (θ̂)

4. Sea X1 , X2 , ..., Xn i.i.d f (~x, θ) se define con ellas un estadístico T (función de tales variables aleatorias).
Se dice que T es suficiente para un parámetro θ ssi f (~x/T ) no depende de θ.
−1 P 2 Pn
Sea f (x, θ) = 1 n2 · e 2 · (xi −θ) y T = i=1 Xi . Pruebe que T es suficiente.
(2π)

Solución.
−1 2
f (T, θ) = 1
1 · e 2n2 ·(T −nθ)
(2π) 2

1
x2i −2θT +nθ 2 ) − 21 ( x2i )
P P
1 1
(2π)n · e− 2 ( (2π)n · e
f (~x/T ) = 1 2 −2θnT +(n·θ)2 )
= 1 2
√ 1 · e 2n (T √ 1 · e 2n (T )
2π·n 2π·n

que no depende de θ
116 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

5. Si θ̂ es un estimador insesgado de θ y T un estadístico suficiente (vea ejercicios 11), demuestre que E(θ̂/T )
es un estimador insesgado de θ y que satisface V (E(θ̂/T )) < V (θ̂)
Solución.
E(E(θ̂/T )) = E(θ̂) = θ por 3b)
siendo Y = θb y X = T se obtiene V (θ)
b = V (E(θ̂/T )) + E(V (θ̂/T ))

y como E(V (θ̂/T )) > 0 ; V (E(θ̂/T )) < V (θ̂)

− (−
6. Sean X1 , X2 , ..., Xn variables aleatorias con función densidad conjunta f→ →
x , θ)
X
 2 →   →
−  2

∂ lnf− (x,θ) ∂lnf→
− ( x ,θ)
Demuestre que E X
∂θ 2 = −E X
∂θ

Solución.
Se hará para un dato con el fin de no tener tantas integrales.
R∞
1 = −∞ fX (x, θ) · dx. Derivando y usando la regla de leibniz
R∞ R∞
0 = −∞ ∂fX∂θ(x,θ)
· dx = −∞ ∂lnf∂θ
X (x,θ)
· fX (x, θ) · dx
Derivando por segunda vez.
R∞ 2
0 = −∞ [ ∂ lnf∂θX2(x,θ) · fX (x, θ) + ∂lnf∂θX (x,θ)
· ∂fX∂θ
(x,θ)
] · dx
R∞ 2
0 = −∞ [ ∂ lnf∂θX2(x,θ) · fX (x, θ) + ( ∂lnf∂θ
X (x,θ) 2
) · fX (x, θ)] · dx
2
 
0 = E( ∂ lnf∂θX2(x,θ) ) + E ( ∂lnf∂θ
X (x,θ) 2
)
Luego
 ∂ 2 lnf→   →
− 2 
− (x,θ) ∂lnf→
− ( x ,θ)
E X
∂θ 2 = −E X
∂θ

7. Sean X1 , X2 , ..., Xn variables aleatorias con función densidad conjunta f→ →



− ( x , θ)
X
Si θ̂es un estimador insesgado de θ y

− (−
∂ln(f→ →
x , θ)  
X
= a(θ) · θ̂ − θ
∂θ
 ∂ 2 lnf→
− (x,θ)

demuestre que E X
∂θ 2 = −a(θ) y que

1
V (θ̂) =
a(θ)

Solución.
Derivando con respecto a θ.
− (−
∂ln(f→ →
x , θ)  
X
= a(θ) · θ̂ − θ
∂θ
Obtenemos:
∂ 2 ln(f→ →

− ( x , θ)  
X
2
= a′ (θ) · θ̂ − θ − a(θ)
∂θ
Aplicando esperanza.
!
∂ 2 lnf→
− (x, θ)
E X
= a′ (θ) · (E(θ̂) − θ) − a(θ) = −a(θ)
∂θ2
8.2. PROBLEMAS DE APLICACIONES. 117

pues E(θ̂) = θ
Elevando al cuadrado


− ( x , θ)
∂ln(f→  
X
= a(θ) · θ̂ − θ
∂θ
y tomando esperanza

− (−
∂ln(f→ →
x , θ) 2  2
E(( X
) ) = E(a2 (θ) · θ̂ − θ ) = a2 (θ) · E((θ̂ − θ)2 ) = a2 (θ) · V (θ̂)
∂θ

Como 
! !2 
∂ 2 lnf→
− (x, θ) − (−
∂lnf→ →
x , θ)
E X
= −E  X 
∂θ2 ∂θ

y !
∂ 2 lnf→
− (x, θ)
X
E = −a(θ)
∂θ2

Obtenemos:
a(θ) = a2 (θ) · V (θ̂)

1
V (θ̂) =
a(θ)

8.2. Problemas de aplicaciones.


8. Sean {Xn } independientes con función densidad :

3 x2
f (x) = k · x2 e− θ I[o,∞[ (x)
θ
;θ>0

a) Encontrar el valor de k.
b) Encontrar un estimador M.V para θ.

Solución.
R∞ 3 x2
a) 0
k· θ · x2 · e− θ · dx = 1
R∞ x2
 R∞ 2
′
3 3 θ − xθ
0 k· θ · x2 · e− θ · dx = k ·0 x
θ · ·− 2 · e · dx
R∞ x 2
h x 2
i∞ R∞ x2
0
k · θ3 · x2 · e− θ · dx = k · θ3 · −x · e− θ + k · 3θ · 0 2θ · e− θ · dx
0
R∞ 3 2 − xθ
2
3 θ
R ∞ − x2
0
k· θ ·x ·e · dx = k · θ · 2 · 0 e θ · dx (1)
q q R ∞ − u2
2 2 1 1
haciendo u = θ · x ; du = θ · dx y sabiendo que √2·π 0 e 2 · du = 2
R ∞ − x2 R ∞ − u2 q θ q √ R
θ √π ∞ − u2

θ·π
0
e θ · dx =
0
e 2 ·
2 · du = 2 · π
· 0
e 2 · du =
2
entonces (1) queda :
R∞ 3 2 − xθ
2
3 θ
R∞ x2 3

θ·π
0 k· θ ·x ·e · dx = k · θ · 2 · 0 e− θ · dx = k · 2 · 2 =1
Luego k = √4
3· π·θ
118 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

b) La función de verosimilitud es
 n Q P 2

f (−
→ · i=1 x2i · e− θ · I[0,∞[n (−

xi
n
x , θ) = θ·√4π·θ x)
La función log-verosímil es:
Q Pn
ln(f (−

x , θ) = n · ln(4) − n · ln(πθ) − n · ln(θ) + ln( x2 ) −
2 i
1
θ · i=1 x2i + ln(I[0,∞[n (−

x ))
Derivando la función log-verosímil queda:
∂ln(f (→

x ,θ) Pn Pn 
∂θ = − nθ − 2θ
n
+ θ12 · i=1 x2i = − 2θ
3·n
2 · θ −
2
3·n · i=1 x2i
x2i
Pn

luego θ̂ = k=1
3·n

9. Sean X1 , X2 , ..., Xn i.i.d exp(θ). Encontrar un estimador máximo verosímil para ekθ
Solución.
ln(u)
Si u = ekθ entonces θ = k , como Xi ∼ θ · e−θx · I[0,∞[ (x) se transforma en

ln(u) − ln(u) x
Xi ∼ · e k · I[0,∞[ (x)
k
luego la función de verosimilitud es :
 n
ln(u)
f (→
− ln(u) P
x , u) = · e− k · Xi
k

de donde

ln(u) ln(u) X
ln(f (~x, u)) = n · ln( )− Xi
k k
Derivando con respecto a u se obtiene que
Pnk
û = e Xi

10. Sea X1 , X2 , ..., Xn i.i.d Ber(θ). Se definen:


Pn Pn
T1 = n1 i=1 Xi y T2 = n+2 1
((n + 1)θ + n1 i=1 Xi )

a) ¿Son insesgados?
b) ¿Cuál es más eficiente?

Solución.
Si X ∼ Ber(θ) entonces E(X) = θ ; V (X) = θ · (1 − θ)
P
a) E(T1 ) = n1 E(Xi ) = θ ; E(T2 ) = (n+1)·θ θ
n+2 + n+2 = θ
P
b) V (T1 ) = n12 · V (Xi ) = θ(1−θ)n
1
P θ(1−θ)
V (T2 ) = n2 (n+2) 2 · V (Xi ) = n(n+2) 2 ; V (T1 ) > V (T2 )

T2 es más eficiente.

11. Sean Y1 , Y2 , Y3 ∼ exp( φ1 ) independientes. Se tienen los siguientes estimadores para φ:


φ̂1 = Y1 ; φ̂2 = Y ;
φ̂3 = min{Y1 , Y2 , Y3 }
Determinar cual de ellos es insesgado.
Solución.
8.2. PROBLEMAS DE APLICACIONES. 119

Y ∼ exp( φ1 ) entonces E(Y ) = φ


Sean {Xn } independientes con función densidad fX . Usando el problema propuesto 14 de vectores alea-
torios continuos, demostrar que la función densidad de K = min {Xi } es

fK (k) = n · (1 − FX (k))n−1 · fX (k)

E(φˆ1 ) = E(Y1 ) = φ es insesgado.


E(φˆ2 ) = E(Y ) = φ es insesgado.
Como
t 1 − φt
fφ3 (t) = 3 · (1 − e− φ )2 · ·e · I[0,∞[ (t)
φ

Entonces Z ∞
3 t 2·t 3·t
E(φ̂3 ) = · t · (e− φ − 2 · e− φ + e− φ ) · dt
φ 0

11·φ
E(φ̂3 ) = 6 no es insesgado.

12. Sean {Xn } independientes con función densidad :

4 x2
f (x) = √ · x2 · e− θ · I[0,∞[ (x), θ>0
θ· π·θ

x2i
Pn

Dado que un estimador M.V. de θ es θ̂ = k=1
3·n . ¿Es insegado?, ¿Es eficiente?
Solución.
2
Pn
E(θ̂) = 3n · i=1 E(Xi2 )
R∞ x2 R∞  x2
′
E(X 2 ) = √4 · x4 · e− θ · dx = √4 · x3 · − 2θ · e− θ · dx
0 θ· π·θ θ· π·θ 0

Realizando las integraciones por partes se obtiene finalmente


R∞ x2
E(X 2 ) = θ·√4π·θ · 0 3 · x2 · θ2 · e− θ · dx
R ∞ 2 − x2
E(X 2 ) = θ·√4π·θ · 3θ
2 · 0 x ·e
θ · dx

R ∞ x 2
Como θ·√4π·θ · 0 x2 · e− θ · dx = 1
3·θ
E(X 2 ) = 2
2
Pn 2 3·θ
Luego E(θ̂) = 3·n · k=1 E(Xi2 ) = 3·n ·n· 2 = θ es insesgado.
2

Es eficiente, alcanza la cota 3n pues
P
∂lnf (x, θ) −3n 2 · nk=1 x2i
= (θ − )
∂θ 2θ2 3n

Ver problema 8b).

13. Sean una muestra independiente X1 , X2 , ...Xn e igualmente distribuida, N (0, σ 2 ).

a) Determine un estimador máximo verosímil, llamémoslo S 2 , para la varianza σ 2 ( use el cambio θ = σ 2 )


b) Determine si S 2 es insesgado o no.
P
c) Sea T = X · ni=1 Xi demuestre que T es insesgado.
d ) Compare las varianzas de S 2 y T y decida cuál es más eficiente.
120 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

Sugerencia:
2
1
·t2
-Use que la f.g.m. de una N (µ, σ 2 ) es ϕX (t) = eµ·t+ 2 σ .
2
- Use que X ∼ N (0, σn )
Solución.
a) Función de verosimilitud:

1 1 2
f (−

x , µ) = n · n · e
− 12 · xµ
· IRn (−

x)
(2π) 2 u 2

Función log - verosímil:


n
n n 1 X 2
ln(f, x, µ) = − · ln(2π) − · ln(µ) − · x + ln(IRn (−

x ))
2 2 2µ i=1 i

Estimador de verosimilitud:
n
1 X 2
σ̂ 2 = S 2 = · x
n i=1 i

1 Pn
b) E(σ̂ 2 ) = n · i=1 E(x2i ) = σ 2 es insesgado, pues Xi ∼ N (0, σ 2 ) ; luego V (Xi ) = E(Xi2 ) = σ 2
2 2 σ2 2 2 σ2
c) E(T ) = E(n · X ) = n · E(X ) = n · n = σ 2 , pues X ∼ N (0, σn ) ; luego V (X) = E(X ) = n
4
d ) V (T ) = E(T 2 ) − E 2 (T ) = n2 E(X ) − σ 4
(iv) σ8 4 7 1 2 2
ϕX = ( n32 σ 4 + 6 2 6
n3 t σ + n4 t σ ) · e2σ t
; ϕX (0) = 3 4
n2 σ
V (T ) = 3σ 4 − σ = 2σ ; 4 4
P Pn
V (S 2 ) = n1 · ni=1 V (Xi2 ) = 1
n
4
i=1 (E(Xi ) − E 2 (Xi2 ))
(iv) 1 2 2
ϕX = (3σ 4 + 6t2 σ 6 + σ t σ ) · e 2 σ
8 4 7 t
; ϕX (t) = 3σ 4
4
1 2·σ
V (S 2 ) = n2 · n · (3σ 4 − σ 4 ) = n ; V (S 2 ) < V (T )
S 2 es más eficiente.

14. Sea {xn }una muestra aleatoria proveniente de una familia con densidad:

1 −x
f (x, θ) = · e 2+θ · I[0,∞[ (x), θ > −2
2+θ
a) Determine un estimador M.V para θ.
b) ¿Es insesgado?, ¿Es eficiente?
c) Para n=100 se obtuvo un promedio de X = 5,5. Encuentre un I.C. del 95 % para θ.

Solución.
 n −
Pn
i=1 xi
Pn
a) f (−
→ · I[0,∞[n (−

1 xi
x , θ) = 2+θ ·e 2+θ x ), θ̂ = i=1
n −2 ;

b) E(Xi ) = 2 + θ; por tanto θ̂ es insesgado y es eficiente pues


Pn
∂lnf (−

x , θ) n k=1 xi
= (−θ − 2 + )
∂θ (2 + θ)2 n

100
c) Usando el teorema del límite central I(θ) = (2+θ) 2
h i
luego IC = 5, 5 − 2 ± 1, 96 · √5,5
100
= [2,422; 4,578]
8.2. PROBLEMAS DE APLICACIONES. 121

15. En ocasiones la f.d.p. de Pareto se utiliza como un modelo, sobre todo en reclamaciones de seguros, donde
pueden haber muchas peticiones de pago pequeñas y unas pocas peticiones de pago enormes. Una de las
formas que adopta la f.d.p. de Pareto es:
1 1
fX (x, θ) = · (1 + x)−1− θ · I[o,∞[ (x)
θ

a) Si {Xi } es una m.a. i.i.d. fX , encontrar un estimador θ̂ máximo verosímil para θ.


b) ¿Es insegado?, ¿Es eficiente?
ln(1+x)
c) Si X ∼ fX . Se define Y = θ , encuentre la función densidad de Y, fY .
d ) Si {Yi } es una m.a. con función densidad fY ( obtenida en c). Pruebe inductivamente que T =
Pn tn−1 −t
i=1 Yi ∼ fT (t) = (n−1)! · e · I[0,∞[ (t)

e) Usando T = θ̂θ , θ̂ del apartado a), encontrar la expresión que da el valor de a para el intervalo [0, a]
para T . A continuación deduzca un intervalo de confianza para θ, en términos de a, con (1 − α) % de
confiabilidad.
f ) Aplique e) con los datos Y1 = 2, 730 ; Y2 = 5, 124 ; Y3 = 0, 798 ; Y4 = 36, 215 , con 90 % de
confiabilidad y asumiendo que a = 3.

Solución.
Pn
ln(1+xi )
a) θ̂ = k=1
n
R∞ 1 1 ∂ln(f (→

x ,θ)
Pn
ln(1+xi )
b) E(ln(1 + X)) = 0
ln(1 + x) · θ · (1 + x)−1− θ dx = θ; ∂θ = − θn2 · (θ − i=1
n ) luego es
eficiente.
c) FY (y) = P (Y ≤ y) = P (X ≤ eyθ −1) = FX (eyθ −1) con lo cual fY (y) = fX (eyθ −1)·θ·eyθ ·I[0,∞[ (y) =
e−y · I[0,∞[ (y)
− (y1 , y2 ) = e−(y1 +y2 ) · I[0,∞[ (y1 ) · I[0,∞[ (y2 ) ;
d ) Y1 + Y2 = Z ; W = Y1 entonces f→
Y
− (z, w) = e−z I[0,∞[ (z) · I[0,z] (w) ; fZ (z) = z · e−z · I[0,∞[ (z)
f→
Z
− (z, y3 ) = z · e−(z+y3 ) · I[0,∞[2 (z, y3 )
Y1 + Y2 + Y3 = Z + Y3 = R ; W = Y3 ; f→
Z
− (r, w) = (r − w) · e−r I[0,∞[ (r) · I[0,r] (w) ; fR (r) = e−r · I[0,∞[ (w) · r2
f→
R 2
r2
Y1 + Y2 + Y3 + Y4 = R + Y4 = S ; W = Y4 ; f→
− (r, y4 ) =
R 2 · e−(r+y4 ) · I[0,∞[2 (r, y4 )
2 3
(s−w)
− (s, w) =
f→
S
· e−s I[0,∞[ (s) · I[0,s] (w) ; fS (s) = e−s · I[0,∞[ (w) · s6
2
Pn tn−1
En general se observa que T = i=1 Yi ∼ fT (t) = (n−1)! · e−t · I[0,∞[ (t)
Pn
ln(1+x ) R ∞ tn−1
e) Si T = θθ̂ = i=1 n·θ i . entonces P (T > a) = 1 − α = a (n−1)! · e−t · dt
R a
(1 − α)(n − 1)! = [e−a · an−1 ] + o (n − 1) · tn−2 · e−t · dt
Pn k−1
quedando la expresión (1 − α)(n − 1)! = e−a (an−1 + k=2 an−k · ⊓j=1 (n − j))
Pn
ln(1+xi )
Asumiendo que a está determinado, el intervalo es 0 ≤ θ ≤ k=1
n·a

16. Sean X1 , X2 , ..., Xn variables aleatorias distribuidas i.i.d. f (x, θ) = θ · e−θxI[0,∞[ (x)

a) Encuentre un estimador por el método de los momentos para e−kθ ; k > 0


b) Demuestre que T = I[k,∞[ (xi ), con un dato, es un estimador insesgado de e−kθ .
(n−1)·X
c) Se define el estimador T = n para 1θ . ¿Es insesgado?, ¿es eficiente?.

Solución.
122 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

a) u = e−kθ ; θ = − k1 · ln(u)
k k
E(X) = − = X, û = e− x
ln(u)
1
O se usa el problema 2, pues h(x) = ekx es biyectiva y diferenciable y si X ∼ exp(θ) entonces θ̂ = X
.
k
Luego un estimador de u = e−kθ es û = e −x
R∞  ∞
b) E(T ) = k θ · e−θx dx = −e−θx k = e−θk
Pn
c) E(T ) = n−1
n2 ·
n−1 1
k=1 E(Xk ) = n · θ . No es insesgado.
2 P n 2
V (T ) = (n−1)
n4 · k=1 V (Xk ) = (n−1)
n3 · θ12 ; no alcanza la cota de Cramer.-Rao.

8.3. Problemas Propuestos


1. Se define X: largo de un pez en pulgadas. Si X se distribuye N (u, 9), determinar el tamaño de la muestra
de un intervalo de confianza para la media de un 90 % de confiabilidad tal que el ancho del intervalo sea
de 0,5 pulgadas.

2. Sean X1 , X2 , ..., Xn variables aleatorias independientes con función densidad conjunta

fX (x) = λ2 · x · e−λx · I[0,∞[ (x)

a) Determinar un estimador máximo verosímil µ̂, donde µ = λ1 .


b) ¿Es insesgado?
c) ¿Es eficiente?

3. Mediante un proceso se produce sal refinada. El contenido de las bolsas se distribuye normalmente con
una desviación estándar de 10 [kg]. El contenido de una muestra aleatoria de tamaño n=20 entregó una
media muestral de 200[kg].

a) Encuentre un intervalo de confianza al 95 % para los pesos medios de las bolsas producidas por el
proceso
b) Encuentre un I.C. al 99 % para los pesos medios de las bolsas producidas.

4. Se administraron dos nuevos medicamentos (distribuido normal) para la cura del cáncer. El primer me-
dicamento bajó la presión sanguínea de 46 pacientes en un promedio de 11 puntos con una desviación
estándar de 6 puntos. El segundo medicamento bajó la presión sanguínea de otros 51 pacientes en un
promedio de 12 puntos con una desviación de 8 puntos.

a) Encuentre un intervalo de confianza del 97 % para el promedio poblacional del primer medicamento.
b) Hacer el mismo procedimiento que el caso anterior para el segundo medicamento.

5. Para estimar la proporción de familias de una determinada ciudad que poseen microondas, se quiere
realizar una muestra aleatoria de medida n. Calcule el valor mínimo de n para garantizar que, a un nivel
de confianza del 95, el error en la estimación sea menor que 0, 05. (Como se desconoce la proporción, se
ha de tomar el caso más desfavorable, que será 0, 5)

6. En un determinado barrio se seleccionó al azar una muestra de 100 personas cuya media de ingresos
mensuales resultaba igual a 106,000 euros, con una desviación típica de 20,000 euros.

a) Si se toma un nivel de confianza del 95 %, ¿cuál es el intervalo de confianza para la media de los
ingresos mensuales de toda la población?
8.3. PROBLEMAS PROPUESTOS 123

b) Si se toma un nivel de significación igual a 0,01, ¿cuál es el tamaño muestral necesario para estimar
la media de ingresos mensuales con un error menor de 3,000 euros.?

7. Se desea estudiar el gasto semanal de fotocopias, en euros, de los estudiantes de bachillerato de Madrid.
Para ello, se ha elegido una muestra aleatoria de 9 de estos estudiantes, resultando los valores siguientes
para estos gastos:

100 150 90 70 75 105 200 120 80

Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de media desconocida
y de desviación típica igual a 12. Determine un intervalo de confianza del 95 % para la media del gasto
semanal en fotocopias por estudiante.

8. Sea X1 , X2 , ..., Xn i.i.d. con función densidad fX (x) = α · xα−1 · I[0,1] (x)

a) Encontrar la distribución de Y = ln(X), si X ∼ fX


1
b) Encontrar un estimador M.V para α.
c) ¿Es insesgado?, ¿Es de varianza mínima?

9. Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas, hechos por una
determinada máquina, dieron una media de 2 cm y una desviación típica de 0,1 cm. Hallar los intervalos
de confianza del :

68,26 %
95,44 %
99,73 %

para el diámetro de todos los cojinetes.


√ √
2· x
10. Sea X1 , X2 , ..., Xn i.i.d. con función densidad, fX (x) = 2 · θ−3 · x · e− θ · I[0,∞[ (x) ; θ > 0.

a) Encontrar un estimador máximo verosímil, θ̂ , para θ. ¿Es insesgado?


b) Encontrar la cota de Crämer-Rao para θ.

11. Sean variables aleatorias independientes X1 , X2 , ..., Xn con función densidad

fX (x) = (θ + 1) · xθ · I]0,1[ (x)


Con θ > −1
1
a) Determinar un estimador Máximo Verosímil û , de u = θ+1
b) Demostrar que û es insesgado.
c) Determinar la cota de Crämer-Rao para u y verificar la eficiencia del estimador û.

12. En ocasiones la f.d.p. de Pareto se utiliza como un modelo, sobre todo en reclamaciones de seguros, donde
pueden haber muchas peticiones de pago pequeñas y unas pocas peticiones de pago enormes. Una de las
formas que adopta la f.d.p. de Pareto es:
1 1
fX (x, θ) = · (1 + x)−1− θ · I[o,∞[ (x)
θ
Aplique 15 e) con los datos Y1 = 2, 730 ; Y2 = 5, 124 ; Y3 = 0, 798 ; Y4 = 36, 215 , con 90 % de confiabilidad
y asumiendo que a = 3.
124 CAPÍTULO 8. ESTIMACIÓN PUNTUAL.

13. Sean n datos independientes distribuidos Bin(m, p)

a) Determinar un estimador para p por M.V.


b) Determinar un estimador para p por el mètodo de los momentos.
c) Determinar la varianza del estimador de a) y b).
d ) Determinar la cota de Crâmer- Rao para p.
e) ¿Son insesgados los estimadores de a) y b)?
f ) ¿Son eficientes tales estimadores?.
Capítulo 9

Test de hipótesis.

En esta sección se intenta validar, sabiendo que los datos provienen de una normal, si los parámetros estimados
son aceptables o no. Para ello se construyen dos posiciones o hipótesis que se contrastan

H0 : θ ∈ Θ vs. HA : θ ∈

θ hace referencia a un parámetro, la media o varianza. Θ es una región de aceptación. Esta región está ligada
a una probabilidad de error que se llama nivel de significancia y que se denota con la letra griega α. Tal error
se genera al considerar que la hipótesis nula, H0 , es verdadera cuando, en realidad, es falsa. Este error se llama
error del tipo I. Se debe hacer que este error sea muy pequeño. Es decir

P (H0 esf alsa/H0esverdadera) = α

Que se escribe

P (θ ∈
/ Θ/θ ∈ Θ) = α

Si la hipótesis nula se trastoca a


Ho : θ = θ 0 ; θ 0 ∈ Θ

El error tipo I se reduce a :

Pθ0 (θ ∈
/ Θ) = α

La búsqueda de tal región se realiza a través de la construcción de un estadístico T definido por los datos de la
muestra y que resulta ser una variable aleatoria que depende del parámetro en cuestionamiento, pero su función
densidad o cuantía no depende de él.
Por ejemplo, para un conjunto de datos X1 , X2 , ..., Xn ∼ N (µ, a2 ); siendo a constante y conocido, y a través de
alguna información histórica o por alguna normativa la media es o ha sido µ0 , las hipótesis se transforman :

H0 : µ = µ0 vs. HA : µ < µ0
X̄−µ0
El estadístico de prueba es Z = √a
∼ N (0, 1), y si α es el nivel de significancia entonces la región se ha de
n
deducir de :

125
126 CAPÍTULO 9. TEST DE HIPÓTESIS.

Pθ0 (Z > z) = 1 − α

Y como Z tiene una función densidad concreta z = z1− α2 . La región de rechazo de H0 es Z > z1− α2 .
Generalmente el nivel de significancia es dado, pero en otras se utiliza el p-valor para llevar a cabo el test de
hipótesis. El p-valor es el nivel de significancia menor que se puede dar para rechazar la hipótesis nula.
Los ejercicios que se exponen tienen como único objetivo que el alumno se habilite en determinar:

1. ¿Cuáles son las hipótesis a contrastar?.

2. ¿Cuál es el estadístico de prueba?

3. Con el nivel de significancia dado o con el p-valor, dar una conclusión.

9.1. Problemas Resueltos


1. Se define la variable X como ”rentabilidad de cierto tipo de fondos de inversión tras una apreciación fuerte
del marco con respecto del dólar”. Se considera que la media de esta variable es 15. Un economista afirma
que dicha rentabilidad media ha variado, por lo que lleva a cabo un estudio sobre una muestra de 9 fondos
cuya media muestral resulta ser 15,308 y cuya varianza muestral corregida ( insesgada) es 0,193.

a) Especificar las hipótesis y contrastarlas al 5 %.


b) A partir del resultado anterior el intervalo de confianza para la media al 95 % contendrá o no al valor
15. Explique.
c) Acotar el p-valor. ¿Qué habría ocurrido si α = 0, 1?

Solución.
a) Ho : µ = 15 ; HA : µ0 > 15 Me dio rechazo Ho
b) To = 2, 10327 [14,97; 15,646] 15 está.
c) p-valor 1,54293E-13

2. El peso en onzas de 12 latas de cervezas es:

11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1

La variación estándar especificada es de 1/2 onza. ¿Se cumple esta especificacion? Use el nivel de signifi-
cacion del 1 % y una prueba bilateral
Solución.
1 1
Ho : σ 2 = 2 ; Ha : σ 2 6= 2 α = 0, 01
χ212,0,995 = 28, 3 ; χ212,0,005 = 3, 074
Q0 = 3, 6 ; ¿Qo > 28, 3? No ; ¿Qo < 3, 074 ? No.

3. Se ha tomado una muestra aleatoria de 100 individuos a los que se ha medido el nivel de glucosa en sangre,
obteniéndose una media muestral de 110 mg/cc. Se sabe que la desviación típica de la población es de 20
mg/cc. Obtén un intervalo de confianza, al 90 %, para el nivel de glucosa en sangre en la población.
Solución.
9.1. PROBLEMAS RESUELTOS 127
h i
Se usa intervalo de confianza para la media con varianza desconocida. x ± √S · tn−1,1− α2 .
n

Como n = 100 se puede aproximar tn−1,1− α2 por z1− α2


X = 110 ; S = 20 ; z0,95 = 1, 645 ; n = 100

4. Una encuesta realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración de un
empleo en la misma es de 6,5 años, con una desviación típica de 4. ¿Sirve esta información para aceptar,
con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica es menor o igual que
6?. Justifica adecuadamente la respuesta.
Solución.
Datos :
X = 6, 5 ; S = 4 n = 64 ; Sn−1 = 4, 032
Hipótesis:
H0 : µ = 6 ; H A : µ > 6
Test : Para medias con desviación desconocida.
6,5−6
T0 = 4,032 = 0, 992 ; t63,0,95 = 1, 67
8

Decisión. ¿T0 > 1, 67 ? No, luego no hay evidencia para rechazar la hipótesis nula.

5. Uno de los factores utilizados para determinar la utilidad de un examen en particular, como una medida
de las capacidades de los estudiantes, es la cantidad de dispersión que se presenta en las calificaciones. Un
conjunto de resultados de la prueba tiene poco valor si la amplitud de variación de las calificaciones es
muy pequeña. Sin embargo, si la amplitud es muy grande, existe una diferencia definida en los porcentajes
logrados por los “ mejores” estudiantes y los alcanzados por los “peores” . Se ha determinado deseable
una desviación estándar de 12 puntos en un examen con un total de 100. Para decidir si se hizo un buen
examen a su grupo, se contrastó esta hipótesis al nivel de significancia de 0.05 utilizando los puntajes
de dicha prueba. Hubo 28 puntajes cuya desviación estándar fue igual a 10.5. Se tiene evidencia, al nivel
de significancia de 0.05 de que su examen no tiene la desviación estándar especificada. Especifique las
hipótesis a contrastar , el test a usar, y luego decida.
Solución.
Datos: n = 28 ; α = 0, 05 ; S = 10, 5 ; Sn−1 = 114, 33
Las hipótesis: Ho : σ = 12 ; Ha : σ < 12
27
Pivote: Q = 144 · 114, 33 = 21, 437 ; χ227,0,05 = 16, 1514
Conclusión: No hay evidencia para rechazar la hipótesis nula.

6. Se espera que en promedio dos operadores, produzcan el mismo número de piezas defectuosas por cada
250 piezas. Los siguientes datos corresponden al número de piezas defectuosas por trabajador en el lapso
de 7 semanas.

1 2 3 4 5 6 7
T1 12 11 14 16 13 10 15
T2 14 18 17 16 18 14 |17

Se sabe que el número de piezas fabricadas por cada trabajador durante una semana son 250.

a) ¿Se puede aseverar que la proporción de piezas defectuosas del segundo trabajador supera a la
proporción de piezas defectuosas del primer trabajador?
128 CAPÍTULO 9. TEST DE HIPÓTESIS.

b) ¿Se puede aseverar que la proporción de piezas defectuosas del segundo trabajador supera en 2 a la
proporción de piezas defectuosas del primer trabajador?

Solución.
a) Ho : p1 − p2 = 0 ; Ha : p1 − p2 < 0 usando test de proporciones realizar cálculos.
b) Ho : p2 − p1 = 2 ; Ha : p2 − p21 > 2 usando test de proporciones realizar cálculos.

7. Sean {Xi } variables aleatorias independientes con función densidad N (µ, 100)
Se generan las siguientes hipótesis :
H0 : µ = 5, Ha : µ < 5
Se definen las siguientes funciones :
L(µ) = P (aceptar H0 /µ) (función de operacion característica)
B(µ) = P (rechazar H0 /µ) (función de potencia)

a) Probar que B(µ) = 1 − L(µ)


b) Probar que L(µ) = P (X < C/µ) = FX ( C−µ
10 )

n

c) Demuestre que L(u) es decreciente.


d ) ¿Cómo interpreta B(5)? ( Error tipo 1)
e) Si n = 100 y B(µ) = 0, 05 ( nivel de significancia). ¿Cuál es el valor de C?
f ) Con esos valores de C, nivel de significancia y n dados y obtenidos en e ) , ¿cuál es el valor de L(4)?
(error tipo 2). Interprete.

Solución.
a) Usando P (A/B) = 1 − P (Ac /B)
b) X es un e.m.v. de µ . Aceptará Ho ssi X < c
Luego L(µ) = P (X < C/µ) = FX ( C−µ 100
10 ) ; con X ∼ N (µ, n )

n

C−µ
c) Sea µ < ν ; L(µ) = FX ( 10

) y L(ν) = FX ( C−ν
10 )

n n
C−µ
10

> C−ν
10

y como FX es creciente entonces ; FX ( C−µ

C−ν
10 ) > FX ( √
10 )
n n n n

luego L(µ) > L(ν) por tanto L es decreciente.


d ) B(5) = P (rechazar H0 /µ = 5) es la medida de rechazar Ho cuando es verdadera. Es error tipo 1.
e) C = Z0,95 + µ
f ) L(4) = 1 − B(4) = 0, 95 ; luego C = 0, 95 + 4 = 4, 95

9.2. Problemas Propuestos


1. En una determinada población juvenil, el peso, en Kgs sigue una distribución normal N (50, 10). Si se
extrae una muestra aleatoria de 25 jóvenes para un nivel de significación del 5 %, ¿en qué condiciones se
rechazaría la hipótesis de que la media de la población es de 50 kgs ?

2. El peso medio de una muestra aleatoria de 81 personas de una determinada población es de 63,6 kg. Se
sabe que la desviación típica poblacional es de 6 kg. Con un nivel de significación del 0,05, ¿hay suficientes
evidencias para rechazar la afirmación de que el peso medio poblacional es de 65 kg?.
9.2. PROBLEMAS PROPUESTOS 129

3. Se toman dos muestras independientes para comparar las medias de dos poblaciones. ¿Se puede concluir
que, al nivel del 0.02, la media de la población A ha de ser mayor que la de B?

muestra n X S
A 50 57,5 6,2
B 60 54,4 10,6

4. Se define una muestra aleatoria X1 , X2 , ..., X100 distribuidas i.i.d.


1 −x2
f (x, θ) = √ √ · e 2·(θ+1) · IR (x), θ>1
2π · θ + 1
P100 P100
Si i=1 Xi = 3 y i=1 Xi2 = 400. Contrastar la hipótesis:
Ho : θ = 2 v/s HA : θ > 2 con α = 0,05

5. Un fabricante dedicado a la elaboración de alimento balanceado para cerdos, afirma que su producto
aumenta el peso promedio en 150 gr. En una muestra de 18 cerdos tomados al azar se obtuvo un aumento
de peso promedio de 125 gr. con una desviación de 25 gr. ¿Se puede suponer que la afirmación del fabricante
es correcta con un nivel de significación del 1 %?

6. Se llama p-valor al nivel de significancia menor que se puede dar para que con la muestra se rechace la
hipótesis nula.
Si Ho : θ = θ0 ; HA : θ > θo entonces p − valor = P (T > t/θo )
Si Ho : θ = θ0 ; HA : θ < θo entonces p − valor = P (T < t/θo )
Si Ho : θ = θ0 ; HA : θ 6= θo entonces
p − valor = min{2P (T > t/θo ); 2P (T < t/θo )}
Se define la variable X como “rentabilidad de cierto tipo de fondos de inversión tras una apreciación fuerte
del marco con respecto del dólar”. Se considera que la media de esta variable es 15. Un economista afirma
que dicha rentabilidad media ha variado, por lo que lleva a cabo un estudio sobre una muestra de 9 fondos
cuya media muestral resulta ser 15,308 y cuya varianza muestral corregida ( insesgada) es 0,193.

a) Especificar las hipótesis y contrastarlas al 5 %.


b) A partir del resultado anterior el intervalo de confianza para la media al 95 % contendrá o no al valor
15. Explique.
c) Acotar el p-valor. ¿Qué habría ocurrido si α = 0, 1?

7. El peso de los pollos de un granja sigue una normal con media 2,6 kg. y desviación típica 0,5 kg. Se
experimenta un nuevo tipo de alimentación con 49 crías. Cuando se hacen adultas se les pesa, resultando
una media de 2,78 kg. ¿Puede afirmarse que el peso medio ha aumentado o por el contrario se ha mantenido,
con un nivel de significación del 1 %? Resalte lo siguiente:

a) Exprese cuáles son las hipótesis a contrastar.


b) Determine el p-valor.

8. Uno de los factores utilizados para determinar la utilidad de un examen en particular, como una medida
de las capacidades de los estudiantes, es la cantidad de dispersión que se presenta en las calificaciones. Un
conjunto de resultados de la prueba tiene poco valor si la amplitud de variación de las calificaciones es
muy pequeña. Sin embargo, si la amplitud es muy grande, existe una diferencia definida en los porcentajes
130 CAPÍTULO 9. TEST DE HIPÓTESIS.

logrados por los “mejores” estudiantes y los alcanzados por los “peores” . Se ha determinado deseable una
desviación estándar de 12 puntos en un examen con un total de 100. Para decidir si se hizo un buen
examen a su grupo, se contrastó esta hipótesis al nivel de significancia de 0.05 utilizando los puntajes
de dicha prueba. Hubo 28 puntajes cuya desviación estándar fue igual a 10.5. Se tiene evidencia, al nivel
de significancia de 0.05 de que su examen no tiene la desviación estándar especificada. Especifique las
hipótesis a contrastar , el test a usar, y luego decida.

9. Un fabricante de lámparas eléctricas sostiene que la duración media de las mismas (horas) es en promedio
superior a 1.300 h. Se toma una muestra de 17 lámparas siendo el resultado de la inspección el siguiente:

980; 1.350; 1.020; 1.140; 1.520; 1.390; 1.205; 1.180; 970; 1.420; 1.850; 1.300; 1.305; 1.040; 1.050; 1.520;
1.320

Verificar la hipótesis del fabricante con un coeficiente de significancia del 5 % (suponga que los datos
provienen de una distribución normal)

10. Suponga que se escogen dos grupos de animales de la misma especie; los primeros son tratados con una
dieta tipo A y los que siguen con una dieta tipo B (la tradicional). Luego de 6 meses de tratamiento
en cada grupo se observa el peso de los animales y el número de veces que debieron recibir tratamiento
veterinario por alguna patología asociada a su sistema digestivo. Los resultados fueron agrupados en dos
muestras aleatorias:

N◦ de animales tipo de dieta peso medio[Kg.] peso medio cuadrático[Kg2] N◦ animales con tratamiento
48 A 40 1800 4
38 B 36 1700 2
a) Estime con un 95 % de confianza la proporción de animales sometidos a la dieta A que debieron
recibir tratamiento veterinario por causa digestiva.
b) Se piensa que el peso medio de los animales sometidos a la dieta A supera en al menos 6[kg] al peso
medio de los sometidos a la dieta B. Opine con α = 0,01

11. Se tienen dos universidades independientes donde se ha aplicado un test a los alumnos de 4◦ año de carrera
de sicología, y a los cuales se les consulta sobre su evaluación a la gestión del ministerio de educación.
Para reducir los costos de consultar a todos los alumnos, sólo se escoge una muestra de 50 alumnos de la
universidad A y 40 de la universidad B. Además, por la gran cantidad de alumnos involucrados, podemos
suponer que ambas poblaciones son infinitas. Si estudios previos respecto de este tema nos indican que
ambas poblaciones son homocedásticas y que la varianza de la evaluación (en nota de 1 a 7) es 2:

a) Estime con un 95 % de confianza la evaluación media de los alumnos de la universidad A. ¿Cuál es


su margen de error?
b) Si la evaluación media en la universidad B es inferior a 2.5, el gobierno enviara un representante
ministerial para evaluar la situación. Usando α = 0,01 ¿Será necesario ese viaje?

12. En un establecimiento lechero, 18 vacas de raza Frisia, produjeron en promedio 70kg. En la tercera semana
luego del parto, con un desvío de 6kg. ¿Se puede asegurar (α = 0, 05 ) que la producción aumentó con
respecto a una media de 65kg.?

13. La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa es de 1,570h, con
una desviación típica de 120h. Si µ es la vida media de todos los productos de esa empresa, contrastar la
hipótesis de que µ = 1600h.
9.2. PROBLEMAS PROPUESTOS 131

14. Una muestra de 9 explotaciones agrícolas arrojó una media de 125 ha y un desvío de 25 ha. Comprobar si
se puede suponer con bastante confiabilidad que el promedio verdadero de la población de explotaciones
puede ser 135 ha

15. El Departamento de Control de Calidad de una empresa que fabrica computadoras estima que si la
longitud de una determinada pieza presenta una varianza mayor a 4 mm. irremediablemente se producirá
una inutilización de una plaqueta en el término de 6 meses de uso. Una muestra de 15 piezas arrojó una
longitud media de 5 mm. con una desviación estándar de 1,2 mm.. ¿Qué conclusiones puede obtener el
Departamento de Calidad de la empresa en cuanto a la calidad de la pieza analizada?

16. Se arroja una moneda al aire 200 veces, obteniéndose 90 veces caras.
Probar: H0 : p = 0, 5 contra la HA : p 6= 0, 5 a un nivel de significación del 5 %.

17. En una muestra al azar de 400 productores, el 65 % de ellos eran propietarios y el 33 % no. Verifique
la hipótesis de que la muestra proviene de una población de la que el 60 % son propietarios. Use una
probabilidad de cometer un error de tipo I del 5 %.

18. Se conoce por investigaciones ya realizadas que el 20 % de la población mayor de 15 años fuma. Después de
efectuar una fuerte campaña televisiva y radial durante 6 meses, se decide estudiar si la población adulta
ha disminuido el hábito de fumar. Para ello se selecciona una muestra aleatoria de 1000 personas adultas
a las que somete a una determinada encuesta. Resumida la información proporcionada por el trabajo de
campo, se observó que el 12 % de las personas encuestadas fumaba habitualmente. Probar la hipótesis que
la campaña publicitaria ha disminuido la cantidad de fumadores.

19. Las puntuaciones en un test de razonamiento abstracto siguen una distribución Normal de media 35 y
varianza 60. Para evaluar un programa de mejora de las capacidades intelectuales, a 101 individuos que
están realizando este programa se les pasa el test, obteniéndose una media de 50 puntos y una varianza
de 80 ¿Puede asegurarse, a un nivel de confianza del 90 %, que el programa incrementa la variabilidad en
esta variable?

20. Un estudiante lanza 10 monedas y contabiliza el número de caras en cada experiencia. Sus resultados
fueron:

N◦ de caras 0 1 2 3 4 5 6 7 8 9 10
frecuencia 300 450 790 1000 1200 1260 1200 1000 790 450 300

El estudiante asevera que las monedas que usó tenían una medida de 1/2 de salir cara. De acuerdo con sus
resultados y la información que dio el estudiantes posible asegurar que él hizo la experiencia y no inventó
los datos. Explique y argumente su afirmación.

Potrebbero piacerti anche