Sei sulla pagina 1di 226

Probabilidad y Estadstica

Csar Amarilla
1 de agosto de 2011
ndice general
1. Estadstica y tipos de estadstica 8
1.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2. Deniciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1. Estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2. Estadstica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3. Estadstica Inferencial . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.4. Poblacin y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.1. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.2. Escalas de medicin . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2. Distribuciones de Frecuencia 16
2.1. Estadstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2. Construccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1. Representacin Grca . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3. Medidas de tendencia central 25
3.1. La Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.1. La Media Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.2. La Media Aritmtica . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.3. Propiedades de la media aritmtica . . . . . . . . . . . . . . . . . . . 26
3.1.4. Desventajas de la media aritmtica . . . . . . . . . . . . . . . . . . . 26
3.1.5. La media para datos no agrupados . . . . . . . . . . . . . . . . . . . 26
3.1.6. La media para datos agrupados . . . . . . . . . . . . . . . . . . . . . 27
3.1.7. La media de la poblacin . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2. La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2.1. Propiedades de la mediana . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2. La mediana para datos agrupados . . . . . . . . . . . . . . . . . . . 29
3.3. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3.1. Propiedades de la moda . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3.2. Desventajas de la moda . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3.3. La moda para datos agrupados . . . . . . . . . . . . . . . . . . . . . 31
3.3.4. Comparacin entre medidas de tendencia central . . . . . . . . . . . 32
3.3.5. Relacin entre las medidas de tendencia central . . . . . . . . . . . . 33
3.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1
NDICE GENERAL 2
4. Medidas de Variabilidad 35
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2. Variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2.1. Rango y rango intercuartlico . . . . . . . . . . . . . . . . . . . . . . 35
4.2.2. Desviacin media . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2.3. Desviacin media para datos agrupados . . . . . . . . . . . . . . . . 36
4.2.4. Varianza y desviacin estndar . . . . . . . . . . . . . . . . . . . . . 37
4.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5. Probabilidad 41
5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2. Deniciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3. Operaciones entre eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.4. Denciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.4.1. Concepto Clsico de Probabilidad . . . . . . . . . . . . . . . . . . . 45
5.4.2. Concepto frecuentista de probabilidad . . . . . . . . . . . . . . . . . 45
5.4.3. Probabilidad subjetiva . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.4.4. Concepto axiomtico de probabilidad . . . . . . . . . . . . . . . . . 46
5.5. Teoremas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.5.1. Teorema 1: Regla de la Adicin . . . . . . . . . . . . . . . . . . . . 47
5.5.2. Teorema 2: Regla de la complementacin . . . . . . . . . . . . . . . 48
5.5.3. Teorema 3: Regla de Diferenciacin . . . . . . . . . . . . . . . . . . 48
5.5.4. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . 48
5.5.5. Teorema 4: Reglas de Multiplicacin . . . . . . . . . . . . . . . . . 49
5.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6. Variables aleatorias 63
6.1. Deniciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2. Distribucin de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.2.1. Propiedades de la funcin de probabilidad . . . . . . . . . . . . . . . 66
6.2.2. Propiedades de la funcin de densidad de probabilidad . . . . . . . . 68
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.4. Funcin generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . 80
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7. Distribuciones de probabilidad 91
7.1. Distribuciones discretas de probabilidad . . . . . . . . . . . . . . . . . . . . 91
7.1.1. Distribucin Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.1.2. Distribucin binomial . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.1.3. Distribucin Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.1.4. Distribucin geomtrica . . . . . . . . . . . . . . . . . . . . . . . . 99
7.1.5. Distribucin binomial negativa . . . . . . . . . . . . . . . . . . . . . 101
NDICE GENERAL 3
7.1.6. Distribucin hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . 103
7.2. Distribuciones continuas de probabilidad . . . . . . . . . . . . . . . . . . . . 107
7.2.1. Distribucin uniforme continua . . . . . . . . . . . . . . . . . . . . 107
7.2.2. Distribucin Normal . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.2.3. Aproximacin normal a la binomial. . . . . . . . . . . . . . . . . . . 117
7.2.4. Distribucin ji-cuadrada . . . . . . . . . . . . . . . . . . . . . . . . 120
7.2.5. Distribucin t de Student . . . . . . . . . . . . . . . . . . . . . . . . 122
7.2.6. Distribucin exponencial . . . . . . . . . . . . . . . . . . . . . . . . 125
7.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8. Muestras aleatorias y distribuciones de muestreo. 150
8.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
8.2. Muestras aleatorias y estadsticos muestrales . . . . . . . . . . . . . . . . . . 150
8.3. Mtodos de Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.3.1. Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . 152
8.3.2. Muestreo aleatorio sistemtico . . . . . . . . . . . . . . . . . . . . . 153
8.3.3. Muestreo aleatorio estraticado . . . . . . . . . . . . . . . . . . . . 154
8.3.4. Muestreo aleatorio por conglomerados . . . . . . . . . . . . . . . . . 155
8.3.5. Error de Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.4. Distribuciones Muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.4.1. Distribucin Muestral de Medias . . . . . . . . . . . . . . . . . . . . 156
8.4.2. Teorema del Lmite Central . . . . . . . . . . . . . . . . . . . . . . 158
8.4.3. Distribucin Muestral de Varianzas . . . . . . . . . . . . . . . . . . 161
8.4.4. Distribucin F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8.4.5. Distribucin Muestral de Proporciones . . . . . . . . . . . . . . . . 166
8.4.6. Distribucin Muestral de Sumas y de Diferencias de medias . . . . . 169
8.4.7. Distribucin Muestral de Relaciones de Varianzas . . . . . . . . . . . 173
8.4.8. Distribucin Muestral de Diferencias de Proporciones . . . . . . . . 173
8.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
9. Estimacin 175
9.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
9.2. Estimadores y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . . . 175
9.2.1. Propiedades de un buen estimador . . . . . . . . . . . . . . . . . . . 176
9.3. Estimacin Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
9.3.1. Estimadores de maxima verosimilitud . . . . . . . . . . . . . . . . . 179
9.3.2. Estimadores por el mtodo de los momentos . . . . . . . . . . . . . 181
9.4. Estimacin por Intervalos de Conanza . . . . . . . . . . . . . . . . . . . . 182
9.4.1. Intervalos de conanza para estimar la media de una poblacin . . . . 183
9.4.2. Intervalos de conanza para la varianza y la desviacin tpica de una
poblacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
9.4.3. Intervalos de conanza para estimar Proporciones . . . . . . . . . . . 191
9.4.4. Intervalos de conanza para estimar Diferencias de Medias . . . . . . 193
9.4.5. Intervalos de conanza para Relaciones de Varianzas . . . . . . . . . 196
9.4.6. Intervalos de conanza para Diferencias de Proporciones . . . . . . . 199
9.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
NDICE GENERAL 4
10. Prueba de Hiptesis 208
10.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
10.2. Deniciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
10.2.1. Qu es una hiptesis? . . . . . . . . . . . . . . . . . . . . . . . . . 208
10.2.2. Hipotesis nula y alternativa . . . . . . . . . . . . . . . . . . . . . . . 209
10.2.3. Dos tipos de errores . . . . . . . . . . . . . . . . . . . . . . . . . . 209
10.2.4. Regin Crtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
10.2.5. Funcin de Potencia . . . . . . . . . . . . . . . . . . . . . . . . . . 210
10.2.6. Funcin Caracterstica de Operacin . . . . . . . . . . . . . . . . . . 211
10.2.7. Hiptesis simples y compuestas . . . . . . . . . . . . . . . . . . . . 212
10.2.8. Procedimiento de 4 pasos para contraste de hiptesis . . . . . . . . . 212
10.3. Pruebas de hiptesis para grandes muestras (n 30) . . . . . . . . . . . . . 213
10.3.1. Prueba de hiptesis para Medias . . . . . . . . . . . . . . . . . . . . 213
11. Anlisis de la Varianza (ANOVA) 216
11.1. Suposiciones de ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
11.2. Procedimiento del anlisis de la varianza . . . . . . . . . . . . . . . . . . . . 216
12. Anlisis de regresin y de correlacin 218
12.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
12.2. Modelo Estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
12.3. Modelo de regresin simple . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
12.3.1. Ajuste de curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
12.3.2. El mtodo de los mnimos cuadrados . . . . . . . . . . . . . . . . . 221
12.3.3. Anlisis de regresin simple . . . . . . . . . . . . . . . . . . . . . . 224
12.4. Anlisis de correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
12.4.1. Anlisis de correlacin simple . . . . . . . . . . . . . . . . . . . . . 225
ndice de guras
2.1. Representacin grca de un histograma de frecuencia . . . . . . . . . . . . 20
2.2. Representacin grca de un histograma de frecuencia relativa . . . . . . . . 20
2.3. Representacin grca de un polgono de frecuencia . . . . . . . . . . . . . 21
2.4. Representacin grca de un polgono de frecuencia relativa . . . . . . . . . 21
2.5. Representacin grca de una ojiva de frecuencia acumulada . . . . . . . . . 22
5.1. Representacin grca de la interseccin de dos eventos . . . . . . . . . . . 43
5.2. Representacin grca de la unin de dos eventos . . . . . . . . . . . . . . . 43
5.3. Representacin grca de complementos de eventos . . . . . . . . . . . . . . 44
5.4. Representacin grca de la diferencia de dos eventos . . . . . . . . . . . . . 44
6.1. Representacin grca de la denicin de una variable aleatoria . . . . . . . 63
6.2. Representacin grca del espacio muestral del ejemplo 6.1.2 . . . . . . . . 64
6.3. Representacin grca de la funcin del ejemplo 6.2.1 . . . . . . . . . . . . 67
6.4. Representacin grca de la probabilidad como un ara . . . . . . . . . . . . 68
6.5. Representacin grca de f (x) (ejemplo 6.2.3 . . . . . . . . . . . . . . . . . 69
6.6. Representacin grca de F(x) del ejemplo 6.2.5 . . . . . . . . . . . . . . . 70
6.7. Representacin grca de F(x) del ejemplo 6.2.6 . . . . . . . . . . . . . . . 70
7.1. Grca de f (x) de la distribucin Poisson . . . . . . . . . . . . . . . . . . . 96
7.2. Grca de f (x) de la distribucin exponencial . . . . . . . . . . . . . . . . . 107
7.3. Grca de F(x) de la distribucin exponencial . . . . . . . . . . . . . . . . . 109
7.4. Grca de f (x) del ejemplo 7.2.1 . . . . . . . . . . . . . . . . . . . . . . . . 109
7.5. Grca de F(x) del ejemplo 7.2.1 . . . . . . . . . . . . . . . . . . . . . . . 110
7.6. Representacin grca de f (x) para ciertos valores de y
2
de una variable
aleatoria normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.7. Representacin grca de f (x) de una variable aleatoria normal . . . . . . . 112
7.8. Curvas normales que tienen medias iguales y desviaciones estndar diferentes 112
7.9. Curvas normales que tienen medias diferentes y desviaciones estndar iguales 113
7.10. Curvas normales que tienen medias diferentes y desviaciones estndar difer-
entes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.11. Grca de f (x) cuando el parmetro k toma los valores 1,2,3,4 y 5 . . . . . . 121
7.12. Distribucin t versus distribucin normal . . . . . . . . . . . . . . . . . . . . 124
7.13. Grca de f (x) cuando el parmetro toma los valores 0,5;1,0 y 1,5 . . . . . 126
7.14. Grca de F(x) cuando el parmetro toma los valores 0,5;1,0 y 1,5 . . . . . 126
8.1. Grca de f (x) cuando los parmetros m y n toman diferentes pares de valores.165
5
NDICE DE FIGURAS 6
9.1. Grca del proceso de eleccin de los valores
2
c
y
2
l
. . . . . . . . . . . . . 189
9.2. Grca de la distribucin acumulada de la
2
. . . . . . . . . . . . . . . . . . 190
12.1. Grco de la relacin entre el nmero de aos que se estudi alemn y la
calicacin obtenida en la prueba. . . . . . . . . . . . . . . . . . . . . . . . 223
ndice de cuadros
7
Captulo 1
Estadstica y tipos de estadstica
1.1. Introduccin
Qu signica la palabra estadstica?
La encontramos frecuentemente en nuestro lenguaje cotidiano. En su uso ms comn,
estadstica se reere a informaciones numricas. Ejemplos seran; el salario inicial promedio
de un graduado de una escuela superior, el nmero de decesos anuales debido al alcoholismo,
el porcentaje de alumnos no graduados que estudian en la Universidad Nacional de Asuncin,
la variacin de ayer a hoy de los precios de los productos de la canasta familiar, etc. En estos
ejemplos la estadstica consiste en nmeros o porcentajes. A estos nmeros se les denomina
estadsticos.
La Estadstica se divide en dos grandes reas (descripcin de datos y realizacin de infer-
encias) que reejan la propia historia del desarrollo de esta ciencia. La Estadstica actual es el
producto del encuentro de dos ramas distintas del saber, la antigua estadstica y el clculo de
probabilidades, que se encontraron en el siglo XIX. Etimolgicamente, la palabra estadstica
procede de la palabra estado, ya que desde la antigedad los romanos hicieron recolecciones
de datos que posteriormente tenan que resumir de una forma comprensiva y que permitiera
proporcionar informaciones tiles. Este tipo de estudios dio lugar a la estadstica descriptiva
cuya misin consiste en describir situaciones y procesos dados; para ello se sirve de tablas,
representaciones grcas, proporciones, nmeros ndice y medidas tpicas.
Sin embargo las conclusiones extradas se agotan en el propio conjunto de datos obser-
vados, pues el objetivo consista en hacerse una idea clara de lo que haba, y lo que haba se
contaba y se meda. Lo que posibilit el clculo de probabilidades fue, precisamente, el desar-
rollo de un conjunto de mtodos para extrapolar las conclusiones a entidades no observadas.
Es decir, proporcion el instrumento adecuado para poder hacer inferencias acerca de grandes
cantidades de observaciones potenciales a partir de unas pocas observaciones reales. Estas
tcnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss, en su apli-
cacin por Galton a los problemas de herencia, etc. Sin embargo los autnticos fundadores
de estas tcnicas fueron Karl Pearson (1857-1936) y Sir Ronald Fisher (1890-1962). As se
ha desarrollado la estadstica analtica o inferencial basada en la teora de probabilidades que
trata de obtener leyes generales a partir de la observacin de algunos datos. Precisamente
este fundamento probabilstico condiciona el que los resultados obtenidos se vean sujetos a
unos mrgenes de error. Ahora se puede dar una denicin de Estadstica en la que aparecen
algunos trminos no denidos lo cual no impedir entender su signicado.
8
1.2. DEFINICIONES Y EJEMPLOS 9
1.2. Deniciones y ejemplos
1.2.1. Estadstica
Denicin 1.2.1 Es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes
de muestras, y de la realizacin de inferencias acerca de las poblaciones de las que stas
proceden. Es la ciencia que estudia los fenmenos aleatorios.
1.2.2. Estadstica Descriptiva
La primer parte de la denicin de estadsticas, es comnmente conocida como Estads-
tica Descriptiva. La denicin es la siguiente: Es el conjunto de procedimientos utilizados
para organizar, resumir y presentar grupos de datos numricos. Los grupos de datos numri-
cos no organizados son de poca utilidad. Sin embargo, tcnicas estadsticas estn disponibles
para organizar estos datos en distribuciones de frecuencia, presentarlos en grcas, resumir-
los en promedios y medidas de variabilidad o dispersin.
1.2.3. Estadstica Inferencial
Otra faceta de las estadsticas es la estadstica inferencial tambin llamada estadstica
inductiva. La principal utilidad de la estadstica inferencial es conocer algo acerca de una
poblacin basndose en una muestra tomada de esa poblacin. La denicin es la siguiente:
Es el conjunto de mtodos utilizados para obtener conclusiones relativas a una poblacin,
basndose en el conocimiento de las caractersticas de una muestra. Una poblacin puede
consistir de individuos, tales como todos los estudiantes de la universidad, todos los estudi-
antes que estudian Estadsticas o todos los internos de la penitenciaria. Una poblacin puede
tambin consistir de objetos, tales como todos los motores producidos por la planta Ford
o todas las truchas en un estanque. Una poblacin tambin puede consistir en un grupo de
medidas, tales como las estaturas equipo de bsquetbol "Dorados de Chihuahua".
1.2.4. Poblacin y muestra
Denicin 1.2.2 : Individuo
Es cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si
estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos
el precio de la vivienda, cada vivienda es un individuo.
Denicin 1.2.3 : Poblacin
Es el conjunto de todos los individuos (personas, objetos, animales, etc.) que portan in-
formacin sobre el fenmeno que se estudia. Para inferir algo acerca de una poblacin, usual-
mente tomamos una muestra de ella.
Denicin 1.2.4 : Muestra
Es un subconjunto de la poblacin de inters.
1.3. VARIABLES 10
Por ejemplo una poblacin en estudio podra ser el conjunto de todos los estudiantes que
estudian administracin en la Facultad de Ciencias Econmicas de la Universidad Nacional
de Asuncin y una muestra podra consistir en el conjunto de estudiantes de primer ao de
dicha poblacin.
1.3. Variables
Denicin 1.3.1 : Variables
Es una caracterstica que puede tomar diferentes valores. Las variables son caractersticas
observables, susceptibles de adoptar distintos valores o ser expresados en categoras. Variable
es un aspecto especico de la realidad referido a la unidad del anlisis y puede ser medidos
o cuanticados. La variable adquiere un valor determinado en cada unidad de anlisis. Si
una caracterstica, se encuentra que toma valores diferentes en personas, lugares o cosas
diferentes, se dice que esta caracterstica es variable, es decir la caracterstica no es la misma
cuando se observa en diferentes poseedoras de ellas.
Ejemplo 1.3.1 Las siguientes caractersticas son ejemplos de variables
Estatura de las personas
Edad de los nios
El precio y la demanda de un producto
Denicin 1.3.2 : Variables Aleatorias
Cuando los valores obtenidos de la variable son el resultado de factores fortuitos o al azar.
Ejemplo 1.3.2 Las siguientes caractersticas son ejemplos de variables aleatorias
El nmero de caras obtenidas en tres lanzamientos de una moneda
El nmero de hijos en un matrimonio determinado
1.3.1. Tipos de variables
Denicin 1.3.3 : Variable Cualitativa
Cuando la variable estudiada es no numrica es decir una caracterstica que no puede ser
medido sino solo catalogarse, esta es llamada variable cualitativa tambin llamada atributo.
Ejemplo 1.3.3 Las siguientes caractersticas son ejemplos de variables cualitativas
lugar de nacimiento
religin
color de ojos
1.3. VARIABLES 11
Denicin 1.3.4 : Variable Cuantitativa
Cuando la variable estudiada puede expresarse en forma numrica es decir puede ser me-
dido, esta es llamada variable cuantitativa. Las variables cuantitativas pueden ser discretas o
continuas.
Ejemplo 1.3.4 Las siguientes caractersticas son ejemplos de variables cualitativas
el saldo de una cuenta bancario,
la duracin de una batera,
la velocidad de los automviles en el perifrico de la juventud
Denicin 1.3.5 : Variables Discretas
Las variables discretas pueden asumir solo ciertos valores, y hay usualmente huecos entre
los valores (valores puntuales).
Ejemplo 1.3.5 Las siguientes caractersticas son ejemplos de variables discretas
nmero de cuartos en una casa
nmero de carros en el estacionamiento del claustro
nmero de estudiantes en la clase de estadsticas.
Note que cada una de estas variables puede valer un nmero entero (por ejemplo: 1,2,3,
etc.) pero no puede valer nmeros fraccionarios (por ejemplo: 1,5). Tpicamente, las variables
discretas resultan de un conteo.
Denicin 1.3.6 : Variables Continuas
Las variables continuas pueden asumir todos los valores dentro de un rango especco
(valores dentro de un intervalo)
Ejemplo 1.3.6 Las siguientes caractersticas son ejemplos de variables continuas
presin del aire en una llanta
el tiempo que se toma en viajar de It a San Lorenzo
el peso de los jugadores de ftbol del club Cerro Porteo
Tpicamente, las variables continuas resultan de medir algo, y lgicamente dependen de
la exactitud del instrumento de medicin.
1.3. VARIABLES 12
1.3.2. Escalas de medicin
La estadstica no realiza sus funciones directamente sobre las modalidades observadas,
sino que stas se representan por valores numricos, y la estadstica realiza sus funciones
sobre esos valores numricos.
Se llama medicin al proceso de atribuir nmeros a las caractersticas. La medicin es-
tudia las condiciones de construccin de representaciones numricas, y los modelos desar-
rollados para la medicin se llaman escalas. Por lo tanto los datos se pueden clasicar de
acuerdo con niveles de medicin. Hay cuatro escalas de medicin que son: nominal, ordinal,
de intervalo y de razn.
Denicin 1.3.7 : Escala Nominal
El trmino nivel nominal es normalmente usado para referirse a datos que solamente
pueden clasicarse en categoras. Es la escala de medicin ms bajo o ms primitiva. Sin
embargo, no hay mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de
nivel de medicin el orden en que estn acomodadas las categoras es totalmente arbitrario.
Ejemplo 1.3.7 Religiones en Mxico (poblacin con 5 aos o ms, censo del 2000)
Categora Seguidores
Religin Catlica 74 612 373
Religin no catlica 3 483 593
Sin religin 2 982 929
total 81 078 895
Denicin 1.3.8 : Escala Ordinal
Este tipo de nivel de medicin tiene caractersticas similares al nivel nominal con la difer-
encia de que en el nivel ordinal las categoras indican que unas son ms que las otras.
Ejemplo 1.3.8 Evaluacin de la atencin mdica en Uruguay en el ao 2006
Categora Calicacin ( %)
Buena / muy buena 75,7
regular 17,1
mala / muy mala 2
no sabe / no contesta 5,2
total 100
Denicin 1.3.9 : Escala cuantitativa intervalar
En este nivel de medicin, las categoras estn denidas por intervalos de valores, y estn
acomodadas en orden a la magnitud de los valores. El tamao de los intervalos es el mismo.
Propiedades de la escala de intervalos
a) Las categoras de datos son mutuamente excluyentes y exhaustivas.
b) Las categoras de datos estn ordenadas de acuerdo con la cantidad de la caractersticas
que poseen.
1.3. VARIABLES 13
c) Diferencias iguales en la caracterstica estn representadas por diferencias iguales en
los nmeros asignados a las categoras
Ejemplo 1.3.9 Calicaciones de los aspirantes a la academia militar
Calicacin Nmero de aspirantes
90 - 99 42
80 - 89 19
70 - 79 7
60 - 69 4
Denicin 1.3.10 : Escala cuantitativa Racional
La escala de razn es el de nivel ms alto. En este nivel al igual que en el nivel intervalar,
las categoras son del mismo tamao. La diferencia es que este nivel tiene un punto cero
signicativo y el valor de las categoras es en relacin a ese punto, por lo que la relacin entre
dos nmeros tiene sentido.
Propiedades de la escala de Razn
a) Las categoras de datos son mutuamente excluyentes y exhaustivas.
b) Las categoras de datos estn ordenadas de acuerdo con la cantidad de las caractersti-
cas que poseen.
c) Diferencias iguales en la caracterstica estn representadas por diferencias iguales en
los nmeros asignados a las categoras.
d) El punto cero reeja la ausencia de estas caractersticas.
Ejemplo 1.3.10 Ingreso de los empleados de la compaa en relacin a la media de la indus-
tria
Ingreso en relacin a la media Nmero de empleados
2000 12
1000 25
0 32
-1000 17
-2000 10
Observacin
En la escala de medicin de una variable; sea cualitativa o cuantitativa; las categoras
deben ser mutuamente excluyentes. Esto signica que un individuo medicin pertenece
nicamente a una de las categorias. Adems las categoras deben ser exhaustivas, esto es
cada individuo medicin debe pertenecer a una de las categoras.
1.4. PROBLEMAS 14
1.4. Problemas
1. Cul es el nivel de medicin de cada una de las siguientes variables?
a) Distancia que recorren los estudiantes para llegar a clases
b) Calicaciones de los estudiantes en la primera prueba de estadstica
c) Una clasicacin de los estudiantes segn el departamento en que nacieron
d) El nmero de horas que estudia por semana un estudiante
2. Cal es el nivel de medicin de estos incisos relacionados con la industria periodsti-
ca?
a) El nmero de peridicos vendidos cada domingo durante el ao 2010
b) El nmero de empleados en cada departamento, editorial, propaganda, deportes,
etctera.
c) Un resumen, por ciudad, del nmero de peridicos vendidos
d) El nmero de aos que lleva cada empleado en el peridico
3. En cada uno de los siguientes puntos determine si el grupo es una muestra o una
poblacin
a) Los participantes en un estudio de un nuevo medicamento para la diabetes
b) Todos los automovilistas que fueron multados por exceso de velocidad en la ciu-
dad de San Lorenzo el mes pasado.
c) Todos los que reciben asistencia mdica en el Hospital Nacional de Itaugua
d) Nmero de artculos defectuosos encontrados en los embarques.
4. Las diferentes variables cuantitativas, A qu tipo de datos corresponden?
a) Nmero de clientes que llegan en un Banco antes del medio da
b) Sueldos que se pagan a los diferentes jubilados Bancarios
c) Superce de tierra que corresponden a los Campesinos de San Pedro
d) Nivel de presin arterial de los varones mayores a 30 aos
5. En los ejemplos a continuacin establezca la muestra o poblacin
a) 50 ama de casa que utilizan determinada marca de detergentes en una ciudad de
800 habitantes.
b) Los montos de sueldos de cada uno de los trabajadores de una compaa
c) 100 estudiantes de la Universidad Nacional de Asuncin con sus respectivas cal-
icaciones en Estadstica.
6. Diga cul es la variable y a qu naturaleza corresponde
a) Un estudiante recorre una distancia de 25 km para llegar a la Universidad
b) Distancia recorrida por un grupo de estudiantes para llegar a la Universidad
1.4. PROBLEMAS 15
c) Preferencia de color de cabello en las mujeres en tiempo de verano
d) Estado de nimo de los trabajadores de una compaia en horas de la siesta
e) Precios de los calzados de vestir masculino en una ciudad
f) Nmero de nios que no acuden diariamente en la semana en una escuela
7. Explique la diferencia entre variables cualitativas y cuantitativas.
8. Explique la diferencia entre poblacin y muestra
9. Dena el trmino mutuamente excluyentes
10. Dena el trmino mutuamente exhaustivo
11. A una muestra aleatoria de 500 clientes se le pidi probar una nueva pasta dental. De
los 500, 400 dijeron que era excelente, 32 pensaron que era buena y el resto de los
clientes no dieron ninguna opinin. Basandose en lo encontrado en la muestra haga
una diferencia de la reaccin de todos los clientes a la nueva pasta dental.
12. Una muestra aleatoria de 300 ejecutivos de los 2500 empleados en una empresa grande
mostr que 270 se mudaran a otro sitio si ello signicara un ascenso importante.
Basndose en los hallazgos en la muestra describa la reaccin de todos los ejecuti-
vo de la empresa.
13. Explique la diferencia entre variables discretas y continuas.
14. Dena el trmino escala
15. Cita los tipos de niveles de medicin
16. Identicar las escalas de medicin de las siguientes variables
a) Nmero de jugadores de ftbol
b) Ansiedad
c) Presin arterial
d) Estado de conciencia
e) Dolor
f) Grupo saguneo
g) Temperatura
Captulo 2
Distribuciones de Frecuencia
2.1. Estadstica descriptiva
Como su nombre lo indica, la estadstica descriptiva es la parte de la estadstica que
describe y resume una serie de datos. La estadstica descriptiva hace nfasis en tres aspectos:
1. La forma de la distribucin. Para describir como estn distribuidos los datos utiliza una
herramienta llamada distribucin de frecuencia y presenta la informacin por medio
de tablas y grcas.
2. Las medidas de tendencia central: que resumen la informacin a una cifra que es rep-
resentativa de la serie de datos.
3. Las medidas de variabilidad: que nos indican que tan variables son los datos respecto
a las medidas de tendencia central.
En este captulo se presenta una manera de elaborar una distribucin de frecuencia, en
las secciones siguientes se abordarn los temas de medidas de tendencia central y medidas
de variabilidad.
2.2. Construccin
Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las
cuales se muestra el nmero de observaciones que contiene cada categora.
Los pasos para la construccin de una distribucin de frecuencias son mejor explicados
con un ejemplo.
Ejemplo 2.2.1 Los siguientes datos son el nmero de meses de duracin de una muestra de
40 bateras para coche.
22 41 35 45 32 37 30 26
34 16 31 33 38 31 47 37
25 43 34 36 29 33 39 31
33 31 37 44 32 41 19 34
47 38 32 26 39 30 42 35
16
2.2. CONSTRUCCIN 17
1. Ordenacin de datos, que puede ser en orden ascendente o descendente
16 19 22 25 26 26 29 30
30 31 31 31 31 32 32 32
33 33 33 34 34 34 35 35
36 37 37 37 38 38 39 39
41 41 42 43 44 45 47 47
2. El rango (amplitud)
Rango = Dato mayor - Dato menor = 47 - 16 = 31
3. Nmero tentativo de los intervalos de clase (nic)
El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo
a la frmula : 2
nic
Nmero de intervalos (nic) Nmero mximo de datos (2
nic
)
5 32
6 64
7 128
8 256
9 512
10 1024
En este ejercicio, puesto que tenemos 40 datos el nic sera de 6.
Tambin al nic le podemos calcular de la siguiente manera:
nic = 1+3, 322log
10
N = 1+3, 3222log
10
40 = 6, 32 6
4. Tamao de los intervalos de Clase (tic)
tic =
Rango
nic
=
31
6
= 5,16 que se redondea a 6
Para facilitar la clasicacin de los datos, el tic se redondea siempre al entero posterior.
5. Lmite inferior (LI)
Usualmente, el lmite inferior del primer intervalo de clase es el dato ms chico, que en
este ejemplo es 16.
El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior
del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande.
6. Lmite superior (LS)
El lmite superior se calcula con la siguiente frmula LS = LI +tic 1
2.2. CONSTRUCCIN 18
LI LS
16 21
22 27
28 33
34 39
40 45
46 51
7. Lmite Superior Real (LSR)
Los lmites anteriores son los lmites nominales pero no son los reales. Los lmites
reales son el punto medio entre el lmite superior (LS) y el lmite inferior del siguiente
intervalo (LIsig), entonces
_
LSR =
LS+LIsig
2
_
LI LS LSR
16 21 21,5
22 27 27,5
28 33 33,5
34 39 39,5
40 45 45,5
46 51 51,5
8. Marca de clase (X)
La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia
entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms
representativo de los valores del intervalo. Con lo cual X =
LI +LS
2
LI LS LSR X
16 21 21,5 18,5
22 27 27,5 24,5
28 33 33,5 30,5
34 39 39,5 36,5
40 45 45,5 42,5
46 51 51,5 48,5
9. Clasicacin de los datos y conteo de frecuencias
Clasicar las observaciones en los intervalos. La prctica usual es marcar con una lnea
( / ) que representa una observacin. En el ejemplo la observacin 22 se clasica en el
intervalo 20 - 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasicados
todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de
cada intervalo de clase.
2.2. CONSTRUCCIN 19
LI LS LSR X cuenta F
16 21 21,5 18,5 // 2
22 27 27,5 24,5 //// 4
28 33 33,5 30,5 ///// ///// /// 13
34 39 39,5 36,5 ///// ///// /// 13
40 45 45,5 42,5 ///// / 6
46 51 51,5 48,5 // 2
10. Distribucin de frecuencia relativa (FR)
Se pueden convertir las frecuencias de clase en frecuencias relativas de clase para
mostrar los porcentajes de observaciones en cada intervalo de clase. Para convertir
una distribucin de frecuencia en una distribucin de frecuencia relativa cada una de
las frecuencias de clase se dividen entre el nmero total de observaciones
_
FR =
F
n
_
LI LS LSR X cuenta F FR
16 21 21,5 18,5 // 2 2/40 = 0, 05
22 27 27,5 24,5 //// 4 4/40 = 0, 1
28 33 33,5 30,5 ///// ///// /// 13 13/40 = 0, 325
34 39 39,5 36,5 ///// ///// /// 13 13/40 = 0, 325
40 45 45,5 42,5 ///// / 6 6/40 = 0, 15
46 51 51,5 48,5 // 2 2/40 = 0, 05
11. Distribuciones de frecuencia acumulada
Las distribuciones de frecuencia acumulada se usan cuando queremos determinar cuan-
tas observaciones, o que porcentaje de observaciones estn debajo de cierto valor.
La distribucin de frecuencia acumulada (FA) de cierto intervalo se calcula sumando
las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase del inter-
valo de inters. Si queremos la frecuencia acumulada del intervalo 25 - 29, sumamos
las frecuencias de clase 2 + 1 + 4 = 7.
La distribucin de frecuencia relativa acumulada (FAR) de cierto intervalo se calcula
dividiendo la frecuencia acumulada entre el nmero total de observaciones
FRA =
FA
n
LI LS LSR X cuenta F FR FA FRA
16 21 21,5 18,5 // 2 0,05 2 0,05
22 27 27,5 24,5 //// 4 0,1 6 0,15
28 33 33,5 30,5 ///// ///// /// 13 0,325 19 0,475
34 39 39,5 36,5 ///// ///// /// 13 0,325 32 0,8
40 45 45,5 42,5 ///// / 6 0,15 38 0,95
46 51 51,5 48,5 // 2 0,05 40 1
2.2. CONSTRUCCIN 20
2.2.1. Representacin Grca
Tres grcas que nos ayudarn a representar grcamente una distribucin de frecuencias
son el histograma, el polgono de frecuencia y la ojiva de frecuencia acumulada.
El histograma
El histograma es una de las grcas ms ampliamente utilizadas y una de las mas fciles
de entender. Un histograma describe una distribucin de frecuencia utilizando una serie de
rectngulos adyacentes donde la altura de cada rectngulo es proporcional a la frecuencia de
clase que representa.
Figura 2.1: Representacin grca de un histograma de frecuencia
Figura 2.2: Representacin grca de un histograma de frecuencia relativa
2.2. CONSTRUCCIN 21
Polgono de frecuencia
El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados
por la interseccin de las marcas de clase y las frecuencias de clase.
Figura 2.3: Representacin grca de un polgono de frecuencia
El polgono de frecuencia relativa
Es similar al anterior solo que en este se muestran porcentajes, es decir las frecuencias
relativas de cada clase.
Figura 2.4: Representacin grca de un polgono de frecuencia relativa
2.3. PROBLEMAS 22
Ojivas de Frecuencia Acumulada
Las distribuciones de frecuencia acumulada y frecuencia relativa acumulada se presentan
grcamente con las ojivas de frecuencia acumulada y frecuencia relativa acumulada, que es
una grca de segmentos de lnea que une los puntos donde se cruzan los lmites reales con
las frecuencias acumuladas y relativas acumuladas de cada intervalo de clase.
Figura 2.5: Representacin grca de una ojiva de frecuencia acumulada
2.3. Problemas
Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas
grcas:
1. Los resultados siguientes representan las calicaciones del examen nal de un curso
de estadstica elemental.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
2. Una compaa de cambio de aceite tiene varias sucursales en la zona metropolitana. El
nmero de cambios de aceite en la sucursal de la calle Roble en los pasados 20 das
son:
66 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
2.3. PROBLEMAS 23
3. El gerente de una rma especializada en renta de condominios para vacacionistas,
quiere saber como estn distribuidas los montos de las rentas mensuales de los de-
partamentos de la rma. Seleccion una muestra de departamentos cuyas muestras son
mostradas abajo.
Rentas mensuales de los condominios
1170 1207 1581 1277 1305 1472 1077 1319 1537 1849
1332 1418 1949 1403 1744 1532 1219 896 1500 1671
1471 1399 1041 1379 821 1558 1118 1533 1510 1760
1826 1309 1426 1288 1394 1545 1032 1289 695 803
1440 1421 1329 1407 718 1457 1449 1455 2051 1677
1119 1020 1400 1442 1593 1962 1263 1788 1501 1668
1352 1340 1459 1823 1451 1138 1592 982 1981 1091
4. Los siguientes datos representan la duracin de la vida en meses de 30 bombas de
combustible similares.
24 36 4 40 16 5 18 6 30 60
3 72 66 78 3 28 67 72 15 3
18 48 71 22 57 9 54 4 12 72
5. Los siguientes datos representan la duracin de la vida, en segundos, de 50 moscas
sometidas a un nuevo atomizador en un experimento de laboratorio controlado.
17 20 10 9 23 13 12 19 18 24
12 14 6 9 13 6 7 10 13 7
16 18 8 13 3 32 9 7 10 11
13 7 18 7 10 4 27 19 16 8
7 10 5 14 15 10 9 6 7 15
6. Se aplic una encuesta donde se les pide indicar el nmero de amigos o parientes que
visitan cuando menos una vez al mes. Los resultados son los siguientes:
3 5 2 3 3 4 1 8 4
2 4 2 5 3 3 3 0 3
5 6 4 3 2 2 6 3 5
4 14 3 5 6 3 4 2 4
9 4 1 4 2 4 3 5 0
4 3 5 7 3 5 6 2 2
7. El gerente de un negocio de comida rpida esta interesado en el nmero de veces que
un cliente compra en su tienda durante un periodo de dos semanas. Las respuestas de
los 51 clientes fueron:
5 3 3 1 4 4 5 6 4 2 6 6 6 7 1 1 14
1 2 4 4 4 5 6 3 5 3 4 5 6 8 4 7 6
5 9 11 3 12 4 7 6 5 15 1 1 10 8 9 2 12
2.3. PROBLEMAS 24
8. El presidente de una agencia de viajes, quiere informacin sobre las edades de la gente
que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero
el ao pasado revel estas edades:
77 18 63 84 38 54 50 59 54 56
36 26 50 34 44 41 58 58 53 51
62 43 52 53 63 62 62 65 61 52
60 45 66 83 71 63 58 61 71 60
9. Una cadena de tiendas de artculos deportivos al servicio de esquiadores principiantes,
planea hacer un estudio de cuanto gasta un esquiador principiante en su primera com-
pra de equipo. Una muestra de recibos de sus cajas registradoras revel esas compras
iniciales.
140 82 265 168 90 114 172 230 142 86 125
235 212 171 149 156 162 118 139 149 132 105
162 126 216 195 127 161 135 172 220 229 129
87 128 126 175 127 149 126 121 118 172 126
10. Se conduce un estudio de los efectos de fumar sobre los patrones de sueo. La medicin
que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos
datos:
69 56 22 28 41 28 47 53 48
30 34 13 52 34 60 25 21 37
43 23 13 31 29 38 26 36 30
11. Un banco seleccion una muestra de 40 cuentas de cheques de estudiantes. Abajo
aparecen sus saldos de n de mes.
404 74 234 149 279 215 123 55 43 321
87 234 68 489 57 185 141 758 72 863
703 125 350 440 37 252 27 521 302 127
968 712 503 498 327 608 358 425 303 203
12. Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los sigu-
ientes datos son las cuentas que se les factur el mes pasado:
54 48 58 50 25 47 75 46 60 70
67 68 39 35 56 66 33 62 65 67
13. Una muestra de suscriptores de una compaa telefnica revel los siguientes nmeros
de llamadas recibidas en la ltima semana.
52 43 30 38 30 42 12 46
39 37 34 46 32 18 41 5
Captulo 3
Medidas de tendencia central
Promedios
A las medidas de tendencia central con frecuencia se les llama promedios. El propsito
de una medida de tendencia central es indicar con toda precisin el centro de un conjunto de
observaciones.
3.1. La Media
3.1.1. La Media Geomtrica
La media geomtrica es til para encontrar el promedio de porcentajes, proporciones,
ndices, o tasas de crecimiento. Tiene mucha aplicacin en el comercio y la economa porque
nos interesa encontrar el porcentaje de cambio en ventas, salarios o datos econmicos como el
producto nacional bruto. La media geomtrica de un conjunto de "n"nmeros enteros positivo
se dene como la n-sima raz del producto de los n valores es decir:
n
_
X
1
, X
2
, . . . , X
n
Ejemplo 3.1.1 Suponga que usted recibe un 5% de aumento en su salario este ao y un
15% de aumento el ao prximo y quiere saber cual es el incremento porcentual promedio.
Si tiene un aumento del 5% entonces su salario es 1,05 y si tiene un aumento del 15%
su salario es de 1,15 entonces calculando la media geomtrica se obtiene
_
(1, 05)(1, 15) =
1, 09886, por lo que el aumento promedio anual es del 9, 886%.
Ejemplo 3.1.2 Las ganancias obtenidas por Atkins Construction Company en cuatro proyec-
tos recientes fueron 3%, 2%, 4% y 6%. Cul es la media de las ganancias?
Por lo que la media de ganancias obtenidas por Atkins Construction Company en los
cuatro proyectos esta dada por
4
_
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464
o sea 3,464%
25
3.1. LA MEDIA 26
3.1.2. La Media Aritmtica
La medida de tendencia central mas ampliamente usada es la media aritmtica, usual-
mente abreviada como media.
La media aritmtica de un conjunto de n valores (observaciones) es el resultado de la
suma de todos ellos dividido entre n.
3.1.3. Propiedades de la media aritmtica
1. Puede ser calculada en distribuciones con escala relativa e intervalar.
2. Todos los valores son incluidos en el cmputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy til para comparar dos o ms poblaciones.
5. Es la nica medida de tendencia central donde la suma de las desviaciones de cada
valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media
como el punto de balance de una serie de datos.
3.1.4. Desventajas de la media aritmtica
1. Si alguno de los valores es extremadamente grande o extremadamente pequeo, la
media no es el promedio apropiado para representar la serie de datos.
2. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase
abiertos.
3.1.5. La media para datos no agrupados
Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores
dividido entre el nmero total de valores. Para encontrar la media de una muestra se usa la
siguiente frmula:
X =
n

i=1
X
i
n
Donde:
X : es la media de la muestra
n

i=1
X
i
: es la suma de todos los valores de la muestra
n : es el nmero de elementos de la muestra
Ejemplo 3.1.3 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria
de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la media
aritmtica de estas observaciones?
3.1. LA MEDIA 27
X =
n

i=1
X
i
n
=
85, 4+85, 3+84, 9+85, 4+84, 0
5
= 85, 0
3.1.6. La media para datos agrupados
Frecuentemente los datos ests agrupados y presentados en forma de distribucin de fre-
cuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales. Por
consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en base
a la distribucin de frecuencias.
La media aritmtica de una muestra de datos organizados en una distribucin de frecuen-
cias se calcula de la siguiente manera:
X =
f
i
X
i
n
Donde:
X : simboliza la media de la muestra
X
i
: es la marca de clase del intervalo i-simo
f
i
: es la frecuencia de clase del intervalo i-simo

f
i
X
i
: es la suma de los productos de f
i
por X
i
n =

f : es la suma de las frecuencias de clase


Ejemplo 3.1.4 Calcular la media aritmtica de la siguiente distribucin de frecuencia del
nmero de meses de duracin de una muestra de 40 bateras para coche.
duracin de las bateras (meses) Nmero de bateras
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 - 39 10
40 - 44 5
45 - 49 3
Damos como un hecho que ya sabemos elaborar una distribucin de frecuencias, si se
quiere ver como se elabor vaya a la seccin de ese tema en este mismo sitio.
Primeramente, de la distribucin de frecuencias que ya tenemos, utilizaremos las mar-
cas de clases y la frecuencias de clases, para despus calcular el producto f
i
X
i
y proceder
3.2. LA MEDIANA 28
nalmente a calcular la sumatoria

f
i
X
i
y aplicar la frmula.
LI LS X
i
f
i
f
i
X
i
15 19 17 2 34
20 24 22 1 22
25 29 27 4 108
30 34 32 15 480
35 39 37 10 370
40 44 42 5 210
45 49 47 3 141
n =40

f
i
X
i
= 1365
X =
f
i
X
i
n
=
1365
40
= 34, 12
3.1.7. La media de la poblacin
Las medidas caractersticas de una muestra son llamadas estadsticos y las medidas car-
actersticas de una poblacin se denominan parmetros. La media de la poblacin se calcula
de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente
notacin:
=
N

i=1
X
i
N
Donde:
: es la media de la poblacin
N

i=1
X
i
: es la suma de todos los valores de la poblacin
N : es el nmero de elementos de la poblacin
3.2. La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la
media aritmtica no es representativa. El valor central en tales problemas puede ser mejor
descrito usando una medida de tendencia central llamada mediana.
La mediana es el punto medio de los valores de una serie de datos despus de haber
sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como
posteriores en el arreglo de datos.
Ejemplo 3.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la mediana de
las observaciones muestreadas?
3.2. LA MEDIANA 29
85,9
85,4
85,4

X
84,3
84,0
Por lo que la mediana es

X = 85, 4
Ejemplo 3.2.2 Una muestra de los honorarios de paramdicos cargados por la clnica Balti-
more revel las siguientes cantidades: 35,29, 30,25, 32,35. Cul es la mediana?
25
29
30

X
32
35
35
En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales

X =
30+32
2
= 31
3.2.1. Propiedades de la mediana
1. Hay solo una mediana en una serie de datos.
2. No es afectada por los valores extremos ( altos o bajos )
3. Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se
encuentra en el intervalo abierto.
4. Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.
3.2.2. La mediana para datos agrupados
Cuando los datos se encuentran agrupados en una distribucin de frecuencia no conoce-
mos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes
pasos:
1. Calcular el valor
n
2
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano).
Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada
es igual o mayor que
n
2
.
3.2. LA MEDIANA 30
3. Aplicando la siguiente frmula con los valores del intervalo mediano:

X = LRI +
(
n
2
FA)tic
F
Donde:

X : mediana de la muestra
LRI : Limite real inferior del intervalo mediano
FA : frecuencia acumulada anterior a la frecuencia del intervalo mediano
tic : tamao de los intervalos de clase
F : frecuencia del intervalo mediano
Ejemplo 3.2.3 Calcular mediana de la siguiente distribucin de frecuencia del nmero de
meses de duracin de una muestra de 40 bateras para coche.
Duracin de las bateras (meses) Nmero de bateras
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 - 39 10
40 - 44 5
45 - 49 3
Para calcular la mediana de una distribucin de frecuencias necesitamos obtener el in-
tervalo el intervalo mediano para luego obtener el lmite superior real (LSR), la frecuencia
acumulada anterior a la frecuencia de la mediana (FA) y la frecuencia absoluta de la mediana
(F).
Procedamos entonces a localizar el intervalo mediano a travs de los siguientes pasos
1. El valor de
n
2
=
40
2
= 20
2. El intervalo mediano es:
LI LS LSR X F FA
15 19 19,5 17 2 2
20 24 24,5 22 1 3
25 29 29,5 27 4 7
30 34 34,5 32 15 22 intervalo mediano
35 39 39,5 37 10 32
40 44 44,5 42 5 37
45 49 49,5 47 3 40
3.3. LA MODA 31
Aplicar la frmula con los datos del intervalo mediano:

X = LRI +
(
n
2
FA)tic
F
= 29, 5+
(207)(5)
15
= 33, 83
3.3. La moda
La moda es la medida de tendencia central especialmente til para describir mediciones
de tipo ordinal y nominal. Es el valor de la observacin que aparece ms frecuentemente.
3.3.1. Propiedades de la moda
1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, in-
tervalar, y relativa).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
3.3.2. Desventajas de la moda
1. En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
2. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse
cual es el valor representativo de la serie de datos?
Ejemplo 3.3.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la moda de las
observaciones muestreadas?
La moda de esta secuencia de observaciones es

X=85,4
3.3.3. La moda para datos agrupados
Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada sigu-
iendo los siguientes pasos:
1. Localizar la clase del intervalo que contenga la frecuencia de clase ms grande.
2. Aplicando la siguiente frmula con los valores del intervalo de la moda:

X = LRI +
_

1

1
+
2
_
tic
Donde:

X : la moda de los datos de la muestra


LRI : Limite real inferior de la clase modal
3.3. LA MODA 32

1
: diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.

2
: diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior.
tic : tamao de los intervalos de clase
Si hay dos intervalos contiguos con frecuencia mxima la moda ser la media aritmtica
de las dos marcas de clases. Si hay dos o ms intervalos no contiguos con frecuencia de clase
mxima habr dos o ms modas que sern las marcas de clases de dichos intervalos.
Ejemplo 3.3.2 Calcular las modas de las siguientes distribuciones de frecuencia:
X F
5 4
10 3
15 15

X= 15
20 9
25 10
30 7
X F hay dos moda
5 4
10 8

X= 10
15 6
20 7
25 8

X =
(25+30)
2
= 27, 5
30 8
X F no hay moda
5 4
10 4
15 4
20 4
25 4
30 4
3.3.4. Comparacin entre medidas de tendencia central
Si no hay ningn argumento de peso en contra, se preferir siempre la media. Hay dos
razones para apoyar esta norma general. La primera es que en ella se basan otros estadsticos
y la segunda es que es mejor estimador de su parmetro que la mediana y la moda.
Hay al menos tres situaciones en las que se preferir la mediana a la media:
Cuando la variable est medida en escala ordinal
Cuando haya valores extremos que distorsionen la interpretacin de la media
3.4. PROBLEMAS 33
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de
lmite superior, el intervalo inferior carece de lmite inferior o ambos.
La media es extremadamente sensible a las puntuaciones y un cambio en slo una de ellas
supone un cambio en la media aritmtica, mientras que la mediana slo se vera alterada por
cambios en los valores centrales.
La mediana ser la segunda candidata para representar la tendencia central y se preferir
la mediana a la moda, a menos de que:
a) Se trate de una variable medida en escala nominal
b) Haya intervalos abiertos y la mediana pertenezca a uno de ellos.
3.3.5. Relacin entre las medidas de tendencia central
1. Para una distribucin simtrica los valores de la media, la mediana y la moda coinciden
es decir: X =

X =

X, con lo cual la distribucin de datos no presenta sesgo.
Observacin : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximacin en funcin del grado de simetra de la curva que represente grcamente
la distribucin.
2. Para una distribucin asimtrica negativa se tiene que: X <

X <

X, con lo cual la
distribucin de datos presenta un sesgo negativo.
3. Para una distribucin asimtrica positiva se tiene que:

X <

X < X, con lo cual la dis-
tribucin de datos presenta un sesgo positivo.
Observacin: La regla emprica se acepta como vlida siempre que el grado de curva
no sea muy acentuado.
3.4. Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimien-
to mensual (en pulgadas) de muestras de maz recien plantados
0,4 1,9 1,5 0,9 0,3 1,6 0,4 1,5 1,2 0,8
0,9 0,7 0,9 0,7 0,7 1,5 0,5 1,5 1,7 1,8
a) Organice los datos en un ordenamiento ascendente
b) calcula las medidas de tendencia central considerando los a datos como simples
2. Un fabricante de neumticos quiere determinar el dimetro interior de cierto grado de
los neumticos. Idealmente el dimetro sera 570mm. Los datos son los siguientes:
572 572 573 568 569 575 565 570
Encuentre las medidas de tendencia central y analice la relacin entre ellas
3.4. PROBLEMAS 34
3. A continuacin presentamos los datos de una muestra de la tasa de produccin diaria
de de botes de bra de vidrio de la Hidrosport Lt. Un fabricante de Miami.
17 21 18 27 17 21 20 22 18 23
a) Calcule las mediadas de tendencia central e interprete los resultados
b) Compare las mediadas de tendencia central
4. Dada la distribucin de frecuencia de rentas mensuales de 200 departamentos (en miles
de pesos)
Renta mensual (en miles de pesos) N
o
de departamentos
350-379 3
380-409 8
410-439 10
440-469 13
470-499 33
500-529 40
530-559 35
560-589 30
590-619 16
620-649 12
Total 200
Determine las medidas de tendencia central y analice la relacin entre ellas
5. las edades de 60 personas que trabajan en una fbrica textil se han tabulado dando la
siguiente tabla de frecuencias:
Edades N
o
de personas
13-17 2
18-22 6
23-27 10
28-32 13
33-37 18
38-42 6
43-47 2
48-52 2
53-57 16
Total 60
a) Hallar las mediadas de tendencia central
b) Interpretar los resultados de la parte a)
c) Comparar las mediadas de tendencia central
Captulo 4
Medidas de Variabilidad
4.1. Introduccin
Qu son las medidas de variabilidad?
Las medidas de variabilidad de una serie de datos, muestra o poblacin, permiten iden-
ticar que tan dispersos o concentrados se encuentran los datos respecto a una medida de
tendencia central.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar
una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una
medida de variabilidad pequea indica que los datos estn agrupados muy cerca, digamos, de
la media. La media, por lo tanto es considerada bastante representativa de la serie de datos.
Inversamente, una gran medida de variabilidad indica que la media no es muy representativa
de los datos.
Una segunda razn para estudiar la variabilidad de una serie de datos es para comparar
como estn esparcidos los datos en dos o ms distribuciones. Por ejemplo, la calicacin
promedio de dos estudiantes, A = {90, 80, 75, 75} y B = {90, 55, 85, 90}, es de 80. Basados
en esto podramos pensar que sus calicaciones son idnticas. Pero si revisamos el detalle de
sus calicaciones vemos que esta conclusin no es correcta.
4.2. Variabilidad
4.2.1. Rango y rango intercuartlico
Denicin 4.2.1 : Amplitud o Rango
Es la diferencia entre observaciones extremas, es decir la diferencia entre el mayor y el
menor valor. Es muy sensible a los valores extremos.
Ejemplo 4.2.1 Dadas las siguientes observaciones 2,1,4,3,8,4. Calcular el rango
R = 81 = 7
Denicin 4.2.2 : Rango intercuartlico
35
4.2. VARIABILIDAD 36
Es parecida al rango, pero eliminando las observaciones ms extremas o sea las inferiores
y superiores. Por lo que no es tan sensible a valores extremos. Es la distancia entre primer y
tercer cuartil.
Rango intercuartil = Q
3
Q
1
(4.2.1)
4.2.2. Desviacin media
La desviacin media mide la cantidad promedio que varan los datos respecto a su media.
Es la media aritmtica de los valores absolutos de las desviaciones de los datos respecto a su
media. La frmula de la desviacin media ( Dm ) es:
Dm =
n

i=1
|X
i
X|
n
(4.2.2)
Ejemplo 4.2.2 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria
de la lnea de produccin son (en ml): 85,4 ; 85,3; 84,9 ; 85,4 y 84,0. Cul es la desviacin
media de las observaciones muestreadas?
X X X |X X|
85,4 + 0.4 0.4
85,4 + 0.4 0.4
85,3 + 0.3 0.3
84,9 - 0.1 0.1
84,0 - 1.0 1.0
Dm =
n

i=1
|X
i
X|
n
=
2, 2
5
= 0, 44
4.2.3. Desviacin media para datos agrupados
En el caso de que los datos se encuentren agrupados en una distribucin de frecuencia la
frmula es :
Dm =

f
i
|X
i
X|
n
(4.2.3)
Ventajas y desventajas de la desviacin media
La desviacin media tiene dos ventajas. Utiliza para su cmputo todos los elementos de
la serie de datos y es fcil de entender. Sin embargo, es difcil trabajar con valores absolutos
y por ello la desviacin media no es usada frecuentemente.
Cuando la suma de las desviaciones parciales absolutas es igual a cero, la desviacin
media no es una medida de variabilidad aceptable. Por ejemplo, tenemos dos series de datos:
A ={0, 50, 100} y B ={49, 50, 51}
4.2. VARIABILIDAD 37
Claramente observamos que la serie B tiene una dispersin mayor que la serie A, sin
embargo en ambos casos la desviacin media es cero.
4.2.4. Varianza y desviacin estndar
La varianza y la desviacin estndar sirven para cuanticar la variabilidad de una muestra
midiendo su dispersin alrededor de la media.
Varianza
Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media.
Desviacin estndar
Es la raz cuadrada de la varianza.
Varianza y desviacin estndar para datos no agrupados
Las frmulas de la varianza de una poblacin y de una muestra son ligeramente diferentes.
Las frmulas son:

2
=
N

i=1
(X
i
)
2
N
=
N

i=1
X
2
i
N

2
(4.2.4)
para la varianza de una poblacin y
S
2
=
n

i=1
(X
i
X)
2
n
=
n

i=1
X
2
i
n
X
2
(4.2.5)
para la varianza de una muestra.
Las desviaciones estndar de la poblacin y muestra se calculan simplemente sacando la
raz cuadrada a la respectiva varianza.
=
_

2
(4.2.6)
desviacin estndar de una poblacin y
S =

S
2
(4.2.7)
desviacin estndar de una muestra
Ejemplo 4.2.3 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85,4; 85,3; 84,9; 85,4; y 84,0. Cul es la varianza y la
desviacin estndar de las observaciones muestreadas?
4.2. VARIABILIDAD 38
X X
2
85,4 7293,16
85,3 7276,09
84.9 7208,01
85.4 7293.16
84.0 7056.00
X
i
= 425, 0 X
2
= 36126, 42
Con lo cual la media de la muestra es
X =
425, 0
5
= 85
entonces la varianza est dada por
S
2
=
n

i=1
X
2
i
n
X
2
=
36126, 42
5
85
2
= 0, 284
la cual arroja una desviacin estndar muestral de
S = 0, 595818764
Varianza y desviacin estndar para datos agrupados
Si los datos estn agrupados en una distribucin de frecuencia, la varianza y la desviacin
estndar de la muestra se pueden aproximar sustituyendo S f
i
X
2
i
por SX
2
i
y S f
i
X
i
por SX
i
. Las
frmulas quedaran de la siguiente manera:

2
=
N

i=1
f
i
(X
i
)
2
N
=
N

i=1
f
i
X
2
i
N

2
(4.2.8)
para la varianza de una poblacin, en donde =
N

i=1
f
i
X
i
N
, y
S
2
=
n

i=1
f
i
(X
i
X)
2
n
=
n

i=1
f
i
X
2
i
n
X
2
(4.2.9)
para la varianza de una muestra, en donde X =
n

i=1
f
i
X
i
n
Al igual que en la situacin anterior las desviaciones estndar de la poblacin y muestra
se calculan sacando la raz cuadrada a la respectiva varianza.
=
_

2
(4.2.10)
desviacin estndar de una poblacin y
4.3. PROBLEMAS 39
S =

S
2
(4.2.11)
desviacin estndar de una muestra
Ejemplo 4.2.4 Calcular la varianza y la desviacin estndar de la siguiente distribucin de
frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche.
duracin de las bateras (meses) Nmero de bateras
15 - 19 2
20 - 24 1
25 - 29 4
30 - 34 15
35 - 39 10
40 - 44 5
45 - 49 3
Primeramente, calculamos la marca de clase, para despus calcular los productos f
i
X
i
y
f
i
X
2
i
para proceder nalmente a calcular las sumatorias f
i
X
i
y f
i
X
2
i
y aplicar las frmulas.
LI LS X f
i
f
i
X
i
f
i
X
2
i
15 19 17 2 34 588
20 24 22 1 22 484
25 29 27 4 108 2916
30 34 32 15 480 15360
35 39 37 10 370 13690
40 44 42 5 210 8820
45 49 47 3 141 6627
n =40 f
i
X
i
= 1365 f
i
X
2
i
= 48475
Entonces la media de la muestra es
X =
1365
40
= 34, 125
con lo cual la varianza muestral es
S
2
=
n

i=1
f
i
X
2
i
n
X
2
=
48475
40
(34, 125)
2
= 47, 359375
que arroja una desviacin estndar de
S = 6, 881814804
4.3. Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueos. La medi-
cin que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene
4.3. PROBLEMAS 40
estos datos:
Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 52,7 34,4 60,2 43,8
No fumadores 28,6 25,1 26,4 34,9 29,8 38,5 30,2 30,6 31,8 41,6
a) Encuentre las medidas de tendencia central para cada grupo
b) Encuentre la varianza y desviacin estndar de cada grupo
c) Diga cual de los dos grupos de datos est ms concentrada
2. La compaa National Tire tiene fondos de reserva en valores negociable a corto plazo.
El saldo diario de cierre (en millones de dlares) de la cuenta de valores negociables
en lapso de dos semanas es el que mostramos a continuacin
Semana 1 1973 1970 1972 1975 1976
Semana 2 1969 1892 1893 1887 1895
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resul-
tados obtenidos.
b) Calcula la desviacin media, la varianza, la desviacin tpica y el coeciente de
variacin de cada grupo.
c) Diga cual de los grupos tiene mejor concentracin
Captulo 5
Probabilidad
5.1. Introduccin
La teora de probabilidad tuvo como uno de sus primeros puntos de partida el intentar
resolver un problema particular concerniente a una apuesta de juego de dados entre dos per-
sonas. El problema al que nos referimos involucraba una gran cantidad de dinero y puede
plantearse de la siguiente forma: Dos jugadores escogen cada uno de ellos un nmero del 1
al 6, distinto uno del otro, y apuestan 32 doblones de oro a que el nmero escogido por uno
de ellos aparece en tres ocasiones antes que el nmero del contrario al lanzar sucesivamente
un dado. Suponga que el nmero de uno de los jugadores ha aparecido dos veces y el nmero
del otro una sola vez. Cmo debe dividirse el total de la apuesta si el juego se suspende?
Uno de los apostadores, Antonio de Gombaud, popularmente conocido como el caballero
De Mere, deseando conocer la respuesta al problema plantea a Blaise Pascal (1623-1662) la
situacin. Pascal a su vez consulta con Pierre de Fermat (1601-1665) e inician un intercambio
de cartas a propsito del problema. Esto sucede en el ao de 1654. Los historiadores de
la matemtica stan generalmente de acuerdo en considerar este hecho como el origen del
estudio de las probabilidades. Con lo anteriormente mencionado se inician algunos esfuerzos
por dar solucin a ste y otros problemas similares que se plantean. Con el paso del tiempo
se sientan las bases y las experiencias necesarias para la bsqueda de una teora matemtica
que sintetice los conceptos y los mtodos de solucin de los muchos problemas particulares
resueltos a lo largo de varios aos.
Las ideas de probabilidades permanecen circunscritas a los problemas de juegos de azar
hasta que Pierre Laplace (1749-1827) y Friedrich Gauss (1777-1855) hacen notar que las
teorias desarrolladas son aplicables tambin a otras actividades diferentes de los juegos de
azar. En el segundo congreso internacional de matemticas, celebrado en la ciudad de Paris
en el ao 1900, el matemtico David Hilbert (1862-1943) plantea 23 problemas matemticos
de importancia. Uno de estos problemas es el de encontrar axiomas o postulados a partir
de los cuales se pueda construir una teora matemtica de la probabilidad. Aproximada-
mente treinta aos despus, en 1933, el matemtico ruso Andrei Nikolaevich Kolmogorov
(1903-1987) propone ciertos axiomas basados en la teora de la medida desarrollada por
H. Lebesgue(1875-1941), que a la postre resultaron adecuados para la construccin de una
teora de la probabilidad. Esta teora prevalece hoy en da y ha adquirido el calicativo de
teora clsica. Actualmente la teora clsica de la probabilidad se ha desarrollado y exten-
41
5.2. DEFINICIONES Y EJEMPLOS 42
dido enormemente gracias a muchos pensadores que han contribudo a su crecimiento, y es
sin duda una parte importante y bien establecida de las matemticas. Ha resultado til para
resolver problemas puramente matemticos, pero sobre todo y principalmente, para modelar
situaciones reales o imaginarias, en donde el azar es relevante.
5.2. Deniciones y ejemplos
Denicin 5.2.1 Experimento: Es cualquier procedimiento mediante el cual obtenemos
una observacin. En particular, para el estudio de la probabilidad nos interesa observar aque-
llos experimentos cuyos resultados no son pronosticables con certeza , esto es aquellos exper-
imentos tales que cuando se les repite bajo las mismas condiciones iniciales, el resultado que
se obtiene no siempre es el mismo, es decir aquellos en que existe aleatoriedad. Este tipo de
experimento se denomina experimentos aleatorios simbolizado por .
Ejemplo 5.2.1 A continuacin presentamos algunos ejemplos posibles de experimentos
Lanzamiento de una moneda
Tomar un punto de un circulo
Elegir un alumno en el campus para preguntarle cuntos libros ha solicitado a prsta-
mo en la biblioteca universitaria durante el ltimo mes.
Contar el nmero de cabellos en la cabeza de una persona.
Medir la resistencia elctrica de un componente electrnico
Denicin 5.2.2 Espacio Muestral: Es el conjunto de todos los resultados individuales
que puede tener un experimento aleatorio. El espacio muestral simbolizado por puede no
ser nico. A cada uno de los elementos del espacio muestral se le llama punto muestral.
Denicin 5.2.3 Evento: Es cualquier resultado posible al realizar un experimento aleato-
rio. Si un evento tiene un nico elemento, se le llama evento simple. En general, a cualquier
subconjunto del espacio muestral se le llama evento compuesto.
Ejemplo 5.2.2 Si un experimento aleatorio consiste en lanzar un dado y observar el nmero
que aparece en la cara superior, entonces claramente el espacio muestral es el conjunto
= {1; 2; 3; 4; 5; 6}. Como ejemplo de un evento para este experimento podemos denir el
conjunto A ={2; 4; 6}, que corresponde al suceso de obtener como resultado un nmero par.
Si al lanzar el dado una vez se obtiene el nmero 4, decimos entonces que se observ la ocur-
rencia del evento A, y si se obtiene por ejemplo el resultado 1, decimos que no se observ la
ocurrencia del evento A.
Ejemplo 5.2.3 Considere el experimento aleatorio de participar en un juego de lotera. Supon-
ga que hay un milln de nmeros en esta lotera y un jugador participa con un boleto.
Cul es un posible espacio muestral para este experimento?. Naturalmente al jugador le
interesa conocer su suerte en este juego y puede proponer como espacio muestral el conjunto
={ganar; perder}. Sin embargo puede tambin tomarse como espacio muestral el conjun-
to que contiene a todos los posibles nmeros de esta lotera, es decir, ={1; 2; :::; 1000000}.
5.3. OPERACIONES ENTRE EVENTOS 43
Este ejemplo sencillo muestra que el espacio muestral de un experimento aleatorio no es
nico y depende del inters del observador.
Puesto que los conceptos de espacio muestral y evento involucran forzosamente la termi-
nologa de conjuntos, recordaremos a continuacin algunas operaciones entre estos objetos, y
algunas propiedades que nos seran de utilidad en el estudio de la probabilidad y la estadtica.
5.3. Operaciones entre eventos
Interseccin
La interseccin de dos eventos dados A y B de un espacio muestral ; es el conjunto de
resultados de un experimento aleatorio que pertenece a los dos eventos dados. El smbolo de
la interseccin es .
Figura 5.1: Representacin grca de la interseccin de dos eventos
Unin
La unin de dos eventos dados A y B de un espacio muestral ; es el conjunto de re-
sultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El
smbolo de la unin es .
Figura 5.2: Representacin grca de la unin de dos eventos
5.4. DEFINCIONES DE PROBABILIDAD 44
Complemento
El complemento de un evento A de un espacio muestral ; es el conjunto de resultados de
un experimento aleatorio que no pertenece a dicho evento dado. El smbolo del complemento
es

.
Figura 5.3: Representacin grca de complementos de eventos
Diferencia
Diferencia de dos eventos A y B de un espacio muestral ; es el conjunto de resultados
de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el
signo "menos"().
Figura 5.4: Representacin grca de la diferencia de dos eventos
5.4. Denciones de probabilidad
La teora de la probabilidad es la parte de las matemticas que se encarga del estudio de
los fenmenos o experimentos aleatorios. La probabilidad de un evento A, es un nmero real
en el intervalo [0; 1] que denotaremos por P(A), y representa una medida de la frecuencia
con la que se observa la ocurrencia del evento A cuando se efecta el experimento aleatorio
en cuestin. Existen al menos cuatro deniciones de probabilidad las cuales explicamos a
continuacin.
5.4. DEFINCIONES DE PROBABILIDAD 45
5.4.1. Concepto Clsico de Probabilidad
El primero en dar una denicin clsica de probabilidad fue Jakob Bernoulli en 1713,
reformulada despus por Abraham De Moivre como: una fraccin; en la que el numerador
es igual al nmero de apariciones del suceso dado y el denominador es igual al nmero total
de casos en los que es suceso pueda o no pueda ocurrir. Tal fraccin expresa la probabilidad
de que ocurra el suceso dado.
El enfoque clsico de la probabilidad est basado en la suposicin de que todos los resul-
tados del experimento son igualmente posibles o tienen el mismo peso. La denicin clsica
de la probabilidad es la siguiente: Sea A un subconjunto de un espacio muestral de cardi-
nalidad nita. Se dene la probabilidad del evento A como el cociente:
P(A) =
#A
#
(5.4.1)
lo que usualmente se expresa como
P(A) =
nmero de casos favorables al evento A
nmero total de resultados posibles del experimento
en donde el smbolo #A denota la cardinalidad o nmero de elementos del conjunto A. Clara-
mente esta denicin es slo vlida para espacios muestrales nitos, pues forzosamente nece-
sitamos suponer que el nmero de elementos en es nito. El espacio muestral debe ser
equiprobable como ya se mencion, pues para calcular la probabilidad de un evento A da-
do, nicamente necesitamos contar cuntos elementos tiene A respecto del total, sin importar
exactamente qu elementos particulares sean.
Ejemplo 5.4.1 El experimento consiste en el lanzamiento de un dado. Cul es la probabi-
lidad de que se obtenga como resultado un dos?
Las caras del dado estn numeradas del 1 al 6, entonces hay solo una posibilidad de entre
un total de seis de que el resultado del experimento sea el nmero 2, entonces la probabilidad
de obtener el nmero 2 es
P(cae 2) =
1
6
= 0, 16667
La principal dicultad que presenta esta interpretacin de la probabilidad es que se basa
en sucesos equiprobables (todos los posibles resultados tienen la misma probabilidad de ocur-
rencia ), siendo fcil para problemas sencillos, como los de cartas, dados o urnas, es casi
imposible para problemas ms complejos.
5.4.2. Concepto frecuentista de probabilidad
Bernoulli resolvi la cuestin de cmo hallar la probabilidad de ocurrencia de un suceso
aun siendo imposible contar los casos favorables:
Aqu hay otro camino disponible para alcanzar el resultado deseado. Lo que no se puede
hallar a priori se puede obtener a posteriori, es decir, mediante la observacin mltiple de los
resultados de pruebas similares.
5.4. DEFINCIONES DE PROBABILIDAD 46
De esta manera, Bernoulli introdujo el concepto de probabilidad frecuentista o estads-
tica que consiste en asignar como probabilidad de un suceso, el resultado que se obtendra
si el proceso se repitiera en condiciones similares un nmero grande de veces. Por lo tanto
supongamos que se realizan n repeticiones de un cierto experimento aleatorio y sea A un
evento cualquiera. Denotemos por n(A) el nmero de veces que ocurre el evento A en las
n realizaciones del experimento. Se dene entonces la probabilidad frecuentista de A como
indica el siguiente lmite
P(A) = lm
n
n(A)
n
En este caso, debemos hacer notar que no es humanamente posible llevar a cabo una in-
nidad de veces el experimento aleatorio, de modo que en la prctica no es posible encontrar
mediante este mecanismo la probabilidad de un evento cualquiera. Esta limitacin hace que
esta denicin de probabilidad no sea enteramente formal, pero tiene algunas ventajas.
Ejemplo 5.4.2 Se quiere saber si una moneda est cargada. Para determinar la probabilidad
de que caiga cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cay cara. Si
aplicamos la frmula
P(cae cara) =
25
60
= 0, 4167
Algunas dicultades que presenta este enfoque de la probabilidad es que no dice cual es
el nmero grande de observaciones necesario, o que se entiende por condiciones similares,
porque si las condiciones son las mismas los resultados sern tambin los mismos.
5.4.3. Probabilidad subjetiva
En el segundo cuarto del siglo XX surgi una nueva interpretacin de la probabilidad lla-
mada subjetiva, segn la cual la probabilidad mide el grado de creencia de un individuo en
la verdad de una proposicin, variando entre 0 (el individuo cree que es falso) a 1 (cree que es
cierto), es decir de lo que el observador conoce del fenmeno en estudio. Esta interpretacin
fue propuesta por primera vez por el lsofo Frank P. Ramsey. Para los subjetivistas la pro-
babilidad de un suceso debe variar en funcin de la nueva informacin recibida respecto del
suceso.
Segn este enfoque la probabilidad de que un evento en particular suceda es asignada
basndose en cualquier informacin disponible, como intuicin, opiniones etc.
Ejemplo 5.4.3 Cul es la probabilidad de que un cierto equipo de ftbol gane en su prx-
imo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o
cualquier otra condicin externa, son elementos que slo algunas personas conocen y que
podran darnos una idea ms exacta de esta probabilidad.
5.4.4. Concepto axiomtico de probabilidad
En la denicin axiomtica de la probabilidad no se establece la forma explcita de calcu-
lar las probabilidades sino nicamente se proponen las reglas que el clculo de probabilidades
debe satisfacer. Esta teora axiomtica de la probabilidad fue desarrollada por el matemtico
ruso Andrei N. Kolmogorov basandose como dijimos en la introduccin de este captulo en
5.5. TEOREMAS DE PROBABILIDAD 47
la teora de la medida estructurada por H. Lebesgue. El modelo matemtico propuesto por
Kolmogorov en el ao 1933 para estudiar los experimentos aleatorios es el llamado espacio
de probabilidad .
Axiomas de Probabilidad
Axioma 1: P(A) 0, con A
Axioma 2: P() = 1
Axioma 3: Si A
1
, A
2
, , tales que A
i
A
j
= / 0, con i distintos de j, entonces
P(

n=1
) =

n=1
P(A
i
)
5.5. Teoremas de Probabilidad
5.5.1. Teorema 1: Regla de la Adicin
La probabilidad de que alguno de dos eventos pertenecientes a un mismo espacio muestral
ocurra se determina mediante la siguiente ecuacin:
P(AB) = P(A) +P(B) P(AB)
Ejemplo 5.5.1 Si el experimento es lanzar un dado una vez, el espacio muestral es:
S ={1, 2, 3, 4, 5, 6}
Si el evento A es el resultado es un nmero par entonces
A ={2, 4, 6}
Si el evento B es el resultado es un nmero menor de 3
B ={1, 2}
Cul ser la probabilidad de que suceda alguno de estos dos eventos?
La probabilidad de que ocurra A y la probabilidad de que ocurra B son respectivamente:
P(A) =
3
6
=
1
2
y P(B) =
2
6
=
1
3
Para aplicar este teorema es necesario conocer la probabilidad de la interseccin de es-
tos dos eventos, para as poder conocer la probabilidad de la unin, o de manera inversa,
conociendo la probabilidad de la unin se puede calcular la probabilidad de la interseccin.
En este caso queremos saber la probabilidad de la unin conociendo la probabilidad de
la interseccin, entonces es necesario conocer la interseccin de estos dos eventos, que es
nmero par y menor de 3, con lo cual
AB ={2}
5.5. TEOREMAS DE PROBABILIDAD 48
por lo que P(AB) =
1
6
Si aplicamos la regla de adicin:
P(AB) = P(A) +P(B) P(AB)
P(AB) =
1
2
+
1
3

1
6
=
2
3
5.5.2. Teorema 2: Regla de la complementacin
La probabilidad de que el complemento de un evento A ocurra est dada por la siguiente
ecuacin:
P(A) = 1P(A)
Ejemplo 5.5.2 Si A es cae cara en el experimento consistente en lanzar un moneda, entonces
la probabilidad de que no caiga cara es:
P(A) = 1P(A) = 1
1
2
=
1
2
5.5.3. Teorema 3: Regla de Diferenciacin
La probabilidad de que un evento dado A ocurra pero no ocurra otro evento dado B
pertenecientes al mismo espacio muestral est dada por
P(AB) = P(A) P(AB)
Ejemplo 5.5.3 Si el evento A es cae un nmero par y si el evento B es cae un nmero
menor de 3, ambos pertenecientes al espacio muestral = {1, 2, 3, 4, 5, 6} que resulta del
experimento aleatorio consistente en el lanzamiento de un dado, entonces la probabilidad de
que caiga un nmero par pero no es menor que tres es:
P(AB) = P(A) P(AB) =
3
6

1
6
= 0, 3333
Y la probabilidad de que caiga un nmero menor que tres pero no sea par es:
P(BA) = P(B) P(AB) =
2
6

1
6
= 0,167
5.5.4. Probabilidad Condicional
La probabilidad condicional, es la probabilidad de que un evento dado ocurra dado que
otro evento ocurre. El operador de la probabilidad condicional es el signo |, esto es, la proba-
bilidad condicional del evento A dado que ha ocurrido el evento B, denotada por P(A|B), se
dene como sigue:
P(A|B) =
P(AB)
P(B)
5.5. TEOREMAS DE PROBABILIDAD 49
Ejemplo 5.5.4 Considere el experimento de extraer un naipe de un mazo de 40 (baraja es-
paola), sean los eventos A ={se extrae un as} y B ={el naipe extraido es de copas}. Calcu-
lar P(A|B)
Como en el mazo de 40 barajas hay un solo as de copas y 10 naipes de copas en total se
tiene que
P(AB) =
1
40
y P(B) =
10
40
=
1
4
entonces la probabilidad de que ocurra A dado que se sabe que ocurri B es
P(A|B) =
P(AB)
P(B)
=
1
40
1
4
=
1
10
5.5.5. Teorema 4: Reglas de Multiplicacin
Regla de multiplicacin para eventos independientes
Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de ocur-
rencia del otro. Para dos eventos independientes A y B, la probabilidad de que ambos eventos
sucedan es encontrada mediante la multiplicacin de sus respectivas probabilidades, esto es
P(AB) = P(A) P(B)
Ejemplo 5.5.5 Una maquina empaca vegetales en una bolsa de plstico. Experiencias ante-
riores revelan que en ocasiones los paquetes tienen menos del peso correcto, y en otras ms,
pero la mayora de las veces tiene el peso satisfactorio. Como muestra la siguiente tabla:
Peso Probabilidad
debajo del correcto 0,025
correcto 0,900
arriba del correcto 0,075
Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los
tres pesen correctamente. Establezcamos los siguientes eventos:
A ={el primer paquete pesa correctamente}
B ={el segundo paquete pesa correctamente}
C ={el tercer paquete pesa correctamente}
La probabilidad de cada uno de estos eventos independientes es:
P(A) = 0, 900
P(B) = 0, 900
P(C) = 0, 900
Segn el teorema de multiplicacin la probabilidad de que los tres eventos ocurran es:
P(ABC) = P(A) P(B) P(C) = (0, 900) (0, 900) (0, 900) = 0, 729
5.5. TEOREMAS DE PROBABILIDAD 50
Regla de multiplicacin para probabilidad condicional
Para dos eventos A y B, donde A depende de la ocurrencia de B, la probabilidad de que
sucedan ambos eventos est dada por la frmula:
P(AB) = P(B) P(A|B)
Ejemplo 5.5.6 Cierto departamento de una compaa esta compuesto por 8 hombres y 4
mujeres, de entre ellos se va elegir al nuevo jefe del departamento, para lo cual se entrevistar
a dos de ellos. Si todos tienen la misma probabilidad de ser elegidos, cual es la probabilidad
de que las dos personas entrevistadas sean mujeres?
Denamos entonces los siguientes eventos
A ={el primer entrevistado es mujer}
B ={el segundo entrevistado es mujer}
La probabilidad de que suceda el evento A ={el primer entrevistado es mujer} es:
P(A) =
4
12
=
1
3
La probabilidad de que suceda el evento B = {el segundo entrevistado es mujer} dado
que ya sucedi A, y solo hay tres mujeres de 11 elementos es:
P(B|A) =
3
11
Segn el teorema de multiplicacin, la probabilidad de que los dos eventos ocurran es:
P(AB) = P(A) P(B|A) =
1
3

3
11
=
1
11
Teorema de Bayes
En el siglo XVIII el reverendo Thomas Bayes, un ministro presbiteriano ingls, se hi-
zo esta pregunta: realmente existe Dios?. Siendo el, un entusiasta matemtico se evoc a
desarrollar una frmula para encontrar la probabilidad de que Dios existe, basndose en la
evidencia disponible sobre la tierra. Aos despus de la muerte de Bayes, Laplace desarrol-
l el trabajo del reverendo, y por vez primera, se logra la determinacin de la probabilidad
de las causas a partir de los efectos que han podido ser observados. El clculo de dichas
probabilidades recibe el nombre de teorema de Bayes. La frmula del teorema de Bayes es:
P(A
1
|B) =
P(A
1
)P(B|A
1
)
P(A
1
)P(B|A
1
) +P(A
2
)P(B|A
2
) +... +P(A
n
)P(B|A
n
)
Ejemplo 5.5.7 : Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y
Consuelo. Andrea realiza el 50% de los cobros, Bianca el 30% y Consuelo el 20%. Cuando
cobra Andrea hay un 1% de probabilidad de que lo haga mal, cuando lo hace Bianca hay un
2% de que cobre mal, y si cobra Consuelo hay un 3% de probabilidad de que se equivoque.
Un cliente se quej con Don Pepe porque le cobraron mal. Cul es la probabilidad de que
el mal cobro lo haya hecho Andrea?
5.6. PROBLEMAS 51
Para responder a la pregunta vamos a considerar los siguientes eventos:
M ={se hizo un mal cobro}
A ={el cobro fue hecho por Andrea}
B ={el cobro fue hecho por Bianca}
C ={el cobro fue hecho por Consuelo}
De los eventos anteriores podemos obtener las siguientes probabilidades:
P(A) = 0, 5 P(B) = 0, 3 P(C) = 0, 2
P(M|A) = 0, 01 P(M|B) = 0, 02 P(M|C) = 0, 03
Utilizando el teorema de Bayes para encontrar la probabilidad de que el cobro lo haya
hecho Andrea dado que fue un mal cobro, tenemos que
P(A|M) =
P(A)P(M|A)
P(A)P(M|A) +P(B)P(M|B) +P(C)P(M|C)
Sustituyendo los valores:
P(A|M) =
(0, 5)(0, 01)
(0, 5)(0, 01) +(0, 3)(0, 02) +(0, 2)(0, 03)
=
0, 005
0, 017
= 0, 2941
5.6. Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fu-
man, que 350 consumen bebidas alcohlicas y que 250 tienen estos dos hbitos nocivos
para la salud. Cul es la probabilidad de que un estudiante seleccionado aleatoria-
mente
a) tenga alguno de estos dos malos hbitos?
b) no tenga ninguno de estos dos psimos hbitos?
c) fume pero no tome?
d) tome pero no fume?
e) No fume?
f) Fume dado que toma?
g) Toma dado que fuma?
h) No tenga alguno de estos nefastos hbitos?
2. La probabilidad de que una compaa norteamericana ubique una de sus plantas en
Jurez es 0,7, la probabilidad de que instale una planta en Chihuahua es 0,4, la probabi-
lidad de que no se ubique ni en Jurez ni en Chihuahua es 0,20. Cul es la probabilidad
de que
a) Se ubique en alguna de estas dos ciudades?
5.6. PROBLEMAS 52
b) Se ubique en ambas ciudades?
c) No se ubique en alguna de estas dos ciudades?
d) Se ubique en Chihuahua pero no en Jurez?
e) Se ubique en Jurez pero no en Chihuahua?
f) Ubique una planta en Jurez dado que ya se ubic en Chihuahua?
g) Ubique una planta en Chihuahua dado que ya se ubic en Jurez?
3. En cierta escuela de 45 estudiantes que reprobaron Estadsticas I, 32 dijeron que repro-
baron por no estudiar, 18 porque no le entienden al maestro, 9 por causas diferentes a
estas dos. Encuentre la probabilidad de los siguientes eventos:
a) Reprob porque no estudi o porque no le entiende al maestro
b) Reprob porque no estudi y porque no le entiende al maestro
c) Reprob porque no estudi y no porque no le entiende al maestro
d) Reprob porque no le entiende al maestro y no porque no estudi
4. Se realiz una encuesta sobre preferencias en materia de peridicos, de 350 personas
entrevistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos peridicos.
Encontrar la probabilidad de los siguientes eventos:
a) Lee alguno de estos dos peridicos
b) No lee ninguno de estos dos peridicos
c) Lee el Diario pero el Heraldo no
d) Lee el Heraldo pero el Diario no
e) Lee el Heraldo dado que lee el Diario
f) Lee el Diario dado que lee el Heraldo
g) No lee alguno de estos dos Peridicos
5. La probabilidad de que en un matrimonio, el esposo vea cierto programa de TV es 0.4,
la probabilidad de que la esposa lo haga es de 0.5. La probabilidad de que el esposo
vea el programa de TV dado que la esposa lo hace es de 0.7. Encuentre la probabilidad
de que:
a) Ambos vean el programa de TV
b) Alguno de los dos vea el programa de TV
c) Ninguno vea el programa de TV
d) El esposo vea el programa pero la esposa no
e) La esposa vea el programa pero el esposo no
f) La esposa vea el programa dado que el esposo lo hace
g) Alguno de los dos no ve el programa
5.6. PROBLEMAS 53
6. El profesor Ramos tiene muchos aos impartiendo la clase de matemticas, por expe-
riencia sabe que el 80% de los estudiantes contestan los problemas que les encarga de
tarea. Tambin sabe que el 90% de los estudiantes que hacen la tarea aprueban el curso
y que el 60% de los estudiantes que no hacen la tarea reprueban. Manuel aprob el
curso, cual es la probabilidad de que hizo la tarea?
7. Un equipo de bisbol juega el 70% de las veces de noche y el 30% de da. Ellos ganan
el 50% de los juegos nocturnos y el 90% de los juegos diurnos. El da de ayer ganaron,
cual es la probabilidad de que el juego fue en la noche?
8. El 30% de las ventas de una tienda departamental son en efectivo, el 30% son pagadas
con cheque en el momento de la compra y el 40% son a crdito. El 20% de las compras
en efectivo, 90% de las compras con cheque y el 60% de las compras a crdito son
mayores a $500. En este momento se est realizando una compra por $1000, cual es la
probabilidad de que sea en efectivo?
9. Una urna contiene 5 bolillas blancas, 4 negras, 6 rojas y 10 verdes. Se extrae una bolilla
de la urna. Calcular la probabilidad de que:
a) la bolilla extrada sea blanca Respuesta: 0,20
b) la bolilla extrada no sea verde Respuesta: 0,60
c) la bolilla extrada no sea ni roja ni negra Respuesta: 0,60
d) la bolilla extrada sea negra Respuesta: 0,16
10. Cierta poblacin de 1500 habitantes, fue clasicado, segn su nacionalidad, resultando:
950 paraguayos, 200 espaoles, 300 italianos y 50 franceses. Si se elige un habitante
al azar, calcular la probabilidad de que:
a) resulte de habla castellana Respuesta: 0,77
b) resulte extranjero Respuesta: 0,77
11. Se arrojan dos monedas. Calcular la probabilidad de obtener:
a) una cara Respuesta: 0,50
b) dos caras Respuesta: 0,25
c) mas de dos caras Respuesta: 0,00
d) ninguna cara Respuesta: 0,25
12. Se arroja un dado. Calcular la probabilidad de obtener:
a) un nmero par, mayor de 3 Respuesta: 0,33
b) un nmero impar Respuesta: 0,5
13. Se arrojan simultneamente tres monedas. Calcular la probabilidad de obtener:
a) exactamente 2 caras Respuesta :0,375
b) 2 o mas caras Respuesta :0,50
c) mas de 2 caras Respuesta :0,125
5.6. PROBLEMAS 54
d) a lo sumo 2 caras Respuesta :0,875
14. De un conjunto de 21 tarjetas numeradas del 1 al 21, se extrae una al azar. Calcular la
probabilidad de que la tarjeta extraida un nmero:
a) sea mltiplo de 3 o de 7 Respuesta: 0,4762
b) sea mltiplo de 5 o de 7 Respuesta: 0,3333
c) sea mltiplo de 4 o de 11 Respuesta: 0,2857
d) sea par o mltiplo de 3 Respuesta: 0,8095
e) sea mltiplo de 3 o de 4 Respuesta: 0,5714
f) sea mltiplo de 3 o de 5 Respuesta: 0,5238
15. Supngase que el Seor Gmez planea salir la noche del sbado prximo. Las proba-
bilidades de que baya a un juego de baloncesto, al cine o a una carrera de caballo son
0,35; 0,30 y 0,20 respectivamente. Determinar la probabilidad de que:
a) haga cual quiera de estas tres cosas Respuesta: 0,85
b) que no haga ninguna de estas tres cosas Respuesta: 0,15
16. En un grupo de colegio han suspendido las matemticas el 60% de los nios, fsica el
50% y ambas asignaturas el 20%. Calcular la probabilidad de que elegido un nio al
azar, haya suspendido las matemticas, la fsica o ambas. Respuesta:0,90
17. Durante una semana dada las probabilidades de que unas acciones aumenten su precio,
permanezcan constantes o disminuyan su precio son estimados en 0,30; 0,20 y 0,50
respectivamente.
a) Cul es la probabilidad que estas acciones aumenten su precio o permanezcan
sin cambios? Respuesta: 0,50
b) Cul es la probabilidad de que esas acciones, el precio cambie durante las sem-
ana? Respuesta: 0,80
18. Suponga que el 80% de los norteamericanos, que pasan vacaciones en Europa visitan
Paris, el 70% Berln y el 60% visitan Paris y Berln.
a) Cul es la probabilidad de que un norteamericano que pasa vacaciones en Eu-
ropa visite Paris o Berln o ambos? Respuesta: 0,90
b) Cul es la probabilidad de que no visite ninguna de esas ciudades? Rta: 0,10
19. Suponga que la probabilidad de que llegue a asistir a una universidad es 0,60, la proba-
bilidad de que trabaje tiempo completo es 0,70, la probabilidad de que llegue a asistir
a una universidad y trabaje tiempo completo es 0,50. Cul es la probabilidad de que
asista a una universidad o trabaje tiempo completo? Respuesta: 0,80
20. Una caja contiene 10 esferas, 5 de ellas son blancas, 3 rojas y 2 negras. Se selecciona
aleatoriamente esferas de la caja sin reemplazo:
a) Si se extraen dos esferas de la caja. Cul es la probabilidad de que las 2 esferas
blancas? Respuesta: 0,2222
5.6. PROBLEMAS 55
b) Si se extraen dos esferas de la caja. Cul es la probabilidad de que extraer una
roja y despus una negra? Respuesta: 0,0667
c) Si se extraen 3 esferas de la caja Cul es la probabilidad de que las tres sean
rojas? Respuesta: 0,0083
d) Si se extraen 3 esferas de la caja. Cul es la probabilidad de extraer una negra,
despus una roja y nalmente una blanca? Respuesta: 0,0417
21. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos
al azar. Cul es la probabilidad de que:
a) los 2 sean defectuosos Respuesta: 0,091
b) ninguno de los 2 sean defectuosos Respuesta: 0,4242
22. Se tiene tres urnas, la primera contiene 50 bolas rojas y 50 bolas blancas; la segunda 60
bolas amarillas y 40 blancas, la tercera 70 bolas verdes y 30 blancas. Si se selecciona
aleatorimente una de las urnas y se extraen dos bolas con reposicin:
a) Cul es la probabilidad de que ninguna sea blanca? Respuesta: 0,3667
b) Cul es la probabilidad de que ambas sean blancas? Respuesta: 0,1667
23. Se arrojan dos dados legales. Calcular la probabilidad de que:
a) ocurra una suma de 7 puntos Respuesta:0,1667
b) ocurra una suma de 2 o 3 puntos Respuesta:0,0833
c) ocurra una suma de menos de 5 puntos Respuesta:0,1667
d) ocurra una suma de al menos 10 puntos Respuesta:0,1667
24. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sis-
temas en una gran empresa en el ultimo ao. 40 contaban con experiencia laboral
previa y 30 tenan titulo profesional. Sin embargo 20 de los solicitantes tenan tanto
experiencia laboral como titulo profesional, de modo que han sido incluidos en ambos
conteos.
a) Cul es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea
experiencia laboral o titulo profesional o ambos? Respuesta: 0,50
b) Cul es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea
experiencia laboral o titulo profesional pero no ambos? Respuesta: 0,30
25. De 300 estudiantes de administracin 100 estn actualmente inscritos en contabilidad
y 80 estn actualmente inscritos en estadstica aplicada a la administracin. Estas cifras
de inscripcin incluyen a 30 estudiantes inscritos en ambos cursos.
a) Cul es la probabilidad de que un estudiante aleatoriamente elegido este inscrito
ya sea en contabilidad o en estadstica o en ambos? Respuesta: 0,50
b) Cul es la probabilidad de que un estudiante aleatoriamente elegido este inscrito
ya sea en contabilidad o en estadstica pero no en ambos? Respuesta: 0,40
5.6. PROBLEMAS 56
26. En una caja hay 15 lapiceras con las plumas en buen estado, de los cuales 5 no tienen
tinta, adems 6 lapiceras con las plumas rotas. Al sacar una lapicera. Calcular la pro-
babilidad de que la lapicera no escriba. Respuesta: 0,5238
27. Para la sealizacin de emergencia se ha instalado dos indicadores que funcionan in-
dependientemente; la probabilidad de que un indicador se accione durante la avera es
igual a 0,95 para el primero y 0,90 para el segundo. Hallar las siguientes probabilidades
que durante una avera:
a) accione solo un indicador Respuesta: 0,14
b) accione por lo menos un indicador Respuesta: 0,995
28. Una caja contiene 20 unidades de cierto producto electrnico, 4 de ellos son defec-
tuosos y 16 son buenas. Se seleccionarn aleatoriamente 4 unidades y se vendern.
Obtngase la probabilidad de que:
a) las cuatro unidades vendidas sean defectuosos Respuesta:
1
4845
b) entre las cuatro unidades vendidas 2 sean buenas Respuesta:
48
323
c) se vendan al menos tres unidades defectuosas Respuesta:
13
969
29. De 12 cuentas contables que se tienen en un archivo, 4 contienen un error de pro-
cedimientos en la elaboracin de los saldos:
a) Si el auditor elige al azar 2 cuentas. Cul es la probabilidad de que ninguna
cuenta contenga error de procesamiento? Respuesta:
14
33
b) Si el auditor elige al azar 3 cuentas. Cul es la probabilidad de que ninguna
cuenta contenga error de procesamiento? Respuesta:
14
55
c) Si el auditor muestrea 2 cuentas. Cul es la probabilidad de que las cuenta
elegidas contenga errores? Respuesta:
1
11
d) Si el auditor muestrea 2 cuentas. Cul es la probabilidad de que al menos una
de ellas contenga error? Respuesta:
19
33
e) Si el auditor muestrea 3 cuentas. Cul es la probabilidad de que al menos una
de ellas contenga error? Respuesta:
41
55
29. En un deposito hay 3000 cajas de plumas de las marcas A, B, C, D y E y en ellas hay
cajas de plumas deterioradas. Las cajas se distinguen de la siguiente manera:
Marca A: hay 200 cajas: 50 son deterioradas
Marca B: hay 300 cajas: 40 son deterioradas
Marca C: hay 1000 cajas: 300 son deterioradas
Marca D: hay 800 cajas: 80 son deterioradas
Marca E: hay 700 cajas: 30 son deterioradas
Si se elige una caja al azar, y resulta deteriorada, calcular la probabilidad de que
pertenezca:
a) a la marca A Respuesta: 0,1
5.6. PROBLEMAS 57
b) a la marca B Respuesta: 0,08
c) a la marca C Respuesta: 0,6
d) a la marca A o D Respuesta: 0,26
e) a la marca B o E Respuesta: 0,24
30. La urna A tiene 2 boletines rojos y 3 azules; la urna B contiene 4 rojas y 1 azul y la urna
C 3 rojas y 4 azules. Se selecciona aleatoriamente una urna y un boletn es extrado y
que resulta ser rojo. Hallar la probabilidad de haber escogido:
a) la urna A Respuesta:
14
57
b) la urna B Respuesta:
28
57
c) la urna C Respuesta:
5
19
d) la urna A o B Respuesta:
14
19
e) la urna A o C Respuesta:
29
57
31. Un agente de una compaa de seguros vende plizas a 5 personas, todas de edad idn-
tica y con buena salud. De acuerdo con la tabla de los actuarios la probabilidad de que
una persona de esta edad especica est viva en 30 aos es
2
3
. Hallar la probabilidad
de que en 30 aos estn vivas:
a) las 5 personas Respuesta:
32
243
b) al menos 3 personas Respuesta:
64
81
c) solamente 2 personas Respuesta:
40
243
d) al menos una persona Respuesta:
242
243
32. En una exhibicin canina, 3 de los 10 perros premiados deben seleccionarse para que
aparezcan en un comercial de comida para perros. Se han otorgados premios a tres
cooles, cuatro pastores alemn, dos perros galeces y un perro de agua.
a) Cual es la probabilidad de que los tres perros elegidos sean de la misma raza?
Respuesta: 0,042
b) Cual es la probabilidad de que se seleccionen dos cooles y un pastor alemn?
Respuesta: 0,10
33. Una caja con guantes de bisbol contiene 2 guantes para jugadores zurdos y 7 para
diestros. Si se seleccionan 3 guantes al azar:
a) Cul es la probabilidad de que los tres sean para jugadores diestros?
Respuesta: 0,417
b) Cul es la probabilidad de que se escogiera un guante para un jugador diestro y
2 para zurdos? Respuesta: 0,083
34. En una caja hay 18 artculos de los cuales cuatro son defectuosas. Si se extrae aleatori-
amente tres artculos al mismo tiempo. Calcular las siguientes probabilidades
a) los tres artculos sean buenos Respuesta: 0,4461
5.6. PROBLEMAS 58
b) no mas de dos artculos sean defectuosos Respuesta: 0,9951
c) al menos dos artculos sern buenos Respuesta: 0,8922
35. Un distribuidor recibe un embarque de 24 aparatos de televisin, de los cuales 6 son
defectuosas. El distribuidor selecciona cuatro aparatos del embarque para ponerlos en
exhibicin. Obtngase la probabilidad de que:
a) 2 de los 4 aparatos sean defectuosas Respuesta: 0,216
b) no hay mas de 2 defectuosas en los 4 aparatos Respuesta: 0,9647
36. Un vendedor de automviles acaba de recibir un embarque de 20 automviles nuevos
de los cuales 15 son sedan y 5 convertibles. Si se venden aleatoriamente 2 automviles.
Cul es la probabilidad de que los 2 vendidos sean del mismo modelo? Rta:
23
38
37. Un articulo se produce utilizando los componentes A y B. La probabilidad de que A
tenga defectos es 0,03 y la probabilidad de que B tenga defectos es 0,02. Cul es la
probabilidad de que el producto tenga defectos despus de armado? Rta: 0,0494
38. La probabilidad de que un hombre vivir 10 aos ms es
1
4
y la probabilidad de que su
esposa vivir 10 aos mas es
1
3
. Hallar la probabilidad de que:
a) ambos estn vivos dentro de 10 aos Respuesta: 0,0833
b) al menos uno estar vivo a los 10 aos Respuesta: 0,50
c) ninguno estarn vivos a los 10 aos Respuesta: 0,50
d) solamente la esposa estar viva a los 10 aos Respuesta: 0,25
39. La probabilidad de que en los hogares de una poblacin tengan lava vajilla es 0,40 y
de que tengan video es de 0,30. Calcular las siguientes probabilidades:
a) que tengan lava vajilla y video Respuesta: 0,12
b) que tengan lava vajilla o tengan video Respuesta: 0,58
c) que en tres hogares elegidos al azar haya lava vajilla Respuesta: 0,064
d) que en dos hogares haya dos lava vajilla o dos videos Respuesta: 0,25
40. Se extrae tres cartas de un mazo de 40. Calcular las siguientes probabilidades:
a) Que sean de distintos palos Respuesta: 0,4049
b) sota, caballo y rey en ese orden Respuesta: 0,00108
c) a lo sumo dos copas Respuesta: 0,988
41. De un baraja espaola de 40 naipes bien mezcladas, se saca 4 naipes sucesivamente.
Hallar la probabilidad de que:
a) sean un as y tres reyes Respuesta: 0,000175
b) dos sean reyes y dos sotas Respuesta: 0,000394
42. De una baraja de 40 naipes bien mezcladas, se sacan al azar 5 cartas. Hallar la proba-
bilidad de que:
5.6. PROBLEMAS 59
a) 4 sean sotas Respuesta: 0,000055
b) al menos uno sea un as Respuesta: 0,4271
c) tres sean caballos y tres reyes Respuesta: 0,0000365
43. Se extraen 5 cartas de una baraja de 52 cartas. Hallar la probabilidad de extraer:
a) 4 aces Respuesta:
1
54145
b) 4 aces y un rey Respuesta:
1
649740
c) 3 dieses y dos jotas Respuesta:
1
108290
d) un nueve, diez, jota, reina y rey en cualquier orden Respuesta:
64
162435
e) al menos un as Respuesta:
18472
54145
44. El 80% de la poblacin es morena y el 70% es de ojos oscuro. Si se selecciona una
persona al azar, calcular la probabilidad de:
a) no ser de piel morena o tener los ojos oscuros Respuesta: 0,76
b) ser de piel morena y tener los ojos oscuros Respuesta: 0,56
45. En una zapatera hay tres estanteras A, B y C, la primera tiene 50 pares de zapatos
negros y 25 marrones, la segunda tiene 40 de cada color y la ultima 20 negros y 30
marrones. Si un cliente no tiene preferencia especial respecto a las estanteras ni re-
specto al color elige un par de zapatos y es marrn. Calcule la probabilidad de que
proceda de la estantera B. Respuesta:
15
43
46. Dos seres humanos y ocho elefantes se sientan al azar entorno a una mesa circular.
Calcular la probabilidad de que los humanos esten juntos. Respuesta:
47. Si A y B son dos sucesos tales que P(A) = 0, 6 y P(B) = 0, 7. Calcular: P(AB) y
P(AB) sabiendo que P(AB) P(AB) = 0, 4 Respuesta: P(AB) = 0, 8 y
P(AB) =0,5 o P(AB) = 0, 5 y P(AB) = 0, 8
48. Al lanzar un dado al aire, sea A el suceso de obtener un mltiplo de 3 y B el suceso de
obtener un nmero par. Justicar si los sucesos son o no independientes. Respuesta:
Son independientes
49. Un jugador lleva en el bolsillo dos monedas, una normal y otras con dos caras. Elige al
azar una de las monedas y la lanza al aire.
Calcular la probabilidad de que caiga cara Respuesta:
Si el resultado es cara, calcular la probabilidad de haber elegido la moneda con
dos caras Respuesta:
50. De los 250 empleados de una compaa, 130 fuman cigarrillos. Hay 150 hombres que
trabajan en esta compaa de los cuales 85 fuman cigarrillos. Cul es la probabilidad
de que un empleado seleccionado en forma aleatoria,
no fume cigarrillo?
5.6. PROBLEMAS 60
sea mujer y fume cigarrillo?
sea hombre o fume cigarrillo?
digamos que se encuentra con una empleada de la compaa. Cul es la proba-
bilidad de que no fume cigarrillo?
51. Se desea determinar si hay una relacin entre el inters de un estudiante por la estads-
tica y su capacidad para las matemticas, se selecciona una muestra aleatoria de 200
estudiantes y se les pregunta si su capacidad para las matemticas y su inters por la
estadstica es bajo, promedio o alto. Los resultados fueron como sigue:
Inters en estadstica Capacidad para las matemticas
Bajo Promedio Alto Total
Bajo 60 15 15 90
Promedio 15 45 10 70
Alto 5 10 25 40
Total 80 70 50 200
Si se selecciona un estudiante al azar, cul es la probabilidad de que l o ella:
tenga alta capacidad para las matemticas?
tenga un inters promedio para la estadstica?
tenga baja capacidad para las matemticas y bajo inters promedio en la estads-
tica?
Suponga que se sabe que la persona seleccionada tiene alta capacidad para las
matemticas, cul es la probabilidad de que tenga un alto inters en la estadsti-
ca?
52. Una moneda esta cargada de modo que la posibilidad de salir cara (H) sea el doble de
salir sello (S). Hallar P(H) y P(T) Respuesta:
53. Tres caballos A, B y C intervienen en una carrera; A tiene el doble de posibilidad de
ganar que B; y B el doble de ganar que C. Cul ea la probabilidad de ganar, esto es;
P(A), P(B) y P(C)? Respuesta:
54. Dos hombres y tres mujeres intervienen en un torneo de ajedrez. Los del mismo sexo
tienen igual probabilidad de ganar pero cada hombre tiene el doble de probabilidad de
ganar que una mujer.
Hallar la probabilidad de una mujer gane el torneo Respuesta:
Si y son casados, hallar la probabilidad de que uno de ellos gane el torneo. Re-
spuesta:
55. Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos castaos. Hallar la probabilidad de que una persona
escogida al azar sea un hombre o tenga los ojos castaos. Respuesta:
56. La probabilidad de que A de en el blanco es 0,4 y la de B es 0,5. Si A y B disparan,
Cul es la probabilidad de que uno de ellos pegue en el blanco? Respuesta:
5.6. PROBLEMAS 61
57. Se escogen al azar dos dgitos desde del conjunto {1, 2, 3, ...., 9}. Si la suma es par,
hallar la probabilidad de que ambos sean nmeros impares. Respuesta:
58. Se escogen al azar tres lamparas entre 15 de las cuales 5 son defectuosos. Hallar la
probabilidad de que:
ninguna sea defectuosa Respuesta:
una por lo menos sea defectuosa Respuesta:
59. Se selecciona al azar dos cartas entre 10 cartas numeradas de 1 a 10. Hallar la proba-
bilidad de que la suma sea impar si:
las dos cartas se sacan juntas Respuesta:
se sacan una tras otra sin reposicin Respuesta:
se sacan una tras otra con reposicin Respuesta:
60. Una clase tiene 12 nios y 4 nias. Se seleccionan tres estudiantes de la clase al azar.
Cul es la probabilidad de que todas sean nias? Respuesta:
61. En cierta facultad, 4% de los hombres y 1% de las mujeres tienen ms de 6 pies de
estatura . Adems, 60% de los estudiantes son mujeres. Ahora bien si se selecciona al
azar un estudiante y es ms alto que 6 pies, Cul es la probabilidad de que el estudiante
seleccionado sea mujer? Respuesta:
62. Una caja contiene tres monedas; una de las monedas es corriente, otra tiene dos caras
y la tercera esta cargada de modo que la probabilidad de obtener cara sea 0,6 . Se
selecciona una de las monedas y se lanza al aire. Hallar la probabilidad de que salga
cara. Respuesta:
63. Una urna contiene 3 bolas rojas y 7 blancas. Se saca una bola de la urna y se reemplaza
por una de otro color. Se saca de la urna una segunda bola.
Hallar la probabilidad de que la segunda bola sea roja Respuesta:
Si ambas son del mismo color. Cul es la probabilidad de que las dos sean
blancas? Respuesta:
64. Se nos da dos urnas como sigue: La urna A contiene 3 bolas rojas y 2 bolas blancas y la
urna B contiene 2 bolas rojas y 5 bolas blancas. Se selecciona al azar una urna; se saca
una bola y se coloca en la otra urna, luego se saca una bola de la segunda urna. Hallar
la probabilidad de que las dos bolas sacadas sean del mismo color. Respuesta:
65. En una carretera entre las ciudades A y B hay tres semforos, a una distancia de unos
kilmetros entre si. Los ciclos de los mismos son de un minuto cada uno. Los tres
semforos estn prendidos en verde durante 30, 40 y 50 segundos respectivamente.
Suponiendo que un auto observa los reglamentos de transito. Calcular la probabilidad
de que el auto:
haga el viaje sin parar por causa del semforo Respuesta:
deba parar exactamente ante un semforo Respuesta:
5.6. PROBLEMAS 62
deba parar exactamente ante dos semforos Respuesta:
deba parar en todos los semforos Respuesta:
66. La suma de las probabilidades de que tres hombres H
1
, H
2
y H
3
peguen en el blanco es
0,95. Adems la posibilidad de que H
1
de en el blanco es el doble de que lo haga H
2
y
H
2
tiene la misma posibilidad de dar en el blanco que H
3
, cada uno dispara una vez al
blanco.
Hallar la probabilidad de que exactamente uno de ellos pegue en el blanco. Re-
spuesta:
Si solo un pega en el blanco. Cul es la probabilidad de que sea el primer
hombre? Respuesta:
67. La probabilidad de que cierto componente electrnico funcione es de 0,90. Un aparato
contiene dos de estos componentes. El aparato funciona si por lo menos uno de los
componentes funciona.
Sin importar cual de los componentes funcione o no. Cules son los posibles
resultados? ( Puede suponer independencia en la operacin de los componentes).
Cul es la probabilidad de que el aparato no funcione Respuesta: 0,99
Captulo 6
Variables aleatorias
6.1. Deniciones y ejemplos
Denicin 6.1.1 Una variable aleatoria es aquella que toma un conjunto de valores numri-
cos asociados a los resultados de nuestro inters que produce un experimento aleatorio, es
decir una funcin que asocia a cada evento del espacio muestral un nmero real.
La denicin anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio
muestral asociado a dicho experimento, una variable aleatoria es una transformacin X del
espacio de resultados (espacio muestral) al conjunto de nmeros reales, esto es, asigna a cada
elemento , un nmero real X(). La expresin matemtica est dada por:
X : R
Figura 6.1: Representacin grca de la denicin de una variable aleatoria
A menudo se escribe simplemente v.a. en lugar del trmino variable aleatoria. En sen-
tido estricto una variable aleatoria es una funcin de en R que satisface adems cierta
condicin de medibilidad, pero omitiremos tales tecnicismos pues no son de utilidad para los
propsitos de este curso. Suponga entonces que se efecta el experimento aleatorio una vez
y se obtiene un resultado en R. Al transformar este resultado con la variable aleatoria X
se obtiene un nmero real X() = x. Podemos entonces suponer que los posibles resultados
del experimento aleatorio son los diferentes nmeros reales x que la funcin X puede tomar.
Haremos aqui la siguiente observacin importante. Seguiremos la notacin usual de usar la
letra mayscula X para denotar una variable aleatoria cualquiera, es decir, X es una funcin
de en R, mientras que la letra minscula x denota un nmero real y que es un posible valor
de la variable aleatoria. En general, las variables aleatorias se denotan usando las ltimas
63
6.1. DEFINICIONES Y EJEMPLOS 64
letras del alfabeto en maysculas, U,V,W, X,Y, Z, y para un valor cualquiera de ellas se usa
la misma letra pero en minscula.
Ejemplo 6.1.1 Si un experimento aleatorio consiste en lanzar una vez un dado equilibrado
y observar la cara superior del dado una vez que cae. Denotemos por 1,2,3,4,5 y 6 las
seis caras del dado. Es claro que el espacio muestral es ={1, 2, 3, 4, 5, 6}. Podemos denir
entonces la variable aleatoria X : R como X({1}) = 1 y X({2, 3, 4, 5, 6}) = 0 si
nuestro inters es el nmero de veces que se obtiene el 1 en este experimento.
Ejemplo 6.1.2 Consideremos el experimento aleatorio consistente en lanzar un dardo en
un tablero circular de radio uno. El espacio muestral o conjunto de posibles resultados del
experimento se puede escribir como sigue:
={(x, y) : x
2
+y
2
1}
Los siguientes son ejemplos de funciones de en R, variables aleatorias, asociadas a este
experimento aleatorio:
a) X(x, y) = x, proyeccin sobre el eje horizontal.
b) Y(x, y) = y, proyeccin sobre el eje vertical.
c) Z(x, y) =
_
x
2
+y
2
, distancia al centro del crculo.
d) V(x, y) =|x| +|y|, distancia del taxista.
e) W(x, y) = xy, producto de las coordenadas.
Figura 6.2: Representacin grca del espacio muestral del ejemplo 6.1.2
Considerando el conjunto de valores que una variable aleatoria puede tomar, se puede
clasicar a las variables aleatorias en dos tipos: discretas o continuas.
Denicin 6.1.2 Una variable aleatoria es discreta cuando el conjunto de valores que s-
ta toma es un conjunto discreto, es decir, un conjunto nito o numerable. Por ejemplo, el
conjunto {0, 1, 2, ..., n} es un conjunto discreto porque es nito, lo mismo N pues aunque es
innito, es numerable y por lo tanto discreto.
6.1. DEFINICIONES Y EJEMPLOS 65
Ejemplo 6.1.3 Un experimento aleatorio consiste en escoger a una persona al azar. La
variable aleatoria X evaluada en corresponde a conocer la siguiente caracterstica, o una
codicacin de esta caracterstica, de la persona escogida. En cada caso se trata de una vari-
able aleatoria discreta:
a) Edad en aos. b) Nmero de hijos. c) Peso. d) Estatura.
e) Sueldo. f) Nivel escolar. g) Estado civil. h) Lugar de nacimiento.
Denicin 6.1.3 Una variable aleatoria es continua cuando toma todos los valores dentro
de un intervalo (a, b) R.
Ejemplo 6.1.4 En el ejemplo del lanzamiento de un dardo en un tablero circular de radio
uno, el espacio muestral (Figura 6.1) es innito no numerable, las variables X,Y, Z,V y
W denidas all son todas variables aleatorias continuas. Si se dibujan crculos concntricos
alrededor del origen y si se asignan premios asociados a cada una de las regiones resultantes,
puede obtenerse un ejemplo de una variable aleatoria discreta sobre este espacio muestral.
La clasicacin anterior de variables aleatorias no es completa pues existen variables que
no son de ninguno de los dos tipos mencionados. Por simplicidad en este curso estudiaremos
nicamente variables aleatorias que son discretas o continuas.
Usaremos tambin la siguiente notacin importante: Si A es un subconjunto de R, en-
tonces la expresin (X A), incluyendo el parntesis, denota el conjunto {: X() A},
es decir, (X A) ={: X() A}. En palabras, la expresin (X A) denota aquel con-
junto de elementos de tales que bajo la aplicacin de la funcin X toman un valor dentro
del conjunto A. A este conjunto se le llama la imagen inversa de A, y se le denota por X
1
A.
Ejemplo 6.1.5 Consideremos el experimento de lanzar una moneda al aire y la variable
aleatoria X que lleva el resultado Cara al valor 0 y el resultado Cruz al valor 1. Tenemos
por ejemplo que (X [1, )) = {Cruz

} pues el conjunto de elementos de tales que bajo


la funcin X toman un valor mayor o igual a uno, es decir caen dentro del intervalo [1, ),
es nicamente el elemento Cruz. Por lo tanto P(X [1, )) = P{Cruz

} =
1
2
. Del mismo
modo puede vericarse que
a) P(X [1, 2)) = P({Cruz

}) =
1
2
.
b) P(X [0, 1)) = P({Cara

}) =
1
2
.
c) P(X [2, 4]) = P(/ 0) = 0.
d) P(X = 1) = P({Cruz

}) =
1
2
.
e) P(X 1) = P(/ 0) = 0.
f) P(X 0) = P() = 1.
Usaremos con mucha frecuencia la notacin arriba explicada. El lector debe asegurarse
de comprender bien que si x es un nmero real entonces (X x) es un subconjunto de y por
lo tanto un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x).
Podemos escribir entonces la igualdad de conjuntos (X x) (X > x) = . Y aplicando
probabilidad se obtiene:
P(X x) +P(X > x) = 1
6.2. DISTRIBUCIN DE PROBABILIDAD 66
Nota importante. A travs de una variable aleatoria se puede considerar que los posibles
resultados de un experimento aleatorio no son elementos en sino nmeros reales que la
variable aleatoria puede tomar. Esta es una consideracin radical pues ya no consideraremos
experimentos aleatorios particulares, ni espacios muestrales arbitrarios , ni eventos (sub-
conjuntos) de , en lugar de ello consideraremos que una cierta variable aleatoria de inters
toma valores en un cierto subconjunto de nmeros reales. La probabilidad denida antes para
subconjuntos de se traslada, como explicamos antes, a probabilidades para subconjuntos
de R. Esta perspectiva permite estudiar modelos generales y despus aplicarlos a cualquier
situacin particular. A partir de ahora y en lo que resta del curso el trmino variable aleatoria
constituir un elemento frecuente en los enunciados.
6.2. Distribucin de probabilidad
En esta seccin vamos a estudiar a las dos funciones que se asocian a cada variable aleato-
ria y que adems nos provean de informacin acerca de las caractersticas de dicha variable
aleatoria. Una de estas funciones es llamada funcin de distribucin y se asocia a una vari-
able continua o discreta, la otra depende del tipo de variable estudiada, en el caso continuo se
denomina funcin de densidad de probabilidad y en caso discreto simplemente funcin de
probabilidad. Estas funciones nos permiten representar a un mismo tiempo tanto los valores
que pueden tomar la variable aleatoria como las probabilidades de los distintos eventos in-
volucrados. Entonces en primer trmino deninamos primero la funcin de probabilidad para
una variable aleatoria discreta, despus la funcin de densidad para una variable continua, y
nalmente denamos la funcin de distribucin para ambos tipos de variables aleatorias.
Denicin 6.2.1 (Funcin de probabilidad para una variable discreta)
Sea X una variable aleatoria discreta que toma los valores x
1
, x
2
, . . . con probabilidades
respectivas P(X = x
1
), P(X = x
2
), . . . . Esta lista de valores numricos y sus probabilidades
puede ser nita o bien innita, pero numerable. La funcin de probabilidad de la variable
aleatoria X denotada por f (x) : R [0, ) se dene como sigue
f (x) =
_
P(X = x) si x = x
1
, x
2
, . . .
0 en otro caso
(6.2.1)
En palabras, la funcin de probabilidad es simplemente aquella funcin que indica los
valores de la probabilidad en los distintos valores que toma la variable aleatoria discreta.
Recordemos que es importante poder distinguir entre X y x, pues conceptualmente son cosas
muy distintas. Denotaremos generalmente a una funcin de probabilidad con la letra f mins-
cula. A veces escribiremos f
X
(x) y el subndice nos ayudar a especicar que tal funcin es
la funcin de probabilidad de la variable aleatoria X. Esta notacin ser particularmente til
cuando consideremos varias variables aleatorias a la vez.
6.2.1. Propiedades de la funcin de probabilidad
Si toda funcin de la forma (6.2.1) cumple las siguientes dos propiedades la llamaremos
funcin de probabilidad.
1) f (x) 0 para todo x R
6.2. DISTRIBUCIN DE PROBABILIDAD 67
2)

x
f (x) = 1
Ejemplo 6.2.1 Considere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con
probabilidades 0,3; 0,5 y 0,2 respectivamente. Entonces la funcin de probabilidad de X es
f (x) =
_
_
_
0, 3 si x = 1
0, 5 si x = 2
0, 2 si x = 3
Esta funcin se muestra grcamente en la Figura 6.2. Alternativamente podemos tam-
bin expresar esta funcin mediante la tabla mostrada ms abajo. En esta representacin se
entiende de manera implcita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3.
En particular, compruebe que las siguientes probabilidades son correctas:
P(X 2) = 0, 7 P(|X| = 1) = 0, 3 y P(X < 1) = 0
Figura 6.3: Representacin grca de la funcin del ejemplo 6.2.1
x 1 2 3
p(x) 0,3 0,5 0,2
Ejemplo 6.2.2 Encontremos el valor de la constante c que hace que la siguiente funcin sea
de probabilidad.
f (x) =
_
cx si x = 0, 1, 2, 3
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especicada, son 0, 1, 2 y 3, con
probabilidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser
uno, obtenemos la ecuacin c +2c +3c = 1. De aqui obtenemos c =
1
6
. Este es el valor de c
que hace que f (x) sea no negativa y sume uno, es decir, una funcin de probabilidad.
Denicin 6.2.2 (Funcin de densidad para una variable aleatoria continua)
Sea X una variable aleatoria continua. Decimos que la funcin integrable y no negativa
f (x) : R [0, ) es la funcin de densidad de X si para cualquier intervalo (a, b) de R se
cumple la igualdad
P(X (a, b)) =

b
a
f (x)dx
6.2. DISTRIBUCIN DE PROBABILIDAD 68
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se
puede calcular o expresar como el rea bajo la funcin de densidad en el intervalo (a, b).
De esta forma el clculo de una probabilidad se reduce al clculo de una integral. Vase
la Figura 6.4. No es difcil comprobar que toda funcin de densidad f (x) de una variable
aleatoria continua X cumple las dos propiedades que mencionamos a continuacin anlogas
al caso discreto.
Figura 6.4: Representacin grca de la probabilidad como un ara
6.2.2. Propiedades de la funcin de densidad de probabilidad
Si toda funcin de la forma f (x) : R [0, ) cumple las siguientes dos propiedades la
llamaremos funcin de densidad de probabilidad.
1) f (x) 0 para todo x R
2)

f (x)dx = 1
Toda funcin f (x) : R [0, ) que satisfaga estas dos propiedades, sin necesidad de
tener una variable aleatoria de por medio, se llamar funcin de densidad.
Ejemplo 6.2.3 La funcin f (x) dada por:
f (x) =
_

_
1
2
si x (1, 3)
0 en otro caso
es una funcin de densidad de una variable aleatoria continua que toma valores en el intervalo
(1, 3), y cuya grca aparece en la Figura 6.5. Observe que se trata de una funcin no negativa
y cuya integral vale uno.
Ejemplo 6.2.4 Encontrar el valor de la constante c que hace que la siguiente funcin sea de
densidad.
f (x) =
_
_
_
c|x| si x [1, 1]
0 en otro caso
6.2. DISTRIBUCIN DE PROBABILIDAD 69
Figura 6.5: Representacin grca de f (x) (ejemplo 6.2.3
Se trata de una variable aleatoria continua que toma valores en el intervalo [1, 1]. Como
esta funcin debe integrar uno tenemos que:
1 =

f (x)dx =

1
1
c|x|dx = 2c

1
0
xdx = 2c
_
x
2
2
_
1
0
= c
Por lo tanto, cuando tomamos c = 1 la funcin anterior resulta ser una funcin de densi-
dad pues ahora cumple con ser no negativa e integrar uno.
Denicin 6.2.3 (Funcin de distribucin). Sea X una variable aleatoria discreta o con-
tinua. La funcin de distribucin de X, denotada por F(x) : R [0, 1], se dene como
F(x) = P(X x)
Esto es, la funcin de distribucin evaluada en un nmero x cualquiera es simplemente la
probabilidad de que la variable aleatoria tome un valor menor o igual a x, o en otras palabras,
que tome un valor en el intervalo (, x]. Siendo F(x) una probabilidad, sus valores estn
siempre entre 0 y 1. Esta funcin resulta ser importante y se le conoce tambin, por razones
evidentes, con el nombre de funcin de acumulacin de probabilidad. Con un par de ejem-
plo mostraremos la forma de calcular esta funcin a partir de la funcin de probabilidad o de
la funcin de densidad.
Ejemplo 6.2.5 Consideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que
la correspondiente funcin de distribucin evaluada en x se calcula sumando las probabilida-
des P(X = u) para valores de u menores o iguales a x, es decir,
F(x) = P(X x) =

ux
P(X = u) =
_

_
0 si x < 1
0, 3 si 1 x < 2
0, 8 si 2 x < 3
1 si x 3
cuya grca aparece en la Figura 6.6. Este es el comportamiento tpico de una funcin de
distribucin de una v.a. discreta, es no decreciente, constante por pedazos, y si la funcin
tiene una discontinuidad en x, entonces el tamao de tal discontinuidad es exactamente la
probabilidad de que la variable aleatoria tome ese valor.
6.2. DISTRIBUCIN DE PROBABILIDAD 70
Figura 6.6: Representacin grca de F(x) del ejemplo 6.2.5
Ejemplo 6.2.6 Consideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La
correspondiente funcin de distribucin se obtiene calculando la siguiente integral:
F(x) = P(X x) =

f (u)du =
_

_
0 si x 1

x
1
1
2
du si 1 < x < 3
1 si x 3
=
_

_
0 si x 1
x 1
2
si 1 < x < 3
1 si x 3
cuya grca aparece en la Figura 6.7. Observe que esta funcin es continua y no decreciente.
Figura 6.7: Representacin grca de F(x) del ejemplo 6.2.6
En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x).
Ahora explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
F(x) = P(X x) =

f (u)du
de modo que por el teorema fundamental del clculo, y cuando F(x) es diferenciable,
d
dx
(F(x)) =
f (x). De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) =
6.2. DISTRIBUCIN DE PROBABILIDAD 71
P(X = x) = F(x) F(x

), en donde F(x

) es el lmite por la izquierda de la funcin


F en el punto x, en smbolos, F(x

) = lm
h0
F(x h), con h > 0. Anlogamente, la ex-
presin F(x
+
) signica el lmite por la derecha de la funcin F en el punto x, es decir,
F(x
+
) = lm
h0
F(x +h), con h > 0.
Proposicin 6.2.1 . Toda funcin de distribucin F(x) satisface las siguientes propiedades:
1. 0 F(x) 1
2. lm
x
F(x) = 1
3. lm
x
F(x) = 0
4. Si x
1
x
2
, entonces F(x
1
) F(x
2
)
5. Si x
1
x
2
, entonces P(x
1
< X x
2
) = F(x
2
) F(x
1
)
6. F(x) = F(x
+
)
Demostracin
1. Como F(x) es una probabilidad pues, por denicin, F(x) = P(X x). Por lo tanto se
cumple la primera propiedad.
2. Cuando x tiende a innito el conjunto (X x) se aproxima al conjunto (X ) que es
idntico a =R, por lo tanto, cuando x ,
F(x) P(X ) = P(R) = 1
3. Anlogamente el conjunto (X x) se aproxima al conjunto (X ) = / 0 cuando x
tiende a menos innito. Por lo tanto, cuando x ,
F(x) P(X ) = P(/ 0) = 0
4. Es suciente observar que si x
1
x
2
, entonces (X x
1
) (X x
2
). Aplicando proba-
bilidad obtenemos P(X x
1
) P(X x
2
).
5. Por teoria elemental de conjuntos el evento (x
1
< X x
2
) puede descomponerse en la
diferencia (X x
2
) (X x
1
), en donde (X x
1
) (X x
2
). Por lo tanto
P(x
1
< X x
2
) = P(X x
2
) P(X x
1
) = F(x
2
) F(x
1
)
6. Para h > 0 tenemos que F(x +h) = P(X x +h) = P(X x) +P(x < X x +h), de
modo que cuando h tiende a cero, el conjunto (x < X x+h) tiende al conjunto vaco.
Concluimos entonces que, cuando h 0 con h > 0,
F(x +h) F(x) +P(/ 0) = F(x)
La propiedad 4) signica que F(x) es una funcin montona no decreciente. Mientras
que la propiedad 6) establece que F(x) es una funcin continua por la derecha.
6.3. ESPERANZA, VARIANZA Y MOMENTOS 72
6.2.3. Distribuciones discretas
Las distribuciones de variables aleatorias discretas ms importantes son las siguientes:
a) Distribucin binomial
b) Distribucin binomial negativa
c) Distribucin Poisson
d) Distribucin geomtrica
e) Distribucin hipergeomtrica
6.2.4. Distribuciones continuas
Las distribuciones de variable continua ms importantes son las siguientes:
a) Distribucin ji cuadrado
b) Distribucin exponencial
c) Distribucin t-student
d) Distribucin normal
e) Distribucin Gamma
f) Distribucin Beta
Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con
curvas.
6.3. Esperanza, varianza y momentos
Todos los seres humanos tenemos caractersticas numricas que nos identican y nos
distinguen de otras personas, por ejemplo, la edad, estatura, talla, peso, etc. Si pudiramos
considerar la totalidad de todos estos nmeros para una persona en particular, la identi-
caramos de manera nica. Algo similar sucede con las variables aleatorias. En esta seccin
estudiaremos algunas caractersticas numricas asociadas a las variables aleatorias.
6.3.1. Esperanza
Denicin 6.3.1 Esperanza
La esperanza de una variable aleatoria X es un nmero real denotado por E(X) y que se
calcula como sigue:
6.3. ESPERANZA, VARIANZA Y MOMENTOS 73
1. Si X es una variable aleatoria discreta con funcin de probabilidad f (x), entonces:
E(X) =

x
x f (x)
en donde la suma se efecta sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se dene cuando esta suma sea absolutamente convergente, es decir,
E(X) =

x
|x| f (x)
El nmero de sumandos puede ser nito o innito dependiendo del conjunto de valores
de la variable aleatoria.
2. Si X es una variable aleatoria continua con funcin de densidad de probabilidad f (x),
entonces la esperanza es
E(X) =

x f (x)dx
suponiendo que esta integral es absolutamente convergente, es decir,
E(X) =

|x f (x)|dx
Si la suma o la integral anteriores no cumplen la condicin de convergencia absoluta, en-
tonces se dice que la esperanza no existe. La esperanza de una variable aleatoria es entonces
un nmero que indica el promedio ponderado de los diferentes valores que puede tomar la
variable aleatoria. A la esperanza se le conoce tambin con los nombre de: media, valor es-
perado o valor promedio. En general se usa la letra griega (mu) para denotarla. La integral
o suma arriba mencionados pueden no ser convergentes y en ese caso se dice que la variable
aleatoria no tiene esperanza nita. La situacin anterior se ilustra en los ejercicios 126 y 127.
La esperanza es uno de los conceptos ms importantes en probabilidad y tiene un amplio
uso en las aplicaciones y otras ramas de la ciencia. Ilustraremos a continuacin la forma de
calcular la esperanza.
Ejemplo 6.3.1 Sea X una variable aleatoria discreta con funcin de densidad dada por la
siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el nmero
E(X) =
3

x=1
x f (x) =1
1
8
+0
4
8
+1
1
8
+2
2
8
=
1
2
Observe que la suma su efecta para todos los valores de x indicados en la tabla, es decir :
-1, 0, 1 y 2. Tambin es instructivo observar que la esperanza no es necesariamente uno de
los valores tomados por la variable aleatoria. En este ejemplo el valor
1
2
nunca es tomado por
la variable aleatoria, pero es su valor esperado.
6.3. ESPERANZA, VARIANZA Y MOMENTOS 74
Ejemplo 6.3.2 Considere la variable aleatoria continua X con funcin de densidad:
f (x) =
_
_
_
2x si 0 < x < 1
0 en otro caso
La esperanza de X es
E(X) =

x f (x)dx =

1
0
x 2x =
2
3
x
2

1
0
=
2
3
Observe que la integral slo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo
la funcin de densidad se anula.
Esperanza de una funcin de una variable aleatoria
En algunos casos es necesario saber calcular la esperanza de una funcin de una variable
aleatoria. Por ejemplo, si X es una variable aleatoria, entonces es claro que Y = X
2
es una
funcin de X y es tambin una variable aleatoria. Si quisiramos calcular la esperanza de
Y = X
2
segun la denicin tendramos que calcular

y f
Y
(y)dy, para lo cual se necesita
encontrar primero la funcin de densidad de Y , y ello en general no es fcil. El siguiente
resultado es muy til y nos dice cmo calcular esta esperanza conociendo nicamente la fun-
cin de densidad de X. A veces se le reere como el teorema del estadstico inconsciente.
Proposicin 6.3.1 Sea X una variable aleatoria y sea g : RR una funcin tal que g(X)
es una variable aleatoria con esperanza nita. Entonces:
1. Si X es una variable aleatoria discreta; con funcin de probabilidad f
X
(x), se dene la
esperanza de la variable aleatoria discreta g(x) esta dada por la siguiente:
E[g(X)] =

X
g(x) f
X
(x) (6.3.2)
2. Si X es una variable aleatoria continua; con funcin de densidad de probabilidad f
X
(x);
entonces la esperanza de la variable aleatoria continua g(x) est dada por la siguiente
ecuacin:
E[g(X)] =

g(x) f
X
(x)dx (6.3.3)
En general, la demostracin de este resultado es complicada, asi es que la omitiremos y
nos concentraremos en su uso y aplicacin.
Ejemplo 6.3.3 Calcularemos E(Y) en donde Y = X
2
, y X es la variable aleatoria continua
del ejemplo anterior, es decir, con funcin de densidad
f (x) =
_
_
_
2x si 0 < x < 1
0 en otro caso
6.3. ESPERANZA, VARIANZA Y MOMENTOS 75
Por la proposicin anterior tenemos que:
E(Y) = E(X
2
) =

g(x) f (x)dx =

1
0
x
2
2x =
2
4
x
4

1
0
=
1
2
Ejemplo 6.3.4 Sea X una variable aleatoria con funcin de probabilidad dada por la tabla
que aparece abajo. Encuentre la funcin de probabilidad de Y =X
2
usando la ecuacin(6.3.2).
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
Por la ecuacin (6.3.2) la esperanza de Y = X
2
es
E(Y) =

X
g(x) f (x) =

X
x
2
f (x) = (1)
2

1
8
+0
2

4
8
+1
2

1
8
+2
2

2
8
=
5
4
Propiedades de la esperanza
Proposicin 6.3.2 Sean X y Y variables aleatorias con esperanzas nitas y sea c una cons-
tante. Entonces
a) E(c) = c
b) E(cX) = cE(X)
c) Si X 0, entonces E(X) 0
d) E(X +Y) = E(X) +E(Y)
Demostracin
a) Si X es una v.a. discreta por denicin de esperanza para caso discreto tenemos que:
E(c) =

x
cP(X = x) = c

x
P(X = x) = c
Si X es una v.a. continua por denicin de esperanza para caso continuo tenemos que:
E(c) =

c f (x)dx = c

f (x)dx = c
b) Si X es una v.a. discreta por denicin de esperanza para caso discreto tenemos que:
E(cX) =

x
(cx)P(X = x) = c

x
xP(X = x) = cE(X)
Si X es una v.a. continua por denicin de esperanza para caso continuo tenemos que:
E(cX) =

(cx) f (x)dx = c

x f (x)dx = cE(X)
6.3. ESPERANZA, VARIANZA Y MOMENTOS 76
c) Este inciso es muy evidente pues cuando se cumple la hiptesis (E(X) 0), en la
integral o suma correspondiente solo aparecern trminos que son no negativos.
d) Esta ltima propiedad, en cambio, no es sencilla de demostrar y an en el caso discreto
requiere de detalles tcnicos que preferimos omitir.
Oservaciones:
Observe que la segunda y la cuarta propiedad establecen que la esperanza es lineal, es
decir, separa sumas y tambin separa multiplicaciones por constantes; esto es
E(c
1
X +c
2
Y) = c
1
E(X) +c
2
E(Y)
Adems si X
1
, X
2
, . . . , X
n
son v.a. y c
1
, c
2
, . . . , c
n
son constantes arbitrarias se tiene que:
E
_ n

k=1
c
i
X
i
_
=
n

k=1
c
i
E(X
i
)
Si Xe Yson v.a. independientes entonces E(XY) =E(X)E(Y). Esto mismo se extiende
para una sucesin X
1
, X
2
, . . . , X
n
de v.a. independientes, esto es E
_ n

i=1
X
i
_
=
n

i=1
E(X
i
).
Esta ltima propiedad no la detallaremos pero la utilizaremos en algunas demostra-
ciones.
6.3.2. Varianza
Denicin 6.3.2 (Varianza)
La varianza de una variable aleatoria X, denotada por Var(X), se dene como la siguiente
esperanza, si sta existe,
Var(X) = E[X E(X)]
2
=
_

x
[x E(X)]
2
f (x) si X es una v.a. discreta

[x E(X)]
2
f (x)dx si X es una v.a. continua
La varianza es una medida del grado de dispersin de los diferentes valores tomados por
la variable aleatoria. Se le denota regularmente por la letra
2
(sigma cuadrada). A la raz
cuadrada positiva de la varianza, esto es , se le llama desviacin estndar. Nuevamente la
anterior suma o integral puede no existir y en ese caso decimos que la variable aleatoria
no tiene varianza nita. Observemos que para calcular Var(X) necesitamos conocer primero
E(X). Veamos algunos ejemplos sencillos.
Ejemplo 6.3.5 Calcularemos la varianza de la variable aleatoria discreta X con funcin de
probabilidad dada por la siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
6.3. ESPERANZA, VARIANZA Y MOMENTOS 77
Recordemos primeramente que por clculos previos, E(X) =
1
2
. Aplicando la denicin de
varianza para v.a. discreta Var(X) =

x
[x E(X)]
2
f (x), tenemos que:
Var(X) =
_
1
1
2
_
2

1
8
+
_
0
1
2
_
2

4
8
+
_
1
1
2
_
2

1
8
+
_
2
1
2
_
2

2
8
= 1
Ejemplo 6.3.6 Calcularemos la varianza de la variable aleatoria continua X con funcin de
densidad f (x) = 2x para x (0, 1) y cero en otro caso. En un clculo previo habamos encon-
trado que E(X) =
2
3
. Aplicando la denicin de varianza para una v.a. continua Var(X) =

[x E(X)]
2
f (x)dx, tenemos que
Var(X) =

1
0
_
x
2
3
_
2
2xdx =

1
0
_
2x
3

8
3
x
2
+
8
9
x
_
dx =
_
x
4
2

8
9
x
3
+
4
9
x
2
_

1
0
=
1
18
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
Proposicin 6.3.3 Sean X y Y dos variables aleatorias, y sea c una constante. Entonces
a) Var(X) 0
b) Var(c) = 0
c) Var(cX) = c
2
Var(X)
d) Var(X +c) =Var(X)
e) Var(X) = E(X
2
) (E(X))
2
f) Var(X +Y) =V(X) +V(Y)
Demostracin
a) Este inciso es evidente a partir de la denicin de varianza pues en ella aparece una
suma o integral de trminos no negativos.
b) Para este inciso la constante c es una v.a. con un nico valor, de modo que E(c) = c,
entonces
Var(X) = E(c c)
2
= E(0)
2
= E(0) = 0
c) Para este inciso tenemos que:
Var(cX) = E[cX E(cX)]
2
= E[cX cE(X)]
2
= E[c
2
(X E(X))
2
]
= c
2
E[X E(X)]
2
= c
2
Var(X)
6.3. ESPERANZA, VARIANZA Y MOMENTOS 78
d) La demostracin de este inciso tiene un procedimiento anlogo al anterior, esto es,
Var(X +c) = E[(X +c) E(X +c)]
2
= E[X +c (E(X) +E(c))]
2
= E[X +c E(X) c)]
2
= E[X E(X)]
2
=Var(X)
e) Para demostrar esta propiedad se desarrolla el cuadrado en la denicin de varianza, y
se usa la propiedad de linealidad de la esperanza, esto es,
Var(X) = E[X E(X)]
2
= E[X
2
2XE(X) +(E(X))
2
]
= E(X
2
) 2E[XE(X)] +E[E(X)]
2
= E(X
2
) 2[E(X)]
2
+[E(X)]
2
= E(X
2
) [E(X)]
2
f) Finalmente para demostrar la propiedad (f) es suciente dar un ejemplo. Puede tomarse
el caso Y = X, en general y por lo demostrado antes, se tiene que
Var(X +Y) =Var(2X) = 2
2
Var(X) = 4Var(X) = 2Var(X) =Var(X) +Var(Y)
Observacin:
Si X e Y son v.a. independientes y c
1
, c
2
son constantes arbitrarias entonces
Var(c
1
X +c
2
Y) = c
2
1
Var(X) +c
2
2
Var(Y)
Adems si X
1
, X
2
, . . . , X
n
son v.a. independientes todas entre si y c
1
, c
2
, . . . , c
n
son con-
stantes arbitrarias se tiene que:
Var
_ n

k=1
c
i
X
i
_
=
n

k=1
c
2
i
Var(X
i
)
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por
eso no demostraremos las propiedades que este hecho implica en la esperanza y la varianza
de la suma de v.a. de este tipo mencionadas anteriormente.
6.3.3. Momentos
Los momentos de una variable aleatoria son nmeros que representan algunas caracters-
ticas de la distribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de
momentos determinan de manera nica a la distribucin de probabilidad. A continuacin
deniremos los momentos si existen de una variable aleatoria alrededor del origen y alrede-
dor de la media tambin llamada momento central.
Denicin 6.3.3 (Momentos)
Se dene el n-simo momento de una variable aleatoria X alrededor del origen, cuando
existe, como el nmero E(X
n
), para cualquier valor natural de n. El n-simo momento central
de X, cuando existe, es el nmero E[(X ]
n
, en donde = E(X).
6.3. ESPERANZA, VARIANZA Y MOMENTOS 79
Observe que el primer momento de X alrededor del origen es simplemente la esperanza,
y el segundo momento central es la varianza. Tenemos entonces que si X es una variable
aleatoria con funcion de probabilidad f (x) si es discreta o funcin de densidad de probabi-
lidad f (x) si es continua, entonces el n- simo momento de X, si existe, se calcula como
sigue:
E(X
n
) =
_

x
x
n
f (x) si X es una v.a. discreta

x
n
f (x)dx si X es una v.a. continua
El n-simo momento central de X se calcula, para variables aleatorias discretas y contin-
uas respectivamente, como indican las siguientes frmulas:
E[X ]
n
=
_

x
(x )
n
f (x) si X es una v.a. discreta

(x )
n
f (x)dx si X es una v.a. continua
Ejemplo 6.3.7 Sea la variable aleatoria discreta X con funcin de probabilidad dada por la
siguiente tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Desarrollo de los incisos
a) Por denicin de momentos alrededor del origen tenemos que
E(X) =
2

x=0
x f (x) = 0
1
4
+1
2
4
+2
1
4
= 1
E(X
2
) =
2

x=0
x
2
f (x) = 0
2

1
4
+1
2

2
4
+2
2

1
4
=
3
2
E(X
3
) =
2

x=0
x
3
f (x) = 0
3

1
4
+1
3

2
4
+2
3

1
4
=
5
2
b) Por denicin de momentos alrededor de la media cuyo valor es 1 tenemos que
E(X ) =
2

x=0
(x 1) f (x) = (01)
1
4
+(11)
2
4
+(21)
1
4
= 0
E[(X )
2
] =
2

x=0
(x 1)
2
f (x) = (01)
2

1
4
+(11)
2

2
4
+(21)
2

1
4
=
1
2
E[(X 1)
3
] =
2

x=0
(x 1)
3
f (x) = (01)
3

1
4
+(11)
3

2
4
+(21)
3

1
4
= 0
6.4. FUNCIN GENERADORA DE MOMENTOS 80
Ejemplo 6.3.8 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
f (x) =
_

_
x
2
si 0 < x < 2
0 en otro caso
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer y segundo momento alrededor de la media
Desarrollo de los incisos
a) Por denicin de momentos alrededor del origen tenemos que
E(X) =

2
0
x
x
2
dx =
x
3
6

2
0
=
4
3
E(X
2
) =

2
0
x
2
x
2
dx =
x
4
8

2
0
= 2
E(X
3
) =

2
0
x
3
x
2
dx =
x
5
10

2
0
=
16
5
b) Por denicin de momentos alrededor de la media tenemos que
E(X ) = E
_
X
4
3
_
= E(X) E
_
4
3
_
=
4
3

4
3
= 0
E[(X )
2
] = E
__
X
4
3
_
2
_
=

2
0
_
x
4
3
_
2
x
2
dx =
1
2

2
0
_
x
3

8
3
x
2
+
16
9
x
_
dx
=
1
2
_
x
4
4

8
9
x
3
+
8
9
x
2
_
2
0
=
2
9
6.4. Funcin generadora de momentos
A continuacin deniremos una funcin especial denominada funcin generadora de mo-
mentos.
Denicin 6.4.1 (Funcin generadora de momentos)
Sea X una variable aleatoria con funcin de probabilidad f (x) en el caso de que sea discreta
o funcin de densidad f (x) en el caso de que sea continua. Se dene a la funcin generadora
de momentos de la variable aleatoria X como la siguiente esperanza,
M
X
(t) = E(e
tX
)
La funcin generadora de momentos de X se calcula, para variables aleatorias discretas y
continuas respectivamente, como indican las siguientes frmulas:
M
X
(t) =
_

x
e
tx
f (x) si X es una v.a. discreta

e
tx
f (x)dx si X es una v.a. continua
6.4. FUNCIN GENERADORA DE MOMENTOS 81
Ejemplo 6.4.1 Sea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con funcin de
probabilidad dada por la tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
Obtener su funcin generadora de momentos.
Por la denicin de funcin generadora de momentos tenemos
M
X
(t) = E(e
tX
) =
2

x=0
e
tx
f (x) = e
0

1
4
+e
1t

2
4
+e
2t

1
4
=
e
2t
+2e
t
+1
4
Ejemplo 6.4.2 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
f (x) =
_
_
_
2e
2x
si x 0
0 en otro caso
Obtener su funcin generadora de momentos.
Por la denicin de funcin generadora de momentos tenemos
M
X
(t) = E(e
tX
) =

e
tx
f (x)dx =


0
e
tx
2e
2x
dx = 2


0
e
(2t)x
dx
=
2
(2t)
e
(2t)x

0
=
2
2t
Propiedades de la funcin generadora de momentos
Proposicin 6.4.1 Sea X una variable aleatoria con los primeros n momentos alrededor del
origen nitos, estos es, E(X
k
) < ; k {0, 1, 2, . . . , n} y funcin generadora de momentos
M
X
(t) , entonces se tiene que:
d
n
dt
n
_
M
X
(0)
_
= E(X
n
)
Demostracin
Por denicin de funcin generadora de momentos, M
X
(t) =E(e
Xt
) y por serie de Taylor,
e
(Xt)
=

k=0
(tX)
k
k!
. Por lo tanto
M
X
(t) = E
_

k=0
(tX)
k
k!
_
=

k=0
t
k
k!
E(X
k
)
Derivando n veces a M
X
(t) obtenemos la siguiente secuencia
d
dt
_
M
X
(t)
_
=

k=1
t
k1
(k 1)!
E(X
k
) =

k=1
t
k1
(k 1)!
E(X
k1
X) = E(Xe
tX
)
6.4. FUNCIN GENERADORA DE MOMENTOS 82
d
2
dt
2
_
M
X
(t)
_
=

k=2
t
k2
(k 2)!
E(X
k
) =

k=2
t
k2
(k 2)!
E(X
k2
X
2
) = E(X
2
e
tX
)
.
.
.
d
n
dt
n
_
M
X
(t)
_
=

k=n
t
kn
(k n)!
E(X
k
) =

k=n
t
kn
(k n)!
E(X
kn
X
n
) = E(X
n
e
tX
)
Por lo que nalmente
d
n
dt
n
_
M
X
(0)
_
= E(X
n
)
Ejemplo 6.4.3 Tomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1
junto con su funcin generadora de momentos y calculemos los cuatro primeros momentos
de la variable alrededor del origen. Entonces
M
X
(t) =
e
t
+e
t
+1
2
E(X) =
d
dx
_
M
x
(t)
_

t=0
=
e
2t
+e
t
2

t=0
=
1+1
2
= 1
E(X
2
) =
d
2
dx
2
_
M
x
(t)
_

t=0
=
2e
2t
+e
t
2

t=0
=
2+1
2
=
3
2
E(X) =
d
3
dx
3
_
M
x
(t)
_

t=0
=
4e
2t
+e
t
2

t=0
=
4+1
2
=
5
2
E(X) =
d
4
dx
4
_
M
x
(t)
_

t=0
=
8e
2t
+e
t
2

t=0
=
8+1
2
=
9
2
Ejemplo 6.4.4 Tomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con
su funcin generadora de momentos y calculemos los cuatro primeros momentos de la vari-
able alrededor del origen. Entonces
M
X
(t) =
2
2t
E(X) =
d
dx
_
M
x
(t)
_

t=0
=
2
(2t)
2

t=0
=
2
2
2
=
1
2
E(X
2
) =
d
2
dx
2
_
M
x
(t)
_

t=0
=
4
(2t)
3

t=0
=
4
2
3
=
1
2
E(X) =
d
3
dx
3
_
M
x
(t)
_

t=0
=
12
(2t)
4

t=0
=
12
2
4
=
3
4
E(X) =
d
4
dx
4
_
M
x
(t)
_

t=0
=
48
(2t)
5

t=0
=
48
2
5
=
3
2
Proposicin 6.4.2 Si X
1
, X
2
, . . . , X
n
son v.a. independientes entonces
M_ n

i=1
X
i
_(t) =
n

i=1
M
X
i
(t)
6.5. PROBLEMAS 83
Demostracin
Por denicin de funcin generadora de momentos se tiene que
M_ n

i=1
X
i
_(t) = E
_
e
n

i=1
X
i
t
_
= E
_ n

i=1
e
X
i
t
_
=
n

i=1
E(e
X
i
t
) =
n

i=1
M
X
i
(t)
Notese que para esta demostracin utilizamos la propiedad de la esperanza para v.a. in-
dependientes.
6.5. Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestin es discreta o continua.
Cules son sus posible valores?
a) Tiempo de vida de una persona escogida al azar.
b) Nmero de errores tipogrcos en una pgina escogida al azar de un libro.
c) Tiempo de servicio en una transaccin escogida al azar realizada por una persona
en un cajero automtico.
d) Monto de una reclamacin por accidente automovilstico escogida al azar del
conjunto de reclamaciones efectuadas a una compaa aseguradora.
2. Considere el experimento aleatorio de escoger un nmero al azar dentro del intervalo
unitario (0, 1). Suponga que cada resultado de este experimento se escribe en su expan-
sin decimal como = 0, x
1
x
2
x
3
. . . . Determine en los siguientes casos el conjunto de
valores de la variable aleatoria denida y clasique sta como discreta o continua.
a) X() =
b) X() = x
1
c) X() = 1
d) X() = 0, 0x
1
x
2
x
3
. . .
3. Considere un experimento aleatorio con espacio muestral equiprobable ={1, 2, 3, 4, 5, 6}.
Dena la variable aleatoria X() = 2(3). Cules son los posibles valores de X?.
Calcule P(X = 0), P(X {2, 3}), P(X 0), P(X < 0), P(X
2
= 1), P(2X 4 = 0), y
P(X
2
= 4).
4. Considere el ejemplo del experimento aleatorio de lanzar un dardo en un tablero circu-
lar de radio uno, Figura 1.13, junto con las variables aleatorias X(x, y) = x,Y(x, y) = y
y Z(x, y) =
_
x
2
+y
2
. Suponga que para cada regin A cuya rea puede ser calcu-
lada se dene por P(A) =
rea(A)
rea()
.
Calcule P(X 0), P(X < 0), P(X +Y 1), P(Y > X), P
_
Z <
1
2
_
y P
_
1
3
< Z <
1
2
_
.
6.5. PROBLEMAS 84
Funciones de probabilidad, de densidad y de distribucin
1. Graque y compruebe que las siguientes funciones son de probabilidad
a) f (x) =
_

_
x
2
10
si x =2, 1, 0, 1, 2
0 en otro caso
b) f (x) =
_

_
(2x 5)
2
70
si x = 1, 2, 3, 4, 5
0 en otro caso
2. Graque y compruebe que las siguientes funciones son de densidad
a) f (x) =
_

_
x +1
2
si x (1, 1)
0 en otro caso
b) f (x) =
_
e
x
si x > 0
0 si x 0
3. Encuentre el valor de la constante c para que f (x) sea una funcin de probabilidad.
Graque esta funcin y calcule P(X 2, 3, 4) y P(X < 3) en cada caso.
a) f (x) =
_
_
_
cx si x = 1, 2, . . . , 10
0 en otro caso
b) f (x) =
_
_
_
cx
2
si x = 1, 2, . . . , 10
0 en otro caso
4. Determine si la siguiente funcin es de probabilidad. Graque la funcin y justique
su respuesta.
f (x) =
_

_
1
6
si x = 0, 1
2
3
si x = 2
0 otro caso
5. Determine si la siguiente funcin es de probabilidad. Graque la funcin y justique
su respuesta.
f (x) =
_

_
4
x!(4x)!
_
3
4
_
x
_
1
4
_
4x
si x = 0, 1, 2, 3, 4
0 otro caso
6.5. PROBLEMAS 85
6. Encuentre el valor de la constante c para que la siguiente funcin sea de densidad.
Graque f (x) y calcule P(X ) y P(X [, 2]).
f (x) =
_
_
_
c(1+senx) si x [0, 2]
0 en otro caso
7. Encuentre el valor de la constante c para que la siguiente funcin sea de densidad.
Graque f (x) y calcule P(X (1, )).
f (x) = ce
|x|
para < x <
8. Determine si cada una de las siguientes funciones es de densidad. Graque la funcin
en cada caso y justique su respuesta.
a) f (x) =
_

_
4x
5
si x [0, 2]
0 otro caso
b) f (x) =
_

_
2x
2
3
2x +
4
3
si x [0, 3]
0 en otro caso
9. Explique porqu no es posible encontrar un valor de la constante c para que la siguiente
funcin sea de probabilidad o de densidad.
a) f (x) =
_
_
_
cx si x =2, 1, 0, 1, 2
0 otro caso
b) f (x) =
_
_
_
c senx si x [, ]
0 en otro caso
10. Sea X una v.a. discreta con funcin de probabilidad dada por la siguiente tabla. Graque
f (x) y calcule P(X 0), P(X < 0) y P(X
2
= 1).
x -1 0 1
f(x) 0,2 0,3 0,5
11. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x 0 1 2 3 4
f(x) 1/210 4/35 3/7 8/21 1/14
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36
a) Graque en ambos casos
6.5. PROBLEMAS 86
b) Calcule P(X 2), P(X 3) y P(1 X 3) en ambos casos
12. Sea X una v.a. discreta con funcin de probabilidad dada por la tabla que aparece abajo.
Graque f (x). Calcule la funcin de probabilidad de las siguientes variables aleatorias
Y = X
2
, Z =|X| y W = 2X 5. Graque en cada caso.
x -2 -1 0 2 3 5
f(x) 0,1 0,15 0,4 0,1 0,15 0,1
13. Sea X discreta con funcin de probabilidad dada por la tabla que aparece abajo. En-
cuentre el valor de c y graque f (x). Calcule y graque la funcin de probabilidad de
la variable Y = X
2
.
x -2 0 2
f(x) 0,1 c 0,1
14. Sea X una variable aleatoria con la siguiente funcin de distribucin. Encuentre y
graque f (x). Calcule P(0 X < 10).
F(x) =
_

_
1
_
1
2
_
x+1
si x = 0, 1, 2, 3, . . .
0 otro caso
15. Sea X una v.a. continua con funcin de densidad
f (x) =
_

_
1
10
si k x 4k
0 otro caso
a) Determine el valor de la constante k y graque f (x)
b) Calcule y graque F(x)
c) Calcule P(1 X 3), P(X 2) y P(X 0)
d) Encuentre m tal que P(|X 1| m) =
1
2
16. Sea X una variable aleatoria continua con la funcin de densidad que aparece abajo.
Encuentre el valor de la constante c y graque la funcin f (x). Encuentre y graque
adems la funcin de distribucin F(x).
f (x) =
_

_
2x
9
si 0 < x < c
0 si en otro caso
17. Dada la siguiente funcin f (x) =
_
ce
3x
si x > 0
0 si x 0
a) Obtenga el valor de c que haga que esta funcin sea de densidad para X
6.5. PROBLEMAS 87
b) Calcule y graque F(x)
c) Calcule P(X 10), P(X 5) y P(5 X 10)
18. El tiempo en minutos que una persona espera un autobs es una v.a. con funcin de
densidad dada por
f (t) =
_

_
1
2
si 0 <t < 1
1
4
si 2 <t < 4
0 para otro valor de t
Hallar la probabilidad de que el tiempo en que la persona que espera el autobs sea de
a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos
19. Una v.a. tiene funcin de densidad
f (t) =
_
_
_
cx
2
si 1 t 2
cx si 2 t 3
0 para otro valor de x
Hallar:
a) la constante c
b) la funcin de distribucin
c) P(X > 2) y P
_
1
2
< X <
3
2
_
20. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Graque F(x). Encuentre y graque la correspondiente funcin
de densidad f (x). Calcule adems P(X = 2) y P(1 < X < 2).
F(x) =
_

_
0 para x < 1
1
3
si 1 x < 2
1 para x 2
21. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Graque F(x). Encuentre y graque la correspondiente funcin
de densidad f (x). Calcule adems P(X =
1
2
) y P(X >
1
2
).
F(x) =
_
_
_
0 para x < 0

x si 0 x < 1
1 para x 1
6.5. PROBLEMAS 88
22. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una
a la vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los nmeros
de las dos bolas seleccionadas.
a) Determine
b) Calcule y graque f (x)
c) Calcule y graque F(x)
d) Calcule P(X 6), P(3 < X 5) y P(X = 6)
Esperanza, varianza, momentos y funcin generadora de momentos
1. Sea a un nmero jo. Construya una variable aleatoria X tal que E(X) = a.
2. Calcule la esperanza de la variable aleatoria discreta X cuya funcin de probabilidad
es
a) f (x) =
_

_
1
3
si x = 0, 1
1
6
si x = 2, 3
0 otro caso
b) f (x) =
_

_
1
4
si x =1, 1
1
2
si x = 0
0 otro caso
3. Calcule la esperanza de la variable aleatoria continua X cuya funcin de densidad es
a) f (x) = e
x
, para x > 0
b) f (x) = 6x(1x), para 0 < x < 1
4. Sea X una variable aleatoria discreta con la funcin de probabilidad que aparece abajo.
Demuestre que f (x) es efectivamente una funcin de probabilidad y que la esperanza
de X no existe. Este es un ejemplo de una variable aleatoria discreta que no tiene
esperanza nita.
f (x) =
_

_
1
x(x +1)
para x = 1, 2, 3, . . .
0 para otros casos
5. Sea X una variable aleatoria continua con la funcin de densidad que aparece abajo.
Demuestre que esta funcin es efectivamente una funcin de densidad. Compruebe
adems que la esperanza de X no existe. Este es un ejemplo de una variable aleatoria
continua que no tiene esperanza nita. Es un caso particular de la distribucin Cauchy.
f (x) =
1
(x
2
+1)
, para < x <
6.5. PROBLEMAS 89
6. Demuestre que no existe la esperanza de la v.a X cuando su funcin de densidad es
f (x) =
_

_
1
x
2
para x > 1
0 para x 1
7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con
la siguiente funcin de densidad no existe.
f (x) =
_

_
2
x
3
para x > 1
0 para x 1
8. Diga falso o verdadero. Justique en cada caso.
a) La esperanza de una v.a. puede ser cero.
b) No hay dos v.a.s distintas con la misma esperanza.
c) La esperanza de una v.a. nunca es negativa.
d) La varianza de una v.a. puede ser cero.
e) La varianza de una v.a. nunca es negativa.
f) No hay dos v.a.s distintas con la misma varianza.
9. Demuestre que
a) E(E(X)) = E(X)
b) Var(Var(X)) = 0
10. Sea X la variable aleatoria constante c. Compruebe que
a) E(X) = c
b) E(X
n
) = c
n
c) Var(X) = 0
11. Calcule la media y varianza de la variable aleatoria X con funcin de probabilidad
f (x) =
_

_
1
9
si x = 0, 1, 2
2
9
si x = 3, 4, 5
0 otro caso
12. Calcule la media y varianza de la variable aleatoria X cuya funcin de probabilidad es
f (x) =
_

_
_
1
2
_
x+1
si x = 0, 1, 2, 3, . . .
0 otro caso
6.5. PROBLEMAS 90
13. Diga falso o verdadero. Justique en cada caso.
a) Var(E(X)) = 0
b) E(Var(X)) = E(X)
14. Sea X una variable aleatoria continua con funcin de densidad f (x) = 12e
|x|
, para
< x < . Demuestre que f (x) es efectivamente una funcin de densidad y com-
pruebe que
a) E(X) = 0
b) E(X
2
) = 2
c) Var(X) = 2
d) E(X
n
) = n! para n par
15. Diga falso o verdadero. Justique en cada caso.
a) E(X) =E(X)
b) Var(X) =Var(X)
c) E(Var(X)) =Var(E(X))
16. Encuentre el error en la siguiente demostracin de la armacin de que la varianza de
cualquier variable aleatoria es cero.
0 =Var(0)
=Var(X +(X))
=Var(X) +Var(X)
=Var(X) +Var(X)
= 2Var(X)
Captulo 7
Distribuciones de probabilidad
Estudiaremos a continuacin algunas distribuciones de probabilidad de variables aleato-
rias importantes. Estas distribuciones son modelos particulares para asignar probabilidades
a subconjuntos de nmeros reales. Empezaremos con las distribuciones de tipo discreto y
continuaremos despus con las de tipo continuo. Es importante sealar que sta es slamente
una lista parcial de algunas distribuciones de probabilidad de mayor uso.
7.1. Distribuciones discretas de probabilidad
7.1.1. Distribucin Bernoulli
Un ensayo Bernoulli se dene como aquel experimento aleatorio con nicamente dos
posibles resultados, llamados genricamente xito y fracaso, con probabilidades respec-
tivas P(xito) = p y P(Fracaso) = 1p.
Construccin de una distribucin de Bernoulli
Sea un experimento aleatorio que arroja nicamente dos posibles resultados, denomina-
dos xito y fracaso. Si se dene la variable aleatoria X como aquella funcin que lleva el
resultado xito al nmero 1 y el resultado fracaso al nmero 0, entonces decimos que X tiene
una distribucin Bernoulli con parmetro p (0, 1), y escribimos X Ber(p). La funcin de
probabilidad es
f (x) =
_
p
x
(1p)
1x
si x = 0, 1
0 para otro caso
Proposicin 7.1.1 Sea X Ber(p), entonces tenemos que
a) E(X) = p
b) Var(X) = p(1p)
c) M
X
(t) = 1p+ pe
t
Demostracin
a) A partir de la denicin de esperanza se tiene que
E(X) =

x
x f (x) = 0 (1p) +1 p = p
91
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 92
b) Segn la denicin de varianza, Var(X) =

x
[x E(X)]
2
f (x), entonces tenemos que
Var(X) = (0p)
2
(1p) +(1p)
2
p = p
2
(1p) + p(1p)
2
= p(1p)
c) Recordando que la funcin generadora de momentos se dene como M
X
(t) = E(e
tX
),
entonces
M
X
(t) =

x
e
tx
f (x) = e
0
(1p) +e
t
p = 1p+ pe
t
Ejemplo 7.1.1 Considere el experimento aleatorio de lanzar una moneda al aire. Calcula la
esperanza, la varianza y la funcin generadora de momentos.
Suponga que
1
= cara y
2
= cruz son los dos resultados posibles, con probabilidades
p =
1
2
y 1 p =
1
2
, respectivamente. Sea X la variable aleatoria dada por X(
1
) = 1, y
X(
2
) = 0. Entonces X tiene distribucin Ber
_
1
2
_
, por lo tanto
E(X) = p =
1
2
Var(X) = p(1p) =
1
2
(1
1
2
) =
1
4
M
X
(t) = 1
1
2
+
1
2
e
t
=
1
2
(1+e
t
)
7.1.2. Distribucin binomial
La distribucin binomial fue desarrollada por suizo Jakob Bernoulli (1654-1705), es la
principal distribucin de probabilidad discreta. La variable aleatoria binomial y su distribu-
cin estn basadas en un experimento que satisface las condiciones citadas a continuacin.
Construccin de la distribucin binomial
Suponga que se realizan n ensayos idnticos independientes de Bernoulli en donde la
probabilidad de xito y de fracaso en cada uno de ellos es la misma, siendo la probabilidad
de xito igual a p y la del fracaso igual a 1 p, con p (0, 1). El espacio muestral de este
experimento consiste de todas las posibles sucesiones de longitud n de xitos y de fracasos,
esto es
={(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}
Usando el principio multiplicativo, es fcil ver que este conjunto tiene 2
n
elementos.
Si ahora se dene la variable aleatoria X como el nmero de xitos en cada una de estas
sucesiones, esto es
X(EEE . . . E) = n, X(FEE . . . E) = n1, . . . , X(FFF . . . EF) = 1, X(FFF . . . F) = 0
entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribucin binomial con
parmetros n y p. Se escribe X bin(n, p), y su funcin de probabilidad es
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 93
f (x) =
_

_
n!
x!(nx)!
p
x
(np)
1x
si x = 0, 1, . . . , n
0 para otro caso
Proposicin 7.1.2 Sea X bin(n, p), entonces tenemos que
a) E(X) = np
b) Var(X) = n(1p)
c) M
X
(t) = (1p+ pe
t
)
n
Demostracin
a) Como la variable aleatoria X constituye el nmero de xitos obtenidos en cada uno
de los posibles resultados en el experimento (posibles sucesiones de ). Entonces
X =
n

j=1
X
j
, donde X
j
Ber(p), j = {1, 2, . . . , n}, por lo que la esperanza, varian-
za y funcin generadora de momentos de cada X
j
son E(X
j
) = p, Var(X
j
) = p(1p)
y M
X
j
(t) = pe
t
+ p 1 respectivamente. Aplicando la propiedad de linealidad de la
esperanza se tiene
E(X) = E
_ n

j=1
X
j
_
=
n

j=1
E(X
j
) =
n

j=1
p = np
b) Tomando en cuenta la propiedad de varianza que establece que si tenemos n variables
aleatorias independientes, todas con varianzas nitas, entonces la varianza de las suma
de las n v.a. es idntica a la suma de las varianzas de las variables, por lo tanto la
varianza de X es:
Var(X) =Var(
n

j=1
X
j
) =
n

j=1
Var(X
j
) =
n

j=1
p(1p) = np(1p)
c) Una de las propiedades de la funcin generadora de momentos establece que si tenemos
n variables aleatorias independientes, entonces la funcin generadora de momentos de
la suma de las n v.a. es idntico al producto de la funcin generadora de momentos de
las variables, entonces
M
X
(t) = M_ n

j=1
X
j
_(t) =
n

j=1
M
X
j
(t) =
n

j=1
(pe
t
+ p1) = (pe
t
+ p1)
n
Ejemplo 7.1.2 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro
inters es el nmero de caras obtenidas en los cuatro lanzamientos. Como es evidente, la
probabilidad de obtener un xito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la
de obtener un fracaso es tambin 0,50.
a) Cul es la probabilidad de no obtener caras en los cuatro lanzamientos?
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 94
b) Cul es la probabilidad de obtener dos caras en los cuatro lanzamientos?
c) Haga una distribucin de probabilidad binomial
d) Calcular la media, la desviacin estndar y la funcin generadora de momentos de esta
distribucin binomial
Esta distribucin binomial tiene por funcin de probabilidad a la siguiente funcin
f (x) =
_

_
4!
x!(4x)!
_
1
2
_
x
_
1
2
_
4x
si x = 0, 1, 2, 3, 4
0 para otro caso
=
_

_
4!
x!(4x)!
_
1
2
_
4
si x = 0, 1, 2, 3, 4
0 para otro caso
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
P(X = 0) =
4!
0!(40)!
_
1
2
_
4
=
1
16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
P(X = 2) =
4!
2!(42)!
_
1
2
_
4
=
6
16
=
3
8
c) La distribucin de probabilidad est dada por la siguiente tabla
x 0 1 2 3 4
p(x) 1/16 4/16 3/8 1/4 1/16
c) Teniendo en cuenta la proposicin 7.1.1 tenemos que la esperanza, la varianza y la
funcin generadora de momentos son respectivamente
E(X) = 4
1
2
= 2
Var(X) = 4
1
2

1
2
= 1
M
X
(t) =
_
1
1
2
+
1
2
e
t
_
4
=
1
16
(e
t
+1)
4
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 95
7.1.3. Distribucin Poisson
Esta distribucin fue descubierta por Simen Denis Poisson (1781-1840) en 1837 como
lmite de la distribucin binomial. En 1838 en su trabajo Recherches sur la probabilit des
jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de
los juicios en materias criminales y civiles). El trabajo estaba enfocado en ciertas varia-
bles aleatorias N que cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas
veces llamadas arribos) que tienen lugar durante un intervalo de tiempo de duracin deter-
minada.
La distribucin de Poisson tiene conexin con los procesos de Poisson. Se aplica a varios
fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3, . . .
veces durante un periodo denido de tiempo o en una rea determinada) cuando la probabi-
lidad de ocurrencia del fenmeno es constante en el tiempo o el espacio.
Ejemplos de eventos que pueden ser modelados por la distribucin de Poisson
a) El nmero de autos que pasan a travs de un cierto punto en una ruta (sucientemente
distantes de los semforos) durante un periodo denido de tiempo.
b) El nmero de errores de ortografa que uno comete al escribir una nica pgina.
c) El nmero de llamadas telefnicas en una central telefnica por minuto.
d) El nmero de servidores web accedidos por minuto.
e) El nmero de animales muertos encontrados por unidad de longitud de ruta.
f) El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad
de radiacin.
g) El nmero de ncleos atmicos inestables que decayeron en un determinado periodo
de tiempo en una porcin de sustancia radiactiva.
h) La radiactividad de la sustancia se debilitar con el tiempo, por lo tanto el tiempo total
del intervalo usado en el modelo debe ser signicativamente menor que la vida media
de la sustancia.
i) El nmero de estrellas en un determinado volumen de espacio.
j) La distribucin de receptores visuales en la retina del ojo humano.
k) La inventiva de un inventor a travs de su carrera
La distribucin de Poisson surge cuando estamos interesados en medir el nmeros de
sucesos aleatorios que suceden en un intervalo de tiempo jo. La variable aleatoria se dis-
tribuye a lo largo del tiempo o del espacio. Las condiciones para que se trate de una distribu-
cin de Poisson son:
Los eventos de inters deben ocurrir independientemente unos de otros
La probabilidad de que suceda un evento en un intervalo depende de la longitud del
intervalo y no de su posicin.
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 96
Construccin de una distribucin de Poisson
Supongamos que deseamos observar el nmero de ocurrencias de un cierto evento dentro
de un intervalo de tiempo dado, por ejemplo, el nmero de clientes que llegan a un cajero au-
tomtico durante la noche, o tal vez deseamos registrar el nmero de accidentes que ocurren
en cierta avenida durante todo un da. Para modelar este tipo de situaciones podemos denir
la variable aleatoria X como el nmero de ocurrencia de este evento en el intervalo de tiempo
dado. Es claro entonces que X puede tomar los valores 0, 1, 2, . . . , y en principio no ponemos
una cota superior para el nmero de observaciones del evento. Adicionalmente supongamos
que conocemos la tasa media de ocurrencia del evento de inters, que denotamos por la letra
(lambda). El parmetro es positivo y se interpreta como el nmero promedio de ocurren-
cias del evento, por unidad de tiempo. La probabilidad de que la variable aleatoria X tome un
valor entero x 0 se denir a continuacin. Decimos que X tiene una distribucin Poisson
con parmetro > 0, y escribimos X Poisson() cuando:
f (x) =
_

_
e

x
x!
si x = 0, 1, 2, . . .
0 para otro caso
Figura 7.1: Grca de f (x) de la distribucin Poisson
El eje horizontal es el ndice x. La funcin solamente est denida en valores enteros de
x. Las lneas que conectan los puntos son solo guas para el ojo y no indican continuidad.
Proposicin 7.1.3 Sea X Poisson(), entonces tenemos que
a) E(X) =
b) Var(X) =
c) M
X
(t) = e
(e
t
1)
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 97
Demostracin
a) A partir de la denicin de esperanza se tiene que
E(X) =

x=0
x
e

x
x!
=

x=1
e

x
(x 1)!
=

x=1
e

x1
(x 1)!
=
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X
2
) [E(X)]
2
, en-
tonces calculemos primero E(X
2
)
E(X
2
) =

x=0
x
2
e

x
x!
=

x=1
x
e

x
(x 1)!
=

x=1
(x 1+1)
e

x
(x 1)!
=

x=1
(x 1)
e

x
(x 1)!
+

x=1
e

x
(x 1)!
=

x=2
e

x
(x 2)!
+

x=1
e

x1
(x 1)!
=
2

x=2
e

x2
(x 2)!
+

x=1
e

x1
(x 1)!
=
2
+
Entonces:
Var(X) =
2
+
2
=
c) Por la denicin de funcin generadora de momentos, se tiene que
M
X
(t) =

x=0
e
tx
e

x
x!
= e

x=0
(e
t
)
x
x!
= e

e
e
t

= e
(e
t
1)
Ejemplo 7.1.3 Una distribucin de Poisson est dada por
P(X = x) =
e
1,8
(1, 8)
x
x!
Hallar
a) P(X = 1), P(X 2) y P(X 3)
b) E(X),Var(X) y M
X
(t)
Desarrollo
a) Tomando la funcin de probabilidad tenemos que
P(X = 1) =
e
1,8
(1, 8)
1
1!
= 1, 8e
1,8
= 0, 2975
P(X 2) = P(X = 0) +P(X = 1) +P(X = 2)
=
e
1,8
(1, 8)
0
0!
+
e
1,8
(1, 8)
1
1!
+
e
1,8
(1, 8)
2
2!
= 0, 7306
P(X 3) = 1P(x < 3) = 1[P(X = 0) +P(X = 1) +P(X = 2)]
= 10, 7306 = 0, 2694
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 98
b) A partir de la proposicin 7.1.3 se tiene que
E(X) =Var(X) = = 1, 8 y M
X
(t) = e
1,8(e
t
1)
Relacin con la distribucin binomial
La distribucin de Poisson puede ser vista como un caso lmite de la distribucin bino-
mial, es decir, una distribucin binomial en la que n y p 0 se puede aproximar
por una distribucin de Poisson de parmetro = np.
Ejemplo 7.1.4 En una central telefnica automtica la probabilidad de que una lla-
mada sea conectada errneamente es 10
3
.
a) Para un da donde son conectadas 2000 llamadas independientes, hallar el valor
aproximado de la probabilidad que se efecten 4 conexiones errneas.
b) Cul es el nmero mnimo de llamadas independientes que se requieren para
asegurar con probabilidad 0,9 que por lo menos una de las llamadas sea conectada
errneamente?
Desarrollo
a) Sea X la v.a que represente el nmero de llamadas telefnicas conectadas errnea-
mente en un da determinado. Entonces la funcin de probabilidad de X est dada
por:
P(X = x) =
e
np
(np)
x
x!
donde p = 10
3
y n = 2000 segn las condiciones de este problema. Entonces
np = 2 y
P(X = 4) =
e
2
(2)
4
4!
= 0, 09
b) Si X es nuevamente el nmero de llamadas conectadas errneamente en un da
determinado entonces X Poisson(np). Segn la informacin P(X 1) 0, 9 y
considerando que P(X 1) = 1P(X < 1) = 1P(X = 0) entonces:
1
e
np
(np)
0
0!
0, 9
0, 1 e
np
ln|0, 1| np
n 2303 llamadas
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 99
7.1.4. Distribucin geomtrica
En la teora de probabilidad y estadstica, la distribucin geomtrica es cualquiera de las
dos distribuciones de probabilidad discretas siguientes:
La distribucin de probabilidad del nmero X de ensayos de Bernoulli necesaria para
obtener un xito, contenido en el conjunto {1, 2, 3, . . . } o
la distribucin de probabilidad del nmero Y = X 1 de fallos antes del primer xito,
contenido en el conjunto {0, 1, 2, 3, . . . }
A cualquiera de stas dos distribuciones se la denomina distribucin geomtrica, es una
cuestin de convencin y conveniencia.
Construccin de una distribucin geomtrica
Supongamos que tenemos ahora una sucesin innita de ensayos independientes Bernoul-
li, en cada uno de los cuales la probabilidad de xito es p. Para cada una de estas sucesiones
denimos la variable aleatoria X como el nmero de fracasos antes de obtener el primer
xito. Por ejemplo, X(FEFEFF . . . ) = 1, X(EFFEEE . . . ) = 0, X(FFFEFE . . . ) = 3. Ob-
servamos que X puede tomar los valores 0, 1, 2, . . . . La probabilidad de que X tome el valor
entero x 0 es p(1 p)
x
. Decimos entonces que X tiene una distribucin geomtrica con
parmetro p, y escribimos X geo(p) cuando
P(X = x) =
_
_
_
p(1p)
x
si x = 0, 1, 2, . . .
0 para otro caso
El nombre de esta distribucin proviene del hecho de que cuando escribimos la suma
de todas las probabilidades, obtenemos una suma geomtrica. La inspeccin sucesiva de
artculos hasta encontrar una defectuoso, posiblemente en un proceso de control de calidad,
puede modelarse usando una distribucin geomtrica.
Proposicin 7.1.4 Si X es la v.a. que muestra el nmero de fracasos antes del primer xito
esto es; X geo(p) entonces:
a) E(X) =
(1p)
p
b) Var(X) =
(1p)
p
2
c) M
X
(t) =
p
1e
t
(1p)
, con t < ln

1
1p

Demostracin
a) A partir de la denicin de esperanza se tiene que
E(X) =

x=0
xp(1p)
x
= p

x=0
x(1p)
x
= p(1p)

x=0
x(1p)
x1
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 100
=p(1p)

x=1
d
dp
[(1p)
x
] =p(1p)
d
dp
_

x=1
(1p)
x
_
=p(1p)
d
dp
_
1
p
1
_
=p(1p)
(1)
p
2
=
1p
p
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X
2
) [E(X)]
2
, en-
tonces calculemos primero E(X
2
)
E(X
2
) =

x=0
x
2
p(1p)
x
= p

x=1
x
2
(1p)
x
= p(1p)

x=1
x
2
(1p)
x1
=p(1p)

x=1
d
dp
[x(1p)
x
] =p(1p)
d
dp
_

x=1
x(1p)
x
_
=p(1p)
d
dp
_
1
p

x=1
px(1p)
x
_
=p(1p)
d
dp
_
1p
p
2
_
=p(1p)
_
p
2
(1p)2p
p
4
_
=p(1p)
_
p2
p
3
_
=
(1p)(2p)
p
2
Entonces:
Var(X) =
(1p)(2p)
p
2

(1p)
2
p
2
=
1p
p
2
c) Por la denicin de funcin generadora de momentos, se tiene que
M
X
(t) =

x=0
e
tx
p(1p)
x
= p

x=0
[e
t
(1p)]
x
=
p
1e
t
(1p)
con t < ln

1
1p

Observacin: Recordar que una serie geomtrica es de la forma

x=1
r
x1
y converge a
1
1r
si su radio r cumple con la condicin |r| < 1
Ejemplo 7.1.5 Supongamos que un dado ordinario (equilibrado) es lanzado repetidas veces
hasta que aparece el resultado 1 por primera vez. Calcular
a) obtener la distribucin de probabilidad de la v.a. que se ajuste a este experimento y
calcular la probabilidad de obtener el 1 en el cuarto lanzamiento
b) la esperanza, la varianza y la funcin generadora de momentos
Desarrollo
a) Sea X la v.a que represente el nmero de lanzamientos necesarios del dado para obtener
por primera vez el resultado 1. Entonces X geo(P =
1
6
), con lo cual
P(X = x) =
_

_
1
6
_
5
6
_
x
si x = 0, 1, 2, . . .
0 para otro caso
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 101
Por lo que
P(X = 3) =
1
6
_
1
5
6
_
3
=
125
1296
b) Segn la proposicin 7.1.4 se tiene que
E(X) =
1
1
6
1
6
= 5
V(X) =
1
1
5
_
1
6
_
2
= 30
M
X
(t) =
1
6
1e
t
_
1
1
6
_ =
1
65e
t
7.1.5. Distribucin binomial negativa
Si en una sucesin innita de ensayos de Bernoulli (el resultado en cada experimento
es un xito o fracaso) cada uno con parmetro p (0, 1); la variable aleatoria X cuenta el
nmero de fracasos antes de obtener el r-simo xito, entonces decimos que X tiene una
distribucin binomial negativa con parmetros r y p, y escribimos X bin neg(r, p).
Construccin de una distribucin binomial negativa
Para construir una distribucin binomial negativa es necesario conocer el nmero de prue-
bas que se repiten, el r-simo xito en el nmero de pruebas que se repiten y la probabilidad
de que suceda un xito en cada una de las pruebas.
Para n = r, r +1, . . . se dene A
n
como el suceso que establece que el nmero total de
pruebas requeridas para obtener exactamente r xitos es n. Como el suceso A
n
ocurre si y
solo si ocurren exactamente r 1 xitos en las primeras n 1 pruebas y el r-simo xito se
da en la n-simo prueba. Puesto que todas las pruebas son de Bernoulli entonces son todas
independientes entre si y plicando el principio de anlisis combinatorio, se obtiene que:
P(A
n
) =
_
n1
r 1
_
p
r1
(1p)
(n1)(r1)
p
con lo cual
P(A
n
) =
_
n1
r 1
_
p
r
(1p)
nr
(7.1.1)
Si decimos que X es la v.a. que cuenta el nmero de fracasos antes de obtener el r-simo
xito, entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Adems recordemos
que n por denicin de A
n
es nmero de fracasos (x) ms nmero de xitos (r), esto es
n = x +r. Entonces se entiende la v.a. X podra caracterizar numricamente al suceso A
n
como X(A
n
) = x, por lo que tendremos;
P(A
n
) = P(A
x+r
) = P(X = x) (7.1.2)
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 102
Tomando en cuenta las ecuaciones 7.1.1 y 7.1.2 se tiene
P(X = x) =
_

_
_
r +x 1
x
_
p
r
(1p)
x
si x = 0, 1, 2, . . .
0 para otro caso
donde
_
_
r +x 1
x
_
_
=
(r +x 1)!
x!(r 1)!
Aparece el trmino p
r
pues la sucesin de ensayos Bernoulli no concluye sino hasta
obtener r xitos. Podemos tener un nmero variable de fracasos, de ah el trmino (1p)
x
, y
nalmente el factor
_
_
r +x 1
x
_
_
que nos dice las diferentes formas en que los r xitos pueden
aparecer en los r +x1 ensayos realizados antes del ltimo que necesariamente fue un xito.
Es claro que esta distribucin es una generalizacin de la distribucin geomtrica, la cual
se obtiene tomando r = 1.
Proposicin 7.1.5 Si X es la v.a. que muestra el nmero de fracasos antes del r xito esto
es; X bin neg(r, p) entonces:
a) E(X) =
r(1p)
p
b) Var(X) =
r(1p)
p
2
c) M
X
(t) =
_
p
1e
t
(1p)
_
r
, con t < ln

1
1p

Demostracin
Si X es la v.a que cuenta el nmero de fracasos antes del r-simo xito en sucesin
de pruebas de Bernoulli; entonces X =
r

i=1
X
i
, donde todas las v.a. X
i
son independientes
entre si y cada X
i
geo(p), i = 1, 2, . . . , r; con lo cual E(X
i
) =
1p
p
,Var(X
i
) =
1p
p
2
y M
X
i
(t) =
p
1e
t
(1p)
. Esto resulta del hecho de que para cada xito se tubo que haber
tenido un cierto nmero de fracasos, que es la caracterstica de la distribucin geomtrica.
Entonces
a) la esperanza de X es
E(X) = E
_ r

i=1
X
i
_
=
r

i=1
E(X
i
) =
r

i=1
1p
p
=
r(1p)
p
b) la varianza de X es
Var(X) =Var
_ r

i=1
X
i
_
=
r

i=1
Var(X
i
) =
r

i=1
1p
p
2
=
r(1p)
p
2
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 103
c) y la funcin generadora de momentos de X es
M
X
(t) = M_ r

i=1
X
i
_(t) =
r

i=1
M
X
i
(t) =
r

i=1
p
1e
t
(1p)
=
_
p
1e
t
(1p)
_
r
Ejemplo 7.1.6 Se lanza repetidas veces una moneda honesta, cuyos dos resultados son cara
y cruz.
a) Cul es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la funcin generadora de momentos para esta dis-
tribucin
Desarrollo
a) Sea X la v.a. que represente el nmero de caras (fracasos) necesarias astes de obtener
por tercera vez cruz. Entonces X bin neg(3,
1
2
), con lo cual
P(X = x) =
_

_
_
2+x
x
_
_
1
2
_
3
_
1
2
_
x
si x = 0, 1, 2, . . .
0 para otro caso
Por lo que
P(X = 2) =
_
2+2
2
_
_
1
2
_
3
_
1
2
_
2
= 6
_
1
2
_
5
=
6
32
= 0, 1875
b) Segn la proposicin 7.1.5 se tiene que
E(X) =
3
_
1
1
2
_
1
2
= 3
V(X) =
3
_
1
1
2
_
_
1
2
_
2
= 6
M
X
(t) =
1
2
1e
t
_
1
1
2
_ =
1
2e
t
7.1.6. Distribucin hipergeomtrica
Como la mayora de los muestreos se hacen sin remplazamiento. As, si la poblacin es
pequea la probabilidad de obtener el artculo del tipo requerido cambia en cada observacin.
En estadstica la distribucin hipergeomtrica es una distribucin de probabilidad discreta
con tres parmetros discretos N, r y n. Adems es apropiada para muestreos sin reemplaza-
miento de poblaciones pequeas. Esta distribucin se reere a un espacio muestral donde hay
elementos que tienen dos tipos de caractersticas posibles. Indica la probabilidad de obtener
un nmero de objetos x de uno de estos tipos, al sacar una muestra de tamao n, de un total
de N objetos, de los cuales k son del tipo requerido.
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 104
Construccin de una distribucin hipergeomtrica
Supongamos que tenemos un conjunto de N objetos de los cuales k son de una primera
clase y N k son de una segunda clase. Supongamos que de este conjunto tomamos una
muestra aleatoria de tamao n (n N), la muestra es sin reemplazo y el orden de los ob-
jetos seleccionados no importa. El espacio muestral de este experimento consiste de todas
las posibles muestras de tamao n que se pueden obtener del conjunto mayor de tamao N.
La cardinalidad del espacio muestral es
_
N
n
_
. Si para cada muestra denimos la variable
aleatoria X como el nmero de objetos de la primera clase contenidos en la muestra selec-
cionada, entonces X puede tomar los valores 0, 1, 2, . . . , n; suponiendo n k. La probabilidad
de que X tome un valor x estar dada por la frmula que enunciamos a continuacin. Dec-
imos que X tiene una distribucin hipergeomtrica con parmetros N, k y n, y escribimos
X hipergeo(N, k, n) si
P(X = x) =
_

_
_
k
x
__
Nk
nx
_
_
N
n
_
si x = 0, 1, 2, . . . , n
0 para otro caso
El trmino
_
k
x
_
nos dice las diferentes formas en que de los k objetos de la primera clase
se pueden escoger x de ellos, y el trmino
_
Nk
nx
_
es nuevamente las diferentes formas de
escoger nx objetos de la totalidad de Nk objetos de la segunda clase. Usamos el principio
multiplicativo para obtener el nmero total de muestras diferentes en donde x objetos son de
la primera clase y nx objetos son de la segunda clase.
Proposicin 7.1.6 Dada una poblacin nita de tamao N con dos clases posibles de objetos.
Si X es la v.a. que muestra el nmero de objetos de la primera clase contenidos en una muestra
de tamao n seleccionada de dicha poblacin entonces X hipergeo(N, k, n) y presenta las
siguientes caracteristicas:
a) E(X) =
nk
N
b) Var(X) =
nk
N
_
1
k
N
__
Nn
N1
_
Demostracin
Como primer paso seleccionemos n objetos de la poblacin de tamao N que contiene
k objetos de una primera clase y N k objetos de la segunda clase. Denamos a X =
n

i=1
X
i
como la v.a aleatoria que cuenta el nmero de objetos de la primera clase en la muestra
seleccionada; en donde cada X
i
, i = 1, 2, . . . , n es una v.a que presenta las siguientes carac-
tersticas:
X
i
= 1 si se selecciona un objeto de la primera clase en la i-sima extraccin
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 105
X
i
= 0 si se selecciona un objeto de la segunda clase en la i-sima extraccin
Debido a la aleatoriedad, la probabilidad de que la i-sima bola extraida sea de la primera
clase es simplemente
k
N
. Por lo tanto:
P(X
i
= 1) =
k
N
y P(X
i
= 0) =
Nk
N
E(X
i
) = P(X
i
= 1) =
k
N
Var(X
i
) = E(X
2
i
) [E(X
i
)]
2
=
k
N

_
k
N
_
2
=
k
N
_
1
k
N
_
Entonces tenemos que:
a) la esperanza de X es
E(X) = E
_ n

i=1
X
i
_
=
n

i=1
E(X
i
) =
n

i=1
k
N
=
nk
N
b) la varianza de X es
Var(X) =Var
_ n

i=1
X
i
_
= E(X
2
) E(X)
calculemos entonces:
E(X
2
) =
n

x=0
x
2
_
k
x
__
Nk
nx
_
_
N
n
_ =
nk
N
n

x=1
x
_
k 1
x 1
__
Nk
nx
_
_
N1
n1
_
=
nk
N
n

x=1
(x 1+1)
_
k 1
x 1
__
Nk
nx
_
_
N1
n1
_
=
nk
N
_
(k 1)(n1)
N1
n

x=2
_
k 2
x 2
__
Nk
nx
_
_
N2
n2
_ +
n

x=1
_
k 1
x 1
__
Nk
nx
_
_
N1
n1
_
_
=
nk
N
_
(k 1)(n1)
N1
+1
_
=
nk
N
_
(k 1)(n1) +N1
N1
_
Por lo tanto
Var(X) =
nk
N
_
(k 1)(n1) +N1
N1
_

_
nk
N
_
2
=
nk
N
_
N
2
(k +n)N+nk
N(N1)
_
=
nk
N
_
Nk
N
__
Nn
N
_
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 106
Ejemplo 7.1.7 Supngase que una urna contiene cinco bolas rojas y diez azules. Si se selec-
cionan bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el nmero de bolas rojas
extraidas. Si se extraen al azar sin reemplazamiento siete bolas
a) Cul es la probabilidad de seleccionar exactamente cuatro bolas rojas?
b) Cul es la probabilidad de seleccionar almenos tres bolas rojas?
c) Calcular la esperanza y la varianza de esta distribucin
Desarrollo
Como X es la v.a que cuenta el nmero de bolas rojas extraidas en un muestreo sin reem-
plazmiento; se tiene que X hipergeo(15, 5, 7). Por lo tanto
P(X = x) =
_

_
_
5
x
__
10
7x
_
_
15
7
_
si x = 0, 1, 2, 3, 4, 5
0 para otro caso
a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;
P(X = 4) =
_
5
4
__
10
3
_
_
15
7
_ =
5 120
6435
=
40
429
b) Para contestar esta parte debemos calcular P(X 3); que equivale a decir,
P(X 3) = P(X = 3) +P(X = 4) +P(X = 5)
Por lo tanto
P(X 3) =
_
5
3
__
10
4
_
_
15
7
_ +
_
5
4
__
10
3
_
_
15
7
_ +
_
5
5
__
10
2
_
_
15
7
_ =
140
429
+
40
429
+
1
143
=
61
143
c) Segn la proposicin 7.1.6 se tiene que
E(X) =
7 5
15
=
7
3
V(X) =
_
7 5
15
__
155
15
__
157
151
_
=
8
9
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 107
7.2. Distribuciones continuas de probabilidad
7.2.1. Distribucin uniforme continua
Las distribuciones uniformes corresponden al experimento de elegir puntos al azar entre
dos puntos jos a y b. Como la probabilidad de elegir cualquier punto es la misma, la funcin
de densidad tendr la misma altura en todos los puntos entre a y b, es decir se trata de una
funcin constante desde a y b, de altura
1
ba
.
Denicin 7.2.1 Decimos que una variable aleatoria X tiene una distribucin uniforme
continua en el intervalo (a, b), y escribimos X uni f (a, b) cuando su funcin de densidad
es
f (x) =
_

_
1
ba
si a < x < b
0 en otro caso
La grca general de esta funcin se muestra en la Figura 7.1, y es evidente que se
trata de una funcin de densidad pues es no negativa e integra uno. Los parmetros de esta
distribucin son los nmeros a y b.
Figura 7.2: Grca de f (x) de la distribucin exponencial
Proposicin 7.2.1 Sea X la v.a. continua con distribucin uniforme en el intervalo (a, b),
entonces X tiene las siguientes caractersticas
a) E(X) =
a+b
2
b) Var(X) =
(ba)
2
12
c) M
X
(t) =
e
bt
e
at
(ba)t
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 108
d) F(x) =
_

_
0 si x > a
x
ba
si a x < b
1 si x b
Demostracin
Como X es una v.a. continua con distribucin uniforme en el intervalo (a, b) entonces su
funcin de densidad de probabilidad es
f (x) =
_

_
1
ba
si a < x < b
0 en otro caso
con lo cual
a) por denicin de esperanza para v.a. continua
E(X) =

x f (x)dx =

b
a
x
1
ba
dx =
1
2(ba)
x
2

b
a
=
1
2(ba)
(b
2
a
2
) =
a+b
2
b) por denicin de varianza para v.a continua
Var(X) =

_
x
a+b
2
_
2
1
ba
dx =
1
3(ba)
_
x
a+b
2
_
3

b
a
=
1
3(ba)
__
b
a+b
2
_
3

_
a
a+b
2
_
3
_
=
1
3(ba)
__
ba
2
_
3

_
ab
2
_
3
_
=
1
3
(ba)
2
4
=
(ba)
2
12
c) por dencicin de funcin generadora de momentos
M
X
(t) =

e
tx
1
ba
dx =
1
ba

b
a
e
tx
dx =
1
t(ba)
e
tx

b
a
=
e
bt
e
at
(ba)t
d) por denicin de funcin de distribucin
F(x) = P(X x) =
_

_
0 si x < a

x
0
1
ba
du si a x < b
1 si x > b
=
_

_
0 si x < a
x
ba
si a x < b
1 si x b
Ejemplo 7.2.1 Supongase que tenemos una cuerda de 2m de longitud que queremos cortar
por un punto al azar a una cierta distancia de uno de los extremos. Sea X la v.a. que represente
el punto elegido; entonces
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 109
Figura 7.3: Grca de F(x) de la distribucin exponencial
a) Expresar y grcar la funcin de densidad?
b) Calcular P(X 0, 7), P(X 1) y P(0, 5 X 1, 25)
c) Obtener E(X),Var(X) y M
X
(t), adems a partir de la funcin de densidad obtener y
gracar la funcin de distribucin
Desarrollo
Como X es la v.a que represente el punto elegido entre 0 y 2; entonces X uni f (0, 2)
a) Como el rea debe ser 1, la altura del rectngulo ser
1
2
, entonces la funcin de densidad
es:
f (x) =
_

_
1
2
si 0 < x < 2
0 en otro caso
Figura 7.4: Grca de f (x) del ejemplo 7.2.1
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 110
b) Calculemos ahora P(X 0, 7), P(X 1) y P(0, 5 X 1, 25)
P(X 0, 7) =

0,7
0
1
2
dx =
1
2
x

0,7
0
=
1
2
(0, 70) = 0, 35
P(X 1) =

2
1
1
2
dx =
1
2
x

2
1
=
1
2
(21) =
1
2
P(0, 5 X 1, 25) =

1,25
0,5
1
2
dx =
1
2
x

1,25
0,5
=
1
2
(1, 250, 5) = 0, 375
c) Por la proposicin 7.2.1
E(X) =
0+2
2
= 1 Var(X) =
(20)
2
12
=
1
3
M
X
(t) =
e
2t
e
0t
(20)t
=
e
2t
1
2t
F(x) =
_

_
0 si x < 0
x
2
si 0 x < 2
1 si x 2
Figura 7.5: Grca de F(x) del ejemplo 7.2.1
7.2.2. Distribucin Normal
La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms pro-
fundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente,
como la campana de Gauss. La distribucin de una variable normal est completamente
determinada por dos parmetros, su media smbolizada por y su desviacin estndar sim-
bolizada por .
La distribucin continua de probabilidad ms importante de toda la estadstica es la dis-
tribucin de probabilidad normal.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 111
Denicin 7.2.2 Decimos que una v.a. X tiene distribucin de probabilidad normal si su
funcin de densidad de probabilidad est denida por la siguiente ecuacin:
f (x) =
1

2
2
e

1
2
(
x

)
2
, para < x <
en donde R y > 0 son los parmetros. Escribimos entonces X N(,
2
). La grca de
esta funcin de densidad tiene forma de campana como se puede apreciar en la Figura 7.6, en
donde se muestra adems el signicado geomtrico de los dos parmetros.
Figura 7.6: Representacin grca de f (x) para ciertos valores de y
2
de una variable
aleatoria normal.
No es inmediato pero es posible demostrar que E(X) = , y ello signica que la campana
esta centrada en este valor, el cual puede ser negativo, positivo o cero. Tambin puede de-
mostrarse que Var(X) =
2
, y que la distancia del punto a cualquiera de los dos puntos en
donde la funcin tiene puntos de inexin es , por lo tanto la campana se abre o se cierra de
acuerdo a la magnitud de este parmetro. El papel que desempean y puede apreciarse
en la grca 7.7.
Caractersticas de la distribucin de probabilidad normal
La distribucin de probabilidad normal con su curva tiene las siguientes caractersticas:
1. La curva normal tiene forma de campana. La media, la moda y la mediana de la dis-
tribucin son iguales y se localizan en el centro de la distribucin.
2. La distribucin de probabilidad normal es simtrica alrededor de su media. Por o tanto,
la mitad del rea bajo la curva est antes del punto central y la otra mitad despus. El
rea total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asinttica al eje horizontal conforme se aleja
de la media en cualquier direccin. Esto signica que la curva se acerca al eje horizon-
tal conforme se aleja de la media, pero nunca lo llega a tocar.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 112
Figura 7.7: Representacin grca de f (x) de una variable aleatoria normal
La familia de la distribucin de probabilidad normal
La forma de la campana de Gauss depende de los parmetros y . La media indica
la posicin de la campana, de modo que para diferentes valores de la grca es desplazada
a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de
apuntalamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en
torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por
lo tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin.
Como se deduce, no existe una nica distribucin normal, sino una familia de distribu-
ciones con una forma comn, diferenciadas por los valores de sus medias y sus varianzas.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas es-
tarn centradas en la misma posicin y tendrn diferentes formas; tal como lo muestra
la Figura 7.8.
Figura 7.8: Curvas normales que tienen medias iguales y desviaciones estndar diferentes
Si las curvas tienen desviaciones estndar iguales y medias diferentes, las curvas sern
idnticas pero centradas en diferentes posiciones sobre el eje horizontal, as como lo
muestra la Figura 7.9.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 113
Figura 7.9: Curvas normales que tienen medias diferentes y desviaciones estndar iguales
Si las curvas tienen medias diferentes y tambin sus desviaciones estndar son difer-
entes entonces aparte de estar centradas en diferentes lugares del eje x, tendr formas
diferentes; as como lo muestra la Figura 7.10.
Figura 7.10: Curvas normales que tienen medias diferentes y desviaciones estndar diferentes
La distribucin normal estndar
En particular, decimos que la variable aleatoria X tiene una distribucin normal estndar
si tiene una distribucin normal con parmetros E(X) = = 0 y Var(X) =
2
= 1. En este
caso la funcin de densidad se reduce a la siguiente expresin
f (x) =
1

2
e

x
2
2
Para facilitar los clculos se decidi tabular las diferentes probabilidades para variable
aleatoria que sigue una distribucin normal. Pero, puesto que sera imposible tener una tabla
para cada posible distribucin normal, se elabor solamente una, la tabla de la distribucin
normal estndar.
De esta manera solo se tiene que transformar o estandarizar una distribucin normal es-
pecca, se revisa la tabla, y se conoce la probabilidad. Para la estandarizacin se debe re-
alizar la siguiente operacin.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 114
Proposicin 7.2.2 Sea X una variable aleatoria con distribucin normal con parmetros
y
2
. Entonces la siguiente variable aleatoria tiene una distribucin normal estndar
Z =
X

(7.2.3)
Demostracin
Para probar que Z sigue una distribucin normal estandar debemos mostrar que E(Z) = 0
y Var(Z) = 1. Recordemos adems que si X N(,
2
) entonces E(X) = y Var(X) =
2
.
Para realizar la demostracin de esta proposicin recordemos adems las propiedades de la
esperanza y la varianza de una v.a. Por lo tanto
E(Z) = E
_
X

_
=
1

E(X ) =
1

[E(X) ] =
1

[] = 0
Var(Z) =Var
_
x

_
=
1

2
Var(X ) =
1

2
Var(X) =
1

2
= 1
A la operacin anterior se le conoce con el nombre de estandarizacin, y bajo tal transfor-
macin se dice que la variable X ha sido estandarizada. Es comn usar la letra Z para denotar
una variable aleatoria con distribucin normal estndar, y seguiremos nosotros tambin esa
costumbre.
La proposicin anterior parece muy modesta pero tiene una gran importancia opera-
cional pues establece que el clculo de las probabilidades de una variable aleatoria normal
cualquiera se reduce al clculo de las probabilidades para la normal estndar. Explicaremos
esta situacin con ms detalles. Suponga que X es una variable aleatoria con distribucin
N(,
2
), y que deseamos calcular, por ejemplo, P(a < X < b), para a < b nmeros dados.
Tenemos entonces que
P(a < X < b) = P(a < X < b) = P
_
a

<
X

<
b

_
por lotanto
P(a < X < b) = P
_
a

< Z <
b

_
La igualdad de estas probabilidades es consecuencia de la igualdad de los eventos. De
esta forma una probabilidad que involucra a la variable X se ha reducido a una probabilidad
que involucra a una variable Z.
reas bajo la curva normal
Una caracterstica que tiene cualquier distribucin normal es que el rea bajo la curva,
que representa la probabilidad de que la variable aleatoria tome ciertos valores X x, se
distribuye siempre en la misma proporcin.
En la tabla de la distribucin normal estndar, estn registradas las reas bajo la curva
normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo se
necesita transformar la distribucin normal de inters en una distribucin normal estndar
mediante la frmula, y el rea a la derecha del valor z ser el mismo que el rea a la derecha
de x, esto es P(X x) = P(Z z).
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 115
Ejemplo 7.2.2 Los coecientes intelectuales de 600 aspirantes de cierta universidad se dis-
tribuyen aproximadamente de forma normal con una media de 115 y una desviacin estndar
de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) tenga un coeciente mayor de 120
b) tenga un coeciente menor de 100
c) tenga un coeciente menor de 122
d) tenga un coeciente entre 115 y 125
e) tenga un coeciente entre 90 y 105
Desarrollo
Segn las condiciones del problema la v.a. X representa el coeciente intelectual del
estudiante elegido y adems X N(115, 144).
Para calcular las probabilidades de los distintos itens debemos transformar esta distribu-
cin normal en una distribucin normal estndar (con media cero y desviacin estndar 1),
para lo cual hay que cambiar el valor de x por un valor z con la frmula z =
x 115
12
. Entonces
la probabilidad de que:
a) tenga un coeciente mayor de 120 es: P(X > 120) = P
_
Z >
120115
12
_
= P(Z > 0, 41)
La distribucin ya transformada se observa en el siguiente grco:
Se busca el valor del rea para 0 Z 0, 41 en la tabla de reas bajo la curva normal
estandar; que corresponde al valor 0,1591. Como el rea a la derecha del valor z = 0, 41
es el que corresponde a la probabilidad pedida, entonces la probabilidad de que un
aspirante a la universidad tenga un coeciente intelectual mayor de 120 es:
P(X > 120) = P(Z > 0, 41) = 0, 50, 1591 = 0, 3409
b) tenga un coeciente menor de 100 es:
P(X < 100) =
_
Z <
100115
12
_
= P(Z <1, 25)
La distribucin ya transformada queda as:
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 116
En la tabla de reas bajo la curva normal estandar no se tabularon valores z negativos,
pero como la curva normal es simtrica, el rea entre cero y el valor z = 1, 25 sm-
bolizado por A(1, 25); es del mismo tamao que el rea entre cero y el valor z = 1, 25
dada por A(1, 25), por lo que solo se necesita buscar en la tabla el rea correspondiente
al valor positivo de z. Como el rea que se busca esta a la izquierda de z = 1, 25, se
tiene que:
P(X < 100) = P(Z <1, 25) = 0, 5A(1, 25) = 0, 50, 3944 = 0, 1056
c) tenga un coeciente menor de 122 es:
P(X < 122) =
_
Z <
122115
12
_
= P(Z < 0, 58)
La distribucin ya transformada queda as:
Se busca el valor del rea para 0 Z 0, 58 en la tabla de reas bajo la curva normal
estandar, que es el valor 0,2190. Y como el rea a la izquierda del valor z = 0, 58 es el
rea que buscamos, entonces el resultado a buscar es:
P(X < 122) = P(Z < 0, 58) = 0, 5+0, 2190 = 0, 7190
d) tenga un coeciente entre de 115 y 125 es:
P(115 < X < 125) =
_
115115
12
< Z <
125115
12
_
= P(0 < Z < 0, 83)
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 117
Se busca el valor del rea para 0 Z 0, 83 en la tabla de reas bajo la curva normal
estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z =0 y z =0, 83,
entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
e) tenga un coeciente entre de 90 y 105 es:
P(90 < X < 105) =
_
90115
12
< Z <
105115
12
_
= P(2, 08 < Z <0, 83)
Se busca el valor del rea para 2, 08 Z 0, 83 en la tabla de reas bajo la curva
normal estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y
z = 0, 83, entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
7.2.3. Aproximacin normal a la binomial.
Cuando las muestras son pequeas, en una distribucin binomial se obtienen fcilmente
probabilidades asociadas a un evento mediante la frmula de la binomial. Cuando las mues-
tras son grandes, el clculo nos llevara bastante tiempo. La distribucin normal es a menudo
una buena aproximacin a una distribucin binomial cuando np y nq son ms grandes que 5.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 118
Ejemplo 7.2.3 La probabilidad de que un paciente se recupere de una rara enfermedad de la
sangre es 0,4. Si se sabe que 100 personas contrajeron esa enfermedad,
a) Cul es la probabilidad de que menos de 30 sobrevivan?
b) Cul es la probabilidad de que exactamente 35 sobrevivan?
c) Cul es la probabilidad de que a lo ms 30 sobrevivan?
Desarrollo
El primer paso es vericar si el experimento cumple con los requisitos de una distribu-
cin binomial, y si es el caso calcular la media y la desviacin estndar de la distribucin.
Como cada paciente puede recuperarse o no de la enfermedad y adems esta situacin se da
de manera independiente entre dichos pacientes, entonces este experimento cumple con las
condiciones de la distribucin binomial.
Si X es la variable aleatoria que denota el nmero de pacientes que sobreviven a la enfer-
medad (se recuperan), entonces X bin(n = 100; P = 0, 4). Entonces la media y la varianza
de X estan dadas por:
E(X) =
p
= np = (100)(0, 4) = 40
_
Var(X) =
p
=
_
np(1p) =
_
(100)(0, 4)(0, 6) =

24 = 4, 899
a) P(X < 30)
Para resolver el problema con la frmula de la distribucin binomial se tendra que
calcular 30 binomiales, desde la binomial de cero hasta la binomial de 29. Mediante el
uso de la aproximacin normal a la binomial el procedimiento es mucho ms corto.
El primer paso es aplicar al valor de x el factor de correccin de continuidad, que es
simplemente sumar o restar 0, 5 al valor de x, dependiendo del problema. En este caso
queremos la probabilidad de que x valga menos de 30, no incluye al 30, entonces se le
resta 0, 5. En seguida se aplica la frmula de Z, utilizando el valor de x = 29, 5, y en
seguida buscar el rea en la tabla normal:
P(X < 30) = P
_
Z <
29, 540
4, 899
_
= P(Z <2, 14)
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 119
Recordemos que en la tabla de reas bajo la curva normal no se tabulan valores neg-
ativos de z y que la distribucin normal es simtrica; estos A(z) = A(z). Se busca el
valor del rea para 0 Z 2, 14 en la dicha tabla, que corresponde al valor 0,48382.
Y como el rea a la izquierda del valor z =2, 14 es el rea que buscamos, entonces el
resultado a buscar es:
P(X < 30) = P(Z <2, 14) = 0, 50, 48382 = 0, 01618
b) P(X = 35)
En este caso se pide una probabilidad cuando la variable aleatoria X toma un valor
exacto. En una distribucin continua la probabilidad de que la variable aleatoria sea
exactamente un determinado valor no se puede calcular y se estima que es cero, mien-
tras que en una distribucin discreta aproximada a una distribucin normal (continua)
la probabilidad de X sea igual a un valor puntual se calcula sumando y restando el fac-
tor de correccin de continuidad a dicho valor puntual y estimar el rea entre ambos
puntos.
Por lo tanto
P(X = 35) = P
_
34, 540
4, 899
Z
35, 540
4, 899
_
= P(1,12 Z 0, 92)
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 120
Se buscan en tabla, los valores de las reas para 0 z 0, 92 y 0 z 1, 12. Se
encuentra que A(1, 12) =A(1, 12) =0, 3686 y A(0, 92) =A(0, 92) =0, 3212. Como
el rea buscada se encuentra entre z =1, 12 y z =0, 92 que es exactamente igual al
rea comprendida entre z = 0, 92 y z = 1, 12 por la simetra de la distribucin normal;
entonces:
P(X =35) =P(1, 12 Z 0, 92) =A(1, 12)A(0, 92) =0, 36860, 3212 =0, 0474
Oservacin: En este caso, como se pide la probabilidad cuando X es exctamente igual
a 35, lo podemos resolver con la frmula de la binomial, y el resultado que produce es
poco diferente: 0,04913.
c) P(X 30)
Aqu se pide la probabilidad de que X tome valores desde 0 hasta 30 inclusive, como el
30 est incluido el factor de correccin de continuidad se suma. Entonces
P(x 30) = P
_
Z
30, 540
4, 899
_
= P(Z 1, 94)
Como A(1, 94) = A(1, 94); se busca el valor del rea para 0 Z 1, 94 en la tabla,
que corresponde al valor 0,4738. Y como el rea a la izquierda del valor z = 1, 94 es
el rea que buscamos, entonces el resultado a buscar es:
P(X 30) = P(Z <1, 94) = 0, 50, 4738 = 0, 0262
7.2.4. Distribucin ji-cuadrada
Si X
1
, X
2
, . . . , X
k
son variables aleatorias normales e independientes. La suma de X
2
1
, X
2
2
, . . . , X
2
k
se dice que es una variable aleatoria ji-cuadrada (
2
) con k > 0 grados de libertad, es decir

2
k
= X
2
1
+X
2
2
+ +X
2
k
Hay un nmero innito de distribuciones ji-cuadrada, una correspondiente a cada entero
positivo k.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 121
Denicin 7.2.3 Decimos que la variable aleatoria continua X tiene una distribucin ji-
cuadrada con k grados de libertad (k entero positivo), si su funcin de densidad est dada por
la siguiente expresin:
f (x) =
_

_
1

2
k
(
k
2
)
x
k
2
1
e

x
2
si 0 < x <
0 si x 0
Figura 7.11: Grca de f (x) cuando el parmetro k toma los valores 1,2,3,4 y 5
Por la denicin anterior; ji-cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ). Esta distribucin tiene un solo parmetro denotado aqui por
la letra k, y al cual se le llama grados de libertad. Tambin al parmetro de ji-cuadrado se
denota por la letra griega . A pesar de la aparente expresin complicada de f (x), no es difcil
comprobar que es efectivamente una funcin de densidad de probabilidad. La grca de esta
funcin para varios valores del parmetro k aparece en la Figura 7.9.
Escribiremos simplemente X
2
(k), en donde la letra griega se pronuncia ji o
tambin chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribucin ji-cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
Proposicin 7.2.3 Si X es una v. a. que sigue una distribucin normal tipicada (X
N(0, 1)), entonces la v.a. X
2
sigue una distribucin ji-cuadrada con un grado de libertad
(X
2

2
(1)).
Es decir, el cuadrado de una variable aleatoria con distribucin normal estndar tiene
distribucin ji-cuadrada con un grado de libertad. Por otro lado, el siguiente resultado es-
tablece que la suma de dos variables aleatorias independientes con distribucin ji-cuadrada
tiene distribucin nuevamente ji-cuadrada con grado de libertad igual a la suma de los grados
de libertad de los sumandos.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 122
Proposicin 7.2.4 Si X
2
(n) y Y
2
(m) son dos variables aleatorias independientes,
entonces X +Y tiene distribucin
2
(n+m).
En general si las v.a. X
1
, X
2
, . . . , X
n
son independientes y si X
i
; i = 1, 2, . . . , n tiene una
distribucin
2
con n
j
grados de libertad para j =1, 2, . . . , k entonces la suma X
1
+X
2
+ +
X
n
tiene una distribucin
2
con n
1
+n
2
+ +n
k
grados de libertad.
Proposicin 7.2.5 Sean X
1
, X
2
, . . . , X
n
una muestra aleatoria de una distribucin normal
con media y varianza
2
. La distribucin de la v.a. Y =
n

i=1
_
X
i

_
2
es del tipo ji-cuadrado
con n grados de libertad.
Caractersticas de la distribucin ji-cuadrada
La distribucin ji-cuadrada es un caso particular de la distribucin gamma.
Las distribuciones ji-cuadradas son positivamente asimtricas.
Est distribucin esta estrechamente ligada con muestras aleatorias de una distribucin
normal.
En la prctica, las probabilidades ji-cuadradas, cuando k 30, pueden calcularse em-
pleando aproximaciones normales en la forma usual.
La distribucin ji-cuadrado tiene muchas aplicaciones en inferencia estadstica, por
ejemplo en el test ji-cuadrado que consiste en una prueba de independencia y bondad
de ajuste, adems en la estimacin de varianzas.
Tambin est involucrada en el problema de estimar la media de una poblacin normal-
mente distribuida y en el problema de estimar la pendiente de una recta de regresin
lineal, a travs de su papel en la distribucin t de Student que veremos ms adelante,
y participa en todos los problemas de anlisis de varianza, por su papel en la distribu-
cin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias de
distribucin ji-cuadrada e independientes.
7.2.5. Distribucin t de Student
Esta distribucin fue desarrollada por William Sealy Gossett, que trabajaba en el depar-
tamento de fermentacin de la cervecera Guinness en Irlanda. Las circunstancias en las que
se llevan a cabo los procesos de fermentacin en la produccin de cerveza demostraron a
Gosset las limitaciones de la teora de muestras grandes y le enfatizaron la necesidad de un
mtodo correcto para el tratamiento de muestras pequeas. Estas circunstancias de su trabajo
dirigieron a Gosset al descubrimiento de la distribucin t, quin public sus estudios sobre
esta distribucin en 1908 con el seudnimo Student.
Gossett se interes en el comportamiento del valor de una v.a. Y N(0, 1) cuando se
utilizaba S en vez de , y particularmente en la discrepancia entre S y cuando S se calcula
de muestras muy pequeas.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 123
La distribucin t est renacionada con muestras aleatorias de una distribucin normal.
Esta distribucin, as como la
2
, han sido ampliamente aplicadas en problemas importantes
de inferencia estadstica. La distribucin t es conocida tambin como distribucin de Student
en honor de W.S. Gosset. La distribucin t se dene como sigue:
Considerense dos variables aleatorias independientes Y y W, tales que Y tenga una dis-
tribucin normal tipicada y W tenga una distribucin
2
con n grados de libertad. Sea X la
variable aleatoria denida como:
X =
Y
_
W
n
entonces, la distribucin de X se denomina la distribucin t con n grados de libertad.
Denicin 7.2.4 Decimos que la variable aleatoria continua X tiene una distribucin t con
n grados de libertad si su funcin de densidad est dada por:
f (x) =

_
n+1
2
_

n (
n
2
)
_
1+
x
2
n
_

n+1
2
para < x <
en tal caso se escribe X t(n)
Es posible demostrar que E(X) = 0, y Var(X) =
n
(n2)
para n > 2.
Relacin con muestras de una distribucin normal
Supongamos que las variables aleatorias X
1
, X
2
, . . . , X
n
constituyen una muestra aleatoria
de una distribucin normal con media y varianza
2
. Como es usual, se dene a la media
muestral como X =
1
n
n

i=1
X
i
y a la varianza muestral como S
2
=
1
n
n

i=1
(X
i
X)
2
.
Si se denen las variables aleatorias Y y W mediante las relaciones
Y =
(X )

y W =
n

i=1
(X
i
X)
2

2
=
nS
2

2
Vemos que Y N(0, 1) y W
2
(n 1). Adems se sabe que si X y S
2
son variables
aleatorias que resultan de muestras aleatorias normales entonces son independientes. Por lo
que la v.a. T denida por la relacin T =
Y
_
W
n1
tiene distribucin t con n 1 grados de
libertad. Entonces
T =
(X )

nS
2

2
n1
=
(X )

nS

n1
=
(X )

n1
S
Un aspecto importamte es que ni el valor de T ni la distribucin de T dependen del valor
de la varianza
2
. Por lo tanto podemos utilizar la distribucin t en situaciones de muestreo
sobre poblaciones normales que cumplan con las siguientes caracteristicas:
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 124
las muestras extraidas son pequeas (n < 30) y
la varinza
2
es desconocida.
Figura 7.12: Distribucin t versus distribucin normal
Las caractersticas de la distribucin t
1. Es una distribucin continua.
2. Tiene forma de campana y es simtrica.
3. Es una familia de curvas.
4. Todas tienen la misma media de cero, pero sus desviaciones estndar dieren de acuer-
do al tamao de la muestra.
5. La distribucin t es ms baja y dispersa que la distribucin normal. Cuando el tamao
de la muestra se incrementa, la distribucin t se aproxima a la normal.
En resumen la distribucin t se puede encontrar en los siguientes contextos:
Proposicin 7.2.6 Si las variables aleatorias Y N(0, 1) y W
2
(n) son independientes,
entonces la v.a.
X =
Y
_
W
n
t(n)
Proposicin 7.2.7 Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes cada una de ellas
con distribucin N(,
2
). Entonces la v.a.
T =
(X )

n1
S
t(n1)
donde X =
1
n
n

i=1
X
i
y S
2
=
1
n
n

i=1
(X
i
X)
2
.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 125
7.2.6. Distribucin exponencial
El modelo de probabilidad de la exponencial tiene su origen en el proceso de Poisson.
Una probabilidad de Poisson se relaciona con la probabilidad de ocurrencia de un nmero
especco de xitos en intervalos de tiempos nitos, donde el nmero de xitos es la variable
aleatoria.
Invirtiendo los papeles de una variable aleatoria de Poisson se tiene lo que se llama un
modelo exponencial. Una variable aleatoria exponencial X es el intervalo de tiempo, o espa-
cio requerido para obtener un nmero especico de xitos.
La distribucin exponencial se utiliza a menudo en problemas prcticos para representar
la distribucin del tiempo que transcurre antes de la ocurrencia de un suceso.
La distribucin exponencial se usa para modelar intervalos de tiempos entre sucesos. Es
muy usada para simular el tiempo entre llegadas cuando las llegadas son completamente
aleatorias y para modelar tiempo de servicio, en los sistemas de colas.
Denicin 7.2.5 Decimos que una variable aleatoria continua X tiene una distribucin
exponencial con parmetro > 0, y escribimos X exp(), cuando su funcin de densidad
de probabilidad es
f (x) =
_
_
_
e
x
si x > 0
0 si x 0
La grca de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.11.
La correspondiente funcin de distribucin de esta v.a. est dada por
F(x) = P(X x) =
_
_
_
0 si x 0
1e
x
si x > 0
La grca de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.12.
Proposicin 7.2.8 Sea X la v.a. continua con distribucin exponencial, entonces X tiene las
siguientes caractersticas
a) E(X) =
1

b) Var(X) =
1

2
c) M
X
(t) =

t
Demostracin
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 126
Figura 7.13: Grca de f (x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
Figura 7.14: Grca de F(x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 127
Por denicin de esperanza se tiene que
E(X) =

x f (x)dx =


0
xe
x
dx =e
x
_
x +
1

0
=
1

E(X
2
) =

x
2
f (x)dx =


0
x
2
e
x
dx =e
x
_
x
2
+
2x

+
2

2
_

0
=
2

2
Entonces la varianza est dada por
Var(X) =
2

2

_
1

_
2
=
1

2
Finalmente por denicin de funcin generadora de momentos se tiene que
M
X
(t) =

e
xt
f (x)dx =


0
e
xt
e
x
dx =


0
e
(t)x
dx =
e
(t)x
(t)

0
=

t
Ejemplo 7.2.4 Suponga que el tiempo en minutos que un usuario cualquiera permanece re-
visando su correo electrnico sigue una distribucin exponencial de parmetro =
1
5
. Calcule
la probabilidad de que un usuario cualquiera permanezca conectado al servidor de correo
a) menos de un minuto
b) ms de un ahora
c) Calcula la esperanza, varianza y la funcin generadora de momentos
Solucin
a) Para este primer inciso tenemos que
P(X < 1) =

1
0
1
5
e

1
5
x
dx =
1
5
5e

1
5
x

1
0
= 1e

1
5
= 0, 1813
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
P(X > 60) =


60
1
5
e

1
5
x
dx =
1
5
5e

1
5
x

60
= e
12
= 6, 14 10
6
c) Tomando en cuenta la proposicin 7.2.3
E(X)
1
1
5
= 5 Var(X) =
1
(
1
5
)
2
= 25 M
X
(t) =
1
5
1
5
t
=
1
15t
7.3. PROBLEMAS 128
7.3. Problemas
Distribucin binomial
1. Sea X una variable aleatoria con distribucin bin(n, p) tal que E(X) = 4 y Var(X) = 2.
Cules son los valores de n y p?
2. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que la variable Y =
nX tiene distribucin bin(n, 1p). Proporcione una explicacin probabilsta de este
resultado.
3. Sea X con distribucin bin(n, p). Demuestre que para x = 0, 1, . . . , n1, se cumple la
siguiente frmula. Esta expresin permite calcular las probabilidades de esta distribu-
cin de una forma iterativa.
P(X = x +1) =
p(nx)
(1p)(x +1)
P(X = x)
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada cara
caiga exactamente 3 veces.
5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas caras
caigan el mismo nmero de veces.
6. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que
0 Var(X) E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer (M), y
considerando la observacin de 6 nacimientos. Cul de los siguientes eventos es ms
probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
8. La probabilidad de que un paciente se recupere de una extraa enfermedad es 0, 4. Si
se sabe que 15 personas contraen esa enfermedad,
a) Haga un histograma donde represente la distribucin binomial para este caso.
b) Cul es la probabilidad de que sobrevivan al menos 10?
c) Cul es la probabilidad de que sobrevivan de 3 a 8?
d) Calcule la media y la varianza de esta distribucin binomial.
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la razn del
75% de los robos. Encuentre la probabilidad de que entre los siguientes cinco casos de
robo:
a) dos resulten de la necesidad de dinero para comprar drogas
7.3. PROBLEMAS 129
b) al menos tres resulten de la necesidad de dinero para comprar drogas
c) Represente esta distribucin binomial en un histograma
d) Calcule la media y la varianza de esta distribucin binomial
10. Un prominente mdico arma que 70% de las personas con cncer de pulmn son
fumadores empedernidos. Si su aseveracin es correcta:
a) encuentre la probabilidad de que de 10 de tales pacientes menos de la mitad sean
fumadores empedernidos
b) encuentre la probabilidad de que de 10 de los pacientes con cncer de pulmn
ninguno sea fumador empedernido
c) Represente esta distribucin binomial en un histograma
d) Calcule la media y la varianza de esta distribucin binomial
11. De acuerdo con un estudio publicado por un grupo de socilogos de la Universidad de
Massachussets aproximadamente el 60% de los consumidores de Valium en el estado
de Massachussets tomaron Valium por primera vez debido a problemas psicolgicos.
Encuentre la probabilidad de que entre los siguientes ocho consumidores entrevistados
en este estado:
a) tres comenzaron a tomar Valium por problemas psicolgicos.
b) al menos cinco comenzaron a consumir Valium por problemas que no fueron
psicolgicos
c) Represente esta distribucin binomial en un histograma
d) Calcule la media y la varianza de esta distribucin binomial
12. De acuerdo a una encuesta a nivel nacional en Estados Unidos de la universidad de
Michigan a estudiantes universitarios de ltimo ao revela que el 70% de los estudi-
antes desaprueba el consumo diario de la mariguana. Si se seleccionan doce estudiantes
al azar y se les pide su opinin, encuentre la probabilidad de que el nmero de los que
desaprueban fumar mariguana todos los das sea:
a) entre siete y nueve
b) a lo ms cinco
c) no memos de ocho
d) Represente esta distribucin binomial en un histograma
e) Calcule la media y la varianza de esta distribucin binomial.
13. Un estudio examin las actitudes hacia los antidepresivos. El estudio revel que aprox-
imadamente el 70% cree que los antidepresivos en realidad no curan nada, slo en-
cubren el problema real. De acuerdo con este estudio
a) cul es la probabilidad de que al menos tres de las siguientes cinco personas
seleccionadas al azar sean de esta opinin?
b) Represente esta distribucin binomial en un histograma
7.3. PROBLEMAS 130
c) Calcule la media y la varianza de esta distribucin binomial.
14. El departamento de mercadotecnia de Kellogg Company planea realizar una investi-
gacin para determinar si los consumidores de cereal en hojuelas pueden distinguir su
cereal favorito de otros. Para probar el cuestionario y el procedimiento a ser usado se
invit a ocho personas a participar en un experimento. Se les coloc frente a cinco
pequeos tazones de cereal en hojuelas marcados con las letras A, B,C, D, y E para
que identicaran su cereal favorito. A las personas se les inform que solo uno de los
tazones contena su cereal favorito.
a) Si una persona no pudo identicar su cereal favorito y supuso que estaba en el
tazn C. Cul es la probabilidad de que la persona haya adivinado correcta-
mente?
b) Cul es la variable aleatoria en este problema?
c) Es la variable aleatoria discreta o continua? Por qu?
d) Suponga que a las ocho personas les fue imposible identicar su cereal favorito y
trataron de adivinar en cual tazn estaba. Cul es la probabilidad de que ninguno
de los ocho haya adivinado correctamente?
e) Desarrolle una distribucin binomial para este experimento
f) Calcule la media, varianza, y desviacin estndar de la distribucin.
g) Represente la distribucin de probabilidad en una grca.
h) Suponga que siete de las ocho personas identican el cereal que ms les gusta.
Es razonable decir que ellos adivinaron? Explique. Cul es tu conclusin?
i) Por qu es la distribucin binomial apropiada para este problema?
15. Al determinar la concentracin letal de una sustancia presente en agua contaminada,
se encuentra que una cierta concentracin mata el 20% de los peces que se exponen a
ella durante 24 horas. Se colocan 20 peces en un tanque con esta concentracin de la
sustancia. Calcular la probabilidad de que a las 24 hs.
a) sobrevivan exactamente 14
b) sobrevivan por lo menos 10
c) sobrevivan cuando mucho 16
d) sobrevivan entre 5 y 10
16. Harley Davidson, director de control de calidad de la compaa de automviles Kyoto
Motor, se encuentra realizando su revisin mensual de trasmisiones automticas . En
el procedimiento, se retiran 10 trasmisiones de la pila de componentes y se les revisa
en busca de defectos de fabricacin. A lo largo del tiempo solo, el 2% de las trasmi-
siones tienen defectos de fabricacin (suponga que los defectos se presentan de manera
independiente en diferentes trasmisiones).
a) Cual es la probabilidad de que la muestra de Harlley contenga mas de dos
trasmisiones con defectos de fabrica?
7.3. PROBLEMAS 131
b) Cual es la probabilidad de que ninguna de las trasmisiones elegidas tengan
defectos de fabrica?
17. Harry Ohme esta a cargo de la seccin de electrnica de una gran tienda departamental.
Se has dado cuenta de que la probabilidad de que un cliente que solamente se encuen-
tra curioseando compre algo es de 0,3. Suponga que 15 clientes visitan la seccin de
electrnica cada hora.
a) Cual es la probabilidad de que almenos una de las personas que curiosea compr
algo durante una hora dada?
b) Cual es la probabilidad de que almenos cuatro personas que curiosean compre
algo durante una hora dada?
c) Cual es la probabilidad de que ninguna de las personas que curiosean compre
algo durante una hora dada?
d) Cual es la probabilidad de que no mas de cuatro personas que curiosean compre
algo durante una hora dada?
18. Un aparato de radio que no funciona se agrupa accidentalmente con 5 radios que fun-
cionan. Cual es la probabilidad de que se escoja un conjunto de tres radios, el aparato
que no funciona este entre los tres escogidos?
19. Una abogada especializada en litigios por drogas estima que gana el 70% de sus casos
que van a la corte. Acaba de leer Drogas: Un caso para legalizacin en el nmero
del 3 de octubre de 1989 y quiere usar parte de los argumentos del artculo en su
prximo juicio. Considere su probabilidad de xito estimado, si actualmente representa
a 5 acusados en distintos casos. Cul es la probabilidad de qu:
a) gane por lo menos tres casos?
b) por lo menos un caso?
20. En el pasado, Phin Anderson ha cometido errores en el 5% de las declaraciones de im-
puestos que prepara. Cual es la probabilidad de que no cometa errores en las primeras
7 declaraciones que prepara para esta ao scal?
21. Un jefe de proyectos ha comprobado que un subcontratista falla en entregar a tiem-
po las ordenes corrientes, en aproximadamente el 20% de las ocasiones. El jefe de
proyectos tiene 6 ordenes que este subcontratista se comprometi a entregar. Calcule
la probabilidad de que:
a) el subcontratista entregue todas las ordenes
b) el subcontratista entregue almenos cuatro ordenes
c) el subcontratista entregue exactamente 5 ordenes
22. Un complejo sistema electrnico esta construido con cierto nmero de componentes de
apoyo en sus subsistema. Un subsistema contiene cuatro componentes idnticos, cada
uno con una probabilidad de 0,2 de fallar en menos de 1000 hs. El subsistema funciona
si dos componentes cualesquiera de los cuatro trabajan en forma adecuada. Se suponen
que los componentes operan independientemente.
7.3. PROBLEMAS 132
a) Encuentre la probabilidad de que exactamente dos de cuatro componentes resistan
mas de 1000hs.
b) Encuentre la probabilidad de que el subsistema funcione por mas de 1000hs.
23. Sobre una mesa se derraman 20 monedas. Calcular la probabilidad de caigan:
a) por lo menos 5 caras
b) ms de 15 caras
c) entre 12 y 17 caras
d) a lo sumo tres caras
e) como mnimo dos caras
f) cuando mucho cuatro caras
24. Un examen de opcin mltiple esta compuesto de 15 preguntas, con cinco respuestas
posibles cada una, de las cuales solamente una es la correcta. Supngase que uno de
los estudiantes que realiza el examen contesta las preguntas al azar. Cual es la proba-
bilidad de que conteste al menos 10 preguntas correctamente?
25. Un sistema para detectar incendios utiliza tres celdas sensibles a la temperatura que
actan independientemente, talque una o ms pueden activar la alarma. Cada celda
tiene una probabilidad p = 0, 8 de activar la alarma al alcanzar la temperatura de 100
grados Celsius o ms. Sea Y el numero de celdas que activan la alarma cuando la
temperatura alcanza 100 grados. Encuentre la probabilidad de que la alarma funcione
cuando la temperatura alcanza los 100 grados.
26. Suponga que un lote de produccin de 40000 hornos de microondas incluye 32000 sin
ningn defecto, que no requieren en absoluto ningn ajuste. Sin embargo el departa-
mento de control de calidad, sin conocer el dato referente al lote de produccin, toma
una muestra aleatoria de 10 hornos para calcular la calidad global.
a) Cul es la probabilidad de que la muestra sea dividida equitativamente es decir
5 hornos defectuosos y 5 no defectuosos?
b) Cul es la probabilidad de que se encuentre a lo sumo 3 defectuosos?
c) Cul es la probabilidad de que se encuentre por lo menos un horno no defectu-
oso?
d) Cul es la probabilidad de que a lo mas 6 sean no defectuosos?
27. A la larga, el 20% de los gerentes que reciben capacitacin obtienen la calicacin de
sobresaliente, el 50% la de aceptable y el 30% la de insatisfactorio. En una muestra de
20 gerentes seleccionados al azar, encuentre las siguientes probabilidades:
a) exactamente 4 gerentes son calicados con sobresaliente
b) al menos 4 gerentes son calicados con sobresaliente
c) exactamente 15 gerentes son calicados con sobresaliente o aceptable
d) al menos 15 gerentes son calicados con sobresaliente o aceptable
7.3. PROBLEMAS 133
28. Una cadena de moteles ha adoptado la poltica de hacer un descuento del 3% a los
clientes que paguen en efectivo en vez de hacerlo con tarjeta de crdito. Su experiencia
indica que el 30% de los clientes aceptan el descuento. Sea Y el nmero de personas
que aceptan el descuento entre los prximos 20 clientes.
a) Suponiendo que las probabilidades binomiales sean aplicables, encuentre la pro-
babilidad de que exactamente 5 entre los prximos 20 clientes acepten el des-
cuento.
b) Encuentre P(5o menos clientes acepten el descuento)
c) Cul es el valor esperado y la desviacin estndar del nmero de personas que
aceptarn el descuento?
29. Un fabricante de medicamentos arma que solo el 10% que resultan efectivas en las
pruebas con animales pasan el resto de las que se le exige para su comercializacin.
Actualmente, el fabricante tiene 8 nuevos medicamentos de probada efectividad en
experimentos con animales y que esperan pasar en las siguientes pruebas.
a) Encuentre la probabilidad de que ninguno de los 8 medicamentos sea comercial-
izado.
b) Encuentre la probabilidad de que al menos 2 de ellos sean comercializados.
c) Encuentre el nmero esperado de medicamentos comercializados entre los 8 nuevos
medicamentos
30. Una compaa pequea utiliza un servicio de paquetera para enviar los pedidos de
quesos especiales que son para obsequios. La compaa ha encontrado que el 90%
de los paquetes se entregan a tiempo. Se enva un embarque de 20 paquetes. Sea Y =
nmero de paquetes embarcados a tiempo. Suponiendo que las hiptesis binomiales se
cumplen calcular:
a) la probabilidad de que de al menos un paquete se entregue a tiempo
b) la probabilidad de que a lo sumo 6 paquetes no se entreguen a tiempo
c) la probabilidad de que por lo menos 7 paquetes se entreguen a tiempo
d) el valor esperado y la varianza del numero de paquetes embarcados a tiempo
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar en
Estados Unidos durante 1985 fue 27755 dlares. En cuatro familias seleccionadas al
azar, calcular la probabilidad de que:
a) las cuatro tuvieron ingresos mayores que 27755 dlares en 1985
b) una de las cuatro haya tenido ingresos menores 27755 dlares en 1985
32. Entre personas que donan sangre en una clnica, 80% tienen RH+, es decir el factor
Rhesus en su sangre. Cinco personas donan sangre en al clnica en determinado da.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
7.3. PROBLEMAS 134
Distribucin Geomtrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al azar,
se registra su color, y despues se regresa a la urna. Cuntas extracciones en promedio
se necesitan realizar hasta obtener una bola negra por primera vez?
2. Sea X una variable aleatoria con distribucin geo(p). Demuestre que para cualesquiera
a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de prdida de memoria:
P(X a+b|X a) = P(X b).
Distribucin Poisson
1. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que para todo
x = 0, 1, 2, . . . se cumple la siguiente frmula. Esta expresin permite calcular las pro-
babilidades Poisson de una forma iterativa.
P(X = x +1) =

(x +1)
P(X = x)
2. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que la probabili-
dad de que X tome un valor par es
(1+e
2
)
2
.
3. El nmero de computadoras que fallan por mes en un laboratorio de cmputo tiene
una distribucin Poisson con un promedio mensual de =2 mquinas descompuestas.
El laboratorio tiene capacidad para reparar hasta dos mquinas por mes. Cuando se
descomponen ms de dos mquinas, las restantes se envan fuera del laboratorio para
su reparacin.
a) Cul es la probabilidad de que en un mes cualquiera sea necesario enviar mquinas
fuera del laboratorio para su reparacin?
b) Responda al inciso anterior cuando se reduce la capacidad de reparacin del lab-
oratorio a una computadora por mes.
c) Cul es el nmero de computadoras con falla ms probable en un mes?
4. Sea Y una variable aleatoria que tiene una distribucin de Poisson cuyo promedio es
de 2. Calcular:
a) P(Y = 4)
b) P(Y 4)
c) P(Y 4)
5. Si la probabilidad de que un tornillo sea defectuosa es 0,008. Cul es la probabilidad
de que en una caja con 100 tornillos contenga uno o ms defectuosos?
6. Supongamos que la probabilidad de que una persona reciba una inyeccin de penicilina
y sufra una reaccin desfavorable es de 0,0002. Si 3000 personas reciben aplicaciones
de este medicamento. Cul es la probabilidad de que 0,1,2,3,4 o 5 personas reaccio-
nen mal?
7.3. PROBLEMAS 135
7. El nmero de llamadas telefnicas que entra en una central de edicio de ocinas es
de 4 minutos en promedio.
a) Calcular la probabilidad de que no lleguen llamadas en un determinado periodo
de un minuto.
b) Calcular la probabilidad de que por lo menos lleguen 4 llamadas en un periodo
de un minuto.
c) Calcular la probabilidad de que por lo menos lleguen dos llamadas en un periodo
determinado de dos minutos.
8. Se certica la calidad de los discos para computadora pasndolos por un certicador
que cuenta el nmero de pulsos faltantes. Una determinada marca de discos para com-
putadora tiene en promedio 0,1 pulsos faltantes por discos.
a) Calcular la probabilidad de que el siguiente disco que se inspeccione no le falte
pulso.
b) Calcular la probabilidad de que al siguiente disco que se inspeccione le falte mas
de un pulso.
c) Calcular la probabilidad de que a ninguno de dos discos inspeccionados le falten
pulsos.
9. En Estados Unidos se ha establecido el limite mximo nacional de velocidad de 50
millas por hora, desde 1974. Kamerud que ha estudiado los efectos de esta ley, informa
que las frecuencia de accidentes fatales en las carreteras interestatales en 1975, estando
vigente el limite, es aproximadamente 19 10
9
millas-vehculo.
a) Calcular la probabilidad de que se tengan cuando mucho 15 accidentes fatales en
10
9
millas-vehculo.
b) Calcular la probabilidad de que por lo menos se tengan 20 accidentes fatales en
10
9
millas-vehculo.
10. En un sistema de computo de tiempo compartido, el nmero de peticiones de telepuerto
es 0,20 por milisegundo, en promedio y sigue una distribucin de Poisson.
a) Calcular la probabilidad de que no lleguen peticiones durante el siguiente milise-
gundo.
b) Calcular la probabilidad de que no lleguen peticiones durante los siguiente tres
milisegundo.
11. Los grandes almacenes Bon han determinado que la demanda de cierto modelo de
cmara fotogrca tiene una distribucin de Poisson con una media de 2 por semana.
La directora del departamento de cmara quiere estudiar la demanda actual para ver si
se justica ofrecer clases de fotografa. Acaba de leer un articulo sobre el paisaje en el
American Photographer y piensa que ese tipo de clases seria efectivo.
a) Determinar la distribucin de probabilidad de la demanda semanal
b) Si la tienda guarda 4 camaras de estas en una semana dada. Cul es la probabi-
lidad exceda al inventario?
7.3. PROBLEMAS 136
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la llegada por
hora sigue una distribucin de Poisson, averige la probabilidad de que lleguen 15 o
ms autos durante una hora dad de operacin.
13. Se estima que el nmero de taxis que esperan recoger un pasajero delante de la terminal
de mnibus de Asuncin tiene una distribucin de Poisson con una media de 5,5 taxis.
a) Averige la probabilidad de, en una observacin aleatoria haya exactamente 6
taxis esperando.
b) Averige la probabilidad de, en una observacin aleatoria haya mas de 10 taxis
esperando.
c) Averige la probabilidad de, en una observacin aleatoria no haya taxis esperan-
do.
14. La concertista de piano Donna Prima se preocupa cada vez ms por el nmero de
tosidos que se presentan en la audiencia justo antes que empiece a tocar. Durante su
ultima gira, Donna estimo un promedio de 8 tosidos justo antes de empezar su concier-
to. La seora prima le ha prometido a su director que si escucha ms de 5 tosidos en
el concierto esa noche, se rehusar a tocar. Cul es la probabilidad de que la artista
toque esa noche?
15. En promedio cinco pjaros chocan contra el monumento en Washington y mueren por
este motivo cada semana. Bill Garey, un ocial del Servicio del Parque Nacional de Es-
tados Unidos, ha solicitado que el congreso estadounidense asigne fondos para adquirir
equipos que alejen a los pjaros de dicho monumento. Un subcomit del congreso le
ha respondido que pueden asignarle fondos para tal n a menos que la probabilidad de
que mueran ms de tres pjaros cada semana sea mayor que 0,70. Se destinaran los
fondos para la compra de los equipos que alejen a los pjaros del monumento?
16. El nmero de nudos en un tipo particular de madera tiene una distribucin de Poisson
con una media de 1,5 nudos de 10 pies cbicos de madera. Encuentre la probabilidad
de que un bloque de esta madera de 10 pies cbico tenga a lo ms un nudo.
17. El 3% de las calculadoras de bolsillo de un modelo en particular fallan durante el
primer mes de operacin. F Mart acaba de recibir un lote de 100 de estas calculado-
ras.
a) Averige la probabilidad de que ninguna calculadora falle
b) Averige la probabilidad de que fallen ms de tres calculadoras
c) Averige la probabilidad de que menos de 2 calculadoras fallen
18. La Articulate Corporation espera que el 99% de los saldos de sus cuentas por cobrar
sean correctas. Se seleccion una muestra aleatoria de 200 cuentas para auditarlas.
a) Cul es la probabilidad de que ninguna de las cuentas tenga errores ?
b) Cul es la probabilidad de que 5 de las cuentas tenga errores ?
c) Cul es la probabilidad de que ms de 5 cuentas tenga errores ?
7.3. PROBLEMAS 137
19. En los ltimos 20 aos, solo el 2% en promedio de los cheques endosados a la Ameri-
can Herat Association fueron rechazados. Este mes, la asociacin recibi 200 cheques.
Cul es la probabilidad de que:
a) exactamente 10 de ellos sean rechazadas
b) exactamente 5 de ellos sean rechazadas
20. El centro contencioso del condado de Orange, en California maneja varios tipos de
litigios, pero casi todos ellos son del tipo conyugal. De hecho 96% de los pleitos que
atiende el centro son de esta naturaleza. Cul es la probabilidad de que de 80 litigios
atendidos por el centro exactamente 7 no sean del tipo conyugal?
Distribucin Uniforme
1. Sea X una variable aleatoria con distribucin uniforme en el intervalo (1, 4).
a) Obtener la funcin de densidad para esta distribucin uniforme
b) Calcular la probabilidad de que X este entre 1 y 3
c) Calcular la probabilidad de que X sea mayor que 2
d) Obtener la esperanza y la varianza de esta distribucin
2. Se escoge al azar un nmero del intervalo (0, 2)
a) Obtener la funcin de densidad para esta distribucin uniforme
b) Calcular la probabilidad de que el nmero elegido este entre 1 y 1,5
c) Calcular la probabilidad de que el nmero elegido sea mayor que 0,5
d) Obtener la esperanza y la varianza de esta distribucin
3. Se escogen al azar dos nmeros del intervalo (0, 3). Sea X la variable aleatoria que
indica la suma de los dos nmeros elegidos. Si X sigue una distribucin uniforme
a) Obtener la funcin de densidad para X
b) Calcular la probabilidad de que X este entre 2 y 4
c) Calcular la probabilidad de que el nmero elegido sea menor que 4
d) Obtener la esperanza y la varianza de X
Distribucin Normal
1. Sea X con distribucin N(10, 25). Calcule
a) P(X 10)
b) P(X < 0)
c) P(0 < X 10)
d) P(X 20)
e) P(20 < X 10)
2. Sea X con distribucin N(0, 100). Calcule
7.3. PROBLEMAS 138
a) P(X 10)
b) P(X > 0)
c) P(0 < X 40)
d) P(X 30)
e) P(10 < X 10)
3. Encuentre x tal que
a) F(x) = 0, 8666
b) 1F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirn un promedio de 40 meses cuando sus
dietas se restringen drsticamente y despus se enriquecen con vitaminas y protenas.
Suponga que la vida de tales ratones se distribuye normalmente con una desviacin
estndar de 6,3 meses, encuentre la probabilidad de que un ratn viva:
a) Ms de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) Cul es la probabilidad de que de seis ratones 4 vivan ms de 30 meses?
5. Las barras de centeno que cierta panadera distribuye a las tiendas locales tienen una
longitud promedio de 30 centmetros y una desviacin estndar de 2 centmetros.
Suponga que las longitudes se distribuyen normalmente, qu porcentaje de las bar-
ras son
a) Ms largas de 31,7 cm?
b) Entre 29,3 cm. y 33,5 cm de longitud?
c) Entre 32 cm y 35 cm?
d) Ms cortas de 38 cm?
e) Entre 27,5 cm. y 30 cm?
f) Cul es la probabilidad de que de 4 barras, tres midan ms de 35 cm?
6. Un abogado va todos los das de su casa a su ocina en el centro de la ciudad. El tiempo
promedio del viaje es 24 minutos, con una desviacin estndar de 3,8 minutos. Si las
duraciones de los viajes estn distribuidas normalmente:
a) Cul es la probabilidad de que un viaje tome al menos
1
2
hora?
b) Si la ocina abre a las 9:00 a.m. y l sale de su casa diariamente a las 8:45 a.m.,
qu porcentaje de las veces llega tarde al trabajo?
c) Si sale de su casa a las 8:35 a.m. y el caf se sirve en la ocina de las 8:50 a.m. a
las 9:00 a.m., cul es la probabilidad de que llegue a la hora del caf?
7.3. PROBLEMAS 139
d) Encuentre cual es el tiempo a partir del cual que duran el 15% de los viajes ms
lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
mximo
1
2
hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174,5
cm y una desviacin estndar de 6,9 cm., cuntos de estos estudiantes se esperara
que tuvieran alturas
a) Menores de 160 cm?
b) Entre 171,5 cm y 182 cm?
c) Mayores a 165 cm?
d) Entre 174,5 cm y 180 cm?
e) Entre 180 cm y 195 cm?
f) Menores de 185 cm?
g) Cul es la probabilidad de que de cinco estudiantes, al menos 3 midan ms de
180 cm?
h) Cul es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160
cm?
8. Una estacin de radio encontr que el tiempo promedio que una persona sintoniza esa
estacin es de 15 minutos con una desviacin estndar de 3,5 minutos. Cual es la
probabilidad de que un radioescucha sintonice la estacin por:
a) ms de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como mximo sintonizan la estacin el 70% de los radioes-
cuchas?
e) Cul es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estacin por ms de 5 minutos?
9. Un analista nanciero seala que (conforme a su probabilidad subjetiva) el precio Y de
los bonos de gobierno a largo plazo, con un valor de 1000 dlares, tendr al cabo de un
ao una distribucin normal con un valor esperado de 980 dlares y desviacin tpica
de 40 dlares.
a) Encuentre P(Y 1000)
b) Encuentre P(Y 940)
c) Encuentre P(960 Y 1060)
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que se basa
en un sistema de pago a destajo) tiene una distribucin normal con un valor esperado
de 5,10 dlares y una desviacin estndar de 0,40 dlares.
7.3. PROBLEMAS 140
a) Encuentre la probabilidad de que el salario por hora de un trabajador sea superior
a 5,40 dlares
b) Encuentre la probabilidad de que el salario por hora de un trabajador se encuentre
entre 4,70 y 5,50 dlares
c) Encuentre la probabilidad de que el salario por hora sea superior al salario mnimo
de 3,90 dlares
11. Se ha determinado que la vida til de cierta marca de llantas radiales tiene una distribu-
cin normal con media 38000 kilmetros y desviacin estndar 3000 kilmetros.
a) Cul es la probabilidad de que una llanta elegida al azar tenga vida til de cuando
menos 35000 km.?
b) Cul es la probabilidad de que dure mas de 45000 km.?
12. Si un distribuidor hace un pedido de 500 llantas de las especicadas en el problema
anterior . Aproximadamente cuantas llantas duraran:
a) entre 40000 y 45000 kilmetros?
b) 40000 kilmetros o ms?
13. Una operacin de maquinado produce ejes de aceros cuyos dimetros estn distribui-
dos normalmente con un promedio de 1,005 pulgadas y desviacin estndar de 0,01
pulgadas. Las especicaciones piden dimetros que queden en el intervalo 1, 000, 02
pulgadas. Qu porcentaje de la produccin no cumplir las especicaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes tiene una
distribucin normal aproximada con promedios de 200 horas y una varianza de 400
horas.
a) Calcular la probabilidad de que el mes prximo el ausentismo total por enfer-
medad sea menar que 150 horas.
b) Para plantear el programa del mes prximo. Cunto tiempo debe suponer darse
el ausentismo por enfermedad, si aquella cantidad solo se debe superar con una
probabilidad de tan solo 0,10.
15. Una empresa elctrica fabrica focos que tienen una duracin, antes de fundirse, que se
distribuye normalmente con una media igual a 800 horas y una desviacin estndar de
40 horas.
a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas
b) Sabiendo que el porcentaje de los focos de mayor duracin es de 35,5%, encuen-
tre el tiempo de duracin.
16. Las calicaciones de un examen se distribuyen normalmente con valor esperado igual
a 74 y desviacin estndar igual a 7. Si 12% de la clase obtiene Calicacin A . Cul
es la A ms baja posible y la B ms alta posible?.
7.3. PROBLEMAS 141
17. Si los ingresos mensuales de mdicos Norteamericanos estn distribuidos normal-
mente, con media 15000 dlares y con un desvo estndar de 3500 dlares . Cul
es la probabilidad de que un medico elegido al azar tenga un ingreso anual de :
a) superior a 16260 dlares
b) entre 16260 y 18500 dlares
c) entre 11500 y 18500 dlares
d) entre 8000 y 11500 dlares
18. Los puntos logrados por los candidatos en una prueba de actitud estn distribuidos
normalmente con una media de 500 y una desviacin 100. Qu porcentaje de los
candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad estn normalmente distribuidos con
media de 70 pulgadas, con un desvo estndar de 3 pulgadas.
a) Si la estatura mnima para ser probado en el equipo de baloncesto es de 72 pul-
gadas. Que proporcin de los estudiantes estaran en condiciones de someterse
a la prueba?
b) Si para ocupar la posicin de centro hay que tener una estatura de 76 pulgadas.
Que proporcin de los estudiantes aptos para jugar baloncesto podran ocupar
dicho lugar?
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una desviacin
tpica de 10. Si quisiramos dar al 15% superior una calicacin A , al 20% siguiente
B, al 30% del medio C, al siguiente 25% D y al 10% ms bajo F. Qu calicaciones
numricas siguen el trazado de la curva?.
21. Las distribucin de los salarios de 2000 trabajadores tiene una media de 70 dlares y
una varianza de 36 dlares. Suponga que la distribucin es normal aproximada. Calcu-
lar la probabilidad que ganen:
a) entre 65 y 77 dlares
b) 82 dlares y mas
c) Cuantos trabajadores ganan 60 dlares o menos?
22. Un especialista en ictiologa tropical esta interesado en estimar cuanto tiempo puede
sobrevivir cierto tipo de pez en agua con determinado porcentaje de toxicidad. Luego
de una serie de experimentos llega a estimar que la vida media de este tipo de pez
alcanza 100 das con un desvi estndar de 20 das.
a) Cul es la probabilidad de un pez sobreviva ms de 110 das?
b) Cul es la probabilidad de un pez sobreviva entre 95 y 105 das?
7.3. PROBLEMAS 142
23. Dos estudiantes fueron informados de que haban recibido referencias tipicadas de
0,8 y -0,4 respectivamente, en un examen de ingls. Si sus puntuaciones fueron de 88
y 64 respectivamente. Hallar la media y la desviacin tpica de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviacin tpica 15 libras. Suponiendo que los pesos se distribuyen normalmente,
hallar
a) el nmero de estudiantes que pesan entre 120 y 155 libras
b) la probabilidad de que un estudiante pese ms de 185 libras
25. Una fabrica de productos para televisores vende transistores de vida media de 1000
horas y desviacin estndar de 100 horas. Suponiendo que la distribucin de vida en
horas de los transistores es normal, calcular:
a) la probabilidad de que un transistor elegido al azar tenga una duracin de vida
comprendida entre 875 y 1075 horas
b) la probabilidad de que un transistor elegido al azar tenga una duracin de vida
mayor a 1020 horas
26. La cantidad semanal que una compaa gasta en mantenimiento y reparaciones tiene
una distribucin normal aproximada cuyo promedio es de 400 dlares y su desviacin
estndar 20 dlares. Si el presupuesto para cubrir los gastos de reparacin para la sem-
ana siguiente es de 450 dlares.
a) Cul es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) De cuanto debe ser el presupuesto semanal para mantenimientos y reparaciones
para que tan solo se rebase con una probabilidad de 0,1.
27. Los conductores que se fabrican para utilizar en determinado sistema de computo nece-
sitan tener resistencias que varen entre 0,12 y 0,14 ohm. Las resistencias reales medi-
das de los conductores que producen la compaa A tiene una distribucin normal con
un promedio de 0,13 ohm y una desviacin estndar de 0,005 ohm.
a) Cul es la probabilidad de que un conductor seleccionado al azar de la produc-
cin de la compaa A cumpla con las especicaciones?
b) Si se usan cuatro de estos conductores en el sistema y son de la compaa A .
Cul es la probabilidad de que los cuatro conductor cumplan con las especica-
ciones?
28. A una temperatura de 25

C, las resistencias de un termistor de determinado tipo tiene


una distribucin normal con un promedio de 10000 ohm y una desviacin tpica de
4000 ohm. Los termistores se clasicaran para enviar a un cliente, los que tengan re-
sistencias entre 8000 y 15000 ohm. Qu fraccin de los termistores se debe enviar?
29. Los tiempos de las primera avera de una unidad de cierta marca de impresoras de
chorro de tinta tienen aproximadamente una distribucin normal con un promedio de
1500 horas y una desviacin estndar de 200 horas.
7.3. PROBLEMAS 143
a) Qu fraccin de esas impresoras fallarn antes de 1000 horas?
b) Cul debe ser el tiempo de garanta para estas impresoras si el fabricante desea
que solo presente averas el 5% de las impresoras dentro del tiempo de garanta?
30. Una encuesta entre los habitantes de cierta ciudad, indic que el ingreso promedio era
de 45000 guaranes, con una desviacin estndar de 5000 guaranes. Admitiendo una
distribucin normal para la variable ingreso, calcular
a) porcentaje de habitantes con renta superior a 55000 guaranes
b) porcentaje de habitantes con rentas comprendidas entre 50000 y 52000 guaranes
31. Se acepta que la vida de las bombillas producidas por una compaa elctrica tiene una
distribucin normal, con una media igual a 1000 hs. y una desviacin tpica de 50 hs.
Determinar la probabilidad de que una bombilla tomada al azar se queme:
a) en memos de 900 hs.
b) entre 900 y 1100 hs.
32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersin de 15 kilo-
gramos. Suponiendo que la variable peso se encuentre normalmente distribuida, de-
terminar:
a) Cuntas vacas pesan entre 120 y 155 kilogramos?
b) Cuntas vacas pesan 185 kilos o ms?
c) Cuntas vacas pesan menos de 128 kilogramos?
33. En un examen de matemticas, el puntaje promedio es de 42 puntos, con una desviacin
estndar de 9 puntos. Hay un 10% de compaeros que por tener mayor puntaje reciben
un premio. Se pide determinar el puntaje mnimo para lograr dicho premio, suponiendo
normal la distribucin de las calicaciones.
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso en una
Facultad, indicaron una distribucin aproximadamente normal de la variable puntaje
con un valor medio de 60 puntos y una dispersin de 8 puntos. Calcular el porcentaje
de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
Aproximacin normal a la binomial
1. Investigadores de la Universidad George Washington reportan que aproximadamente
75% de las personas creen que los tranquilizantes funcionan muy bien para hacer que
una persona est ms tranquila y relajada. De las siguientes 80 personas entrevistadas,
cual es la probabilidad de que
a) Al menos 50 sean de esa opinin?
7.3. PROBLEMAS 144
b) A lo ms 56 tengan esta opinin?
c) Entre 60 y 70 tengan esta opinin?
d) Exactamente 43 tengan esta opinin?
2. Si el 20% de los residentes de una ciudad de Estados Unidos preere un telfono
blanco sobre cualquier otro color disponible. Cul es la probabilidad de que entre los
siguientes mil telfonos que se instalen en esta cuidad
a) Entre 170 y 200 sean blancos
b) Al menos 210 sean blancos
c) Ms de 225 sean blancos
d) Entre 180 y 225 sean blancos
3. Un fabricante de medicamentos sostiene que cierto medicamento cura una enfermedad
de la sangre en promedio el 80% de los casos. Para vericar esta armacin, inspec-
tores de gobierno utilizan el medicamento en una muestra de 100 individuos y deciden
aceptar la armacin si 75 o ms se curan.
a) Cul es la probabilidad de que el gobierno acepte la armacin?
b) Cul es la probabilidad de que el gobierno rechace la armacin si en realidad
la probabilidad de curarse es de 0,70?
4. Un estudio sobre nuevos delincuentes juveniles revel que el 38% de ellos vuelve a
delinquir.
a) Cul es la probabilidad de que de cien nuevos delincuentes juveniles 30 o ms
vuelvan a delinquir?
b) Cul es la probabilidad de que de 50 nuevos delincuentes juveniles 40 o menos
vuelvan a delinquir?
c) Cul es la probabilidad de que de 35 nuevos delincuentes juveniles 15 vuelvan a
delinquir?
5. Para varios millares de artculos que se mantienen en existencia en una empresa, existe
una probabilidad global del 0,08 de que un articulo especico (incluyendo tamao y
color determinado) no se encuentre en existencia. Si para un embarque que cubre los
pedidos para 120 artculos distintos.
a) Cul es la probabilidad de que 15 o ms de ellos no se encuentren en existencia?
b) Cul es la probabilidad de que haya entre 10 y 15 artculos que no se encuentren
en existencia?
6. La probabilidad de que un paciente se recupere de una delicada operacin del corazn
es 0,9. De los siguientes 100 pacientes que tienen estas operacin cul es al probabi-
lidad de que:
a) sobrevivan entre 84 y 95 inclusive ?
b) sobrevivan menos de 86 ?
7.3. PROBLEMAS 145
7. La Articulate Corporation espera que el 99% de los saldos de sus cuentas por cobrar
sean correctas. Se selecciono una muestra de 200 cuentas para auditarlas.
a) Cul es la probabilidad de que ninguna de las cuentas tengan errores?
b) Cul es la probabilidad de que 5 de las cuentas tengan errores?
c) Cul es la probabilidad de que ms de 5 cuentas tengan errores?
8. En los ltimos 20 aos, solo 3% de los cheques endosados a la American Herat Asso-
ciation fueron rechazados. Este mes, la asociacin recibi 200 cheques . Cul es la
probabilidad de que:
a) exactamente 10 de ellos sean rechazadas?
b) exactamente 5 de ellos sean rechazadas?
c) ms de 20 sean rechazadas?
d) a lo sumo 30 sean rechazadas?
9. Suponga que el 10% de los habitantes de una ciudad son pelirrojos. Un grupo de en-
cuestadores selecciona 200 personas al azar y les pregunta condencialmente por quien
votaran en las prximas elecciones.
a) Cul es la probabilidad de que 15 o ms sean pelirrojos?
b) Cul es la probabilidad de que 30 o menos sean pelirrojos?
c) Cul es la probabilidad de que 20 sean pelirrojos?
10. Supngase que se sabe que la probabilidad de recuperacin de cierta enfermedad es de
40
a) la probabilidad de que ms de 20 personas se recuperen
b) la probabilidad de que se recuperen entre 10 y 25 personas inclusive
c) el valor esperado de personas que se recuperan
11. Si el 15% de motores elctricos producidos por una lnea de montaje son defectuosos,
determinar la probabilidad de que entre 100 motores elegidos al azar :
a) haya a lo sumo 20 defectuosos
b) por lo menos 80 no defectuosos
c) hayas entre 15 y 25 defectuosos
12. La proporcin de familias que usan el jabn A en cierta ciudad es de 0,3. Se toma una
muestra aleatoria de 40 familias. Determinar
a) el numero esperado de familias que usen el jabn A
b) la probabilidad de que mas de 12 familias usen el jabn A
c) la probabilidad de que menos de 30 familias usen el jabn A
13. La proporcin de estudiantes que reciben calicacin C es de 0,7. Se toma una muestra
aleatoria de 150 estudiantes.
7.3. PROBLEMAS 146
a) Cul es la probabilidad de que a lo sumo 100 estudiantes tengan calicacin C?
b) Cul es la probabilidad de que cuando menos 95 estudiantes tengan calicacin
C?
c) Cul es la probabilidad de que exactamente 105 estudiantes tengan calicacin
C?.
14. La probabilidad de que una persona que entra en un supermercado efecte compra es
de 0,80. Si entran 35 personas diariamente. Calcular la probabilidad de que :
a) ms de 25 personas realicen compras
b) por lo menos 28 efectu compras
Distribucin Exponencial
1. Suponga que el tiempo que un usuario cualquiera permanece conectado a un servidor
en una red de cmputo se puede modelar como una variable aleatoria con distribucin
exponencial con media igual a 10 minutos. De mil usuarios, Cuntos tienen un conex-
in superior a una hora?. Calcule adems la probabilidad de que un usuario cualquiera
a) no permanezca conectado mas de 10 minutos.
b) permanezca conectado ms de 10 minutos pero menos de una hora
2. Sabemos que la duracin del tipo de bombillas que usamos sigue una distribucin
exponencial de media 6 horas.
a) Si una persona entra a la habitacin con la luz encendida dispuesta a permanecer
siete horas. Podr hacerlo sin que se funda la bombilla?.
b) Encuentre el tiempo promedio de duracin de las bobillas.
3. Si la cantidad de dinero pagado por cada pliza en una compaa de seguros se dis-
tribuye exponencialmente con media 2000.
a) Si una persona en este momento est pagando una poliza de seguros a la compaa
cul es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compaa.
4. Una mquina de servicio tiene una unidad de reserva para sustituirla de inmediato
cuando falle. El Tiempo a la falla (tiempo entre fallas) de la mquina (o de su unidad
de reserva) es exponencial, y sucede cada 40 minutos en promedio.
a) El operador de la mquina dice que sta tiene la costumbre de descomponerse
cada noche a eso de las 8:30 P.M. Analizar lo que dice el operador.
b) La cantidad promedio de fallas en una semana, suponiendo que el servicio se
ofrece 24 horas por da y 7 das por semana.
c) La probabilidad de que haya al menos una falla en un perodo de 2 horas.
d) La probabilidad de que la prxima falla no suceda en menos de 3 horas.
7.3. PROBLEMAS 147
e) Si no ha sucedido falla en 3 horas despus de la ltima falla, cul es la probabi-
lidad de que el tiempo entre fallas sea de 4 horas cuando mucho?.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial con
valor medio de 0,05 hora. La ocina abre a las 8:00 A.M.
a) Escriba la distribucin exponencial que describa el tiempo entre llegadas.
b) Determine la probabilidad de que no lleguen clientes a la ocina hasta las 8:15
A.M.
c) Son las 8:35 A.M. El ltimo cliente entr a las 8:26. Cul es la probabilidad de
que el siguiente cliente llegue antes de las 8:38 A.M.? Y de que no llegue hasta
las 8:40?.
d) Cul es la cantidad promedio de clientes que llegan entre las 8:10 y las 8:45
A.M.?
6. Suponga que el tiempo entre descomposturas de una mquina es exponencial, con
promedio de 6 horas. Si la mquina ha trabajado sin fallar durante las ltimas tres
horas, cul es la probabilidad de que continue sin fallar durante la prxima hora? De
que se descomponga durante la siguiente 0,5 hora?.
7. El tiempo entre llegadas a una sala de juego en la sociedad de alumnos es exponencial,
con una media de 10 minutos.
a) Cul es la frecuencia de llegadas por hora?
b) Cul es la probabilidad de que no lleguen alumnos a esa sala durante los 15
minutos siguientes?.
c) Cul es la probabilidad de que al menos un alumno visite la sala de juegos du-
rante los prximos 20 minutos?
8. El gerente de un nuevo restaurante de comida rpida desea cuanticar el proceso de
llegadas de clientes, estimando la fraccin del intervalo de tiempo entre llegadas que
sea:
a) menor que 2 minutos,
b) entre 2 y 3 minutos y
c) ms de 3 minutos.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por hora.
El tiempo entre llegadas tiene distribucin exponencial.
9. Ana y Pedro, dos empleados de un restaurante de comida rpida, juegan lo siguiente
mientras esperan la llegada de clientes. Pedro le paga 2 dlares a Ana si el prximo
cliente no llega en menos de 1 minuto; en caso contrario, Ana le paga a Pedro 2 dlares.
Calcule la recompensa promedio de Pedro en un perodo de 8 horas. El tiempo entre
llegadas es exponencial, con una media de 1,5 minutos.
7.3. PROBLEMAS 148
10. Si un cliente llega a McDonalds en menos de 4 minutos despus del cliente inmediato
anterior, recibir un descuento del 10%. Si el tiempo entre llegadas es entre 4 y 5
minutos, el descuento, es del 6%. Si el tiempo entre llegadas es mayor que 5 minutos,
el cliente tiene 2% de descuento. El tiempo entre llegadas es exponencial, con media
de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el mximo des-
cuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial, con una
media de 9000 horas (ms o menos 1 ao de funcionamiento), y la empresa otorga una
garanta de 1 ao con el refrigerador. Cul es la probabilidad de que la garanta cubra
una reparacin por descompostura?.
12. Los nios nacen en un estado poco poblado, con una frecuencia de un nacimiento cada
12 minutos. El tiempo entre nacimientos sigue una distribucin exponencial. Determi-
nar
a) La cantidad promedio de nacimientos por ao
b) La probabilidad de que no haya nacimientos en cualquier da
c) La probabilidad de emitir 50 certicados de nacimientos en 3 horas, cuando se
emitieron 40 certicados durante las primeras 2 horas del perodo de 3 horas.
d) Suponga que el empleado que pasa la informacin de los certicados de nacimien-
to a la computadora suele esperar hasta que se hayan acumulado 5 certicados.
Calcule la probabilidad de que el empleado capture un nuevo lote en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a subastas.
En cada viaje se garantiza una compra. El tiempo entre los viajes tiene distribucin
exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un perodo de
3 meses.
b) La probabilidad de que el coleccionista no compre ms de 8 obras de arte por
ao.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine lo sigu-
iente:
a) La cantidad promedio de llegadas durante 5 minutos.
b) La probabilidad de que no haya llegadas durante el prximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5 minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media de 5
minutos. El restaurante abre a las 11:00 A.M. Determine:
7.3. PROBLEMAS 149
a) La probabilidad de tener 10 llegadas al restaurante hasta las 11:12 A.M. si hubo
8 llegadas hasta las 11:05.
b) La probabilidad de que un cliente llegue entre las 11:28 y las 11:33 A.M. si el
ltimo cliente lleg a las 11:25 A.M.
Captulo 8
Muestras aleatorias y distribuciones de
muestreo.
8.1. Introduccin
Supongamos que tenemos una poblacin de inters, esto es, un conjunto arbitrario de in-
dividuos (personas, animales, plantas objetos en general) cualesquiera, y deseamos conocer
cierta informacin de esta poblacin. Debido a la imposibilidad o no conveniencia de tener
informacin de todos y cada uno de los elementos de la poblacin, generalmente tomamos un
pequeo subconjunto de ella, al cual llamamos muestra. Con base en esta muestra trataremos
de inferir la informacin de la poblacin en su totalidad.
8.2. Muestras aleatorias y estadsticos muestrales
Denicin 8.2.1 Una muestra aleatoria (escribimos simplemente m.a.) es una coleccin de
variables aleatorias X
1
, X
2
, . . . , X
n
que son independientes e idnticamente distribuidas.
De este modo, cuando se diga, por ejemplo, que una muestra aleatoria es tomada de una
poblacin normal con media y varianza
2
, ello signica que las variables aleatorias que
forman la m.a. son independientes entre s, y todas ellas tienen la misma distribucin normal
y los mismos parmetros que la poblacin. Una muestra aleatoria constituye el elemento
bsico para llevar a cabo inferencias estadsticas.
Denicin 8.2.2 Una estadstica o estadstico muestral es una funcin cualquiera de una
muestra aleatoria X
1
, X
2
, . . . , X
n
, y por lo tanto es tambin una variable aleatoria.
150
8.3. MTODOS DE MUESTREO 151
Una estadstica es entonces cualquier funcin de las variables aleatorias que se observaron
en la muestra; de manera que esta funcin no contiene cantidades desconocidas.
Veremos a continuacin dos ejemplos de estadsticas que sern usados con frecuencia
ms adelante. Considere una muestra aleatoria X
1
, X
2
, . . . , X
n
. La funcin X denida como
sigue
X =
1
n
n

i=1
X
i
es una estadstica, y se le conoce con el nombre de media muestral. El otro ejemplo es el de
la varianza muestral, que se puede expresar de dos maneras distintas y se denen por
S
2
=
1
n
n

i=1
(X
i
X)
2
y

S
2
=
1
n1
n

i=1
(X
i
X)
2
8.3. Mtodos de Muestreo
Por qu muestrear?
Muestreo es la actividad por la cual se toman ciertas muestras de una poblacin de ele-
mentos de los cuales vamos a tomar ciertos criterios de decisin, el muestreo es importante
porque a travs de l podemos hacer anlisis de situaciones de una empresa o de algn campo
de la sociedad.
Y porque no se estudia la poblacin completa? se preguntaran algunos, pero en oca-
siones no es factible, veamos algunas razones por las cuales conviene muestrear:
1. La naturaleza destructiva de algunas pruebas.
Por ejemplo se quiere conocer la resistencia de los tornillos que se fabrica en una plan-
ta, para conocerla es necesario destruir el producto, lgicamente no podemos probar
toda la poblacin porque nos quedaramos sin productos.
2. La imposibilidad fsica de chequear todos los elementos de la poblacin.
Por ejemplo se quiere conocer el efecto de un nuevo insecticida en las moscas, como se
puede comprender no es posible contactar a todas las moscas para realizar el estudio.
3. El costo de estudiar a toda la poblacin es muy alto.
Por ejemplo se quiere conocer la opinin de la poblacin sobre cierto personaje de la
poltica, si en el pas hay 100 millones de habitantes, se tendra que contratar mucho
personal y equipo para realizar el estudio.
4. El tiempo para contactar a toda la poblacin es inviable.
En ocasiones se necesita informacin rpida para tomar una decisin importante, tal
vez estudiar a toda la poblacin nos lleve ms tiempo del que disponemos.
8.3. MTODOS DE MUESTREO 152
Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero
para que podamos extraer conclusiones, es importante que elijamos bien las muestras para
nuestros estudios. Hay cuestiones que debemos especicar a la hora de elegir una muestra:
a) El tipo de muestreo que se va a utilizar.
b) El tamao de la muestra.
c) El nivel de conanza de las conclusiones que vamos a presentar.
Clasicacin de los mtodos de muestreo
Los mtodos de muestreo pueden dividirse en dos grandes grupos: mtodos de muestreo
probabilsticos y mtodos de muestreo no probabilsticos.
Muestreos no probabilsticos
No sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra ex-
trada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabi-
lidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.
Muestreo intencional u opinativo: en el que la persona que selecciona la muestra es
quien procura que sea representativa, dependiendo de su intencin u opinin, siendo
por tanto la representatividad subjetiva.
Muestreo sin norma: se toma la muestra sin norma alguna, la muestra podra ser
representativa si la poblacin es homognea y no se producen sesgos de seleccin.
Muestreos probabilsticos
Los muestreos probabilsticos son aquellos en los que todos los individuos tienen la mis-
ma probabilidad de ser elegidos para formar parte de una muestra. Dentro de los mtodos de
muestreo probabilsticos encontramos los siguientes tipos:
1. Muestreo aleatorio simple
2. Muestreo sistemtico
3. Muestreo estraticado
4. Muestreo por conglomerados
8.3.1. Muestreo aleatorio simple
Una muestra seleccionada de modo que cada uno de los individuos en la poblacin tengan
las mismas posibilidades de ser seleccionados.
El procedimiento de seleccin consiste en:
primeramente se asigna un nmero a cada elemento de la poblacin,
8.3. MTODOS DE MUESTREO 153
despus al azar (como una urna, tablas de nmeros aleatorios, nmeros aleatorios gen-
erados electrnicamente, etc.) se eligen los elementos necesarios para la muestra.
La ventaja de este mtodo de muestreo es que es sencillo y de fcil comprensin. Sus
desventajas son:
requiere que se posea de antemano un listado completo de toda la poblacin y
que cuando se trabaja con muestras pequeas es posible que no represente a la poblacin
adecuadamente.
Ejemplo 8.3.1 En una compaa con 150 trabajadores se quiere obtener una muestra aleato-
ria de 15 elementos para un chequeo mdico. Se sigue el siguiente procedimiento:
1) Los trabajadores fueron numerados del 1 al 150
2) Mediante una tabla de nmeros aleatorios se procede a seleccionarlos.
3) El punto de arranque en la tabla se ja mediante la hora en ese momento, 4:03, por lo
tanto se inicia en la la 4, columna 3.
4) Como los nmeros de los trabajadores van desde 1 hasta 150 solo se toman en cuenta las
primeras 3 cifras de cada nmero y se registran los nmeros que se vayan encontrando
en ese rango.
El primer nmero encontrado fue el 054 en la la 4 columna 5, se siguen revisando
los nmeros horizontalmente, el siguiente seleccionado fue el 095 y as sucesivamente. La
muestra de 15 nmeros fue la siguiente:
054 095 080 004 147
005 050 024 046 018
041 021 105 009 146
8.3.2. Muestreo aleatorio sistemtico
Se acomodan los individuos de la poblacin en cierta forma. Se selecciona un punto de
partida aleatorio y luego se toma cada k-simo miembro para formar parte de la muestra.
El procedimiento de seleccin consiste en:
primeramente es necesario conocer el nmero de los elementos de la poblacin (N) y
el tamao que deber tener la muestra (n);
se dene cada cuantos elementos de la poblacin seleccionaremos uno para la muestra
con la siguiente ecuacin k =
N
n
.
Se comienza la seleccin eligiendo aleatoriamente el primer elemento entre 1 y k, luego
se cuentan k elementos y se selecciona el segundo y as sucesivamente hasta completar
la muestra.
Este mtodo tiene las ventajas:
8.3. MTODOS DE MUESTREO 154
de ser fcil de aplicar,
no es necesario tener un listado de toda la poblacin y
asegura una cobertura de unidades de todos los tipos.
Su desventaja es que si la constante de muestreo est asociada con el fenmeno de inters,
las estimaciones obtenidas a partir de la muestra pueden contener un sesgo.
Ejemplo 8.3.2 Suponga que la poblacin de inters consiste de 2000 expedientes en un
archivo. Para seleccionar una muestra de 100 con el mtodo aleatorio simple primero se ten-
dra que numerar todos los expedientes. En este mtodo se selecciona el primer expediente
de acuerdo al mtodo aleatorio simple, luego como se quiere una muestra de 100, se divide
2000
100
= 20, y se selecciona un expediente cada 20.
8.3.3. Muestreo aleatorio estraticado
En un muestreo aleatorio estraticado se divide la poblacin en subgrupos denomina-
dos estratos, y se selecciona una muestra de cada uno de ellos. En ciertas ocasiones resultar
conveniente estraticar la muestra segn ciertas variables de inters. Para ello debemos cono-
cer la composicin estraticada de la poblacin objetivo a muestrear. Una vez calculado el
tamao muestral apropiado, este se reparte de cierta manera que puede ser proporcional o no
proporcional entre los distintos estratos denidos en la poblacin. Como el nombre lo indca,
un procedimiento o ajacin de muestreo proporcional requiere que el nmero de individuos
de cada estrato est en la misma proporcin que la problacin.
Entre sus ventajas, este mtodo asegura que la muestra represente adecuadamente a la
poblacin en funcin de ciertas variables seleccionadas, adems de obtener estimaciones
ms precisas.
La desventaja es que se ha de conocer como se distribuye la poblacin de acuerdo a las
variables utilizadas para la estraticacin.
Ejemplo 8.3.3 Se quiere obtener una muestra de 50 estudiantes de la universidad. Se pre-
tende que la muestra sea representativa en relacin al lugar de origen de los estudiantes (si
son de la localidad o son forneos). Se sabe que en esta universidad el 30% de los estudi-
antes son forneos. Primero debemos identicar los estratos de la poblacin y sus respectivas
proporciones:
Estududiantes locales 0.70
Estudiantes forneos 0.30
La muestra deber mantener esas mismas proporciones, para lo cual es preciso multiplicar
el tamao de la muestra (n) por las proporciones de los estratos y obtenemos el nmero de
elementos que sern selecionados de cada estrato:
Estudiantes locales (0,70)(50) = 35
Estudiantes forneos (0,30)(50) = 15
Ahora se procede a seleccionarlos por medio de alguno de los mtodos anteriores.
8.4. DISTRIBUCIONES MUESTRALES 155
8.3.4. Muestreo aleatorio por conglomerados
El muestreo por conglomerados consiste en dividir la poblacin en sectores o conglom-
erados, seleccionar una muestra aleatoria de esos sectores, y nalmente obtener una muestra
aleatoria de cada uno de los sectores seleccionados. Muchas veces se le emplea para reducir
el costo de realizar un muestreo de una poblacin dispersa en una gran rea geogrca.
Entre sus ventajas se encuentra que es muy eciente cuando la poblacin es muy grande
y dispersa, adems de que no es preciso tener un listado de toda la poblacin, slo de las
unidades primarias de muestreo.
Su desventaja radica en que una muestra de conglomerados, usualmente produce un may-
or error muestral (por lo tanto, da menor precisin de las estimaciones acerca de la poblacin)
que una muestra aleatoria simple del mismo tamao.
Ejemplo 8.3.4 Se quiere conocer la opinin de los padres de familia sobre los temas de edu-
cacin sexual tratados en los libros de texto de primaria en la Repblica Mexicana. Como la
poblacin est muy dispersa y es muy grande, es necesario hacer un muestreo por conglom-
erados en varias etapas.
Primero dividimos la Repblica en sectores geogrcos, que podran ser los estados, y
seleccionamos una muestra aleatoria de ellos. Luego en cada uno de ellos hacemos una se-
leccin aleatoria de escuelas primarias. Y por ltimo en las escuelas seleccionadas obtenemos
una muestra aleatoria de padres de familia.
8.3.5. Error de Muestreo
Al seleccionar una muestra aleatoria, sin importar por cual de los cuatro mtodos, es
poco probable que la media de la muestra sea idntica a la media de la poblacin de donde
fue obtenida. De la misma forma, es probable que la desviacin estndar de la muestra no
sea exactamente igual al valor correspondiente de la poblacin. Por lo tanto podemos esperar
alguna diferencia entre un estadstico muestral y el correspondiente parmetro poblacional.
Esta diferencia es llamada error de muestreo.
8.4. Distribuciones Muestrales
Las distribuciones muestrales constituyen distribuciones de probabilidad de los estadsti-
cos muestrales. Por ejemplo si tomamos una muestra aleatoria X
1
, X
2
, . . . , X
n
de una poblacin
con cierta distribucin y calculamos X y S
2
; podramos establecer una distribucin muestral
de medias y una distribucin muestral de varianzas. Adems si tenemos dos poblaciones
podemos extraer muestras aleatorias de cada poblacin, calcular ciertos extadsticos mues-
trales de cada poblacin, establecer relaciones entre ellos y nalmente obtener una distribu-
cin para dicha relacin. Por ejemplo si tenemos dos poblaciones y extraemos muestras
aleatorias de ciertos tamaos de cada poblacin, luego calculamos las medias muestrales
correspondientes, adems de las respectivas varianzas, podramos establecer una distribu-
cin muestral de sumas o de diferencias medias y una distribucin muestral de relaciones de
varianzas.
8.4. DISTRIBUCIONES MUESTRALES 156
A continuacin presentaremos primeramente algunas distribuciones muestrales para el
caso de una sola poblacin y luego distribuciones muestrales para el caso de dos poblaciones.
8.4.1. Distribucin Muestral de Medias
Denicin 8.4.1 Una distribucin muestral de medias es una distribucin de probabilidad
de todas las posibles medias muestrales, de un tamao de muestra dado, seleccionadas de una
poblacin.
Para nes de entender mejor el concepto de distribucin muestral de medias estudiemos
la siguiente poblacin. Don Pepe en su restaurante tiene 5 parrilleros (poblacin), a los cuales
se les paga por hora segn su trabajo. Las percepciones de los parrilleros son las siguientes:
Parrillero Percepcin por hora
Adrin $ 9,00
Blas $ 8,00
Carmela $ 8,00
Diana $ 8,00
Enrique $ 7,00
La poblacin en este ejemplo son los ingresos por hora de los cinco parrilleros. Si calculamos
la media de esta poblacin obtendramos
=
9+8+8+8+7
5
= 8
Para facilitar la explicacin y comenzar a elaborar la distribucin muestral de medias,
vamos a jar el tamao de muestra (n) en 2. Formamos todas las posibles muestras de tamao
2, y como vemos en el siguiente cuadro son 10, y a cada una le calculamos la media.
muestra parrilleros percepciones media
1 A - B 9,00 8,00 8,50
2 A - C 9,00 8,00 8,50
3 A - D 9,00 8,00 8,50
4 A - E 9,00 7,00 8,00
5 B - C 8,00 8,00 8,00
6 B - D 8,00 8,00 8,00
7 B - E 8,00 7,00 7,50
8 C - D 8,00 8,00 8,00
9 C - E 8,00 7,00 7,50
10 D - E 8,00 7,00 7,50
A continuacin elaboramos una distribucin de probabilidad con las medias de las mues-
tras, quedando de la siguiente manera:
Distribucin Muestral de Medias para n=2
media muestral frecuencia Probabilidad
7,50 3 0,3
8,00 4 0,4
8,50 3 0,3
10 1,0
8.4. DISTRIBUCIONES MUESTRALES 157
Calculamos la media de la distribucin que acabamos de hacer:

X
=
3(7, 5) +4(8, 0) +3(8, 5)
10
= 8
A partir de las observaciones anteriores podemos supioner que la media de la distribucin
muestral de medias es igual a la media de la poblacin y que la forma de la distribucin
muestral presenta un cambio respecto a la forma de la poblacin.
Proposicin 8.4.1 La media de la distribucin muestral de medias denotada por
X
est
dada por
E(X) =
X
=
donde es la media de la poblacin de la cual provienen todas las muestras de tamao n.
Demostracin
Para realizar la demostracin de esta proposicin recordemos que una muestra aleato-
ria de tamao n esta constituida por n variables aleatorias independientes e identicamente
distribuidas, esto es cada una de las variables aleatorias X
i
, i = 1, 2, . . . , n intervinientes
tienen los mismos parmetros que el de la poblacin de la cual provienen. Por lo tanto
E(X
i
) = , i = 1, 2, . . . , n; entonces
E(X) = E
_
1
n
n

i=1
X
i
_
=
1
n
n

i=1
E(X
i
) =
1
n
n =
Proposicin 8.4.2 Si una poblacin es innita o si el muestreo es con reemplazamiento,
entonces la varianza de la distribucin muestral de medias, denotada por
2
X
, esta dada por
E(X )
2
=
2
X
=

2
n
donde
2
es la varianza de la poblacin de la cual provienen todas las muestras de tamao n.
Demostracin
Como ya se dijo anteriormente las variables aleatorias X
i
, i = 1, 2, . . . , n intervienientes
en la muestra aleatoria son independientes e identicamente distribuidas con lo cual tendremos
que Var(X
i
) =
2
, i = 1, 2, . . . , n y para cualquier par de variables aleatorias X
i
, X
j
, i = j
en la muestra se tendr Var(X
i
+X
j
) =Var(X
i
) +Var(X
j
). Por lo tanto
E(X )
2
=
2
X
=Var(X) =Var
_
1
n
n

i=1
X
i
_
=
1
n
2
n

i=1
Var(X
i
) =
1
n
2
n
2
=

2
n
Observacin: Cuando el tamao de la poblacin es nita o el muestreo es sin reemplaza-
miento, entonces

2
X
=

2
n
_
Nn
N1
_
Cuando el tamao de la muestra es pequeo (n < 30) y la varianza poblacional es de-
sconocida, la distribucin muestral de medias se podr relacionar con la distribucin t de
Student, teniendo en cuenta que t
c
=
(X )

n1
S
t(n1).
8.4. DISTRIBUCIONES MUESTRALES 158
8.4.2. Teorema del Lmite Central
El Teorema del Lmite Central consiste en un conjunto de resultados acerca del compor-
tamiento de las distribuciones muestrales. En el que se arma, bajo ciertas hiptesis, que la
distribucin de las medias de un nmero muy grande de muestras se aproxima a una distribu-
cin normal.
El trmino Central, debido a Poly (1920), signica fundamental, o de importancia cen-
tral, este describe el rol que cumple este teorema en la teora de la probabilidad.
Muchos grandes matemticos colaboraron para desarrollar el teorema del lmite central,
sin embargo Laplace ocupa un lugar fundamental, a pesar de que nunca enunci formalmente
este resultado, ni lo demostr rigurosamente, a l le debemos este importante descubrimiento.
Teorema 8.4.1 Teorema del Lmite Central:
Para una poblacin con una media y una varianza
2
, la distribucin de las medias
de todas las muestras posibles de tamao n generadas de la poblacin estar distribuida de
forma aproximadamente normal asumiendo que el tamao de la muestra es lo sucientemente
grande.
Con relacin al teorema del lmite central debemos enfatizar en:
1. Si el tamao de la muestra n es sucientemente grande (n 30) la distribucin de las
medias ser aproximadamente normal. No importa si la poblacin es normal, sesgada
u uniforme, si la muestra es grande el teorema se aplicar.
2. La media de la poblacin y la media de la distribucin de todas las posibles mues-
tras sern iguales. Si la poblacin es grande y un gran nmero de muestras son selec-
cionadas de esa poblacin entonces la media de las medias muestrales se aproximar a
la media poblacional.
3. La desviacin estndar de la distribucin muestral de las medias, a la que llamaremos
error estndar, es determinado por:
a) Si la poblacin es innita o si el muestreo es con reemplazamiento:
X
=

n
b) Si la poblacin es nita o el muestreo es sin reemplazamiento:
X
=

n
_
Nn
N1
Ejemplo 8.4.1 Los pesos de los paquetes recibidos en un departamento de almacenamiento
tienen una media de 300 libras y una desviacin estndar de 50 libras.
a) Cul es la probabilidad de que el peso medio de 35 paquetes recibidos aleatoriamente
sea menor que 320 libras?
b) Cul es la probabilidad de que el peso medio de 40 paquetes recibidos aleatoriamente
sea mayor que 290 libras?
c) Cul es la probabilidad de que el peso de 25 paquetes recibidos aleatoriamente y car-
gados en un ascensor supere el lmite de seguridad del ascensor, que es 8200 libras?
8.4. DISTRIBUCIONES MUESTRALES 159
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente =300 libras y =50 libras. Como no se conoce el tamao de la poblacin
se asume que es innita, por lo que los parmetros de la distribucin muestral de medias
sern:
X
= = 300 libras y
X
=

n
=
50

n
libras. Entonces la probabilidad de que
a) el peso medio de 35 paquetes recibidos aleatoriamente sea menor que 320 libras es
P(X < 320) = P
_
Z <
320300
50

35
_
= P(Z < 2, 37) = 0, 5+A(2, 37)
Buscando en la tabla de la distribucin Z encontramos que A(2, 37) = 0, 4911 por lo
que la probabilidad buscada esta dada por
P(X < 320) = 0, 5+0, 4911 = 0, 9911
b) el peso medio de 40 paquetes recibidos aleatoriamente sea mayor que 290 libras
P(X >290) =P
_
Z >
290300
50

40
_
=P(Z >1, 26) =0, 5+A(1, 26) =0, 5+A(1, 26)
Buscando nuevamente en la tabla de Z encontramos que A(1, 26) = 0, 3962 por lo que
la probabilidad buscada esta dada por
P(X > 290) = 0, 5+0, 3962 = 0, 8962
8.4. DISTRIBUCIONES MUESTRALES 160
c) el peso de 25 paquetes recibidos aleatoriamente y cargados en un ascensor supere el
lmite de peso de 8200 libras es
P
_
X >
8200
25
_
= P
_
Z >
328300
50

25
_
= P(Z > 2, 8) = 0, 5A(2, 8)
Buscando en la tabla de la distribucin Z encontramos que A(2, 8) =0, 4974 por lo que
la probabilidad buscada esta dada por
P(X > 328) = 0, 50, 4974 = 0, 0026
Ejemplo 8.4.2 El peso medio de un grupo de 1000 estudiantes es de 68,2 kg y la desviacin
estndar es de 2,5 kg. Halle la probabilidad de que en una muestra de 100 estudiantes la
media muestral
a) sea mayor que 68,9 kg
b) est entre 67,5 y 68,5 kg
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente = 68, 2 kg y = 2, 5 kg. El tamao de la poblacin es 1000 estudiantes,
por lo que los parmetros de la distribucin muestral de medias sern:
X
= = 68, 2 kg y

X
=

_
Nn
N1
=
2, 5

100

_
1000100
10001
= 0, 2373 kg. Entonces la probabilidad de que
la media muestral
a) sea mayor que 68, 9 kg es
P(X > 68, 9) = P
_
Z >
68, 968, 2
0, 2373
_
= P(Z > 2, 95) = 0, 5A(2, 95)
Buscando en la tabla de la distribucin Z encontramos que A(2, 95) = 0, 4984 por lo
que la probabilidad buscada est dada por
P(X > 328) = 0, 50, 4984 = 0, 0016
8.4. DISTRIBUCIONES MUESTRALES 161
b) est entre 67, 5 y 68, 5 kg es
P(67, 5 < X < 68, 5) = P
_
67, 568, 2
0, 2373
< Z <
68, 568, 2
0, 2373
_
= P(2, 95 < Z < 1, 26)
= A(2, 95) +A(1, 26) = A(2, 95) +A(1, 26)
Buscando en la tabla de la distribucin Z encontramos que A(2, 95) = 0, 4984 y
A(1, 26) = 0, 3962 por lo que la probabilidad buscada est dada por
P(67, 5 < X < 68, 5) = 0, 4984+0, 3962 = 0, 8946
8.4.3. Distribucin Muestral de Varianzas
Supongase que las variables aleatorias X
1
, X
2
, . . . , X
n
constituyen una muestra aleatoria de
una distribucin normal con media conocida y varianza desconocida
2
>0. Se desarrollar
ahora una distribucin de muestreo para la varianza muestral S
2
. Por denicin
S
2
=
1
n
n

i=1
(X
i
)
2
Como el parmetro poblacional no siempre es conocido, muchas veces se sustituye
por X, en la denicin de varianza muestral. Entonces

S
2
=
n

i=1
_
X
i
X
_
2
n1
y S
2
=
n

i=1
_
X
i
X
_
2
n
8.4. DISTRIBUCIONES MUESTRALES 162
Deduccin de la distribucin de muestreo de S
2
La sustitucin anterior lo realizamos para determinar la distribucin de muestreo de S
2
,
con base a una muestra aleatoria proveniente de una distribucin normal. Entonces
S
2
=
1
n
n

i=1
(X
i
X)
2
=
1
n
n

i=1
[(X
i
) (X )]
2
nS
2
=
n

i=1
[(X
i
)
2
2(X
i
)(X ) +(X )
2
]
=
n

i=1
(X
i
)
2
2(X )
n

i=1
(X
i
) +
n

i=1
(X )
2
=
n

i=1
(X
i
)
2
2n(X )
2
+n(X )
2
=
n

i=1
(X
i
)
2
n(X )
2
Por lo tanto
n

i=1
(X
i
)
2
= nS
2
+n(X )
2
Dividimos la expresin anterior por
2
tenemos
n

i=1
(X
i
)
2

2
=
nS
2

2
+
n(X )
2

2
Por la prosicin 7.2.5 la v.a.
n

i=1
(X
i
)
2

2
tiene una distribucin ji-cuadrada con n gra-
dos de libertad, adems por la proposicin 7.2.3 la v.a.
n(X )
2

2
tiene una distribucin
ji-cuadrada con un grado de libertad, por lo que nalmente por la proposicin 7.2.4 la v.a.
nS
2

2
tiene una distribucin ji-cuadrada con n1 grados de libertad.
Probamos entonces que la distribucin muestral de varianzas para muestras de tamao
n provenientes de una distribucin normal con media y varianza
2
tiene una distribucin
ji-cuadrada con n1 grados de libertad.
Proposicin 8.4.3 Si se extraen muestras de tamao n de una poblacin normal con media
y varianza
2
, entonces la esperanza y la varianza de S
2
son respectivamente

S
2 =
n1
n

2
y
S
2 =
2(n1)
n
2

4
.
8.4. DISTRIBUCIONES MUESTRALES 163
Desarrollo
Para realizar la demostracin primeramente recordemos que la esperanza y la varianza
de una distribucin ji-cuadrada con con k grados de libertad estn dadas por k y 2k respecti-
vamente. Adems tomemos en cuenta que la v.a.
nS
2

2
tiene una distribucin ji-cuadrada con
n1 grados de libertad. Entonces
E
_
nS
2

2
_
= n1 y Var
_
nS
2

2
_
= 2(n1)
por lo que
n

2
E(S
2
) = n1 y
n
2

4
Var(S
2
) = 2(n1)
con lo cual
E(S
2
) =
n1
n

2
y Var(S
2
) =
2(n1)
n
2

4
Ejemplo 8.4.3 Una poblacin normal tiene una varianza de 15. Si se extraen muestras de
tamao 5 de esta poblacin; qu porcentajes pueden tener varianzas
a) menores que 10?
b) mayores que 20?
Calcule adems la media y la varianza de esta distribucin muestral de varianzas.
Desarrollo
Segn las condiciones del problema;
2
= 15 y n = 5. Adems el grado de libertad ser
n1 = 51 = 4, entonces
a) para responder este inciso debemos calcular primeramente
2
1
que viene dada por la
siguiente relacin

2
1
=
nS
2
1

2
=
(5)(10)
15
= 3, 3333
Luego se busca en la tabla
2
un valor que tenga 4 grados de libertad y este lo ms
cercano a 3,3333. Este valor resulta ser
2
[0,50 ; 4]
= 3, 36 y por lo cual la probabilidad
buscada es de aproximadamente 0,50.
8.4. DISTRIBUCIONES MUESTRALES 164
b) para responder a este inciso se debe realizar un procedimiento anlogo al anterior; esto
es

2
2
=
nS
2
2

2
=
(5)(20)
15
= 6, 667
Luego en la tabla
2
se observa que el valor 6,667 con 4 grados de libertad est ente los
valores
2
[0,80 ;4]
= 5, 99 y
2
[0,90 ;4]
= 7, 78; con lo cual podramos tomar al promedio
de estos valores como el valor ms cercano. Entonces

2
[0,85 ;4]
=

2
[0,80 ;4]
+
2
[0,90 ;4]
2
=
5, 99+7, 78
2
= 6, 885
con lo cual la probabilidad buscada es de aproximadamente 10, 85 = 0, 15.
La esperanza y la varianza para esta distribucin vienen dadas por la siguientes relaciones
E(S
2
) =
n1
n

2
=
4
5
15 = 12
Var(S
2
) =
2(n1)
n
2

2
=
2(4)
5
2
15 = 4, 8
8.4.4. Distribucin F
Esta distribucin de probabilidad es usada en varias situaciones. Es usada cuando quer-
emos probar si dos varianzas muestrales provienen de la misma poblacin o de poblaciones
con caractersticas idnticas, adems es aplicada cuando se quiere comparar las medias de
ms de dos poblaciones simultneamente.
La distribucin F se dene como la razn entre dos distribuciones ji-cuadrada indepen-
dientes, dividida cada una de ellas entre sus respectivos grados de libertad.
Consideremos dos variables aleatorias independientes Y y W tales que Y tiene una dis-
tribucin
2
con m grados de libertad y W una distribucin
2
com n grados de libertad,
donde m y n son enteros positivos. Se dene una nueva variable aleatoria como sigue:
X =
Y
m
W
n
=
nY
mW
entonces a la variable aleatoria X se le denomina distribucin F de Snedecor con m y n
grados de libertad.
8.4. DISTRIBUCIONES MUESTRALES 165
Denicin 8.4.2 Una variable aleatoria X tiene distribucin F de Snedecor si su funcin
de densidad de probabilidad est dada por
f (x) =
_

_
m+n
2
_
m
m
2
n
n
2

_
m
2
_

_
n
2
_
x
m
2
1
(mx +n)
m+n
2
si x > 0
0 si x 0
Figura 8.1: Grca de f (x) cuando los parmetros m y n toman diferentes pares de valores.
Caractersticas de la distribucin F
Hay una familia de distribuciones F. Cada miembro de esta familia est determinado
por los grados de libertad del numerador (varianza mayor) y por los del denominador
(varianza menor).
La distribucin F es una distribucin continua y no puede tomar valores negativos.
La curva que representa la distribucin F est sesgada hacia la derecha.
Su rango de valores va desde 0 hasta innito, cuanto ms se incrementa F, la curva se
aproxima al eje X, pero nunca lo toca.
Inferencias con respecto a las varianzas de dos distribuciones normales independientes.
Sea X
1
, X
2
, . . . , X
n
una muestra aleatoria de una distribucin normal con media
X
y var-
ianza
2
X
, sea adems Y
1
,Y
2
, . . . ,Y
m
otra muestra aleatoria de una distribucinb normal con
media
Y
y varianza
2
Y
. Si se supone independencia entre las variables aleatorias X e Y, las
estadsticas u
X
=
(n1)S
2
X

2
X
y u
Y
=
(m1)S
2
Y

2
Y
son distribuciones ji-cuadradas con n 1 y
8.4. DISTRIBUCIONES MUESTRALES 166
m1 grados de libertad. Entonces
F =
u
x
n1
u
Y
m1
=
S
2
X

2
X
S
2
Y

2
Y
tiene una distribucin F con n1 y m1 grados de libertad.
Si las dos varianzas poblacionales son iguales la frmula se reduce a:
F =
S
2
X
S
2
Y
8.4.5. Distribucin Muestral de Proporciones
Sea una poblacin nita de tamao N, en la que la probabilidad de ocurrencia de un
suceso en el que se est interesado es P y la probabilidad de ocurrencia del suceso contrario a
aquel en el que se est interesado es Q = 1P (poblacin Bernoulli). Si de est poblacin se
extraen todas las posibles muestras de tamao n, con n < N, y se averigua para cada una de
las muestras la proporcin correspondiente al atributo o categoria en el que se est interesado
con relacin al total de elementos n de la muestra se obtendr una distribucin muestral de
proporciones.
Se dene una proporcin de muestra como p =
X
n
, donde X es el nmero de unidades de
la muestra que posee el rasgo en el que se est interesado y n es el tamao de muestra. Por
su forma de denicin X es la suma de las variables aleatorias Benoulli de la muestra que
poseen el rasgo de inters y por lo tanto X tiene distribucin Binomial con parmetro P.
Si se obtiene una muestra de tamao n al azar, con reemplazamiento (reposicin), la
distribucin por muestreo de P, obedece a la ley de probabilidad binomial. La media y la
varianza estn dadas por:
E( p) =
p
= E
_
X
n
_
=
E(X)
n
=
nP
n
= P

2
p
=Var
_
X
n
_
=
Var(X)
n
2
=
nP(1P)
n
2
=
P(1P)
n
para muestras de tamao n < 30.
Cuando el muestreo se realiza sin sustitucin, obedece a la ley de probabilidades hiper-
geomtrica y como la poblacin es nita, la media y la varianza estn dadas por
E( p) =
p
= E
_
X
n
_
=
E(X)
n
=
1
n

nk
N
=
k
N
= P

2
p
=Var
_
X
n
_
=
Var(X)
n
2
=
nk(Nk)(Nn)
n
2
N
2
(N1)
=
1
n

k
N

_
1
k
N
_

Nn
N1
=
P(1P)
n

Nn
N1
Cuando el muestreo es efectuado ya sea con o sin reemplazamiento, si el tamao de las
muestras es n 30, la distribucin muestral de las proporciones en las muestras se aproxima a
la normal por aplicacin del teorema central del lmite. A continuacin se enuncia el teorema
central del lmite para este caso.
8.4. DISTRIBUCIONES MUESTRALES 167
Teorema de la convergencia o central del lmite
Sea una variable aleatoria con slo dos caracteres complementarios (el considerado y su
contrario) cuyas proporciones con respecto al total son P y 1P respectivamente. Si de esta
poblacin se extraen muestras de tamao n grande de forma que nP > 5 y n(1 P) > 5, la
distribucin muestral de las proporciones p, del caracter considerado en la poblacin, que
aparecen en cada una de las muestras, sigue una distribucin normal con valor medio
p
= P
y varianza
2
p
=
P(1P)
n
.
La variable
pP

p
se aproxima a una normal estandar cuando n se aproxima al innito.
La funcin de distribucin de p con n grande es
P( p p
0
) = P
_
Z
p
0
P

p
_
Cuando n no es tan grande, pueden obtenerse aproximaciones normales muy satisfac-
torias, introduciendo un factor de correccin de continuidad dada por
1
2n
. La funcin de
distribucin de p para este caso ser
P( p p
0
) = P
_
Z
p
0

1
2n
P

p
_
Ejemplo 8.4.4 De un total de 1000 muestras de 200 nios cada uno, en cuanto cabe esper-
ar que
a) menos del 40% sean nios?
b) entre el 40% y el 60% sean nias
c) el 53% o ms sean nias
Desarrollo
Segn las especicaciones de este problema tenemos 1000 muestras, cada una de tamao
n = 200. Como la poblacin del cual provienen las muestras est constituido por dos carac-
teres: nio y nia, con lo cual se tiene
P(nio) =
1
2
= 0, 5 y P(nia) =
1
2
= 0, 5
Para responder a los tres incisos calculemos primeramente
p
; que ser el mismo para
los tres incisos ya que los dos acontecimientos involucrados tienen las misma probabilidad
de ocurrencia. Por lo tanto

p
=
_
P(1P)
n
=
_
(0, 5)(0, 5)
200
= 0, 0354
Adems se tendr en cuenta el factor de correccin
1
2n
; que se le suma o se le resta a
los lmites en los clculos de acuerdo a si se quiere que inuya o no las probabilidades de
ocurrencia de tales valores lmites. Esta consideracin lo hacemos debido a que n = 200 no
es tan grande.
8.4. DISTRIBUCIONES MUESTRALES 168
a) La probabilidad de que menos del 40% sean nios esta dada por
P(p
nio
<0, 40) =P
_
Z <
0, 40
1
2(200)
0, 5
0, 0354
_
=P(Z <2, 90) =0, 5A(2, 90)
Se rest el factor de correccin al lmite superior 0,4 debido a que p
nio
< 0, 4. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo no forme parte
del resultado nal. Luego en la tabla de Z se observa que A(2, 90) = A(2, 90) =
0, 4981, con lo cual
P(p
nio
< 0, 40) = 0, 50, 4981 = 0, 0019
Finalmente (1000)(0, 0019) = 1, 9. Por lo que en aproximadamente 2 muestras cabe
esperar que menos del 40% sean nios.
b) La probabilidad de que entre el 40% y 60% sean nias esta dada por
P(0, 4 < p
nia
< 0, 6) = P
_
0, 40+
1
2(200)
0, 5
0, 0354
< Z <
0, 60
1
2(200)
0, 5
0, 0354
_
= P(2, 75 < Z < 2, 75) = A(2, 75) +A(2, 75) = 2A(2, 75)
El factor de correccin se le sum al lmite inferior 0,4 y se le rest al superior 0,6;
debido a que 0, 4 < p
nia
< 0, 6. Esta suma y resta se hizo para garantizar que la
8.4. DISTRIBUCIONES MUESTRALES 169
probabilidad de ocurrencia de estos valores extremos no formen parte del resultado
nal. Luego en la tabla de Z se observa que A(2, 75) = 0, 4970, con lo cual
P(0, 4 < p
nia
< 0, 60) = 2(0, 4970) = 0, 994
Entonces (1000)(0, 994) = 994. Lo que signica que con 994 muestras cabe esperar
que entre 40% y 60% sean inas.
c) La probabilidad de que 53% o ms sean nias est dada por
P(p
nia
0, 53) = P
_
Z
0, 53
1
2(200)
0, 5
0, 0354
_
= P(Z 0, 78) = 0, 5A(0, 78)
Se rest el factor de correccin al lmite inferior 0,53 debido a que p
nia
0, 53. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo forme parte del
resultado nal. Luego en la tabla de Z se observa que A(0, 78) = 0, 2823, con lo cual
P(p
nia
0, 53) = 0, 50, 0, 2823 = 0, 2177
Con lo cual (1000)(0, 2177) = 217, 7. Por lo que en aproximadamente 218 muestras
cabe esperar que 53% o ms sean nias.
8.4.6. Distribucin Muestral de Sumas y de Diferencias de medias
Sean dos poblaciones normalmente distribuidas con medias
X
y
Y
, adems de varianzas

2
X
y
2
Y
respectivamente. De la poblacin uno se extraen todas las posibles muestras de
tamao n
1
, y de la poblacin dos todas las posibles muestras de tamao n
2
, con el n de
obtener M muestras de cada poblacin. Si de cada muestra n
1
se extrae su media X y de
cada muestra n
2
se extrae su media Y y se relacionan de tal forma que establescan sumas
o diferencias (X +Y X Y) se tendr una variable aleatoria formada por el conjunto de
dichas sumas diferencias.
Proposicin 8.4.4 Sean X e Y dos variables aleatorias independientes y normalmente dis-
tribuidas con medias
X
y
Y
, adems de varianzas
2
X
y
2
Y
respectivamente. Si todos los
posibles pares de muestras se extraen de estas poblaciones, tanto la suma como la diferencia
entre las medias muestrales estarn normalmente distribuidas con medias
X+Y
=
X
+
Y
y
XY
=
X

Y
respectivamente, y adems las varianzas de estas dos distribuciones sern
iguales, esto es
2
X+Y
=
2
XY
=
2
X
+
2
Y
.
8.4. DISTRIBUCIONES MUESTRALES 170
Demostracin
Recordemos primeramente que por la proposicin 8.4.1 la media de toda distribucin
muestral de medias coincide con la media de la poblacin del cual se extraen las muestras.
Entonces la media de la distribuciones muestral de sumas y la media de la distribucin mues-
tral de diferencias sern respectivamente
E(X +Y) = E(X) +E(Y) =
X
+
Y
E(X Y) = E(X) E(Y) =
X

Y
Como las variables aleatorias X e Y son independientes se tendr que tambin X e cY,
con c = 0 sern independientes entonces
Var(X +Y) =Var(X) +Var(Y) =
2
X
+
2
Y
Var(X Y) =Var[X +(Y)] =Var(X) +Var(Y) =Var(X) +Var(Y) =
2
X
+
2
Y
Observacin: Si las poblaciones son innitas o los muestreos son sin reemplazamiento
entonces

2
X+Y
=
2
XY
=

2
X
n
X
+

2
Y
n
Y
de lo contrario si almenos uno de ellos por ejemplo la poblacin 1 es nita o el muestreo fue
hecho sin reemplazamiento se tiene

2
X2
=

2
X
n
X

N
X
n
X
N
X
1
donde n
X
y N
X
son el tamao de la muestra y de la poblacin uno respectivamente.
Cuando las muestras n
1
y n
2
son de gran tamao, esto es n
1
+n
2
2 30, la distribucin
muestral de sumas de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media
X+Y
=
X
+
Y
y varinaza
2
X+Y
=
2
X
+
2
Y
. Por lo tanto la
variable aleatoria
Z =
(X +Y)
X+Y

X+Y
N(0, 1)
Bajo estas mismas condiciones la distribucin muestral de diferencias de medias tambin
se aproxima a una distribucin normal con media
XY
=
X

Y
y varinaza
2
XY
=
2
X
+
2
Y
y la variable aleatoria.
Z =
(X Y)
XY

XY
N(0, 1)
Ejemplo 8.4.5 Los acumuladores del automvil de manufactura XY tienen una duracin
promedio de 360 das con una desviacin estndar de 45 das, y los de manufactura ZW
duran en promedio 300 das con una desviacin estndar de 30 das. Si se prueban muestras
al azar de 50 acumuladores de cada marca.
a) Halllar la probabilidad de que los de la marca XY tenga una duracin promedio de a lo
ms 40 das sobre los de la marca ZW.
8.4. DISTRIBUCIONES MUESTRALES 171
b) Halllar la probabilidad de que la suma de los promedios de los dos grupos sea mayor
que 670 das.
Desarrollo
Si nombramos por X a los acumuladores del automvil de manufactura XY y por Y a los
acumuladores del automvil de manufactura ZW tendremos:
X
= 360 das,
X
= 45 das,
n
X
= 50,
Y
= 300 das,
Y
= 30 das y n
Y
= 50.
a) La probabilidad de que los acumuladores de la marca XY tenga una duracin prome-
dio de a lo ms 40 das sobre los de la marca ZW, se puede calcular estableciendo una
distribucin muestral de diferencias de medias sobre las dos poblaciones de acumu-
ladores. Adems n
1
+n
2
2 = 50+502 = 98, con lo cual
P(X Y +40) = P(X Y 40) = P
_
Z
(X Y) (
X

Y
)
_

2
X
+
2
Y
_
entonces se tiene que
P(X Y 40) = P
_
Z
40(360300)
_
45
2
50
+
30
2
50
_
= P(Z 2, 61) = 0, 5A(2, 61)
Buscando en la tabla Z: A(2, 61) = A(2, 61) = 0, 4955, con lo cual
P(X Y 40) = 0, 50, 4955 = 0, 0045
b) La probabilidad de que suma de los promedios de los acumuladores tenga una duracin
mayor de 670 das, se puede calcular estableciendo una distribucin muestral de sumas
de medias sobre las dos poblaciones de acumuladores para automviles. Adems se
tiene que n
1
+n
2
2 = 50+502 = 98, con lo cual
P(X +Y > 670) = P
_
Z >
(X +Y) (
X
+
Y
)
_

2
X
+
2
Y
_
8.4. DISTRIBUCIONES MUESTRALES 172
entonces se tiene que
P(X +Y > 670) = P
_
Z >
670(360+300)
_
45
2
50
+
30
2
50
_
= P(Z > 1, 31) = 0, 5A(1, 31)
Buscando en la tabla Z: A(1, 31) = 0, 4049, con lo cual
P(X +Y > 670) = 0, 50, 4049 = 0, 0951
A continuacin se analizar que ocurre cuando de las poblaciones se extraen pequeas
muestras (cuando n
1
+n
2
2 < 30), y adems las varianzas poblacionales son desconocidas.
Para ello consideremos las siguientes variables aleatorias con sus distribuciones asociadas
(X Y)
XY

XY
N(0, 1);
n
1
S
2
X

2
X

2
(n
1
1) y
n
2
S
2
Y

2
Y

2
(n
2
1)
Por la proposicin 7.2.4
n
1
S
2
X

2
X
+
n
2
S
2
Y

2
Y

2
(n
1
+n
2
2); entonces
T =
(X Y)
XY

XY

_
n
1
S
2
X

2
X
+
n
2
S
2
Y

2
Y
n
1
+n
2
2
t(n
1
+n
2
2)
Si se asume que las varianzas poblacionales son iguales; esto es
2
X
=
2
Y
=
2
; se tendr
las siguientes relaciones

XY
=

2
n
1
+

2
n
2
=
_
1
n
1
+
1
n
2

_
n
1
S
2
X

2
X
+
n
2
S
2
Y

2
Y
n
1
+n
2
2
=
1

n
1
S
2
X
+n
2
S
2
Y
n
1
+n
2
2
8.4. DISTRIBUCIONES MUESTRALES 173
Entonces se tendr que
T =
(X Y)
XY

_
1
n
1
+
1
n
2
1

n
1
S
2
X
+n
2
S
2
Y
n
1
+n
2
2
=
(X Y)
XY

n
1
S
2
X
+n
2
S
2
Y
n
1
+n
2
2
_
1
n
1
+
1
n
2
=
(X Y)
XY
S
p
_
1
n
1
+
1
n
2
donde S
P
=

n
1
S
2
X
+n
2
S
2
Y
n
1
+n
2
2
recibe el nombre de varianza combinada de las muestras.
Como se puede observar tanto T como su distribucin no dependen de las varianzas
poblaciones. Esto es caracterstico de las distribuciones t.
8.4.7. Distribucin Muestral de Relaciones de Varianzas
8.4.8. Distribucin Muestral de Diferencias de Proporciones
Sean dos poblaciones con distribuciones de Bernoulli, tal que la primera tiene parmetro
P
1
y la segunda parmetro P
2
. De la poblacin uno se extraen muestras aleatorias de tamao
n
1
, y de la poblacin dos muestras de tamao n
2
. Sean las proporciones muestrales
p
1
=
X
n
1
y p
2
=
Y
n
1
donde X es la v.a. que indica el nmero de unidades de la muestra n
1
que posee cierto rasgo y
Y la v.a. que indica el nmero de unidades en la muestra n
2
que posee tambin un cierto rasgo.
Si las proporciones muestrales se relacionan a pares de tal forma que establescan diferencias
( p
1
p
2
); se tendr una nueva v.a. formada por el conjunto de dichas diferencias.
Si X e Y son independientes la distribucin muestral de diferencias de proporciones es-
tarn dadas respectivamente por

p
1
p
2
= E( p
1
p
2
) = E( p
1
) E( p
2
) =
p
1

p
2

2
p
1
p
2
=Var( p
1
p
2
) =Var( p
1
) +Var( p
2
) =
2
p
1
+
2
p
2
Si las poblaciones son innitas o el muestreo en cada poblacin se realiza con sustitucin
la distribucin muestral de proporciones en cada poblacin seguir una ley bimonial y se
tendr que

p
1
p
2
= P
1
P
2

2
p
1
p
2
=
P
1
(1P
1
)
n
1
+
P
2
(1P
2
)
n
2
Por el contrario si almenos una de las poblaciones es nita o el muestreo en l se realiza
sin reemplazamiento, la distribucin muestral de proporciones obtenida obedecer a la ley
hipergeomtrica y se tendr que

2
p
1
=
P
1
(1P
1
)
n
1

N
1
n
1
N
1
1

2
p
2
=
P
2
(1P
2
)
n
2

N
2
n
2
N
2
1
8.5. PROBLEMAS 174
donde N
1
es el tamao de la poblacin uno y N
2
el tamao de la poblacin dos.
Si las muestras son lo sucientemente grandes, por aplicacin del teorema central del
lmite, la distribucin muestral de diferencias de proporciones se apoximar a la normal con
media
p
1
p
2
y varianza
2
p
1
p
2
.
Ejemplo 8.4.6 Un colegio de artes liberales tiene 100 profesores, 60 de los cuales tienen el
doctorado. Dos muestras con n
1
= n
2
= 30, son extradas independientemente de este grupo
de profesores, con reposicin, y se anotan los nmeros de los que tienen el doctorado. Hallar
la probabilidad de que las dos muestras dieran en 8 ms en el nmero con doctorado.
Desarrollo
Segn el problema el tamao de la poblacin es de 100 profesores, de las cuales 60 tienen
doctorado y 40 no, con lo cual la proporcin de profesores con doctorado es P = 0, 6 y la de
su opuesto es 1P = 0, 4. El rasgo a estudiar en cada muestra es tiene doctorado.
Se dene p
1
=
X
n
1
y p
2
=
Y
n
2
; donde X representa el nmero de profesores con doctorado
en la muestra n
1
y Y nmero de profesores con doctorado en la muestra n
2
. Adems como
los muestreos fueron hechos de la misma poblacin y con sustitucin, se tiene

p
1
p
2
= P
1
P
2
= 0, 60, 6 = 0

p
1
p
2
=

P
1
(1P
1
)
n
1
+
P
2
(1P
2
)
n
2
=
_
(0, 6)(0, 4)
30
+
(0, 6)(0, 4)
30
= 0, 1265
Entonces la probabilidad de que las dos muestras dieran en 8 ms en el nmero de
profesores con doctorado est dada por
P(X Y 8) = P
_
X Y
30

8
30
_
= P( p
1
p
2
0, 2667) = P
_
Z
0, 2667
0, 1265
_
= P(Z 2, 11) = 0, 5A(2, 11)
Finalmente la probabilidada pedida es P(X Y 8) = 0, 50, 4826 = 0, 0174.
8.5. Problemas
Captulo 9
Estimacin
9.1. Introduccin
El objetivo ms importante de la Estadstica es obtener una inferencia con respecto a
la poblacin basndose en la informacin contenida en una muestra. Como las poblaciones
se describen mediante medidas numricas denominadas parmetros, el objetivo de la may-
ora de las investigaciones estadsticas es deducir una inferencia con respecto a uno o ms
parmetros de la poblacin. Los parmetros poblacionales pertenecen a ciertos conjuntos de
valores denominados espacios parmetricos.
Un problema de inferencia estadstica o, ms simplemente, un problema de estadstica es
un problema en el cual se han de analizar datos que han sido generados de acuerdo con una
distribucin de probabilidad desconocida y en el que se debe realizar algn tipo de inferencia
acerca de tal distribucin. En otras palabras, en un problema de estadstica existen dos o ms
distribuciones de probabilidad que podran haber generado algunos datos experimentales.
En la mayoria de los problemas reales, existe un nmero innito de distribuciones posibles
distintas que podran haber generado los datos. Analizando los datos, se intenta conocer la
distribucin desconocida para realizar inferencias acerca de ciertas propiedades de la dis-
tribucin y determinar la verosimilitud relativa que cada distribucin posible tiene de ser la
correcta.
Los problemas que se tratan en la inferencia estadstica se dividen generalmente en dos
clases: los problemas de estimacin y los de prueba de hiptesis.
El procedimiento mediante el cual; a partir del conocimiento de las caractersticas de la
muestra que llamaremos estimadores; inferimos las caractersticas de la poblacin se llama
estimacin, que a su vez se divide en estimacin puntual y estimacin por intervalos.
9.2. Estimadores y sus propiedades
Denicin 9.2.1 Sea X una v.a. con una distribucin de probabilidad que depende de un
parmetro desconocido perteneciente a un espacio parmetrico . Sea X
1
, X
2
, . . . , X
n
una
muestra aleatoria de X. Adems sean x
1
, x
2
, . . . , x
n
los valores muestrales correspondientes.
Si g(X
1
, X
2
, . . . , X
n
) es una funcin de la muestra que va a ser usada para estimarle a , nos
referimos a g como un estimador de .
175
9.2. ESTIMADORES Y SUS PROPIEDADES 176
El valor que toma g, es decir g(x
1
, x
2
, . . . , x
n
) ser mencionado como una estimacin de
y habitualmente es escrito como:

= g(x
1
, x
2
, . . . , x
n
)
9.2.1. Propiedades de un buen estimador
Insesgado
Se dice que un estimador para un parmetro poblacional es insesgado si su valor esper-
ado es igual al verdadero valor del parmetro poblacional. Esto es; si

es el estimador
y es el parmetro entonces:
E(

) =
Ejemplo 9.2.1 Sea p =
X
n
un estimacin del parmetro P; donde X es una v.a. bino-
mial con parmetros P y n. Probar que p es un estimador insesgado de P.
Desarrollo
Recordemos que si X bin(P, n) tendremos que E(X) = nP. Entonces
E( p) = E
_
X
n
_
=
1
n
E(X) =
1
n
nP = P
por lo que p es un estimador insesgado de P.
Eciente
La eciencia se reere al tamao de la varianza del estadstico. Si comparamos dos
estadsticos;

1
y

2
ambos insesgados con varianzas Var(

1
) y Var(

2
) respectiva-
mente; y tratamos de decidir cual de ellos es un estimador ms eciente, escogeramos
al que tuviese la menor varianza, es decir se preferir a

1
si Var(

1
) < Var(

2
). El
estadstico eciente recibe el nombre estadstico estimador insesgado de varianza
mnima.
Ejemplo 9.2.2 Sea una poblacin con media y varianza
2
. La distribucin mues-
tral de medias tiene media dada por E(X) = y varianza Var(X) =

2
n
y la dis-
tribucin muestral de medianas tiene tambin media E(X
mediana
) = , pero varianza
Var(X
mediana
) =

2
2n
. Vemos que X y X
mediana
son estimadores insesgados del parmetro
y adems Var(X) <Var(X
mediana
), por lo que X es un estimador eciente de .
Eciencia relativa
Tambin se pueden comparar dos estimadores en base a su eciencia relativa. Sean

1
y

2
dos estimadores diferentes del parmetro . La eciencia relativa de

2
, comparada
con

1
, se dene por la rezn:
R =
E(

1
)
2
E(

2
)
2
(9.2.1)
9.2. ESTIMADORES Y SUS PROPIEDADES 177
Si R > 1,

2
ser relativamente ms eciente que

1
.
Si R < 1,

1
ser relativamente ms eciente que

2
.
En la ecuacin anterior E(

i
)
2
, para i = 1, 2 se llama error cuadrtico medio y
pueden escribirse como
E(

i
)
2
=Var(

i
) +[E(

i
)]
2
donde E(

i
) se llama sesgo del estimador y puede ser positivo, negativo cero. Si
es cero el estimador ser insesgado.
Si

1
y

2
son insesgados, la eciencia relativa no es ms que el cociente de sus vari-
anzar.
R =
Var(

1
)
Var(

2
)
(9.2.2)
Consistente convergente
Un estadstico es un estimador consistente de un parmetro poblacional, si a medida
que aumenta el tamao de la muestra se tiene casi la certeza de que el valor del estads-
tico se aproxima bastante al valor del parmetro de la poblacin. Entonces,

es un
estimador consistente del parmetro si, para cualquier nmero > 0, la probabilidad
de que la diferencia entre el estimador

y el parmetro sea menor que tienda a la
unidad cuando el tamao de la poblacin (n) tiende al innito. Es decir:
P(|

| < ) 1 cuando n
Proposicin 9.2.1 Sea

una estimacin del parmetro basada en una muestra de
tamao n; si lm
n
E(

) =, y si lm
n
Var(

) = 0; entonces

es una estimacin conver-
gente de .
Ejemplo 9.2.3 La media muestral es un estimador convergente o consistente del parmetro
, ya que
lm
n
E(X) = lm
n
= y lm
n
Var(X) = lm
n

2
n
= 0
Suciente
Denicin 9.2.2 Consideremos una muestra aleatoria X
1
, X
2
, . . . , X
n
tomada de una
poblacin con distribucin f (x|) y sean Y
1
,Y
2
, . . . ,Y
n
estadisticos muestrales. Un es-
tadstico Y
1
= Y
1
(X
1
, X
2
, . . . , X
n
) se denomina suciente si la distribucin condicional
f (y
2
, y
3
, . . . , y
n
|y
1
, ) = f (y
2
, y
3
, . . . , y
n
|y
1
).
La denicin anterior nos dice que un estimador

es suciente si utiliza una cantidad
de la informacin contenida de la muestra y adems ningn otro estimador podra
extraer informacin adicional de la muestra sobre el parmetro de la poblacin que
se est estimando que no sea ya suministrada por

.
9.2. ESTIMADORES Y SUS PROPIEDADES 178
Criterio de Fisher-Neyman
Un estadstico Y
1
=Y
1
(X
1
, X
2
, . . . , X
n
) es suciente, si y slo si:
f (x
1
, x
2
, . . . , x
n
|) =
n

i=1
f (x
i
|) = f (y
1
|)h(x
1
, x
2
, . . . , x
n
)
donde h no contiene a .
Ejemplo 9.2.4 Sea X
1
, X
2
, . . . , X
n
una muestra aleatoria tomada de una distribucin
Bernoulli con parmetro 0 < p < 1. Vericar que el estadstico Y
1
= X
1
+X
2
+ +X
n
es suciente.
Como la poblacin tiene distribucin Bernoulli con parmetro 0 < p < 1, la distribu-
cin conjunta de X
1
, X
2
, . . . , X
n
est dada por
f (x
1
, x
2
, . . . , x
n
|p) =
n

i=1
f (x
i
|p) =
n

i=1
p
x
i
(1p)
1x
i
= p
n

i=1
x
i
(1p)
n

i=1
(1x
i
)
Como el estadstico Y
1
est dada por la relacin Y
1
= X
1
+X
2
+ +X
n
entonces tiene
distribucin binomial con parmetro p esto es
f (y
1
|p) =
n!
y
1
!(ny
1
)!
p
y
1
(1p)
ny
1
donde y
1
=
n

i=1
x
i
.
De las dos relaciones anteriores tendremos que
f (x
1
, x
2
, . . . , x
n
|p) = f (y
1
|p)
y
1
!(ny
1
)!
n!
con lo cual segn el criterio de Fisher-Neyman Y
1
=
n

i=1
X
i
es un estimador suciente.
Invariante
Un estimador

de un parmetro se dice invariante, respecto a una clase de transfor-
macin g, si g(

) es un estimador de g() con propiedades anlogas a



.
Ejemplo 9.2.5 Consideremos una distribucin normal con media y varianza
2
.
Sean X un estimador de y X
2
un estimador de
2
.
Como la distribucin muestral de medias tiene media E(X) = tenemos que X es un
estimador insesgado de , adems la varianza viene dada por Var(X) =

2
n
y por una
de las propiedades de varianza

2
n
= E(X
2
) [E(X)]
2
= E(X
2
)
2
9.3. ESTIMACIN PUNTUAL 179
con los cual E(X
2
) =

2
n
+
2
. Entonces X
2
no es un estimador insesgado de
2
, con lo
cual X no es un estimador invariante de .
9.3. Estimacin Puntual
El objetivo de la estimacin puntual es obtener valores puntuales aproximados de los
parmetros poblacionales. Consiste en considerar que el parmetro poblacional es aproxi-
madamente igual al estimador o valor puntual obtenido apartir de la informacin de la mues-
tra.
Ejemplo 9.3.1 Los siguientes datos corresponden a una muestra aleatoria de las estaturas
de jugadores de baloncesto de una liga local. Vamos a realizar una estimacin puntual de la
estatura promedio de los jugadores de baloncesto de esta liga.
1,95 2,15 1,83 2,04 2,02
1,80 1,85 2,05 1,99 1,95
Se calcula la media aritmtica de la muestra de los 10 basquetbolistas:
X =
1
10
10

i=1
x
i
= 1, 96
Como es una estimacin puntual, se establece que la estatura promedio de los jugadores
de baloncesto de esta liga es aproximadamente igual a 1, 96 metros.Esto es = 1, 96.
Supongamos ahora que extraemos una muestra aleatoria de una poblacin con cierta dis-
tribucin de probabilidad y queremos estimar un cierto parmetro de est poblacin a traves
de la muestra tomada. Existen dos metodos de estimacin puntual de un parmetro pobla-
cional:
Mtodo de mxima verosimilitud
Mtodo de los momentos
9.3.1. Estimadores de maxima verosimilitud
Consideremos una distribucin de probabilidad concreta sobre la recta real que puede
ser representada por una funcin de probabilidad o una funcin de densidad de probabilidad
f . Recordemos que n variables aleatorias X
1
, X
2
, . . . , X
n
constituyen una muestra aleatoria
de est distribucin si son independientes y estn idnticamente distribuidas, es decir que
cada X
i
, i =1, 2, . . . , n tiene funcin de probabilidad o funcin de densidad de probabilidad
dada por f . En otras palabras, las variables aleatorias X
1
, X
2
, . . . , X
n
constituyen una muestra
aleatoria de la distribucin representada por f si su funcin de probabilidad o funcin de
densidad de probabilidad conjunta g para los puntos reales x
1
, x
2
, . . . , x
n
se especica como
sigue:
g(x
1
, x
2
, . . . , x
n
) = f (x
1
) f (x
2
) f (x
n
)
9.3. ESTIMACIN PUNTUAL 180
Considrese un problema de inferencia estadstica en el que se van a seleccionar obser-
vaciones de una distribucin cuya funcin de probabilidad o de densidad de probabilidad
es f (x|), donde es un parmetro desconocido. Se supone que el valor desconocido del
parmetro debe pertenecer a un espacio paramtrico . El problema de estimacin con-
siste en intentar determinar donde es probable que se encuentre el verdadero valor de en ,
partiendo de las observaciones de f (x|).
Funcin de verosimilitud
Si las variables aleatroias X
1
, X
2
, . . . , X
n
constituyen una muestra aleatoria de una dis-
tribucin cuya funcin de probabilidad o de densidad de probabilidad es f (x|), entonces
la funcin de probabilidad o de densidad de probabilidad conjunta de las varables aleatorias
X
1
, X
2
, . . . , X
n
, est dada por:
L(x
1
, x
2
, . . . , x
n
|) = f (x
1
|) f (x
2
|) f (x
n
|)
Cuando la funcin de probabilidad o de densidad de probabilidad conjunta L(x
1
, x
2
, . . . , x
n
|)
de las observaciones de una muestra aleatoria se considera como una funcin de para los
valores x
1
, x
2
, . . . , x
n
se llama funcin de verosimilitud.
Ejemplo 9.3.2 Supongamos que las variables aleatorias X
1
, X
2
, . . . , X
n
constituyen una mues-
tra aleatoria de una distribucin de Bernoulli con parmetro p desconocido (0 p 1).
Encontrar la funcin de verosimilitud.
Desarrollo
Como cada X
i
; i = 1, 2, . . . , n; tiene distribucin de Bernoulli entonces
f (x) =
_
_
_
p
x
i
(1p)
1x
i
si x = 0, 1
0 en otro caso
por lo que la funcin de verosimilitud es
L(x
1
, x
2
, . . . , x
n
|p) =
n

i=1
p
x
i
(1p)
1x
i
= p
n

i=1
x
i
(1p)
n

i=1
(1x
i
)
Pasos para obtener el estimador de verosimilitud
Tomar una muestra aleatoria de tamao n de la poblacin cuyo parmetro se desea
estimar.
Establecer la forma de la funcin de probabilidad o densidad de probabilidad de la
poblacin.
Obtener la funcin de verosimilitud a partir de la muestra.
Por ultimo el estimador de verosimilitud ser el valor de que maximiza al logaritmo
de la funcin de verosimilitud.
9.3. ESTIMACIN PUNTUAL 181
Ejemplo 9.3.3 Suponiendo que el tiempo para fallar T, de una componente tiene una dis-
tribucin exponencial con parmetro desconocido. Si se extrae una mustra aleatoria de
tamao n de esta poblacin, hallar el estimador de verosimilitud de .
Desarrollo
Como cada T
i
, i = 1, 2, . . . , n tiene distribucin exponencial con prmetro por ser una
muestra aleatoria proveniente de una poblacin exponencial con dicho parmetro entonces
f (t
i
) =
_
_
_
e
t
i
si t
i
> 0
0 en otro caso
por lo que la funcin de verosimilitud es
L(x
1
, x
2
, . . . , x
n
|p) =
n

i=1
e
t
i
=
n
e

i=1
t
i
entonces el logaritmo de esta funcin esta dada por la siguiente relacin
log L(x
1
, x
2
, . . . , x
n
|p) = log
n
e

i=1
t
i
Aplicando propiedades de logaritmo teenmos
log L(x
1
, x
2
, . . . , x
n
|p) = nlog
n

i=1
t
i
Derivando parcialmente con respecto a la expresin anterior e igualando a cero se
obtiene la siguiente relacin

(log L(x
1
, x
2
, . . . , x
n
|p)) = n
1

i=1
t
i
= 0
con lo cual

=
n
n

i=1
t
i
=
1
t
Entonces el estimador verosimil de es

=
1
t
.
9.3.2. Estimadores por el mtodo de los momentos
Recordemos que la denicin del r-simo momento alrededor del origen de una v.a. X
est dada por E(X
r
).
Sea X
1
, X
2
, . . . , X
n
una muestra aleatoria de una distribucin con funcin de probabilidad
o de densidad de probabilidad f (X|). El r-simo momento muestral alrededor del origen se
dene por
m
r
=
1
n
n

i=1
X
r
i
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 182
El mtodo de los momentos proporciona una alternativa razonable cuando no se puede
determinar los estimadores de mxima verosimilitud. Este mtodo consiste en igualar los
momentos apropiados de la distribucin de la poblacin, con los correspondientes momentos
muestrales para estimar un parmetro desconocido de la distribucin.
Sea f (x|
1
,
2
, . . . ,
k
) una funcin de probabilidad o de densidad con k parmetros y
designemos por
1
,
2
, . . . ,
k
,los primeros k momentos alrededor del origen, es decir

t
=
_

x
x
t
f (x|
1
,
2
, . . . ,
k
) si X es discreta

x
t
f (x|
1
,
2
, . . . ,
k
)dx si X es continua
para t = 1, 2, . . . , k.
En general
t
ser funcin de los k parmetros. Sea ahora X
1
, X
2
, . . . , X
n
una muestra
aleatoria de tamao n de f (x|
1
,
2
, . . . ,
k
). A partir de esta muestra formamos los k primeros
momentos muestrales m
1
, m
2
, . . . , m
n
. Sean

1
,

2
, . . . ,

k
las soluciones que resultan de las k
ecuaciones m
t
=
t
, para t = 1, 2, . . . , k. Las soluciones

1
,

2
, . . . ,

k
constituyen los esti-
madores por el metodo de los momentos.
Ejemplo 9.3.4 Sea una poblacin normal con parmetros y
2
, ambas desconocidas. Sea
X
1
, X
2
, . . . , X
n
una muestra aleatoria de tamao n de esta distribucin. Obtener por el metodo
de los momentos las estimaciones de y de
2
.
Desarrollo
Como la distribucin es normal entonces E(X) = y Var(X) =
2
. Adems recordemos
que Var(X) = E(X
2
) [E(X)]
2
, entonces E(X
2
) =
2
+
2
. Por otro lado los momentos
muestrales se denen como m
1
=
1
n
n

i=1
X
i
y m
2
=
1
n
n

i=1
X
2
i
. Tomando en consideracin la
relacin m
t
=
t
temdremos que : =
1
n
n

i=1
X
i
= X y
2
+
2
=
1
n
n

i=1
X
2
i
, entonces

2
=
1
n
n

i=1
X
2
i
X
2
=
1
n
_ n

i=1
X
2
i
nX
2
_
=
1
n
n

i=1
(X
i
X)
2
Entonces los estimadores por el mtodo de los momentos son
= X y

2
=
1
n
n

i=1
(X
i
X)
2
9.4. Estimacin por Intervalos de Conanza
La estimacin puntual no es muy conveniente, pues con el procedimiento de estimacin
de un parmetro a travs de un nico valor no se puede determinar el error de muestreo, ni la
precisin de la estimacin, ni la conanza que merece tal estimacin.
Hay otro mtodo para hacer una estimacin mucho ms precisa, la estimacin por inter-
valos de conanza. Este mtodo consiste en el procedimiento de encontrar un intervalo de
valores dentro del cual se espera que se encuentre un parmetro poblacional.
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 183
Denicin 9.4.1 Sea (0, 1). Un intervalo de conanza para un parmetro desconocido
de una distribucin de probabilidad es un intervalo aleatorio de la forma (

1
,

2
), en donde

1
y

2
son estadsticas muestrales tales que:
P(

1
< <

2
) = 1
A las estadsticas

1
y

2
se les conoce como lmites inferior y superior, respectivamente,
del intervalo de conanza. A los nmeros y 1 se les conoce como nivel se signicacin
y grado o nivel de conanza, respectivamente. En general, se toma el valor de cercano a 0
de tal forma que el grado de conanza, 1, es cercano a 1. Entonces el nivel de conanza es
la probabilidad de que el parmetro poblacional se encuentre dentro del intervalo encontrado.
Los niveles de conanza ms ampliamente usados son 0, 95 y 0, 99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Interpretacin de un intervalo de conanza
Segn la denicin anterior; podramos realizar la interpretacin de dos maneras distin-
tas, que son:
el verdadero valor del parmetro desconocido se encuentre entre los valores

1
y

2
con un grado de conabilidad de 1; o tambin
la probabilidad de que el verdadero valor del parmetro desconocido se encuentre
entre los valores

1
y

2
es igual a 1.
Para entender mejor el concepto de intervalo de conanza vamos a suponer que selec-
cionamos 100 muestras de una poblacin y calculamos la media de las muestras e intervalos
de conanza del 95% para cada muestra. Descubriremos que cerca de 95 de los 100 interva-
los de conanza contienen la media poblacional.
Pasos para construir un intervalo de conanza
1. Establecer el nivel de conanza.
2. Determinar el valor de la variable aleatoria estndar.
3. Calcular los estadsticos de la muestra.
4. Calcular el error estndar.
5. Calcular el error mximo de estimacin.
6. Determinar los lmites del intervalo de conanza e interpretar.
9.4.1. Intervalos de conanza para estimar la media de una poblacin
Para la estimacin de la media de una poblacin se deben tener en cuenta las siguientes
condiciones:
Tomar una muestra aleatoria de tamao n de la poblacin cuya media se quiere estimar.
El estadstico a utilizar es la media muestral X.
La distribucin muestral a considerar es la distribucin muestral de medias.
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 184
Intervalos de conanza para estimar la media de una poblacin con muestras grandes
Recordemos que si la muestra es lo sucientemente grande, esto es n 30, la distribu-
cin muestral de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media
X
= y varianza
2
X
. Entonces la v.a.
Z =
X
X

X
N(0, 1)
Por lo tanto para encontrar el intervalo de conanza podramos establecer un nivel de
conanza de 1, que sera la probabilidad de que Z se encuentre entre dos valores, esto es
P(Z
1
< Z < Z
2
) = P
_
Z
1
<
X
X

X
< Z
2
_
= 1
Como la distribucin normal tipicada est centrada en el cero y es simtrica entonces
podramos establecer que Z
1
=Z
2
. Si Z
c
= Z
2
y se despeja
X
en expresin
Z
1
<
X
X

X
< Z
2
se tendr
X Z
c

X
<
X
< X +Z
c

X
que generalmente se abrevia como
X Z
c

X
con lo cual el intervalo buscado para la media poblacional es
(X Z
c

X
, X +Z
c

X
)
Finalmente la expresin para el intervalo de conanza en trmino de probabilidad est
dada por la relacin
P(X Z
c

X
< < X +Z
c

X
) = 1
Nota: Recordar que si la poblacin es innita
2
X
=

2
n
, de lo contrario
2
X
=

2
n

Nn
N1
,
donde N es el tamao de la poblacin. Si se desconoce el valor de la varianza poblacional
2
,
se ha de utilizar la varianza muestral S
2
para encontrar el intervalo.
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 185
Ejemplo 9.4.1 Los resultados siguientes representan las calicaciones de una muestra aleato-
ria de estudiantes en el primer examen de estadstica elemental. Elaborar un intervalo de
conanza del 95% para estimar la media poblacional.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Desarrollo
1. El nivel de conanza ya est establecido como 95%. Entonces 1 = 0, 95
2. Como se trata de estimar la media poblacional y n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 es la probabili-
dad de que la media poblacional se encuentre dentro del intervalo buscado (centro de
la curva), es la probabilidad de que no se encuentre en el intervalo (extremos de la
curva), y cada extremo de la curva o cola corresponde al valor

2
.
Como la distribucin normal estndar se tabula dos maneras: la primera utilizando la
funcin de distribucin (tabla 1) y la segunda integrando la funcin de densidad en
el intervalo que va de cero a cualquier valor positivo de Z (tabla 2). Como nosotros
utilizaremos la tabla 2, busquemos en dicha tabla el valor de Z que corresponde al rea
de 0, 5

2
, que resulta ser 1, 96.
3. Para estimar la media poblacional necesitamos calcular los estadsticos de la muestra
que son la media y la varianza muestral. Entonces la media muestral ser
X =
1
60
60

i=1
X
i
=
3929
60
= 65, 483
En el caso de la varianza muestral se puede optar por S
2


S
2
, la eleccin es del inves-
tigador, pero generalmente se preere usar

S
2
ya que es un estimador insesgado de la
varianza poblacional
2
. Para nes comparativos calculemos los dos
S
2
=
1
60
60

i=1
X
2
i
X
2
=
283635
60

_
3929
60
_
2
= 439, 183 y

S
2
=
60
601
S
2
= 446, 627
4. Como no conocemos el tamao de la poblacin se asume que es innita. Calculemos
ahora el error estndar utilizando la desviacin estndar muestral para las dos situa-
ciones (S y

S), esto se hace debido a que no conocemos el valor de
2
. Por lo tanto

X
=
S

60
= 2, 705 y
X
=

S

60
= 2, 728
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 186
5. A continuacin se calcula el error mximo de estimacin denotado por E para las dos
situaciones, entonces
E = Z
c

X
= (1, 96)(2, 705) = 5, 302 y E = Z
c

X
= (1, 96)(2, 728) = 5, 347
6. Finalmente se calculan los lmites del intervalo de conanza de la siguiente manera:
Restando a la media de la muestra el error mximo de estimacin se obtiene el
lmite inferior.
Sumando a la media de la muestra el error mximo de estimacin se obtiene el
lmite superior.
Entonces si ulitizamos S como estimacin de , los lmites inferior y superior sern
respectivamente
X E = 60, 181 y X +E = 70, 785
por lo que el intervalo de conanza buscado ser (60, 181 ; 70, 785), es decir
P(60, 181 < < 70, 785) = 0, 95
Este resultado se interpreta de la siguiente manera: La calicacin media de los es-
tudiantes en el primer examen de estadstica elemental, se encuentre entre 60,181 y
70,785 con un grado de conanza del 95%.
Si por el contrario utilizamos

S, los lmites inferior y superior sern respectivamente
X E = 60, 136 y X +E = 70, 83
por lo que el intervalo de conanza buscado ser (60, 136 ; 70, 83), es decir
P(60, 136 < < 70, 83) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95
de que la calicacin media de los estudiantes en el primer examen de estadstica
elemental, se encuentre entre 60,136 y 70,83.
Si comparamos los intervalos obtenidos vemos que hay muy poca diferencia, pero la
obtenida con

S es un poco ms ancha y por lo tanto un poco ms able.
Intervalos de conanza para estimar la media de una poblacin con muestras pequeas
Si la muestra es de tamao menor que 30 y la varianza poblacional es desconocida, en-
tonces para calcular el intervalo de conanza que contiene a la media poblacional se utiliza
la distribucin t de Student en vez de la distribucin normal. Luego se siguen los mismos
pasos de los intervalos de conanza para muestras grandes.
Tomando en consideracin que cuando se tienen muestras paqueas (n <30) y la varianza
poblacional es desconocida, la distribucin muestral de medias puede ser relacionada con una
distribucin t de Studens. Por lo tanto la v.a.
T =
(X
X
)

n1
S
t(n1)
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 187
Como t al igual que Z, est centrada en el origen y es simtrica podemos reemplazar a Z
por T en el procedimiento anterior para encontrar un intervalo de conanza con un grado de
abilidad de 1 para la media poblacional , esto es
P(t
c
< T <t
c
) = P
_
t
c
<
(X
X
)

n1
S
<t
c
_
= 1
Realizando un anlisis totalmente anlogo al caso de muestras grandes se tendr que
X t
c
S

n1
< < X +t
c
S

n1
con lo cual el intervalo buscado estar dada por
_
X t
c
S

n1
, X +t
c
S

n1
_
que se abrevia generalmente con la expresin
X t
c
S

n1
Entonces la expresin para el intervalo de conanza en trmino de probabilidad ent dada
por
P
_
X t
c
S

n1
< < X +t
c
S

n1
_
= 1
Ejemplo 9.4.2 Una muestra aleatoria de 12 secretarias que escriben a mquina arroj un
promedio 85,2 palabras por minuto con una desviacin estndar de 9,3 palabras por minu-
to. Encuentre un intervalo de conanza de 95% para el nmero promedio de palabras por
minuto escritas por todas las secretarias.
Desarrollo
1. El nivel de conanza establecido es 1 = 0, 95.
2. Como la muestra es pequea (n = 12 < 30) y la varianza poblacional es desconocida
se procede a determina el valor de t, para lo cual antes se debe determinar los grados
de libertad, que estn dadas por n 1 = 12 1 = 11. El valor de
t
de la tabla de la
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 188
distribucin t corresponde al rea que se encuentra a la derecha del valor positivo de t
que buscamos, por lo tanto para los intervalos de conanza sera la mitad del valor del
nivel de signicacin, esto es

t
=

2
=
0, 05
2
= 0, 025
Se busca en la tabla t lo siguiente
/2 = 0, 025
n1 = 11 2,201
con lo cual el valor buscado es t
c
= 2, 201.
3. Los estadsticos de la muestra son: X = 85, 2 y S = 9, 3
4. El error estndar estar dada por
S

n1
=
9, 3

121
= 2, 804
5. El error mximo de estimacin ser
E =t
c
S

n1
= (2, 201)(2, 804) = 6, 172
6. Finalmente los lmites inferior y superior sern respectivamente
X E = 85, 26, 172 = 79, 028 y X +E = 85, 2+6, 172 = 91, 372
Por lo tanto el intervalo de conanza buscado es (79, 028 ; 91, 372), que en trmino de
probabilidades se expresa como
P(79, 028 < < 91, 372) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95 de
que el nmero promedio de palabras por minuto escritas por todas las secretarias, se
encuentre entre 79,028 y 91,372.
9.4.2. Intervalos de conanza para la varianza y la desviacin tpica de
una poblacin.
Intervalos de conanza para la varianza
Para encontrar un intervalo de conanza con un cierto grado de abilidad 1 , para
todo 0 < < 1, que contenga a la varinaza poblacional
2
, si esta se desconocida, se puede
utilizar a la v. a.
nS
2

2
, donde n es el tamao de muestra y S
2
es la varianza muestral. Teniendo
en cuenta que esta v. a. se distribuye como una ji-cuadrada con n 1 grados de libertad,
puede seleccionarse dos valores de esta distribucin (
2
c
y
2
l
), tales que la probabilidad de
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 189
que
nS
2

2
est entre estos dos valores sea igual al grado de abilidad propuesto, tal como lo
muestra la gura 9.1. Esto es
P
_

2
c
<
nS
2

2
<
2
l
_
= 1
Figura 9.1: Grca del proceso de eleccin de los valores
2
c
y
2
l
.
Tomando la expresin
2
c
<
nS
2

2
<
2
c
y despejando en ella a
2
, se tendr

2
c
nS
2
<
1

2
<

2
l
nS
2

nS
2

2
l
<
2
<
nS
2

2
c
Entonces la probabilidad de que la varianza poblacional est entre los valores
nS
2

2
l
y
nS
2

2
c
estar dada por la relacin
P
_
nS
2

2
l
<
2
<
nS
2

2
c
_
= 1
con lo cual el intervalo de conanza de
2
con un nivel de conanza de 1 estar dada por
_
nS
2

2
l
,
nS
2

2
c
_
Analizando la elaboracin de la tabla de la distribucin ji-cuadrada encontramos que si
X
2
(n) entonces P(X x) = p, donde p es el rea bajo la curva y va desde el valor cero a
un cierta valor x =
2
[p ; ]
, donde son los grados de libertad, tal como lo muestra la siguiente
gura
Por lo tanto analizando las guras 9.1 y 9.2, tenemos que:

2
l
=
2
[1

2
; n1]
y
2
c
=
2
[

2
; n1]
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 190
Figura 9.2: Grca de la distribucin acumulada de la
2
.
Intervalos de conanza para la desviacin tpica
De la expresin que se obtuvo para el estimdor por intervalos de conanza para la varian-
za de una poblacin, se puede encontrar un intervalo de conanza para la desviacin estndar.
Entonces de la expresin
nS
2

2
[1

2
; n1]
<
2
<
nS

2
[

2
; n1]
se obtiene lo siguiente

nS

[1

2
; n1]
< <

nS

2
; n1]
en trmino de probabilidades, esto es
P
_
nS
2

2
[1

2
; n1]
<
2
<

nS

2
[

2
; n1]
_
= P
_

nS

[1

2
; n1]
< <

nS

2
; n1]
_
= 1
Por lo tanto el intervalo de conanza para est dada por
_

nS

[1

2
; n1]
;

nS

2
; n1]
)
Ejemplo 9.4.3 Las resistencias a la rotura, expresada en libras, de 5 ejemplares de cuerdas
estn dadas por los siguientes valores:
460 540 660 580 550
Estime los intervalos de conanza del 90% para la varianza
2
y la desviacin estndar
de la poblacional.
Desarrollo
1. El nivel de conanza establecido es 1 = 0, 90, con lo cual = 0, 10.
2. Como se desea estimar a la varianza poblacional, la variable aleatoria a utilizar es
2
de
la distribucin ji-cuadrada. Como siguiente paso, se procede a determina los valores
2
c
y
2
l
, para lo cual antes se debe determinar los grados de libertad que estn dadas por
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 191
n1 = 51 = 4. El valor de p de la tabla de la distribucin ji-cuadrada corresponde
al rea que se encuentra a la izquierda del valor de
2
que se busca. Como

2
l
=
2
[1

2
; n1]
=
2
[0,95 ; 4]
y
2
c
=
2
[

2
; n1]
=
2
[0,05 ; 4]
se busca en la tabla de la ji-cuadrada lo siguiente
p = 0, 05
gl = 4 0,7107
y
p = 0, 95
gl = 4 9,488
con lo cual los valores buscado son
2
c
= 0, 711 y
2
l
= 9, 488.
3. Los estadsticos de la muestra son: X = 558 y S
2
= 4176
4. Los lmites inferior y superior del intervalo buscado son respectivamente
nS
2

l
=
(5)(4176)
9, 488
= 2200, 67 y
nS
2

c
=
(5)(4176)
0, 711
= 29367, 09
Con lo cual el intervalo buscado para la varianza es (2200, 67 ; 29367, 09), que en
trmino de probabilidades se expresa como
P(2200, 67 <
2
< 29367, 09) = 0, 90
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,90
de que el verdadero valor de la varianza de la poblacin de secretarias que escriben
palabras por minuto, se encuentre entre los valores 2200,67 y 29367,09.
Del resultado anterior, el intervalo de conanza del 90% para la desvicin estndar
poblacional estar dada por
46, 91 < < 171, 37
Este resultado se interpreta de la misma manera que para el caso anterior, esto es,
sustituyendo la palabra varianza por la de desiviacin estndar.
9.4.3. Intervalos de conanza para estimar Proporciones
Sea una poblacin con una distribucin Bernoulli cuyo parmetro P es desconocido y se
desea estimar estableciendo un intervalo de conanza con un cierto grado de abilidad. Para
esta nalidad se utilizarar la distribucin muestral de proporciones.
Recordemos que si el tamao de la muestra es lo sucientemente grande (n 30) por
aplicacin del teorema central del lmite la distribucin muestral de proporciones se aproxima
a una distribucin normal con media
p
= P y varianza
2
p
=
P(1P)
n
. Por lo tanto la v.a.
Z =
p
p

p
N(0, 1)
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 192
Si establecemos un nivel de conanza de 1 para la estimacin del intervalo de conan-
za para P y realizamos los mismos pasos hechos en el caso de medias con muestras grandes,
tendremos que
P( pZ
c

p
<
p
< p+Z
c

p
) = 1
Como no se conoce el valor
p
=
_
P(1P)
n
, en su lugar se utilizar a
_
p(1 p)
n
.
Entonces tendremos que
P
_
pZ
c
_
p(1 p)
n
< P < p+Z
c
_
p(1 p)
n
_
= 1
Por lo que el intervalo buscado estar dada por
_
pZ
c
_
p(1 p)
n
; p+Z
c
_
p(1 p)
n
_
Ejemplo 9.4.4 Se pregunta a 2000 votantes cul ser la actitud respecto a una determinada
propuesta poltica; 800 se oponen. Suponiendo que la muestra fuese aleatoria y procedente de
una poblacin Bernoulli. Construya un intervalo de conanza para la proporcin de votantes
a favor de la propuesta poltica para un 95% de conanza.
Desarrollo
1. El nivel de conanza jado es 1 = 0, 95.
2. Como se trata de estimar una proporcin y adems n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 = 0, 95, ya
vimos anteriormente que Z
c
= 1, 96.
3. Para realizar la estimacin de la proporcin P de votantes que estn a favor de la prop-
uesta poltica bajo un intervalo necesitamos calcular el estadstico muestral p =
X
n
,
donde X es el nmero de votantes que estn a favor de la propuesta poltica, entonces
p =
1200
2000
= 0, 6
4. El error estndar estar dada por

p
=
_
0, 6(10, 4)
2000
= 0, 01095
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 193
5. El error mximo de estimacin ser
E = Z
c

p
= (1, 96)(0, 01095) = 0, 0215
6. Los lmites inferior y superior sern respectivamente
pE = 0, 60, 0215 = 0, 5785 y p+E = 0, 6+0, 0215 = 0, 6215
Por lo que el intervalo buscado es (0, 5785 ; 0, 6215), que en trminos de probabilida-
des se expresa como
P(0, 5785 < P < 0, 6215) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95 de
que la proporcin de votantes que estn a favor de la propuesta poltica, se encuentre
entre los valores 0,5785 y 0,6215.
9.4.4. Intervalos de conanza para estimar Diferencias de Medias
Si tenemos dos poblaciones, de las cuales extraemos muestras de ciertos tamaos, hay
que tener en cuenta que se puede construir una distribucin muestral para la diferencia de las
medias muestrales. Si las medias poblaciones son desconocidas; en esta seccin se estimar
un intervalo de conanza para la diferencia de estas medias utilizando la distribucin muestral
de diferencias de medias.
Intervalos de conanza para Diferencias de Medias utilizando la distribucin normal
Si de la poblacin uno con media
1
desconocida y varianza
2
1
extraemos muestras de
tamao n
1
, y de la poblacin dos con media
2
desconocida y varianza
2
2
extraemos muestras
de tamao n
2
; y tenemos que n
1
+n
2
2 30 por aplicacin del teorema central del lmite
la variable aleatoria
Z =
(X Y)
XY

XY
N(0, 1)
donde
XY
=
1

2
y
XY
=

2
1
n
1
+

2
2
n
2
.
Por lo tanto si la estimacin del intervalo de conanza ser hecho con un nivel de con-
anza de 1 y se sigue un razonamiento anlogo al hecho en el caso de una poblacin con
media desconocida; se tendr la siguiente relacin
P
_
Z
c
<
(X Y)
XY

XY
< Z
c
_
= 1
que se transforma en
P[(X Y) Z
c

XY
<
XY
< (X Y) +Z
c

XY
] = 1
Por lo que el intervalo de conanza para diferencias de medias est dada por
_
X Y Z
c

2
1
n
1
+

2
2
n
2
; X Y +Z
c

2
1
n
1
+

2
2
n
2
_
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 194
Observacin: Si n
1
+n
2
2 30 y se desconocen las varianzas poblaciones se utilizan
las varianzas muestrales; dicho de otro modo

S
2
1
n
1
+
S
2
2
n
2
en lugar de

2
1
n
1
+

2
2
n
2
.
Ejemplo 9.4.5 En un laboratorio, se experimenta con dos drogas que reducen el tiempo de
respuesta a cierto estmulo. Se administra a 35 ratas la droga 1 y a 30 la droga 2. La reduccin
del tiempo de reaccin al estmulo de cada rata fue registrada como sigue:
Reduccin del tiempo con la droga 1
28 31 33 23 20
30 22 34 32 35
30 33 36 34 43
26 28 27 23 29
28 33 33 29 38
27 26 21 24 24
27 15 28 19 27
Reduccin del tiempo con la droga 2
11 21 7 21 23
23 24 27 23 30
17 17 16 16 25
37 29 22 12 26
27 15 23 29 19
16 17 33 36 14
Encuentre un intervalo de conanza del 90% para estimar la diferencia entre los tiempos
de respuesta promedio al estmulo de los grupos e interprete el resultado.
Desarrollo
El nivel de conanza ya establecido es 1 = 0, 90.
Como n
1
+n
2
2 = 35 +30 2 = 63 > 30, la variable aleatoria a utilizar es Z de la
normal tipicada. Como 1 = 0, 90, buscando en la tabla de Z, encontraremos que
Z
c
= 1, 645.
Los estadsticos muestrales a utilizar son
X = 28, 457 S
2
1
= 32, 3053 n
1
= 35
Y = 21, 867 S
2
2
= 51, 3156 n
2
= 30
El error estandar de estimacin es

XY
=
_
32, 3053
35
+
51, 3156
30
= 1, 623
El error mximo de estimacin estar dada por
E = (1, 645)(1, 623) = 2, 67
Los lmites inferior y superior sern respectivamente
X Y E = 28, 45721, 8672, 67 = 3, 92 y
X Y +E = 28, 45721, 867+2, 67 = 9, 26
Por lo tanto el intervalo de conanza buscado es (3, 92 ; 9, 26), que en trmino de
probabilidades se expresa como
P(3, 92 <
1

2
< 9, 26) = 0, 90
Entonces hay una probabilidades de 0,90 de que la diferencia entre los tiempos de
respuesta promedio al estmulo de los grupos est entre 3,92 y 9,26.
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 195
Intervalos de conanza para Diferencias de Medias utilizando la distribucin t
Si las poblaciones tienen varianzas desconocidas y adems, de ellas se extraen muestras
cuyos tamaos cumplen con la condicin n
1
+n
2
2 < 30; suponiendo igualdad de varian-
zas poblacionales se puede utilizar la distribucin t de Student para establecer intervalos de
conanza para la diferencia de medias.
Si el grado de abilidad es igual a 1 y la varianza combinada de las muestras es dene
por S
2
p
=
n
1
S
2
X
+n
2
S
2
Y
n
1
+n
2
2
; entonces
P
_
t
c
<
(X Y)
XY
S
p
_
1
n
1
+
1
n
2
<t
c
_
= 1
que con aplicaciones algebraicas se transforma en la relacin
P
_
X Y t
c
S
p
_
1
n
1
+
1
n
2
<
1

2
< X Y +t
c
S
p
_
1
n
1
+
1
n
2
_
= 1
con lo cual; el intervalo de conanza buscado en estas condiciones est dada por la expresin
_
X Y t
c
S
p
_
1
n
1
+
1
n
2
; X Y +t
c
S
p
_
1
n
1
+
1
n
2
_
donde t
c
es el valor de t con n
1
+n
2
2 grados de libertad.
Ejemplo 9.4.6 Durante varios aos se han cultivado, en diversos lugares de un rea, dos
variedades de cebada y est en discusin su adaptacin. Cul se seleccionar para el rea,
basandose en las siguientes cosechas por hectrea?
Trebi 120,6 56,5 133,2 187,1 186,9 129,4 155,2
Svanota 115,4 90,2 130,3 147,9 120,3 77,6 104,5
Localice los lmites de conanza de la diferencia entre las medias con un grado de conanza
del 99% e interprete el resultado.
Desarrollo
El nivel de conanza establecido es 1 = 0, 99
Como n
1
+n
2
2 = 7 +7 2 = 12 < 30 y las varianzas poblacionales son descono-
cidas, la variable aleatoria estndar a usar es la t de la distribucin t de Student, que
en este caso tendr 12 grados de libertad. El valor de
t
de la tabla para este caso
corresponde al valor

t
=

2
=
0, 01
2
= 0, 005
Por lo que se busca en la tabla t lo siguiente
/2 = 0, 005
n
1
+n
2
2 = 12 3,055
con lo cual el valor buscado es t
c
= 3, 055.
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 196
Los estadisticos muestrales a utilizar son:
X = 138, 4143 S
2
X
= 1734, 09551 n
1
= 7
Y = 112, 3143 S
2
Y
= 488, 329796 n
2
= 7
con lo cual la diferencia entre las medias y la varianza combinada de las muestras son
respectivamente
X Y = 138, 4143112, 3143 = 26, 1
S
2
p
=
n
1
S
2
X
+n
2
S
2
Y
n
1
+n
2
2
=
7(1734, 09551) +7(488, 329796)
7+712
= 1296, 4148
El error estndar de estimacin est dada por
S
p
_
1
n
1
+
1
n
2
=
_
1296, 4148
_
1
7
+
1
7
= 19, 2459
El error mximo de estimacin es
E =t
c
S
p
_
1
n
1
+
1
n
2
= (3, 055)(19, 2459) = 58, 8
Los lmites inferior y superior sern respectivamente
X Y E = 26, 158, 8 =32, 7 y X Y +E = 26, 1+58, 8 = 84, 9
Por lo que el intervalo buscado es (32, 7 ; 84, 9), que en trminos de probabilidades
se expresa como
P(32, 7 <
X

Y
< 84, 9) = 0, 99
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,99 de
que la diferencias entre los promedios de los dos tipos de cebadas, se encuentre entre
los valores -32,7 y 84,9.
9.4.5. Intervalos de conanza para Relaciones de Varianzas
Sean dos muestras aleatorias independientes de tamaos m y n, con varianzas S
2
1
y S
2
2
, que
se extraen de dos poblaciones distribuidas normalmente con varianzas desconocidas
2
1
y
2
2
respectivamente. Con base a estas informaciones se puede estimar un intervalo de conanza
para la relacin de estas varianzas desconocidas
_

2
1

2
2
_
. Como primer paso para conseguirlo
se toma en cuenta las siguientes variables aleatorias con sus distribuciones asociadas
mS
2
1

2
1

2
(m1) y
nS
2
2

2
2

2
(n1)
Suponiendo independencia entre estas variables aleatorias; entonces por lo ya visto an-
teriormente el cociente entre dos variables con distribuciones ji-cuadradas divididas por sus
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 197
grados de libertad correspondientes constituye una variable aleatoria con distribucin F de
Snedecor con m1 y n1 grados de libertad; esto es
mS
2
1
(m1)
2
1
nS
2
2
(n1)
2
2
F(m1; n1)
Por lo tanto si se establece un nivel de conanza de 1, se tiene que
P
_
F
1
<
mS
2
1
(m1)
2
1
nS
2
2
(n1)
2
2
< F
2
_
= P
_
F
1
<
m(n1)S
2
1

2
2
n(m1)S
2
2

2
1
< F
2
_
= 1
que por medio de procedimientos algebricos se transforma en
P
_
1
F
2

m(n1)S
2
1
n(m1)S
2
2
<

2
1

2
2
<
1
F
1

m(n1)S
2
1
n(m1)S
2
2
_
= 1
Por conveniencia se podra tomar a F
1
= F
[

2
; m1 ; n1]
y F
2
= F
[1

2
; m1 ; n1]
; adems
de tener en cuenta que

S
2
1
=
mS
2
1
m1
y

S
2
2
=
nS
2
2
n1
la ultima expresin se transforma en
P
_
1
F
[1

2
; m1 ; n1]

S
2
1

S
2
2
<

2
1

2
2
<
1
F
[

2
; m1 ; n1]

S
2
1

S
2
2
_
= 1
Finalmente el intervalo buscado est dado por
_
1
F
[1

2
; m1 ; n1]

S
2
1

S
2
2
;
1
F
[

2
; m1 ; n1]

S
2
1

S
2
2
_
En la realizacin de los clculos resulta til recordar que
F
[1

2
; m1 ; n1]
=
1
F
[

2
; n1 ; m1]
F
[

2
; m1 ; n1]
=
1
F
[1

2
; n1 ; m1]
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 198
Ejemplo 9.4.7 La poblacin A tiene una varianza de 3,4 segn se determin con una mues-
tra de 21 elementos, mientras que la poblacin B tena una varianza de 5,2 segn se determin
por una muestra de 16 elementos. Determinar los lmites de conanza del
a) 90%
b) 95%
de la razn de las varianzas de las dos poblaciones.
Desarrollo
El nivel de conanza ya establecido es
a) 1 = 0, 90
b) 1 = 0, 95
Como se busca un intervalo de conanza para relaciones de varianzas, la variable
aleatoria estandar a usar es la F de la distribucin F de Snedecor, que en este caso
tendr m1 = 211 = 20 y n1 = 161 = 15 grados de libertad. El valor
t
de la
tabla corresponde al valor
a)
t
=

2
=
0, 10
2
= 0, 05
b)
t
=

2
=
0, 05
2
= 0, 025
por lo que para cada caso se busca en la tabla F lo siguiente
a)
P(X x) = 0, 95
m = 20
n = 15 2,33
y
P(X x) = 0, 95
m = 15
n = 20 2,20
Con lo cual
F
[0,95 ; 20 ; 15]
= 2, 33 y F
[0,05 ; 20 ; 15]
=
1
F
[0,95 ; 15 ; 20]
=
1
2, 20
= 0, 455
b)
P(X x) = 0, 975
m = 20
n = 15 2,76
y
P(X x) = 0, 975
m = 15
n = 20 2,57
Con lo cual
F
[0,975 ; 20 ; 15]
= 2, 76 y F
[0,025 ; 20 ; 15]
=
1
F
[0,975 ; 15 ; 20]
=
1
2, 57
= 0, 39
Los estadsticos muestrales a utilizar en cada caso son

S
2
1
=
m
m1
S
2
1
=
21
20
(3, 4) = 3, 57

S
2
2
=
n
n1
S
2
1
=
16
15
(5, 2) = 5, 547
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 199
Los lmites inferior y superior para cada caso son respectivamente
a)
1
F
[0,95 ; 20 ; 15]

S
2
1

S
2
2
=
1
2, 33

3, 57
5, 547
= 0, 2762
1
F
[0,05 ; 20 ; 15]

S
2
1

S
2
2
=
1
0, 455

3, 57
5, 547
= 1, 4145
Por lo tanto el intervalo de conanza buscado es (0, 2762 ; 1, 4145); que en tr-
mino probabilstico se expresa como
P
_
0, 2762 <

2
1

2
2
< 1, 4145
_
= 0, 90
b)
1
F
[0,975 ; 20 ; 15]

S
2
1

S
2
2
=
1
2, 76

3, 57
5, 547
= 0, 2332
1
F
[0,05 ; 20 ; 15]

S
2
1

S
2
2
=
1
0, 39

3, 57
5, 547
= 1, 6502
Por lo tanto el intervalo de conanza buscado es (0, 2332 ; 1, 6502); que en tr-
mino probabilstico se expresa como
P
_
0, 2332 <

2
1

2
2
< 1, 6502
_
= 0, 95
9.4.6. Intervalos de conanza para Diferencias de Proporciones
Sean dos muestras aleatorias de tamaos n
1
y n
2
que se extraen de dos poblaciones
Bernoulli con parmetros P
1
y P
2
respectivamente, sean adems las proporciones muestrales
p
1
y p
2
. Si se desconocen los valores de dichos parmetros, se podra estimar un intervalo
de conanza para la diferencia de proporciones utilizando la distribucin muestral de difer-
encias de proporciones. La estimacin de este intervalo se har en base a muestras grandes,
por lo que se aplicar una aproximacin a la distribucin normal. Entonces
( p
1
p
2
)
p
1
p
2

p
1
p
2
N(0, 1)
donde
p
1
p
2
= P
1
P
2
y
p
1
p
2
=

p
1
+
p
2
.
Por lo tanto si establece un nivel de conanza de 1 y se toman consideraciones anlo-
gas al caso de diferencias de medias para el caso normal se tendr que
P
_
Z
c
<
( p
1
p
2
)
p
1
p
2

p
1
p
2
< Z
c
_
= 1
que con procedimientos algebricos se tranforma en
P
_
( p
1
p
2
) Z
c

p
1
p
2
<
p
1
p
2
< ( p
1
p
2
) +Z
c

p
1
p
2
_
= 1
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 200
Por lo que el intervalo de conanza buscado es
_
( p
1
p
2
) Z
c

p
1
p
2
; ( p
1
p
2
) +Z
c

p
1
p
2
_
Recordemos que
p
1
p
2
depende de los parmetros P
1
y P
2
, que en este caso son de-
sconocidos, razn por la cual para su clculo se reemplaza a P
1
por p
1
y a P
2
por p
2
.
Ejemplo 9.4.8 De una cierta ciudad se extrae una muestra aleatoria de 100 personas y
se encuentra que 50 usan una cierta marca de jabn. De la misma ciudad se extrae otra
muestra de 100 personas y se encuentra que 20 usan una marca de jabn distinta a la primera.
Construya un intervalo de conanza del 95% para la diferencia de proporciones de personas
que usan las respectivas marcas de jabn e interprete el resultado.
Desarrollo
1. El nivel de conanza jado es 1 = 0, 95.
2. Como se trata de estimar diferencias de proporciones y adems las muestras son grandes,
la variable aleatoria estndar a utilizar es Z de la distribucin normal estndar. Como
1 = 0, 95, ya se vi que Z
c
= 1, 96.
3. Para realizar la estimacin de la diferencia entre las proporciones P
1
y P
2
de personas
que usan las respectivas marcas de jabones bajo un intervalo necesitamos calcular los
estadsticos muestrales p
1
=
X
n
1
y p
2
=
Y
n
2
, donde X es el nmero de personas en
n
1
que usan la primera marca de jabn e Y el nmero de personas en n
2
que usan la
segunda marca de jabn, entonces
p
1
=
50
100
= 0, 5 y p
2
=
20
100
= 0, 2
4. El error estndar estar dada por

p
1
p
2
=
_
0, 5(10, 5)
100
+
0, 2(10, 2)
100
= 0, 06403
5. El error mximo de estimacin ser
E = Z
c

p
= (1, 96)(0, 06403) = 0, 1255
9.5. PROBLEMAS 201
6. Los lmites inferior y superior sern respectivamente
p
1
p
2
E =0, 50, 20, 1255 =0, 1745 y p+E =0, 50, 2+0, 1255 =0, 4255
Por lo que el intervalo buscado es (0, 1745 ; 0, 4255), que en trmino de probabilidad
se expresa como
P(0, 1755 < P
1
P
2
< 0, 4255) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95
de que la diferencia de proporciones de personas que usan las marcas de jabones, se
encuentre entre los valores 0,1755 y 0,4255.
9.5. Problemas
Estimadores y sus propiedades
1. Sean

1
y

2
dos estimadores insesgados para el parmetro , y sea una constante.
Demuestre que

=

1
+(1)

2
es tambin un estimador insesgado para .
2. Sea X
1
, X
2
, . . . , X
n
una m.a. de una poblacin con media desconocida . Probar que la
estadstica X
a) es un estimador insesgado de la media problacional
b) es un estimador convergente o consistente de
3. Sea X
1
, X
2
, . . . , X
n
una m.a. de una poblacin con media desconocida y varianza
2
desconocida. Probar que
a) S
2
es un estimador sesgado pero ser un estimador consistente para
2
b)

S
2
es un estimador insesgado de
2
4. Sea X
1
, X
2
, . . . , X
n
una m.a. de una poblacin con media conocida y varianza
2
de-
sconocida. Demuestra que la siguiente estadstica es un estimador insesgado para
2
,

2
=
1
n
n

i=1
(X
i
)
2
5. Sea X
1
, X
2
, . . . , X
n
una m.a. de una poblacin con media desconocida y varianza nita

2
desconocida. Demuestra que la siguiente estadstica es un estimador insesgado para

2
,

2
=
1
2(n1)
n1

i=1
(X
i+1
X
i
)
2
6. Sea X
1
, X
2
, X
3
, X
4
una muestra aleatoria de una poblacin distribuida segn la ley una
ley de Poissn con parmetro . Considere los siguientes estadsticos para .

1
=
X
1
+X
2
+X
3
+X
4
4
y
X
1
+2X
2
+3X
3
+4X
4
10
9.5. PROBLEMAS 202
Verique la condicin de insesgamiento en ambos estadsticos y halla la eciencia
relativa.
Estimacin Puntual
Mtodo de mxima verosimilitud
7. Supngase que X
1
, X
2
, . . . , X
n
constituye una muestra aleatoria de tamao n de una
distribucin Bernoulli con parmetro P desconocido, pero se sabe que P pertenece al
intervalo abierto (0, 1).
a) Determinar el estimador de mxima verosimilitud de P, suponiendo que no todos
los valores observados son 0 o todos los valores observados son 1.
b) Probar que el estimador de mxima verosimilitud de P no existe si todo valor
observado es 0 o si todo valor observado es 1.
8. No se sabe que proporcin P de la compra de cierta marca de cereal es realizada por
mujeres y que proporcin es realizada por hombres. En una muestra de 70 compras
de este cereal, se encontr que 58 fueron realizadas por mujeres y 12 por hombres.
Determine el estimador de mxima verosimilitud para P.
9. Supngase que X
1
, X
2
, . . . , X
n
constituye una muestra aleatoria de tamao n de una
distribucin normal con media desconocida y varianza
2
tambin desconocida. De-
termnense los estimadores de mxima verosimilitud para y
2
.
10. Supngase que X
1
, X
2
, . . . , X
n
constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
f (x|) =
_
_
_
x
1
si 0 < x < 1
0 en otro caso
Adems, supngase que el valor de es desconocido ( >0). Determnese el estimador
de mxima verosimilitud para .
11. Supngase que X
1
, X
2
, . . . , X
n
constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
f (x|) =
1
2
e
|x|
para < x <
Adems, supngase que el valor de es desconocido ( < < ). Determnese el
estimador de mxima verosimilitud para .
12. Supngase que X
1
, X
2
, . . . , X
n
constituye una m.a. de una distribucin uniforme sobre el
intervalo (
1
,
2
), donde
1
y
2
son desconocidos (<
1
<
2
<). Determnense
los estimadores de mxima verosimilitud para
1
y
2
.
13. Una poblacin tiene una funcin de densidad de probabilidad dada por
f (x|) = 2
_

x
2
e
x
2
para < x <
9.5. PROBLEMAS 203
Si se toman n observaciones de esta poblacin, hallar la estima de maxima verosimili-
tud de .
14. Supongase que , el tiempo para fallas (en horas) de un instrumento elctronico, tiene
la siguiente funcin de densidad de probabilidad
f (t|) =
_
_
_
e
(tt
0
)
si t >t
0
> 0
0 en otro caso
Supngase que se prueban n artculos y que se anotan los tiempos de fallas t
1
, t
2
, . . . , t
n
.
suponiendo que t
0
es conocido, obtener el estimador de maxima verosimilitud para .
15. Supngase que X
1
, X
2
, . . . , X
n
constituye una m.a. de una distribucin de Poisson con
media desconocida ( > 0).
a) Determnese el estimador de mxima verosimilitud de , suponiendo que al menos
uno de los valores observados es distinto de cero.
b) Demestrese que el estimador de mxima verosimilitud de no existe si todo
valor observado es cero.
Mtodo de momentos
16. Dada una muestra aleatoria de tamao n de una poblacin uniforme en el intervalo
[0, a], use el mtodo de momentos para encontrar un estimador para el parmetro a.
17. Dada una muestra aleatoria de tamao n de una poblacin Poisson con parmetro de-
sconocido >0, use el mtodo de momentos para encontrar un estimador del parmetro
.
18. Dada una muestra aleatoria de tamao n de una poblacin exponencial con parmetro
desconocido >0, use el mtodo de momentos para encontrar un estimador del parmetro
.
19. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
f (x) =
_

_
1

si 0 < x <
0 otro caso
Estimar por el mtodo de los momentos.
20. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
f (x) =
_
_
_
(1)x

si 0 < x < 1
0 otro caso
Estimar por el mtodo de los momentos.
9.5. PROBLEMAS 204
21. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
f (x) =
_

_
2

2
(x) si 0 < x <
0 otro caso
Estimar por el mtodo de los momentos.
Estimacin por intervalos
Para medias cuando
2
es conocida o la muestra es grande
22. Las estaturas en centmetros de una muestra aleatoria de 50 estudiantes universitarios
son:
180 160 174 172 186 171 169 179 175 175
178 184 167 170 174 175 182 188 176 169
183 171 164 179 162 175 166 174 175 177
183 171 184 182 159 171 175 179 160 175
176 178 180 167 170 161 167 169 184 176
Construya un intervalo de conanza de 98% para estimar la media de todos los estudi-
antes de la universidad e interprete el resultado.
23. Los siguientes datos son el nmero de kilmetros al ao que es manejado el automvil
por una muestra de 25 propietarios de automviles:
26597 20700 29174 19405 32501
23873 22974 23815 29588 18091
23719 25048 16818 25620 22581
23471 26798 24352 19455 30104
22977 27147 20340 25566 29236
Construya un intervalo de conanza del 99% para estimar el nmero promedio de
kilmetros al ao que es manejado un automvil e interprete el resultado.
24. Se toma una muestra aleatoria de 81 observaciones de una poblacin normal. La media
de la muestra es 40 y la desviacin estndar de la muestra es 5. Encuentre el intervalo
de conanza de 95% para la media de la poblacin e inteprete el resultado.
25. Se toma una muestra aleatoria de 49 observaciones de una poblacin normal. La media
de la muestra es 55 y la desviacin estndar de la muestra es 10. Encuentre el intervalo
de conanza de 99% para la media de la poblacin.
26. Una empresa de investigacin realiz una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 49
fumadores continuos revel que X = 20 dlares y S = 5 dlares.
a) Cul es la estimacin puntual de la media poblacional?. Explique que indica.
b) Utilizando un nivel de conanza de 95%, determine el intervalo de conanza para
la media poblacional e interprete el resultado.
9.5. PROBLEMAS 205
27. Un profesor de ingles cont el nmero de palabras mal escritas en su ensayo que asign
hace poco a sus alumnos. Para una clase de 40 alumnos, el nmero medio de palabras
mal escritas fue de 6, 05 y la desviacin estndar fue de 2, 44. Construya un intervalo
de conanza de 95% para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
28. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente dis-
tribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de
30 focos tienen una duracin promedio de 780 horas. Encuentre un intervalo de con-
anza de 95% para la media de la poblacin de todos los focos que producen esta
empresa e interprete el resultado.
29. A muchos pacientes con problemas cardiacos se les implant un marca pasos para con-
trolar su ritmo cardiaco. Se monta un modulo conector de plstico sobre la parte su-
perior del marca pasos. Suponga una desviacin estndar de 0,0015 y una distribucin
aproximadamente normal. Encuentre un intervalo de conanza de 95% para la media
de todos los mdulos conectores que fabrica cierta compaa e interprete el resultado.
Una muestra aleatoria de 75 mdulos tiene un promedio de 0,310 pulgadas.
30. En un proceso qumico se fabrica cierto polmero. Normalmente se hacen mediciones
de la viscosidad despus de cada corrida, y la experiencia acumulada indica que la vari-
abilidad en el paso es muy estable, con = 20. La siguiente son 15 mediciones de la
viscosidad por corrida: 724, 718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747
y 742. Encuentre un intervalo de conanza de 90%para la viscosidad media de polmeros
e interprete el resultado.
31. Para una muestra de 50 empresas tomadas de una industria determinada, se encuentra
que el nmero promedio de empleados por empresas es de 420,5 con una desviacin
muestral de 55,7. Existe un total de 380 empresas en esa rama industrial. Encuentre
un intervalo de conanza de 95% para media de la poblacin de los empleados por
empresa e interprete el resultado.
32. Una fabrica produce anillos para los pistones de un motor de automvil. Se sabe que
el dimetro del anillo esta distribuida aproximadamente en forma normal y que tiene
una desviacin estndar de 0, 001 mm. Una muestra aleatoria de 15 anillos tiene un
dimetro promedio de 74, 036 mm.
a) Construye un intervalo de conanza de 99% para el dimetro promedio del anillo
e interprete el resultado.
b) Construya un limite inferior de conanza de 95% para el dimetro promedio del
anillo e inteprete el resultado.
33. Se toma una muestra al azar de 45 alumnos, tomados sin reposicin de una clase de
estadstica de 221 alumnos que muestra una media de 70 puntos y una desviacin estn-
dar de 9 puntos en las calicaciones nales. Compruebe que el intervalo de conanza
del 98% para la media de las 221 calicaciones varia de 72, 8 a 97, 2 puntos.
34. La media y la desviacin tpica de las cargas mximas soportadas por 60 cables estn
dadas respectivamente por 11, 9 ton. y 0, 73 ton. Hallar los limites de conanza de:
9.5. PROBLEMAS 206
a) 95%
b) 99% para la media de las cargas mximas de todos los cables producidos por la
compaa e interprete los resultados.
35. La municipalidad necesita adquirir lamparitas elctricas en una fbrica. Se toma una
muestra de 100 lmparas con las cuales se hace que se mida el tiempo en que tardan
en quemarse. Los resultados son: media 2080 horas de vida y desviacin tpica de 300
horas. Hallar un intervalo de conanza para con un nivel de signicacin de 1% e
interprete el resultado.
36. Se desea estimar el precio promedio de cierto artculo de consumo. Para tal n se
realiza una muestra en 101 comercios seleccionados al azar, que indica un precio medio
de 120 dlares, con una desviacin muestral de 16 dlares. Construir un intervalo de
conanza que con 95% de seguridad contenga el parmetro poblacional e interprete el
resultado.
37. La estatura de 1000 estudiantes estn distribuidas aproximadamente de forma normal,
con una media de 174, 5 cm y una desviacin estndar de 6, 9 cm. Si se extraen 200
muestras aleatorias de tamao 25 de esta poblacin y las medidas se registran al dcimo
de centmetros ms cercanos. Determine:
a) La media y la desviacin estndar de la distribucin muestral de medias
b) Construya un intervalo de conanza de 90% para la media de estaturas de esta
poblacin e interprete el resultado.
Para medias cuando
2
es desconocida y la muestra es pequea
38. las cantidades de pesetas, destinadas por un total de 15 familias a diversiones tales
como cine, teatro y otros espectculos pblicos durante un periodo de tiempo determi-
nado fueron los siguientes:
134 136 137 138 138
143 144 144 145 146
146 146 147 148 153
Construya un intervalo de conanza de 90% para la media de las cantidades de pesetas
destinadas por las familias de la poblacin para diversiones e interprete el resultado.
39. Se realizan 20 pruebas de resistencia de un cierto material obtenindose los siguientes
datos:
2225 2300 2217 2190 2295 2285 2195 2255 2232 2252
2272 2231 2223 2211 2219 2231 2218 2262 2257 2261
Construya un intervalo de conanza del 98% para la resistencia media de este material
e interprete el tesultado.
40. Una empresa de investigacin realiz una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 25
fumadores continuos revel que X = 20 dlares y S = 5 dlares. Elabora un intervalo
de conanza del 99% para la media poblacional e interprete el resultado.
9.5. PROBLEMAS 207
41. Un profesor de ingls cont el nmero de palabras mal escritas en un ensayo que asign
hace poco a sus alumnos. Para una clase de 24 alumnos, el nmero medio de palabras
mal escritas fue de 6,05 y la desviacin estndar fue de 2,44. Construya un intervalo
de conanza de 95% para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
Captulo 10
Prueba de Hiptesis
10.1. Introduccin
En el captulo 8 se inici el estudio de la inferencia estadstica. Se describi la manera
de seleccionar una muestra aleatoria y, con base a sta, estimar el valor de un parmetro
poblacional.
En este captulo se continuar con el estudio de la inferencia estadstica. Pero ya no se
realizarn estimaciones puntuales sobre el valor de un parmetro se establecer un intervalo
de valores dentro del cual se espera que se encuentre el parmetro poblacional, sino que se
realizar una prueba de hiptesis acerca de una amacin sobre un parmetro poblacional.
10.2. Deniciones y ejemplos
En esta seccin se denir y luego se describirn los pasos a seguir para la realizacin de
un contraste de hiptesis. Comenzaremos el estudio de esta parte de la inferencia estadstica
dando la denicin de hiptesis.
10.2.1. Qu es una hiptesis?
Denicin 10.2.1 Hiptesis estadstica o simplemente hiptesis es una armacin o suposi-
cin respecto al valor de un parmetro poblacional. Una vez hecha la armacin, se utilizan
los datos para vericar que tan razonable es dicha armacin.
Son ejemplos de hiptesis, o armaciones hechas sobre un parmetro poblacional las
siguientes:
El ingreso mensual promedio de todos los ciudadanos paraguayos es de 1.500.000
guaranies.
El 20% de los delincuentes capturados son sentenciados a prisin.
El 90% de las formas scales son llenadas correctamente.
Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tan grandes
que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar
208
10.2. DEFINICIONES Y EJEMPLOS 209
la poblacin entera es tomar una muestra de la poblacin de inters. De esta manera podemos
probar una armacin para determinar si la evidencia soporta o no la armacin.
10.2.2. Hipotesis nula y alternativa
En esta seccin se considerarn de nuevo los problemas estadsticos que involucran un
parmetro cuyo valor es desconocido, pero que debe pertenecer a un cierto espacio paramtri-
co . Si se puede descomponer en dos subconjuntos disjuntos
0
y
1
, entonces el inves-
tigador debe decidir si el valor desconocido de pertenece a
0

1
.
Se dene H
0
como la hiptesis de que
0
y H
1
como la hiptesis de que
1
.
Puesto que los subconjuntos
0
y
1
son disjuntos y
0

1
= , exactamente una de las
hiptesis, H
0
H
1
, debe ser cierta. El investigador debe decidir si acepta la hiptesis H
0
o acepta la hiptesis H
1
. Un problema de este tipo, en el cual existen slo dos decisiones
posibles, se denomina un problema de contraste de hiptesis. Si el investigador toma un
adecisin errnea sufrir una cierta prdida o pagar un cierto costo. En muchos problemas,
el investigador podr analizar muestras aleatorias antes de tomar su decisin, y los valores
observados en las muestras le proporcionarn informacin acerca del valor de . Un pro-
cedimiento para decidir si aceptar la hiptesis H
0
aceptar la hiptesis H
1
se denomina
procedimiento de contraste o simplemente contraste.
En la mayora de los problemas las dos hiptesis, H
0
y H
1
, se tratan de manera totalmente
distinta. Para distinguir entre ellas, la hiptesis H
0
se denomina hiptesis nula y la hiptesis
H
1
se denomina hiptesis alternativa.
Denicin 10.2.2 La prueba de hiptesis es un procedimiento de contraste basado en una
evidencia muestral y en la teora de la probabilidad, usado para determinar si la hiptesis nula
H
0
es una armacin razonable para no ser rechazada, o es una armacin poco razonable y
ser rechazada en favor de la hiptesis alternativa H
1
.
10.2.3. Dos tipos de errores
Cuando se toma la decisin de acptar o rechazar la hiptesis nula H
0
en un procedimiento
de constraste se corre el riesgo de cometer errores. A continuacin se darn las deniciones
de los posibles errores que se pueden cometer en una prueba de hiptesis.
Denicin 10.2.3 Si en un procedimiento de contraste se rechaza la hiptesis nula cuando
sta es verdadera, entonces se dice que se comete un error tipo I, y la probabilidad de cometer
este primer tipo de error est dada por la relacin
= P(rechazar H
0
| H
0
es cierta)
En cambio, la aceptacin de la hiptesis nula cuando sta es falsa recibe el nombre de error
tipo II, y la probabilidad de cometer este segundo tipo de error est dada por la relacin
= P(aceptar H
0
| H
0
es f alsa)
Todas las decisiones posibles en un contrastes de hiptesis se resumen en la siguiente
tabla:
10.2. DEFINICIONES Y EJEMPLOS 210
H
0
cierta H
0
falsa
Rechazar H
0
Error tipo I Decisin correcta
con probabilidad con probabilidad 1
Aceptar H
0
Decisin correcta Error tipo II
con probabilidad 1 con probabilidad
La informacin para obtener una regla de decisin que nos lleve a rechazar o no rechazar
un hiptesis estadstica provendr de una muestra aleatoria X
1
, . . . , X
n
de la distribucin de
que se trate. Observe adems que al aceptar una hiptesis no se arma que sta sea absoluta-
mente cierta, sino simplemente que es consistente con los datos de la muestra aleatoria. Si la
muestra cambia, posiblemente la decisin de rechazar o no rechazar tambin.
10.2.4. Regin Crtica
Considrese un problema de contraste de hiptesis que tiene la siguiente forma:
H
0
:
0
H
1
:
1
Supngase que antes de que el investigador tenga que decidir que hiptesis aceptar, puede
observar una muestra aleatoria X
1
, X
2
, . . . , X
n
seleccionada de una poblacin cuya distribucin
tiene un parmetro desconocido . Se denir a S como el espacio muestral de la n-upla
X = (X
1
, X
2
, . . . , X
n
). En otras palabras, S es el conjunto de todos los resultados posibles de
la muestra aleatoria.
En un problema de este tipo, el investigador especica un procedimiento de contraste
dividiendo el espacio muestral S en dos subconjuntos disjuntos S
0
y S
1
. El subconjunto S
0
contiene los valores de X para los cuales aceptar H
0
y el otro subconjunto S
1
contiene los
valores de X para los cuales rechazar H
0
y, por lo tanto aceptar H
1
.
Denicin 10.2.4 El subconjunto S
1
del espacio muestral S para el cual H
0
sera rechazada
se denomina regin crtica del contraste y a la probabilidad de cometer el error tipo I, esto
es , se le llama tamao de la regin crtica. A esta probabilidad se le conoce tambin con el
nombre de nivel de signicancia.
En resumen, un procedimiento de contraste se determina especicando la regin crtica
del contraste. Por lo tanto, el espacio parmetrico queda dividido en dos subconjuntos
disjuntos:
A denominada zona de aceptacin y que contiene todos los resultados para para los
cuales H
0
ser aceptada;
y R denominada zona de rechazo y que contiene todos los resultados para para los
cuales H
0
ser rechazada.
10.2.5. Funcin de Potencia
Las caractersticas de un procedimiento de constraste se pueden describir especicando,
para cada valor de , la probabilidad () de que el procedimiento conducir al rechazo
10.2. DEFINICIONES Y EJEMPLOS 211
de H
0
, o la probabilidad 1 () de que conducir a la aceptacin de H
0
. La funcin ()
se denimina funcin de potencia del contraste. Por lo tanto, si C denota la regin crtica del
contraste, entonces la funcin de potencia () se determina por la relacin
() = P(X C|) para
Sea =
0

1
, donde
0

1
= / 0 y sean adems las hiptesis
H
0
:
0
H
1
:
1
Para esta prueba, si H
0
es falsa, es decir
1
, la funcin de potencia se dene como
() = P(Rechazar H
0
|H
0
es f alsa) = P( R| =
i

i

1
) = 1
que constituye la probabilidad de evitar un error de tipo II. Por lo que la potencia de la prueba,
para cualquier valor en H
1
, es la probabilidad de rechazar H
0
, dado que H
1
es cierta.
Por el contrario si H
0
es cierta, la funcin de potencia es
() = P(Rechazar H
0
|H
0
es cierta) = P( R| =
i

i

0
) =
que constituye la probabilidad de cometer el error de tipo I. Por lo que la potencia de la
prueba, para cualquier valor en H
0
, es la probabilidad de rechazar H
0
, dado que H
0
es cierta.
Funcin de Potencia Ideal
Puesto que la funcin de potencia () especica para cada valor posible del parmetro
la probabilidad de que H
0
sea rechazada, resulta que la funcin de potencia ideal sera una
para la cual () = 0 para todo valor de
0
y () = 1 para todo valor de
1
.
Si la funcin de potencia tuviera realmente estos dos valores, entonces, independientemente
del verdadero valor de , el contraste conducira a la decisin correcta con probabilidad 1.
En un problema prctico, sin embargo, rara vez podra exixtir un procedimiento de contraste
que tubiera esta funcin de potencia ideal.
10.2.6. Funcin Caracterstica de Operacin
Adems de la funcin potencia existe otra forma de describir las caractersticas de un
procedimiento de constraste, que tambin se basa en una funcin de probabilidad denominada
funcin caracterstica de operacin, cuya denicin se da a continuacin.
Denicin 10.2.5 El complemento de la funcin potencia 1 () se denomina funcin
caracterstica de operacin. Se dene como una funcin de probabilidad. Por lo tanto, si B
denota el comlemento de la regin crtica, la funcin caracterstica de operacin estar dada
por la relacin
1() = P(X B|) para
Si H
0
es cierta, la funcin de caracterstica de operacin ser
P(X B|) = P(Aceptar H
0
|H
0
es cierta) = P( A| =
i

i

0
) = 1
10.2. DEFINICIONES Y EJEMPLOS 212
que constituye la probabilidad de evitar un error de tipo I. Por lo tanto, constituye la proba-
bilidad de tomar la decisin correcta de aceptar H
0
cunado esta es cierta.
Cuando H
0
es falsa, la funcin caracteristica de operacin est dada por la relacin
P(X A|) = P(Aceptar H
0
|H
0
es f alsa) = P( A| =
i

i

1
) =
que constituye la probabilidad de cometer un error de tipo II.
10.2.7. Hiptesis simples y compuestas
Supngase que X
1
, X
2
, . . . , X
n
constituyen una muestra aleatoria de una distribucin cuya
funcin de probabilidad o de densidad de probabilidad es f (x|), donde el valor del parmetro
debe pertenecer al espacio paramtrico , que
0
y
1
son conjuntos disjuntos tal que

1
= y que se desea contrastar las siguientes hiptesis:
H
0
:
0
H
1
:
1
Si el conjunto
i
, i = 0, 1, solo puede contener un valor de , se dice entonces que la
hiptesis H
i
es una hiptesis simple. Si el conjunto
i
, i = 0, 1, contiene ms de un valor de
, se dice entonces que la hiptesis H
i
es una hiptesis compuesta. Con una hiptesis simple,
la distribucin de las observaciones queda completamente especicada. Con una hiptesis
compuesta, slo se especica que la distribucin de las observaciones pertenece a cierta
clase. Por ejemplo, supngase que en un problema dado la hiptesis nula H
0
tiene la siguiente
forma:
H
0
: =
0
.
Puesto que esta hiptesis es simple, el tamao de cualquier procedimiento de contraste
ser presisamente = (
0
).
10.2.8. Procedimiento de 4 pasos para contraste de hiptesis
Hay un procedimiento de cuatro pasos que sistematizan la prueba de hiptesis. Estas son:
1. Establecer las hiptesis nula y alterna
El primer paso para un contraste de hiptesis es establecer las hiptesis nula y alterna-
tiva; esto es
H
0
: =
0
contra una de las tres alternativas siguientes
_
_
_
H
1
: <
0
(1)
H
1
: >
0
(2)
H
1
: =
0
(3)
Si estamos ante el caso (1) o (2) decimos que el contraste es unilateral o de una cola;
por el contrario si estamos ante el caso (3) el contraste es bilateral o de dos colas.
10.3. PRUEBAS DE HIPTESIS PARA GRANDES MUESTRAS (N 30) 213
2. Determinar el criterio de contraste
La determinacin del criterio de contraste consiste en especicar el nivel de signican-
cia, el tipo de distribucin, y los valores crticos.
Nivel de signicancia: como ya se mencion es la probabilidad de rechazar una
hiptesis nula verdadera y es simbolizado por . No hay un nivel de signicancia
para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0
y 1; y esto depende exclusivamente del investigador antes de colectar la muestra.
El tipo de distribucin se determinar dependiendo de la naturaleza de la hiptesis
y del tamao de la muestra.
Los valores crticos son los valores de la variable que en la distribucin limitan el
rea crtica, que es la parte de la curva que corresponde al nivel de signicancia.
3. Calcular el estadstico de prueba
El estadstico de prueba es un valor obtenido de la informacin de la muestra para
compararlo con el criterio de contraste y rechazar o aceptar la hiptesis. El estadstico
de prueba cambia de acuerdo a la distribucin que se utilice.
4. Tomar decisin y conclusin
Una regla de decisin es establecer las condiciones sobre las cuales la hiptesis nula
deber ser rechazada o no rechazada. Si el estadstico de prueba queda dentro de la
zona crtica la hiptesis nula deber ser rechazada. Si por el contrario, el estadstico de
prueba queda fuera de la zona crtica la hiptesis nula no deber ser rechazada.
La conclusin deber reejar la exixtencia o no de evidencia suciente para aceptar o
no la hiptesis nula bajo el mivel de signicancia establecido.
10.3. Pruebas de hiptesis para grandes muestras (n 30)
10.3.1. Prueba de hiptesis para Medias
Sea X
1
, X
2
, . . . , X
n
una muestra aleatoria de una poblacin con media desconocida y
varianza
2
que puede ser conocida o no. En caso de que la varianza
2
no sea conocida se
utiliza la varianza muestral S
2
como su estimador. Sabemos que X tiene distribucin N(,

2
n
)
y
Z =
(X )

N(0, 1)
Sea
0
un nmero real particular. Adems se desea contrastar las hiptesis H
0
: =
0
contra H
1
, que dependiendo de la naturaleza de la prueba podra ser cualquiera de las sigu-
ientes alternativas
_
_
_
H
1
: <
0
(1)
H
1
: >
0
(2)
H
1
: =
0
(3)
10.3. PRUEBAS DE HIPTESIS PARA GRANDES MUESTRAS (N 30) 214
El problema es encontrar una regla para decidir cundo rechazar H
0
en favor de H
1
con
base en los datos de la muestra X
1
, X
2
, . . . , X
n
. Cuando H
0
es cierta, esto es, cuando es
efectivamente
0
, se tendr que X N(
0
,

2
n
) y por lo tanto
Z =
(X
0
)

N(0, 1)
La variable aleatoria Z es una medida natural de la distancia entre X (un estimador de
) y su valor esperado
0
cuando H
0
es cierta. Es entonces razonable rechazar H
0
cuando la
variable |Z| sea grande. Es por ello que se puede tomar como criterio de decisin rechazar
H
0
cuando |Z| k, para cierta constante k. Cmo encontramos el nmero k?, es la pregunta
a contestar. Si estamos ante una prueba unilateral (caso (1) el caso(2)); en una tabla de la
distribucin normal podemos encontrar un valor z

talque P(Z z

) = P(Z z

) =,
de la misma forma si estamos ante una prueba bilateral (caso (3)) podemos encontrar z
/2
tal
que P(|Z| z
/2
) =, en todos los casos que se pueden presentar el valor de lo determina
la persona que lleva a cabo la prueba de hiptesis. Este valor z

z
/2
es precisamente la
constante k buscada pues con ello se logra que la regin de rechazo sea de tamao .
La variable aleatoria Z constituye la estadstica de la prueba. Llevar a cabo esta prueba
de hiptesis consiste en usar los datos de la muestra para encontrar el valor de Z, si |Z| z

caso unilateral |Z| z


/2
caso bilateral, entonces se rechaza H
0
, en caso contrario no se
rechaza H
0
. En la siguiente tabla se muestra resumida la informacin de este anlisis.
Ejemplo 10.3.1 La experiencia de varios aos ha demostrado que los focos marca A tienen
una vida media de 1180 hs, con una desviacin estndar de 90hs. Para probar la pretencin
de los vendedores de la marca B, se probaron 100 de esos focos comprados en almacenes
ordinarios. La muestra arroj X = 1220 hs. y S = 80 hs. Probar la hiptesis de que la media
marca B es igual a la media marca A, contra la alternativa de que tenga un valor mayor. Usar
un nivel de signicancia del 5%.
Desarrollo
Paso 1: Formulacin de las hipteisis nula y alternativa
H
0
: = 1180 hs
H
1
: > 1180 hs
Paso 2: Determinacin del criterio de contraste
Segn las especicaciones del problema, el nivel de signicancia establecido es del
5%, esto es = 0, 05 y como se trata de una prueba de hiptesis para medias con var-
ianza poblacional conocida, el tipo de distribucin a utilizar es la distribucin normal
estndar. Como la prueba es unilateral se busca en la tabla Z, el valor crtico correspon-
diente.
Z 0,04 0,045 0,05
1,6 0,4495 0,45 0,4505
por lo que el valor crtico buscado es Z = 1, 645.
10.3. PRUEBAS DE HIPTESIS PARA GRANDES MUESTRAS (N 30) 215
Paso 3: Calculo del estadstico de prueba
El estadstico de prueba en este caso tendra un valor de
Z
c
=
(12201180)

100
90
= 4, 44
Paso 4:Toma de desicin y conclusin
El siguiente paso consiste en establecer un criterio de decisin, que en este caso ser
1. Si Z
c
< Z no se puede rechazar H
0
2. Si Z
c
Z se rechaza H
0
Como Z
c
= 4, 44 > 1, 645, se observa que el estadstico de prueba queda localizado
dentro de la zona crtica, entonces podemos rechazar la hiptesis nula (H
0
), de tal
suerte que se concluye lo siguiente:
Con un nivel de signicancia de 0,05 se puede armar que son distintos los promedios
de la marca A y la marca B, presumiblemente mayor el de la marca B.
Captulo 11
Anlisis de la Varianza (ANOVA)
Adems de probar hiptesis relativas a dos varianzas, un segundo uso de la distribu-
cin F involucra la tcnica de Anlisis de la Varianza, abreviado ANOVA (Analysis of vari-
ance). Bsicamente, el anlisis de la varianza utiliza informaciones provenientes de mues-
tras para determinar si tres o ms tratamientos producen diferentes resultados. El uso de la
palabra tratamiento tiene su origen en la investigacin agrcola. Las tierras se trataron con
diferentes fertilizantes, para determinar si habra una diferencia signicativa en las produc-
ciones. Nosotros podramos probar la hiptesis de que cinco diferentes aditivos de gasolina
(tratamientos) resultan en un diferente kilometraje por litro. Tambin podramos contestar
la pregunta, son cuatro mtodos de capacitacin y entrenamiento (tratamientos) igualmente
efectivos?.
11.1. Suposiciones de ANOVA
En la tcnica del anlisis de varinza consiste en la comparacinde tres o ms medias
muestrales para determinar si provienen de poblaciones con medias iguales. Para utilizar esta
tcnica, se supone lo siguiente:
1. Las poblaciones tienen una distribucin normal
2. Las poblaciones tienen desviaciones estndar () iguales.
3. Las muestras se seleccionan de manera independiente
Cuando se cumplen estas condiciones, se utiliza la distribucin F como estadstico de
prueba. En particular, se emplea el trmino tratamiento para identicar las diferentes pobla-
ciones que se examinan.
Denicin 11.1.1 : Tratamiento
Fuente especca de variacin en un conjunto de datos.
11.2. Procedimiento del anlisis de la varianza
El procedimiento ANOVA puede ser ilustrado usando un ejemplo. Se quiere probar la
hiptesis, en el nivel de signicancia de 0,05; de que la cantidad de tabletas de alimento
216
11.2. PROCEDIMIENTO DEL ANLISIS DE LA VARIANZA 217
que un grupo de ratas consume est en relacin con el tiempo transcurrido desde su ltima
comida. Para comprobar esta hiptesis, se selecciona al azar tres grupos de ratas con seis
ratas en cada grupo. Despus de someter a cada grupo a un entrenamiento preliminar, prueba
al grupo A, tres horas despus de comer; el grupo B, doce horas despus de comer y al grupo
C, veinticuatro horas despus de comer. La cantidad de tabletas consumidas por cada animal
en un periodo de diez minutos fueron las siguientes:
Grupo A Grupo B Grupo C
0 5 5
7 2 11
2 3 9
1 9 9
1 6 4
7 5 10

x = 18

x = 30

x = 48

x
2
= 104

x
2
= 180

x
2
= 424
Captulo 12
Anlisis de regresin y de correlacin
12.1. Introduccin
En muchas investigaciones estadsticas, el principal objetivo es establecer relaciones que
permitan pronosticar una o ms variables en trminos de otras. Por ejemplo, se han efectuado
estudios para pronosticar las ventas futuras de un producto en trminos de su precio, de la
reduccin de peso de una persona en trminos del nmero de semanas que ha seguido una
dieta de 800 caloras por da, de los gastos familiares en atencin mdica en trminos del
ingreso familiar, del consumo per cpita de ciertos artculos alimenticios en trminos de su
valor nutricional y el dinero que se gasta en su publicidad televisiva y as consecutivamente.
Es evidente que sera ideal si pudiramos pronosticar una cantidad exactamente en trmi-
nos de otra, pero esto rara vez es posible. En la mayoria de los casos debemos conformarnos
con pronosticar promedios o valores esperados. Por ejemplo, no podemos pronosticar con
exactitud la cantidad de dinero que un graduado universitario especco ganar diez aos
despus de graduarse, pero considerando datos apropiados podemos pronosticar las ganan-
cias promedio de todos los graduados univeristarios diez aos despus de su graduacin. Este
problema de pronstico del valor promedio de una variable en trminos del valor conocido de
otra variable (o de los valores conocidos de otras variables) se designa como el problema de
la regresin. Este trmino se remonta a Francis Galton (1822-1911), quien lo us por primera
vez en un estudio de la relacin entre las alturas de padres e hijos.
12.2. Modelo Estadstico
Toda investigacin estadstica tiene por objeto encontrar una ecuacin matemtico que
ayude a explicar el comportamiento de un fenmeno fsico de inters en un estudio deter-
minado. Dicha ecuacin matemtica recibe el nombre de medelo estadstico o simplemente
modelo.
Denicin 12.2.1 Modelo: Por un modelo entendemos una ecuacin matemtica que con-
tiene variables aleatorias, variables matemticas (no aleatorias) y parmetros poblacionales.
Ejemplo 12.2.1 La siguiente ecuacin constituye un ejemplo de modelo estadstico
Y
i
=
1
X
1i
+
2
2
X
2i
+
3
X
3i
+
i
para i = 1, 2, . . . , n
218
12.2. MODELO ESTADSTICO 219
donde

1
,
2
2
y
3
son parmetros poblacionales desconocidos
X
1i
, X
2i
y X
3i
son variables matemticas

i
son variables aleatorias
Dependiendo de la forma de la ecuacin matemtica podemos tener diferentes tipos de
modelos estadsticos. Uno de los ms utilizados es el modelo lineal.
Denicin 12.2.2 Modelo Lineal: Es una ecuacin que contiene variables aleatorias, va-
riables matemticas (no aleatorias) y parmetros poblacionales y que el modelo es lineal en
los parmetros y en las variables aleatorias.
Ejemplo 12.2.2 La siguiente ecuacin constituye un ejemplo de modelo lineal
Y
i
=
1
X
1i
+
2
X
2i
+
3
X
3i
+
i
para i = 1, 2, . . . , n
donde

1
,
2
y
3
son parmetros poblacionales desconocidos
X
1
, X
2
y X
3
son variables matemticas

i
son variables aleatorias
Denicin 12.2.3 Modelo determinstico matemtico: Es un modelo matemtico en el
cual puede haber equivocacin pero no variabilidad
Ejemplo 12.2.3 La siguiente ecuacin matemtica constituye un modelo deterministico
Y = +X
Denicin 12.2.4 Modelo Probabilstico: Es un modelo determinstico ms una compo-
nente aleatoria debido a la variabilidad de las variables que no fueron incluidos en el modelo
y ser menor cada vez que se considere ms variables de inters en el estudio y mientras ms
se mantenga los requisitos de similitud de las variables.
Ejemplo 12.2.4 La siguiente ecuacin matemtica constituye un modelo probabilstico
Y = +X +
Denicin 12.2.5 Modelo de Regresin: Son aquellas en que las variables aleatorias inde-
pendientes o predictoras son variables continuas; tales como la edad, peso, ingreso, demanda,
produccin, etc; que toman innitos valores y sirven para cuanticar en lugar de indicar la
presencia de un efecto cualitativo.
Ejemplo 12.2.5 La siguiente ecuacin matemtica constituye un modelo de regresin
Y
i
=
0
+
1
X
1i
+
2
X
2i
+
3
X
3i
+
i
para i = 1, 2, . . . , n
12.3. MODELO DE REGRESIN SIMPLE 220
12.3. Modelo de regresin simple
El anlisis de regresin es una rama de la teoria estadstica cuyom uso est muy difundido
en casi todas las disciplinas cienticas. Es una tcnica bsica para medir o estimar relaciones
entre las variables de inters consideradas en un estudio de investigacin.
El anlisis de regresin simple estudia la relacin entre dos grupos de datos desarrollando
una ecuacin matemtica que describa dicha relacin. La ecuacin nos permitir predecir el
valor de la variable dependiente Y basndonos en el valor de la variable independiente X. La
tcnica usada para desarrollar la ecuacin para la lnea de tendencia y hacer esta prediccin
es llamada anlisis de regresin simple.
Antes de estudiar el modelo de regresin simple veamos dos aspectos que sern de suma
importancia para el anlisis de dicho modelo. Estos dos aspectos consiten en el problema de
bondad de ajuste y el mtodo de mnimos cuadrados.
12.3.1. Ajuste de curva
Siempre que es posible intentamos expresar o aproximar las relaciones entre cantidades
conocidas y cantidades que se deben pronosticar en trminos de ecuaciones matemticas.
esto ha tenido mucho xito en las ciencias naturales, donde se sabe, por ejemplo, que a una
temperatura constante la relacin entre el volumen y, y la presin x, de un gas se obtiene por
medio de la frmula:
y =
k
x
donde k es una constante numrica.
Siempre que usemos datos observados para llegar a una ecuacin matemtica que de-
scribe la relacin entre dos variables, un procedimiento conocido como el ajuste de curva,
debe enfrentar tres clases de problemas:
1. Debemos decidir qu clase de curva y por tanto qu clase de ecuacin de pronstico
queremos usar.
2. Debemos encontrar la ecuacin particular que es mejor en cierto sentido.
3. Debemos investigar ciertos aspectos referentes a los mtodos de la ecuacin particular
y de los pronsticos hechos a partir de sta.
En la seccin 12.3.2 estudiaremos detalladamente el segundo de estos problemas y en la
seccin 12.3.3 estudiaremos el tercero.
El primer problema por lo regular se decide mediante la revisin directa de los datos.
Ilustramos los datos en papel para grcas ordinarias (aritmticas), a veces en papel para
grcas especiales con escalas especiales y decidir mediante la revisin visual la clase de
curva (una linea recta, una parbola, etc.) que describe mejor el patrn general de los datos.
Existen mtodos por medio de los cuales se puede hacer esto de modo ms objetivo, pero son
bastante avanzados y no los analizaremos en este material.
En esta parte nos centraremos, en esencia, en ecuaciones lineales de dos incgnitas que
describan una posible relacin entre dos variables. Estas son de la forma
Y = a+bX
12.3. MODELO DE REGRESIN SIMPLE 221
donde a se denomina coeciente de interseccin intersecto (es la interseccin de Y con
el eje de las abscisas o eje horizontal) y b se denomina coeciente de pendiente de la lnea
recta (el cambio en Y que acompaa un incremento de una unidad en X).
El coeciente de interseccin o intersecto a nos dice cul es el valor de Y cuando X es
igual a cero.
El coeciente de pendiente b equivale a la variacin de Y debido a la correspondiente
variacin de X, en trminos matemticos esto corresponde a b =
Y
X
.
12.3.2. El mtodo de los mnimos cuadrados
Una vez que hemos decidido ajustar una lnea recta a un conjunto de datos determinado
{x
1
, x
2
, . . . , x
n
, y
1
, y
2
, . . . , y
n
}, enfrentemos la segunda clase de problema, especcamente, el
problema de encontrar la ecuacin de la lnea recta particular que en cierto sentido propor-
cione el mejor ajuste posible y posteriormente ofrezca los mejores pronsticos posibles de la
variable dependiente Y a partir de la variable independiente X. Lgicamente, no existe lmites
para el nmero de lneas rectas que se pueden trazar en un papel para grcas. Algunas de
estas lneas se ajustaran a los datos en forma tan deciente que no las consideraramos con
seriedad, pero muchas otras pareceran proporcionar ms o menos buenos ajustes y el prob-
lema consiste en localizar la lnea que se ajuste mejor a los datos en sentido bien denido.
Si todos los puntos caen en una lnea recta no hay ningn problema, pero este es un caso
extremo que rara vez encontramos en la prctica. En general, debemos conformarnos con
una lnea recta que tiene ciertas propiedades deseables, faltas de perfeccin.
El criterio que en la actualidad se usa casi exclusivamente para denir un mejor ajuste
se remonta al inicio del siglo XIX y al trabajo del matemtico francs Andrien Legendre;
ste mtodo se conoce con el nombre de mtodo de los mnimos cuadrados. Este mtodo
implica que la linea que ajustamos para nuestros datos sea tal que la suma de los cuadrados
de las distancias verticales de los puntos a la lnea recta sea mnima.
Para demostrar como se ajusta en realidad una lnea de mnimos cuadrados a un conjunto
de datos {x
1
, x
2
, . . . , x
n
, y
1
, y
2
, . . . , y
n
}, que podra verse con un conjunto de n pares ordenados
{(x
1
, x
1
), (x
2
, x
2
), . . . , (x
n
, x
n
)}. Si expresamos la ecuacin de la lnea como y =a+bx, donde
el smbolo, y (y acento circunejo), se usa para distinguir entre un valor observado de y
y el valor correspondiente y en la lnea, el criterio de los mnimos cuadrados implica que
reduzcamos al mnimo la suma de los cuadrados de las distancias entre las y

s y las y

s. Esto
implica que sedeben encontrar los valores numricos de las constantes a y b que aparecen en
la ecuacin y = a+bx para la cual
n

i=1
(y
i
y
i
)
2
=
n

i=1
(y
i
abx
i
)
2
sea tan baja como sea posible.
Para encontrar los resultados deseados de a y b, debemos minizar
n

i=1
(y
i
y
i
)
2
con respec-
to de a y b; para ello aplicaremos los conocimientos de los criterios sobre puntos mximos
y mnimos desarrollados en el clculo diferencial y procedimientos algebraicos. Por lo tanto
12.3. MODELO DE REGRESIN SIMPLE 222
para minimizar
n

i=1
(y
i
y
i
)
2
respecto de a y b; lo derivamos parcialmente con respecto de
ellos e igualemos dichas derivadas parciales a cero y obtendremos un sistema de dos ecua-
ciones con dos incgnitas denominados ecuaciones normales. Esto es

a
_ n

i=1
(y
i
y
i
)
2
_
=2
n

i=1
(y
i
abx
i
) =2
_ n

i=1
y
i
nab
n

i=1
x
i
_
= 0

b
_ n

i=1
(y
i
y
i
)
2
_
=2
n

i=1
(y
i
abx
i
)x
i
=2
_ n

i=1
x
i
y
i
a
n

i=1
x
i
b
n

i=1
x
2
i
_
= 0
con lo cual
n

i=1
y
i
= na+b
n

i=1
x
i
(12.3.1)
n

i=1
x
i
y
i
= a
n

i=1
x
i
+b
n

i=1
x
2
i
(12.3.2)
Ejemplo 12.3.1 Considerando los datos muestrales siguientes obtenidos en un estudio de la
realacin entre el nmero de aos que los solicitantes de ciertos trabajos en el servicio exterior
estudiaron alemn en preparatoria o universidad y las calicaciones que obtuvieron en una
prueba de dominio de lectura de ese idioma.
Nmero de aos (x) Calicacin en la prueba (y)
3 57
4 78
4 72
2 58
5 89
3 63
4 73
5 84
3 75
2 48
Ajusta una lnea recta de mnimos cuadrados que relacione los nmeros de aos que los
solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria o universi-
dad con las calicaciones que obtuvieron en la prueba de dominio de ese idioma.
Desarrollo
Ilustrando los puntos correspondientes a estos diez pares de valores en un diagrama, ob-
servaremos que aunque no todos los puntos caen en una misma lnea recta, el patrn general
de la relacin se describira razonablemente bien por medio de una lnea recta adecuada acier-
tos criterios bien denidos.
El grco 12.1 muestra el partrn de comportacin de la relacin entre los nmeros de
aos que los solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria
o universidad con las calicaciones que obtuvieron en la prueba de dominio de ese idioma,
adems muestra la linea que mejor se ajusta a los diez pares de datos.
12.3. MODELO DE REGRESIN SIMPLE 223
Figura 12.1: Grco de la relacin entre el nmero de aos que se estudi alemn y la cali-
cacin obtenida en la prueba.
Las sumas requeridas para la sustitucin en las ecuaciones normales se obtienen realizan-
do los clculos que aparecen en la tabla siguiente:
x y x
2
xy
3 57 9 171
4 78 16 312
4 72 16 288
2 58 4 116
5 89 25 445
3 63 9 189
4 73 16 292
5 84 25 420
3 75 9 225
2 48 4 96

x
i
= 35

y
i
= 697

x
2
i
= 133

x
i
y
i
= 2554
Sustituyendo

x
i
= 35;

y
i
= 697;

x
2
i
= 133;

x
i
y
i
= 2554 y n = 10 en las ecua-
ciones normales, obtenemos
697 = 10a+35b
2544 = 35a+133b
Resolviendo este sistema de ecuaciones, obtenemos a = 31, 55 y b = 10, 90. Entonces la
ecuacin de mnimos cuadrados est dada por
y = 31, 55+10, 90x
12.4. ANLISIS DE CORRELACIN 224
12.3.3. Anlisis de regresin simple
Como ya se ha dicho el propsito fundamental del anlisis de regresin simple es estimar
la relacin que existe entre dos variables Y dependiente y X independiente, consideradas en
un estudio.
Una vez estimadas las relaciones entre las variables X e Y, interesa averiguar cun tan
estrechas son, as como tambin estimar la exactitud de las predicciones basadas en ellas.
Las respuestas a estos problemas pueden obtenerse utilizando las ideas bsicas en el anlisis
sobre pruebas de hiptesis e intervalos de conanza de los parmetros del modelo.
Supuestos bsicos del anlisis de regresin
Es posible que se descubra que una funcin lineal Y = f (X) no describe los datos con
que se esta trabajando. La funcin lineal Y = f (X) no deja margen para variaciones y por lo
tanto, no puede suministrar una descripcin adecuada de la relacin entre la variable X e Y.
Por lo cual necesitamos de un modelo que incluye ciertas variaciones.
Si suponemos que los datos observados fueron generados por una ecuacin lineal estocs-
tica tal como
Y = +X +
donde es un trmino de error o perturbacin aleatoria, la ecuacin permite que Y sea
mayor o menor que +X, lo cul depende de que sea positivo o negativo. Lo ideal sera
que fuera pequeo y que no este correlacionado (relacionado) con la variable X, a n de
poder cambiar X sin que se modique y determinar asi lo que ocurre en promedio con Y.
En general, los datos observados para el anlisis de regresin simple pueden considerarse
como un conjunto de pares ordenados de nmeros {(X
1
,Y
1
), (X
2
,Y
2
), . . . , (X
n
,Y
n
)}, donde
Y
1
,Y
2
, . . . ,Y
n
son variables aleatorias dependientes
X
1
, X
2
, . . . , X
n
son variables matemticas independientes
El par (X
i
,Y
i
) corresponde a la i-sima observacin de las variables X e Y. Adems para
cada par (X
i
,Y
i
) existe un trmino de error
i
, esto es Y
i
= +X
i
+
i
.
Si se conociera los valores de los parmetros poblacionales y podramos trazar en un
diagrama la funcin de regresin +X. Los trminos de error son iguales a la distancias
verticales u horizontales entre los puntos observados (X
i
,Y
i
) y los puntos correspondientes
en la linea de regresin (X
i
, +X
i
).
12.4. Anlisis de correlacin
Denicin 12.4.1 Correlacin: es un grupo de tcnicas estadsticas usadas para medir la
fuerza de la relacin entre dos variables.
El estudio de la correlacin involucra cuestiones como: hay una relacin entre los prome-
dios de la preparatoria y los promedios de primero en la universidad?. Hay una relacin entre
los gastos en publicidad de un negocio y sus ventas?. Hay una relacin entre el nmero de
aos en el trabajo y la productividad?, etc.
12.4. ANLISIS DE CORRELACIN 225
12.4.1. Anlisis de correlacin simple
La idea bsica del anlisis de correlacin simple es dar la magnitud de la relacin entre
dos variables. Por lo tanto la correlacin simple mide la fuerza y la direccin de una relacin
lineal entre solo dos variables aleatorias.
El primer paso de la correlacin simple es normalmente gracar los datos es un diagrama
que recibe el nombre de diagrama de dispersin.
Denicin 12.4.2 Diagrama de dispersin: es un diagrama que reeja la relacin entre
dos variables aleatorias.
En el diagrama de dispersin debemos establecer cual es la variable dependiente y la
variable independiente.