Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TEMA 8
Estadística descriptiva bidimensional. Relaciones entre dos
variables estadísticas. Parámetros estadísticos bidimensionales:
medias y desviaciones típicas marginales, covarianza. Coeficiente
de correlación lineal. Regresión lineal.
INTRODUCCIÓN. 1
Algunas definiciones:
𝑓𝑖
ℎ𝑖 =
𝑁
𝐹𝑖
𝐻𝑖 =
𝑁
recogida de datos
ordenación de los datos
recuento de frecuencias
agrupación de los datos, en caso de que sea una variable aleatoria continua
o bien discreta pero con un número de datos muy grande se agrupan en
clases. Nº de clases =√𝑁 . Los puntos medios de cada clase se llaman
marcas de clase. Además se debe adoptar el criterio de que los intervalos
sean cerrados por la izquierda y abiertos por la derecha.
construcción de la tabla estadística que incluirá, clases, marca de clase, fi,
Fi, hi , Hi .
534128987667987710159980888957
𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊
0 2 2 2/30 2/30
1 3 5 3/30 5/30
2 1 6 1/30 6/30
3 1 7 1/30 7/30
4 1 8 1/30 8/30
5 3 11 3/30 11/30
6 2 13 2/30 13/30
3
7 5 18 5/30 18/30
8 7 25 7/30 25/30
9 5 30 5/30 30/30
30 1
gráfico será la misma , aunque ahora el área del rectángulo ya no sea exactamente
la frecuencia absoluta (a no ser que la amplitud del intervalo sea igual a 1).
8
7
frecuencias absolutas fi
6 4
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9
notas
Diagrama de sectores
Cartogramas
Pirámides de población
Diagramas lineales
Pictogramas
Medidas de centralización:
Media aritmética :
∑𝑖𝑖=1 𝑥𝑖 ∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖
𝑥̅ = =
𝑁 𝑁
𝒙𝒊 𝒇𝒊 𝒇𝒊 · 𝒙𝒊
0 2 0
1 3 3
2 1 2
3 1 3
4 1 4
5 3 15
6 2 12
7 5 35
8 7 56
9 5 45
30 175
𝑑1
𝑀𝑜 = 𝐿𝑖𝑛𝑓 + ∆
𝑑1 + 𝑑2
La moda si sirve para datos cualitativos, pero no tiene por qué situarse en la zona
central del gráfico.
Cuando los datos están agrupados la mediana viene dada por el primer valor de
la variable cuya Fi excede a la mitad del número de datos . Si la mitad del número
de datos coincide con Fi se tomará la semisuma ente este valor y el siguiente.
Cuando los datos estén agrupados en clases se puede utilizar reglas de tres o bien
la fórmula :
𝑁
− 𝐹𝑖−1
𝑀 = 𝐿𝑖𝑛𝑓 +∆· 2
𝑓𝑖
Ejemplo : En el caso de las notas podrías ordenar de menor a mayor los datos y
obtendríamos : 0 0 1 1 1 2 3 4 5 5 5 6 6 7 7 7 7 7 8 8 8 8 8 8 8 9 9 9 9 9
7+7
𝑀𝑒 = =7
2
Medidas de dispersión:
𝑅𝑎𝑛𝑔𝑜 = 9 − 0 = 9
Al igual que la media en el caso de que los datos estén agrupados en clases, se
tomará la marca de clase como xi.
𝒙𝒊 𝒇𝒊 𝒇𝒊 · 𝒙𝒊 𝒙𝟐𝒊 𝒇𝒊 · 𝒙𝟐𝒊
0 2 0 0 0
1 3 3 1 3
2 1 2 4 4
3 1 3 9 9
4 1 4 16 16
5 3 15 25 75
6 2 12 36 72
7 5 35 49 245
8 7 56 64 448
9 5 45 81 405
30 175 1277
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖2
2
1277
𝑠 = − 𝑥̅ 2 = − 5,832 = 8,58
𝑁 30
𝜎 = √8,58 = 2,93
𝜎 2,93
𝐶𝑉 = = = 0,50
𝑥̅ 5,83
𝑥−𝑥
𝑧=
𝜎
Los dos caracteres observados no tienen por qué ser de la misma clase, así
nos podemos encontrar con las siguientes situaciones:
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están
repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta
es que el número de modalidades distintas que adopta el carácter X no tiene por
qué ser el mismo que el que adopta el carácter Y:
Los datos se suelen ordenar por tablas. Parece que lo más lógico es ordenar
éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s
valores de la variable X y los t valores de la variable Y. Donde nij es el número
de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta
del par (xi, yi). 9
𝒀 𝒚𝟏 𝒚𝟐 … 𝒚𝒋 … 𝒚𝒕
𝑿
𝒙𝟏 𝑛11 𝑛12 … 𝑛1𝑗 … 𝑛1𝑡
… … … … … … …
… … … … … … …
Una tabla de doble entrada también se puede expresar como una tabla
simple, de forma que siempre es posible pasar de una a otra según convenga. Las
tablas simples reflejan el comportamiento de la variable estadística bidimensional
(X, Y) a partir de los valores individuales que toman cada una de las variables
estadísticas unidimensionales X e Y.
𝒙𝒊 𝒚𝒊 𝒏𝒊
𝒙𝟏 𝑦1 𝑛1
𝒙𝟐 𝑦2 𝑛2
𝒙𝟑 𝑦3 𝑛3
… … …
𝒙𝒌 𝑦𝑘 𝑛𝑘
𝑘
∑ 𝑛𝑖 = 𝑁
𝑖=1
Observaciones:
∑ ∑ 𝑛𝑖𝑗 = 𝑁
𝑖=1 𝑗=1
Representaciones gráficas.
Y
Diagrama de Dispersión
yj
xi X
11
Distribuciones marginales.
Frecuencias
absolutas ∑ 𝑓𝑥𝑖 = 𝑁 ∑ 𝑓𝑦𝑗 = 𝑁
marginales 𝑖 𝑗
Desviaciones Típicas
marginales 𝜎𝑥 = √𝑠𝑥2 𝜎𝑦 = √𝑠𝑦2
Covarianza.
∑ 𝑓𝑖 · (𝑥𝑖 − 𝑥) · (𝑦𝑖 − 𝑦) ∑𝑖 𝑓𝑖 · 𝑥𝑖 · 𝑦𝑖
𝑠𝑥𝑦 = =⋯= − 𝑥̅ · 𝑦̅
𝑁 𝑁
Una covarianza positiva indica que las diferencias (𝑥𝑖 − 𝑥) e (𝑦𝑖 − 𝑦), tienen
el mismo signo, es decir, la correlación es positiva. Cuando los valores altos de una
de las variables suelen mayoritariamente corresponderse con los valores altos de la
otra, y lo mismo se verifica para los pequeños valores de una con los de la otra, se 12
corrobora que tienden a mostrar comportamiento similar lo que se refleja en un
valor positivo de la covarianza.
Por el contrario, una covarianza negativa indica que las diferencias (𝑥𝑖 −
𝑥) e (𝑦𝑖 − 𝑦), tienen signos opuestos, es decir, la correlación es negativa. Cuando
una de las variables se encuentra por encima de su media, la otra está por debajo,
esto es, cuando aumenta una de las variables, disminuye la otra. O, lo que es lo
mismo, cuando a los mayores valores de una variable suelen corresponder en
general los menores de la otra, expresando un comportamiento opuesto, la
covarianza es negativa.
La covariancia también se puede simbolizar por XY , (X,Y) o por cov(X,Y). También como xy ,
1
Podemos establecer, por otro lado, la relación que existe entre la covarianza
y las desviaciones típicas de las variables. A partir de la desigualdad de Cauchy-
Schwarz3
|𝑐𝑜𝑣(𝑋, 𝑌)| ≤ 𝜎𝑥 𝜎𝑦
O, lo que es lo mismo:
−𝜎𝑥 𝜎𝑦 ≤ 𝑐𝑜𝑣(𝑋, 𝑌) ≤ 𝜎𝑥 𝜎𝑦
Matriz de covarianza.
2
En estadística la esperanza matemática (también llamada esperanza, valor esperado, media
poblacional o media) de una variable aleatoria X es el número E [ X ] que formaliza la idea de valor
medio de un fenómeno aleatorio. Cuando la variable aleatoria es discreta, la esperanza es igual a la
suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso.
Por lo tanto, representa la cantidad media que se "espera" como resultado de un experimento
aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite
un elevado número de veces. 𝐸[𝑋] = ∑𝑛𝑖 𝑥𝑖 · 𝑝(𝑥𝑖 ).
3
La desigualdad de Cauchy-Schwarz dice que si la desviación típica de X, o de Y, es
pequeña, entonces la covarianza de X e Y también es pequeña.
Propiedades
s2 sxy s x2
s x2 s y2 s xy
s xy
V x L
2
s yx s y2 s yx sy 2
𝑠𝑥𝑦
𝑟=
𝜎𝑥 𝜎𝑦
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total
entre las dos variables denominada relación directa: cuando una de ellas aumenta, la
otra también lo hace en proporción constante.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las dos
variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia
total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la
otra disminuye en proporción constante.
4
https://es.wikipedia.org/wiki/Coeficiente_de_correlación_de_Pearson
Puede ser que una fuerte correlación exprese una verdadera causalidad,
como entre el número de cigarrillos que se fuma al día y la aparición de un cáncer
de pulmón. Pero no es la estadística la que demuestra la causalidad, ella permite
solamente detectarla. La influencia del consumo del tabaco en la aparición de un
cáncer de pulmón ha sido científicamente demostrada en la medida en que se
pudieron analizar los mecanismos fisiológicos y bioquímicos que hacen que el
alquitrán y la nicotina induzcan errores en la reproducción del código genético de
las células.
Matriz de correlación.
5
Las variables de confusión, también llamadas terceras variables, son variables que el investigador
no controló o no eliminó y que dañan la validez interna de un experimento.
1 𝑟12 … 𝑟1𝑛
𝑟21 1 … 𝑟2𝑛
𝑅=( )
… … … …
𝑟𝑛1 𝑟𝑛2 … 1
Una vez que conocemos la mayor o menor relación entre las variables con el
coeficiente de correlación lineal y que hemos calculado las rectas de regresión,
podemos utilizarlas para predecir el valor de una de las variables a partir de la
otra. Después de haberlo calculado los valores que nos interesan, podemos
preguntarnos si este dato obtenido es fiable o no. Esto dependerá de dos cuestiones.
La primera que exista correlación lineal entre ambas variables. El dato será
más fiable cuanto más se aproxime el coeficiente de correlación lineal a 1 o a -1. La
segunda que las rectas de regresión se han obtenido para unos valores concretos de
X y de Y. Aunque exista una correlación lineal fuerte, si intentamos hacer
predicciones para valores de las variables lejanos a los estudiados, podemos
llevarnos sorpresas. Es decir, para que sea fiable una estimación, además de la
primera condición, los valores de X e Y tienen que estar dentro del dominio de los
estudiados.
𝑠𝑥𝑦
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ )
𝑠𝑥2
𝑠𝑥𝑦
𝑥 − 𝑥̅ = (𝑦 − 𝑦̅)
𝑠𝑦2
17
en la cual se hace mínima la distancia entre los valores xi obtenidos
experimentalmente y los valores teóricos de x.
𝑠𝑥𝑦
A valor se le llama coeficiente de regresión de x sobre y.
𝑠𝑦2
Fis, yi
I 2,5 , 5) 4 2 1 0 0 7
SF 5 , 6) 2 4 2 1 0 9
B 6 , 7) 1 2 3 0 0 6
N 7 , 8,5) 0 1 2 1 2 6
SB8,5, 10) 0 0 0 1 1 2
7 9 8 3 3
2,5 + 5 18
𝑥𝑖 = = 3,75
2
∑ 𝑥𝑖 𝑓𝑖 179,75 ∑ 𝑦𝑖 𝑓𝑖 178,75
𝑥= = = 5,99 𝑦= = = 5,96
𝑁 30 𝑁 30
∑ 𝑥 2 𝑓𝑖 2 1155,6875
𝜎𝑥 = √ 𝑖 − 𝑥 = √ − 5,992 = 1,63
𝑁 30
∑ 𝑦 2 𝑓𝑖 2 1145,563
𝜎𝑦 = √ 𝑖 − 𝑦 = √ − 5,962 = 1,63
𝑁 30
Y la covarianza:
∑𝑖 𝑓𝑖 · 𝑥𝑖 · 𝑦𝑖 1124,938
𝑠𝑥𝑦 = − 𝑥̅ · 𝑦̅ = − 5,99 · 5,96 = 1,80
𝑁 30
𝑠𝑥𝑦 1,80
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ ) → 𝑦 − 5,96 = (𝑥 − 5,99)
𝑠𝑥2 1,632
𝑦 = 0,68𝑥 + 1,90
PROBLEMAS.
1. Del conjunto de datos 2,2,5,7,9,9,9,10,10,11,12,18, ¿cuál es su moda?
a) 9 b) 10 c) 11 d) 7
La moda de una serie de valores, es el que más se repite. En este caso M o=9.
Cuya frecuencia es 3 (aparece tres veces). La respuesta correcta es la a).
La respuesta correcta es la b)
Los puntos medios de cada intervalo de clase son las marcas de clase. Así pues,
tenemos siete intervalos cuyas marcas de clase son los valores de la tabla.
Ti,Ti+1
T1,T2 12,7
T2,T3 13,4
T3,T4 14,1
T4,T5 14,8
T5,T6 15,5
T6,T7 16,2
T7,T8 15,9
Así pues la cuarta clase tiene como límites 14,8-0,35 y 14,8+0,35. Es decir
14,45 y 15,15.
Conjunto 1 8 8 9 9 9 9 9 10 10
Conjunto 2 1 3 6 9 9 11 13 14 15
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖 2 · 8 + 5 · 9 + 2 · 10
𝑥̅ = = =9
𝑁 9
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖 1 + 3 + 6 + 2 · 9 + 11 + 13 + 14 + 15
𝑥̅ = = =9
𝑁 9
b) La moda (el valor que más se repite) del conjunto 1 es: Mo(1)=9
Me(1)=9 Me(2)=9
2
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖2 2
2 · 82 + 5 · 92 + 2 · 102
𝑠 = − 𝑥̅ = − 92 = 0,444
𝑁 9
𝜎 = √𝑠 2 = √0,444 = 0,666
𝜎 = √𝑠 2 = √21,11 = 4,59
Como se aprecia la desviación del conjunto 2 es mucho mayor que la del conjunto 1.
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖 158
𝑥̅ = = = 5,45
𝑁 29
La varianza será:
Y la desviación típica:
𝜎 = √𝑠 2 = √0,0275 = 0,17
14
12
10
frecuencia
6
24
4
0
4,875 5,125 5,375 5,625 5,875
marcas de clase
Año 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
Inclinación 667 673 688 696 698 713 717 725 742 757
Inclinación / años
770
760
750
740
730
720
710
700
690
680 25
670
660
1976 1978 1980 1982 1984 1986 1988
𝑠𝑥𝑦
𝑦 − 𝑥̅ = (𝑥 − 𝑥̅ )
𝑠𝑥2
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖 19825
𝑥̅ = = = 1982,5
𝑁 10
∑𝑖 𝑓𝑖 · 𝑥𝑖 · 𝑦𝑖 14028948
𝑠𝑥𝑦 = − 𝑥̅ · 𝑦̅ = − 1982,5 · 707,6 = 77,8
𝑁 10
77,8
𝑦 − 707,6 = (𝑥 − 1982,5)
8,25
26
𝑦 = 9,43𝑥 − 17987,98
500
400
300
200
100
0
1984 1986 1988 1990 1992 1994
∑𝑖𝑖=1 𝑓𝑖 · 𝑥𝑖 17901
𝑥̅ = = = 1989
𝑁 9
∑𝑖 𝑓𝑖 · 𝑥𝑖 · 𝑦𝑖 4005982
𝑠𝑥𝑦 = − 𝑥̅ · 𝑦̅ = − 1989 · 223,89 = −208,10
𝑁 9
𝑠𝑥𝑦 −208,10
𝑟= = = −0,657
𝜎𝑥 𝜎𝑦 2,58 · 122,84
Se trata de una correlación negativa (al aumentar una variable la otra tiende a
disminuir) y no muy buena. Hay una cierta correlación entre ambas magnitudes
pero no se puede predecir sin mucho error la superficie quemada en años otros
años.
TEMA 9
Variable aleatoria discreta. Función de probabilidad. Media y
varianza de una función de probabilidad discreta. Distribución
binomial. Variable aleatoria continua. Función de densidad.
Función de distribución, media y varianza. La distribución
normal. Ampliación: Inferencia
28
VARIABLE ALEATORIA DISCRETA.
En gran cantidad de experimentos aleatorios es necesario cuantificar los
resultados, es decir, asignar a cada resultado del experimento un número, con el fin
de poder realizar un estudio matemático. Por ejemplo, consideremos el experimento
aleatorio que consiste en lanzar tres monedas, supongamos que a cada elemento de
su espacio muestral6
6
Al conjunto formado por todos los sucesos elementales (cada uno de los resultados de un fenómeno
aleatorio, que no se puede descomponer en otros más simples), se le llama espacio muestral o suceso
seguro, puesto que ocurre siempre que se realiza el experimento. Generalmente se representa por la
letra E.
Variable aleatoria.
E ℝ 29
CCC 3
CC+
C+C 2
+CC
C++ 1
+C+
++C 0
+++
(X<x) representa el suceso "la variable aleatoria X toma un valor menor a x",
y p(X<x) representa la probabilidad de que la v.a. X tome un valor menor a x.
intervalo de ℝ, diremos que es continua (los ejemplos de los pesos de las sandías y
las tallas de las personas).
FUNCIÓN DE PROBABILIDAD.
Consideremos una v.a. discreta X, que toma los valores x1, x2,..., xn.
Supongamos que conocemos la probabilidad de que la variable X tome dichos
valores, es decir, se conoce que:
30
p(X=x1) = p1 , p(X=x2) = p2, p(X=x3) = p3, ..., p(X=x1) = pn ,
en general p(X=xi) = pi
𝑝(𝑥𝑖 ) ≥ 0, ∀ 𝑖
𝑛
∑ 𝑝(𝑥𝑖 ) = 1
𝑖=1
Obsérvese que la función está bien definida puesto que todas las
probabilidades son números positivos, y su suma es 1.
Se calcula:
- 𝐹(𝑥) = 0 ∀𝑥 < 𝑥1
- 𝑓(𝑥) = 1 ∀𝑥 ≥ 𝑥𝑛
𝑿 𝒙𝟏 𝒙𝟐 … 𝒙𝒏
𝒇(𝒙) = 𝒑(𝑿 = 𝒙) 𝑝1 𝑝2 … 𝑝𝑛
0 𝑠𝑖 𝑥 < 𝑥1
𝑝1 𝑠𝑖 𝑥1 ≤ 𝑥 < 𝑥2
𝑝1 + 𝑝2 𝑠𝑖 𝑥2 ≤ 𝑥 < 𝑥3
𝐹(𝑥) =
… …
𝑝1 + 𝑝2 + ⋯ + 𝑝𝑛−1 𝑠𝑖 𝑥𝑛−1 ≤ 𝑥 < 𝑥𝑛
{ 1 𝑠𝑖 𝑥 ≥ 𝑥𝑛
0 𝑠𝑖 𝑥 < 0
0,064 𝑠𝑖 0 ≤ 𝑥 < 1
𝐹(𝑥) = 0,352 𝑠𝑖 1 ≤ 𝑥 < 2 7
0,784 𝑠𝑖 2 ≤ 𝑥 < 3
{ 1 𝑠𝑖 𝑥 ≥ 3
Su gráfica es:
33
7
El valor 0,352, correspondiente a los puntos entre 1 y 2, es el resultado de la suma de 0,064+0,288, que
son las probabilidades de los valores 0 y 1. Del mismo modo, el valor 0,784 es el resultado de la suma
0,064+0,288+0,432 que son las probabilidades de los valores 0, 1 y 2
Valores de X 2 3 4 5 6 7 8 9 10 11 12
Sucesos 1,2 1,2 1,3 1,4 1,5 1,6 2,6 3,6 4,6 5,6 6,6
elementales 34
asociados8 2,1 2,2 2,3 2,4 2,5 3,5 4,5 5,5 6,5
6,1
Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/3 1/36
p(x)
6 − |7 − 𝑥|
𝑝(𝑥) = { si 𝑥 = 2, 3, … ,12
36
0 para cualquier otro valor
Si x (-,2) 2,3) 3,4) 4,5) 5,6) 6,7) 7,8) 8,9) 9,10) 10,11) 11,12) 12,)
F(x) 0 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 1
8
La expresión “sucesos elementales asociados” hace referencia a las distintas combinaciones de dados
para obtener la suma dada. Por ejemplo para obtener suma 3, un dado puede salir en ¡ y el otro en 2, o
bien al revés. Es decir hay dos posibilidades de obtener suma 3.
𝜇 = 𝐸[𝑥] = ∑ 𝑥𝑖 · 𝑝(𝑥𝑖 )
𝑖
𝒙𝒊 0 1 2 3
Así pues:
𝑠 2 = ∑ 𝑥𝑖2 · 𝑝(𝑥𝑖 ) − 𝜇2 → 𝜎 = √𝑠 2
𝑖
0 0,064 0 0 0
1 1,8 3,960
De donde:
DISTRIBUCIÓN BINOMIAL.
Supongamos que un experimento aleatorio tiene las siguientes características:
2. En cada prueba del experimento sólo son posibles dos resultados: el suceso 𝐴
(éxito) y su contrario 𝐴̅ (fracaso).
Todo experimento que tenga estas características diremos que sigue el modelo
de la distribución Binomial. A la variable X que expresa el número de éxitos
obtenidos en cada prueba del experimento, la llamaremos variable aleatoria
binomial.
La variable binomial es una variable aleatoria discreta, sólo puede tomar los
valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como hay
que considerar todas las maneras posibles de obtener k-éxitos y (n-k) fracasos
debemos calcular éstas por combinaciones (número combinatorio n sobre k).
𝑛
𝑝(𝑋 = 𝑘) = ( ) · 𝑝𝑘 · 𝑞 𝑛−𝑘
𝑘
9
La varianza se puede representar también como 𝜎 2 .
𝑛 𝑛 𝑛
𝐹(𝑥𝑖 ) = 𝑝(𝑋 ≤ 𝑥𝑖 ) = ( ) 𝑝0 𝑞 𝑛 + ( ) 𝑝1 𝑞 𝑛−1 + ⋯ + ( ) 𝑝𝑘 𝑞 𝑛−𝑘
0 1 𝑘
P4. Una máquina fabrica una determinada pieza y se sabe que produce un 7 por
1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas
sólo haya una defectuosa.
50 50
𝑝(𝑋 = 1) = ( ) · 0,0071 · (1 − 0,007)50−1 = ( ) 0,007 · 0,99349 = 0,248
1 1
15
𝑃(𝑋 = 15) = ( ) · 0,7215 · 0,280 = 0,00724 → 0,724%
15
10
Se puede consultar dichas tablas en : http://www.uv.es/~montes/nau_gran/tablas.pdf
15
𝑃(𝑋 = 0) = ( ) · 0,720 · 0,2815 = 5,097 · 10−9 → 5,097 · 10−7 %
0
15
𝑃(𝑋 = 13) = ( ) · 0,7213 · 0,282 = 0,11503 → 11,503%
13
39
P6. La probabilidad de que el carburador de un coche salga de fábrica defectuoso
es del 4 por 100. Hallar:
a) El número de carburadores defectuosos esperados en un lote de 1000
b) La varianza y la desviación típica.
𝜇 = 𝑛𝑝 = 1000 · 0,04 = 40
40 carburadores defectuosos.
b) La varianza es:
y la desviación típica
P6. Un examen de matemáticas tipo test consta de 10 preguntas cada una de ellas
con cuatro respuestas posibles. Calcúlese la probabilidad de: a) sacar un cinco en el
examen contestando al azar cada pregunta; b) aprobar dicho examen contestando
al azar las preguntas.
10
𝑃(𝑋 = 5) = ( ) · 0,255 · 0,7510−5 = 0,0584 → 5,84%
5
40
b) En este caso, para aprobar el examen hemos de obtener un 5 en la prueba, o un
6, o un 7, 8, 9 o10.
Si alguien considera la posibilidad de aprobar el primer examen tipo test de la oposición a Observador de
Meteorología contestando al azar, ha de tener en cuenta que n=70 y que, como hay 4 respuestas posibles en
cada pregunta, p=0,25. De modo que se trata de una distribución binomial B(70 , 0,25).
Tanto si hace el cálculo directamente o si se ayuda de las tablas o si recurre a calculadoras on line (por ejemplo:
https://www.geogebra.org/probability), llegará al resultado de que dicha probabilidad es nula.
Moraleja: hay que estudiar y no dejar la contestación a las preguntas en manos del azar .
Crear una variable aleatoria no tiene mucho sentido sino la vamos a utilizar
en un determinado contexto, por ejemplo, podemos utilizar la segunda variable
aleatoria que hemos creado para apostar si sale o no múltiplo de tres. Así pues, una
variable aleatoria se construye al atribuir un número (positivo, negativo o cero) a
cada uno de los sucesos aleatorios que forman el espacio muestral de un
experimento aleatorio. La probabilidad de cada valor de la variable es la
probabilidad conjunta de los sucesos que dan lugar a ese valor. Es decir, definimos
una variable aleatoria como una aplicación del espacio muestral sobre el conjunto
de los números reales .
Como hemos visto hay variables aleatorias que pueden tomar cualquier
valor de un intervalo real de la forma (a, b), (a, +), (-, b), (-, +) o uniones de
ellos. A las variables de este tipo se las denomina variables aleatorias continuas.
𝑝(𝑠1 ) = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎(𝑠1 ).
Puesto que la función de densidad no tiene por qué ser constante, este
cálculo es una aproximación, que resulta tanto mejor cuanto menor sea la amplitud
del intervalo. Para obtener el valor exacto de la probabilidad en el intervalo, se
puede descomponer en n subintervalos y calcular el límite de la suma de las
probabilidades en cada uno de esos subintervalos, cuando n tiende a infinito. Es
decir, hacer la integral:
𝑛 𝑏
𝑝(𝑎 < 𝑥 < 𝑏) = lim ∑ 𝑓(𝑥) · (𝑥𝑖+1 − 𝑥𝑖 ) = ∫ 𝑓(𝑥)𝑑𝑥
𝑛→∞ 𝑎
𝑖=1
1. 𝑓(𝑥) ≥ 0 ∀𝑥
+∞
2. ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1
𝑏
3. 𝑝(𝑎 ≤ 𝑥 ≤ 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥
𝑏
𝑝(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑝(𝑎 ≤ 𝑋 < 𝑏) = 𝑝(𝑎 < 𝑋 ≤ 𝑏) = 𝑝(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
Del mismo modo que se hizo en las variables discretas, para facilitar el
cálculo de probabilidades en variables continuas, se define la función de
distribución, que da el área encerrada por la gráfica de la función de densidad
sobre el eje OX desde - hasta x.
𝑥 44
𝐹(𝑥) = 𝑝(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥)𝑑𝑥
−∞
𝟐 − 𝒌𝒙 𝐬𝐢 𝟎 ≤ 𝒙 ≤ 𝟏
𝒇(𝒙) = {
𝟎 𝐞𝐧 𝐜𝐚𝐬𝐨 𝐜𝐨𝐧𝐭𝐫𝐚𝐫𝐢𝐨
Calcular el valor de k para que sea una función de densidad de una v.a., hallar su
función de distribución y calcular la probabilidad de que la variable esté
comprendida entre 0,2 y 0,5.
Para que 𝑓(𝑥) sea una función de densidad debe cumplir que:
+∞
∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
1
∫ 𝑓(𝑥)𝑑𝑥 = 1
0
Es decir,
1 1 1
𝑥2
∫ 𝑓(𝑥)𝑑𝑥 = ∫ (2 − 𝑘𝑥)𝑑𝑥 = 1 → [2𝑥 − 𝑘 ] = 1 → 𝑘=2
0 0 2 0
𝑥
𝐹(𝑥) = ∫0 (2 − 2𝑥)𝑑𝑥 ∀𝑥 comprendido entre 0 y 1. Es decir,
0 𝑥<0
𝐹(𝑥) = {2𝑥 − 𝑥 2 ∶ 0 ≤ 𝑥 ≤ 1
1 𝑥>1
𝑝(0,2 < 𝑥 < 0,5) = 𝐹(0,5) − 𝐹(0,2) = (2 · 0,5 − 0,52 ) − (2 · 0,2 − 0,22 ) = 0,75 − 0,36
= 0,39 → 39%
45
+∞
𝜇 = 𝐸[𝑋] = ∫ 𝑥 · 𝑓(𝑥)𝑑𝑥
−∞
2 − 2𝑥 si 0 ≤ 𝑥 ≤ 1
𝑓(𝑥) = {
0 en caso contrario
Según la definición:
+∞ 1 1 1
𝑥2 𝑥3 1
𝜇 = 𝐸[𝑋] = ∫ 𝑥 · 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥(2 − 2𝑥)𝑑𝑥 = 2 ∫ (𝑥 − 𝑥 2 )𝑑𝑥 = 2 [ − ] =
−∞ 0 0 2 3 0 3
𝑉[𝑋 + 𝑘] = 𝑉[𝑋]. 46
𝑉[𝑘𝑋] = 𝑘 2 𝑉[𝑋]
+∞ 1
1
𝐸[𝑋 2 ] = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 2 (2 − 2𝑥)𝑑𝑥 =
−∞ 0 6
1 1 2 1
𝑉(𝑋) = 𝐸[𝑋 2 ] − 𝜇2 = −( ) =
6 3 18
Y la desviación típica:
1
𝜎 = √𝑉(𝑋) = √ ≈ 0,236
18
LA DISTRIBUCIÓN NORMAL.
La mayor parte de las variables aleatorias continuas tienen una distribución
que acumula mucha densidad de probabilidad en los valores centrales pero va
decreciendo según la variable se aleja en cualquiera de los dos sentidos. Lo normal
es que haya pocos individuos con valores extremos, ya sea por debajo o por encima
de la media, y muchos individuos que tomen valores intermedios, próximos a la
media.11
11
La expresión matemática de la función de densidad de la distribución normal fue descubierta por De
Moivre (https://es.wikipedia.org/wiki/Abraham_de_Moivre) en 1773 como límite de la distribución
binomial. Así mismo Laplace (https://es.wikipedia.org/wiki/Pierre-Simon_Laplace) y Gauss
(https://es.wikipedia.org/wiki/Carl_Friedrich_Gauss) , también la estudiaron y finalmente se la llama
curva gaussiana en honor de este último
1 1 𝑥−𝜇 2
− ( )
𝑓(𝑥) = 𝑒 2 𝜎
𝜎√2𝜋
𝑋~𝑵(𝝁, 𝝈)
𝑓(𝑥) 48
1
𝜎√2𝜋
Campana de Gauss
𝜇 − 2𝜎 𝜇 − 𝜎 𝜇 𝜇 + 𝜎 𝜇 + 2𝜎 x
1
2. Su máximo está en el punto (𝜇, 𝜎 )
√2𝜋
12
https://es.wikipedia.org/wiki/Funci%C3%B3n_gaussiana
Por ejemplo, para una distribución normal 𝑋~𝑵(𝟎, 𝟏), la probabilidad13 de que
un valor x esté comprendido entre -0,5 y 0,5 es:
0,5 1 𝑥−𝜇 2
1 − ( ) 49
𝑝(−0,5 < 𝑥 < 0,5) = ∫ 𝑒 2 𝜎 𝑑𝑥 = 0,3829
𝜎√2𝜋 −0,5
13
Cálculo hecho con la ayuda de Geogebra https://www.geogebra.org/probability
14
http://www.uv.es/~montes/nau_gran/tablas.pdf
15
Por ejemplo, https://www.geogebra.org/
𝟏
Por ejemplo, en una distribución 𝑋~𝑵 (𝟎, ):
√𝟐
51
P10. Se sabe que la talla de una población de 800 personas se distribuye según una
normal de media =1,75 m y desviación típica =0,10 m. Hállese el recorrido
significativo de la variable y el número aproximado de individuos cuya estatura
está en los intervalos: a) 𝒙 = 𝝁 − 𝟑𝝈 y 𝒙 = 𝝁 − 𝟐𝝈; b) 𝒙 = 𝝁 − 𝟐𝝈 y 𝒙 = 𝝁 − 𝝈
c) 𝒙 = 𝝁 − 𝝈 y 𝒙 = 𝝁 ; d) 𝒙 = 𝝁 y 𝒙 = 𝝁 + 𝝈; e) 𝒙 = 𝝁 + 𝝈 y 𝒙 = 𝝁 + 𝟐𝝈; f)
𝒙 = 𝝁 + 𝟐𝝈 y 𝒙 = 𝝁 + 𝟑𝝈.
Por tanto habrá 800 − 764 = 36 individuos repartidos entre 1,45 y 1,55 y
entre 1,95 y 2,05. Como la distribución es simétrica, debe haber 18 individuos entre
1,45 y 1,55 y otros 18 entre 1,95 y 2,05.
Del mismo modo, entre 1,65 y 1,85 debe haber el 68,37%, es decir, 546 individuos.
Por tanto habrá 218 individuos repartidos en los intervalos [1,55 , 1,65] y [1,85 ,
2,05]. En cada uno de ellos habrá 109 personas. 52
16
https://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Tabla_para_imprimir:_Distribuci%C3%B3n_n
ormal
Tipificación de la variable.
𝑋−𝜇
𝑋 = 𝜇 + 𝑍𝜎 → 𝑍=
𝜎 53
𝑋−𝜇
En general, si X sigue una distribución normal N(,), la variable 𝑍 = 𝜎
sigue
una distribución normal N(0,1).
P11. Si X es una variable que sigue una distribución normal N(120,30), hallar la
probabilidad de que la variable tome valores menores a 125.
𝑋 − 𝜇 𝑋 − 120
𝑍= =
𝜎 30
Para X=125:
Así pues:
El cálculo de 𝐹(0,17) = 𝑝(𝑧 < 0,17) lo hacemos observando directamente las tablas:
𝑥 𝑥2
1 −
𝐹(𝑥) = 𝑝(𝑋 ≤ 𝑥) = ∫ 𝑒 2 𝑑𝑥
−∞ √2𝜋
54
Dado que en la tabla solamente aparecen valores positivos para z, por simetría se
tiene que:
𝑋 − 𝑛𝑝
𝑍= → 𝑁(0,1)
√𝑛𝑝𝑞
(Teorema de De Moivre)
Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto más
próximo sea p a 0.5, tanto mejor será la aproximación realizada. Es decir, basta
con que se verifique: 𝑛𝑝 ≥ 5 y 𝑛𝑞 ≥ 5.
57
P12. Se sabe que tres de cada diez personas de un país tienen los ojos verdes. ¿Cuál
es la probabilidad de que en una reunión de 40 personas, haya al menos 5 que
tengan los mojos verdes?
𝑛𝑝 = 40 · 0,3 = 12 ≥ 5
𝑛𝑞 = 40 · 0,7 = 28 ≥ 5
4,5 − 12
𝑧= = −2,59
2,90
Si las tablas que estamos consultando tienen datos para valores negativos, entonces:
Si las tablas que estamos usando no tiene datos para valores negativos de la variable,
hemos de aplicar las propiedades de la normal vistas anteriormente:
58
Área=0,9952 u2
𝑛𝑝 = 70 · 0,25 = 17,5 ≥ 5
𝑛𝑞 = 70 · 0,75 = 52,5 ≥ 5
Así pues se nos pide que determinemos 𝑝(𝑥 ≥ 35). Efectuando la corrección de
continuidad, habremos de determinar 𝑝(𝑥 ≥ 34,5).
59
Tipificando la variable:
34,5 − 17,5
𝑧= = 4,70
3,62
Las tablas no suelen dar datos para valores tan grandes de z. En la tabla dada
en el tema, el máximo valor para z es 1,9.
17
http://www.uv.es/~montes/nau_gran/tablas.pdf
INFERENCIA18
La Estadística inferencial se encarga de extraer conclusiones acerca de la
población a partir de los resultados obtenidos de una muestra.
X 1 X 2 ... X n 60
X
n
4 6 8 10 12
8 años
5
Imaginemos ahora que vamos a tomar, al azar, una muestra de dos empresas
para determinar la media de funcionamiento. Es evidente que, dependiendo de
la muestra se obtendrán resultados diferentes. En la siguiente tabla se
muestran todas las posibles muestras aleatorios de tamaño dos y sus medias
muestrales.
18
Una interesante colección de problemas sobre Inferencia Muestral se pueden encontrar en :
http://www3.uah.es/jmmartinezmediano/Segundo%20CS/MCCSS%20Tema%2009d%20Problemas%20d
e%20distribucion%20de%20la%20media%20muestral.pdf
19
http://e-stadistica.bio.ucm.es/glosario2/def_media_muestral.html
10,12 11
12,4 8
12,6 9
12,8 10
12,10 11
12,12 12
La distribución de las media muestral viene dada por las medias muestrales y
sus probabilidades respectivas. A partir de los datos recopilados en la tabla
anterior podemos construir esta otra tabla:
Probabilidad 61
Medias muestrales, X
4 1/25=0,04
5 2/25=0,08
6 3/25=0,12
7 4/25=0,16
8 5/25=0,20
9 4/25=0,16
10 3/25=0,12
11 2/25=0,08
12 1/25=0,04
0,2
0,15
0,1
0,05
0
4 5 6 7 8 9 10 11 12
x
2
(4 8) 2 (6 8) 2 (8 8) 2 (10 8) 2 (12 8) 2
i
2 2 años
N 5
X X
2
(4 8) 2 (5 8) 2 ... (12 8) 2
X i
2 años
N 25
2 2 62
2 X
X 2 2
X
n
X N ( X , X ) N ,
n
X X X
z N (0,1)
X
n
En nuestro caso
9 10
p( X 9) p Z p(Z 2,5) 1 p(Z 2,5) 1 0,9938 0,0062
0,4
20
http://www.uv.es/~montes/nau_gran/tablas.pdf
Teorema central del límite. Si una muestra aleatoria de tamaño n procede de una
población con media y desviación típica, entonces en el caso de que el tamaño de la
muestra sea lo suficientemente grande (n>30), la media muestral X , tiene
aproximadamente una distribución normal de media y desviación típica . Es decir:
n
X N ,
n
Es decir, cualquiera que sea la distribución de la población de partida, la distribución de la media
muestral, X sigue una distribución normal, siempre que el tamaño muestral sea suficientemente
grande (n>30)
64
X 60 65 60
p( X 65) p p( Z 1,77)
2,83 2,83
Consultando en las tablas y aplicando las propiedades vistas anteriormente, vemos
que:
p( X 65) p( Z 1,77) 1 p( Z 1,77) 1 0,9616 0,0384
De modo que, aproximadamente el 3,84% de los 50 botes de refresco tendrán una
cantidad de azúcar mayor de 65 g por bote.
x
pˆ
n
Por ejemplo, una persona candidata en unas elecciones municipales sondea entre
100 votantes y comprueba que solamente 25 le votarían. Entonces:
x 25
pˆ
n 100
Es evidente que, si hubiera escogido otra muestra, posiblemente el resultado sería
diferente. Entonces, lo que interesa es conocer cómo se distribuye la proporción
muestral, teniendo en cuenta cuáles son la media y la desviación típica en la
distribución binomial.
pq pq
pˆ N p, N p,
n
n
pq 0,40·0,60
pˆ N p, N 0,40 , 0,40 , 0,035 66
n
200
Ahora, tipificamos la variable:
pˆ 0,40
Z
0,035
Con lo que, según las condiciones enunciadas en el problema:
Estimación puntual.
Cliente Cliente Cliente Cliente Cliente Cliente Cliente Cliente Cliente Cliente
1 2 3 4 5 6 1 8 9 10
5,30€ 3,00€ 7,20€ 12,50€ 8,00€ 6,30€ 4,20€ 3,70€ 10,50€ 4,50€
5,30 3,00 7,20 12,50 8,00 6,30 4,20 3,70 10,50 4,50
x 6,52€
10
Esta estimación puntual de la media poblacional nos permite inferir que el gasto
medio diario de los clientes es de 6,52€.
Dada una muestra aleatoria simple de tamaño n procedente de una población con media , se
puede utilizar el valor de la media muestral x , para estimar la media de la población . Es la
llamada estimación puntual de la media.
Por ejemplo, si el intervalo (5, 7) está dado con un nivel de confianza del
90%, se está expresando que la dueña de la frutería confía en un 90% de que el
gasto medio de sus clientes se encuentra entre 5 y 7 €.
1-
Un nivel de confianza del 90%, o 0,90, indica que si se construyen todos los
intervalos de confianza posibles, el 90% de ellos contendrá el verdadero valor del
parámetro que se desea estimar, y, por tanto, un 10% de que no lo contendrá.
Ahora bien, si se toman 100 muestras aleatorias de tamaño n de una misma
población y se calculan los límites de confianza para cada muestra, se epera que el
90% de los intervalos así construidos contengan el verdadero valor del parámetro, y
el 10% restante no lo contengan. Pero en la práctica sólo se dispondrá de un
intervalo de confianza y no se sabe si está dentro de los del 90% o de los del 10%.
Por eso se habla de un nivel de confianza del 90%.
68
Intervalo de confianza para la media de una población con desviación
típica conocida.
Población normal.
Sea una población que sigue una distribución normal N(, ) de desviación
típica conocida. Se toma una muestra aleatoria n y se obtiene una media muestral
x . Si se desea encontrar un intervalo de confianza (1-) de contener a la media
de la población, basta con determinar dos valores: z y z tales
2 2
p z z z 1
2 2
/2 /2
1-
z z
2 2
x
Como z N(0,1), entonces z y z se obtienen de las expresiones
2 2
n
siguientes:
p Z z
2
2
p Z z
2
2
El intervalo para la media poblacional a un nivel de confianza (1-) es:
x z , x z o bien x z
n
2 n 2 2 n
El intervalo está centrado en la media muestral, x , y se le resta y suma z
2 n
P19. Una máquina se encarga de llenar cajas de cereales de 500 g. El peso de estas
cajas sigue una distribución normal con desviación típica 4 gramos. En una
muestra aleatoria simple de 50 cajas se obtuvo un peso medio de 498 g. Hallar un 69
intervalo de confianza del 95% para el peso medio de todas las cajas llenadas por
esa máquina.
La población sigue una distribución N(, 4) y la muestra de tamaño n=50 tiene una
media muestral x 498g . Si el nivel de confianza es de 0,95 entonces:
0,05
1 0,95 1 0,95 0,05 0,025
2 2
Debido a que, teniendo en cuenta las propiedades de la variable tipificada:
p Z z p Z z 1 p Z z
2 2 2
2
Podemos concluir que:
0,05
p Z z 1 1 0,975
2
2 2
Consultando las tablas de la distribución normal, observamos que esta
probabilidad de 0,975 corresponde a un valor de 1,96. De modo que:
z 1,96
2
0,975
1,96
Así pues, el intervalo para la media poblacional con un nivel de confianza del 95%
es el siguiente:
4 4
x z , x z 498 1,96 , 498 1,96
n 50
2 n 2 50
(498 1,11 , 498 1,11) (496,89 , 499,11)
95%
( ) 70
496,89g 499,11g
Se trata de una población que sigue una distribución normal N(, 8,9) y en la
muestra de tamaño n=10 se tiene que:
x x i
44 68 57 48 66 47 60 53 51 68 562
56,2cm
n 10 10
Para un nivel de confianza de 0,90 , se tiene que:
0,10
1 0,90 1 0,90 0,10 0,05
2 2
z 1,645
2
71
Así pues, el intervalo para la media poblacional con un nivel de confianza del 90%
es el siguiente:
8,9 8,9
x z , x z 56,2 1,645 , 56,2 1,645
n 10
2 n 2 10
(51,6 , 60,8)
Se tiene el 90% de confianza de que el peso medio de los bebés se encuentre entre
51,6 y 60,8. Además, se sabe que el 90% de todos los intervalos de confianza
construidos contendrán el verdadero valor de .
90%
( )
51,6g 60,8g
El peso medio de los recién nacidos estará comprendido entre 51,6 cm y 60,8 cm con
una confianza del 90%
P21. La temperatura durante los meses de verano en una ciudad sigue una
distribución normal de desviación típica 5ºC. Elegida una muestra y con un nivel
de confianza del 98% se obtiene un intervalo (25ºC , 30ºC). Calcúlese la media y el
tamaño de la muestra elegida.
Se trata de una distribución normal N(, 5). Como el nivel de confianza es del 98%,
podemos establecer que:
0,02
1 0,98 1 0,98 0,02 0,01
2 2
0,02
Y como p Z z 1 1 0,99 , de donde, y con la ayuda de las tablas y
2
2 2
hacemos una interpolación lineal, obtenemos que z 2,367, ya que el valor 0,99
2
no aparece en las tablas, siendo los más cercanos 0,9898 y 0,9901 correspondientes,
respectivamente, a los valores 2,32 y 2,33.
72
Así pues:
5 5 11,6335 11,6335
x z , x z x 2,3267 , x 2,3267 x , x
n n n
2 n 2 n n
(25 , 30)
De donde:
11,6335
x 25
n 11,6335 11,6335 23,2670 23,2670
25 30 5 n 4,6534
11,6335 n n n 5
x 30
n
Y la media es:
11,6335 11,6335
x 25 x 25 27,5º C
n 4,6534
x
z N (0,1)
n
El intervalo aproximado Para la media poblacional a un nivel d confianza
(1-) es el mismo que para una población normal. Es decir:
x z , x z o bien x z
n
2 n 2 2 n
73
0,05
1 0,95 1 0,95 0,05 0,025
2 2
Como
p Z z p Z z 1 p Z z
2 2 2
2
Y
0,05
p Z z 1 1 0,975
2
2 2
Consultando las tablas de la distribución normal, observamos que esta
probabilidad de 0,975 corresponde a un valor de 1,96. De modo que:
z 1,96
2
0,975
1,96
Así pues, el intervalo para la media poblacional con un nivel de confianza del 95%
es el siguiente:
30 30
x z , x z 140 1,96 , 140 1,96
n 49
2 n 2 49
(140 8,4 , 140 8,4) (131,6 , 148,4)
131,6 148,4
Se tiene el 95% de confianza de que el número medio de kilómetros recorridos a la
semana por toda la flota estará comprendido entre 131,6 y 148,4.
95%
( )
131,6 km 148,4 km
74
Intervalo de confianza para la media de una población con desviación típica
desconocida.