Esta Di Stica Probab Il I Dad

ESTADÍSTICA Y PROBABILIDAD
http://sites.google.com/site/mat3catorce/
Índice
1. ESTADÍSTICA ................................................................................................................................. 3
2. CONCEPTOS .................................................................................................................................. 3
3. VARIABLES ESTADÍSTICAS ............................................................................................................. 3
4. ORDENACIÓN DE DATOS. TABLA DE FRECUENCIAS ....................................................................... 4
5. REPRESENTACIONES GRÁFICAS ..................................................................................................... 6
6. MEDIDAS DE CENTRALIZACIÓN ..................................................................................................... 9
7. MEDIDAS DE DISPERSIÓN ........................................................................................................... 11
8. ......................................................................................................................................................... 13
9. INTRODUCCIÓN A LA ESTADÍSTICA BIDIMENSIONAL .................................................................. 13
10. VARIABLE ESTADÍSTICA BIDIMENSIONAL .................................................................................... 14
11. DIAGRAMA DE DISPERSIÓN. NUBE DE PUNTOS .......................................................................... 15
12. TABLAS DE DOBLE ENTRADA....................................................................................................... 16
13. MEDIDAS MARGINALES .............................................................................................................. 17
14. COVARIANZA .............................................................................................................................. 19
15. COEFICIENTE DE CORRELACIÓN LINEAL ....................................................................................... 20
16. COEFICIENTE DE DETERMINACIÓN .............................................................................................. 22
17. RECTA DE REGRESIÓN DE Y SOBRE X ........................................................................................... 23
18. COEFICIENTE DE REGRESIÓN DE LA RECTA Y/X ........................................................................... 24
19. RECTA DE REGRESIÓN DE X SOBRE Y ........................................................................................... 24
20. COEFICIENTE DE REGRESIÓN DE LA RECTA X/Y ........................................................................... 25
21. EXPERIMENTOS ALEATORIOS. SUCESOS ALEATORIOS ................................................................. 29
22. OPERACIONES CON SUCESOS ...................................................................................................... 31
22.1. LEYES DE MORGAN ........................................................................................................................ 33
23. CONCEPTO DE PROBABILIDAD .................................................................................................... 33
24. DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD ............................................................................. 35
25. PROBABILIDAD CONDICIONADA ................................................................................................. 36
26. INDEPENDENCIA DE SUCESOS ..................................................................................................... 37
27. PROBABILIDAD TOTAL ................................................................................................................ 39
28. TEOREMA DE BAYES ................................................................................................................... 41
29. EJERCICIOS .................................................................................................................................. 43
30. INTRODUCCIÓN A LAS FUNCIONES DE PROBABILIDAD ............................................................... 51
31. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA .............................................................................. 51
1/66
32. DEFINICIÓN DE LA PROBABILIDAD A PARTIR DE LAS FRECUENCIAS RELATIVAS .......................... 53

33. VARIABLE ALEATORIA DISCRETA ................................................................................................. 53
34. DISTRIBUCIÓN DE PROBABILIDAD. FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA
DISCRETA ............................................................................................................................................. 55
35. MEDIA O ESPERANZA MATEMÁTICA DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA........ 57
36. VARIANZA DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA ................................................ 57
37. DISTRIBUCIÓN BINOMIAL ........................................................................................................... 58
37.1. PARÁMETROS DE UNA DISTRIBUCIÓN BINOMIAL .................................................................................. 60
38. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA ............................................................................ 61
39. FUNCIÓN DE DENSIDAD .............................................................................................................. 62
40. FUNCIÓN DE DISTRIBUCIÓN ........................................................................................................ 63
41. DISTRIBUCIÓN NORMAL ............................................................................................................. 63
41.1. DISTRIBUCIÓN NORMAL ESTÁNDAR ................................................................................................... 65
42. DISTRIBUCIÓN NORMAL COMO APROXIMACIÓN DE UNA BINOMIAL ......................................... 65
2/66
1. Estadística
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa

concerniente a individuos, grupos, series de hechos, etc. y deducir de ello, gracias al
análisis de estos datos, unos significados precisos o unas previsiones para el futuro.
La Estadística, en general, es la ciencia que trata de la recopilación, organización

presentación, análisis e interpretación de datos numéricos con el fin de realizar una
toma de decisión más efectiva.
La Estadística descriptiva se ocupa de tomar los datos de un conjunto, organizarlos

en tablas o en representaciones gráficas y del cálculo de unos números que dan
información de manera global del conjunto deseado.
La Estadística inferencial trata sobre la elaboración de conclusiones, partiendo de los

resultados de una muestra y del grado de fiabilidad de estas conclusiones.
En la Estadística actual se utilizan métodos de Análisis Matemático, surgiendo la

vinculación a este a través del Cálculo de Probabilidades.
2. Conceptos
 Población: conjunto de todos los elementos que son objeto de estudio

estadístico. Los elementos de la población pueden ser finitos o infinitos.
Ejemplo Si se quiere analizar el precio del litro de gasóleo de España, la población es cada
una de las gasolineras del País.
 Individuo: es cada uno de los elementos de la población.
Ejemplo Precio del litro de gasóleo de la gasolinera de la Avenida de la Aviación, Madrid.
 Muestra: subconjunto de elementos de la población. Se suelen tomar muestras

cuando es difícil o costosa la observación de todos los elementos de la
población estadística.
Ejemplo Precio del litro de gasóleo de 100 gasolineras de España elegidas al azar entre las
distintas Comunidades Autónomas.
 Tamaño de la población: es el número de individuos de la población.
 Tamaño de la muestra: es el número de individuos de la muestra
3. Variables Estadísticas
A los valores de las distintas modalidades que adopta un carácter se le llama variable
estadística.
Por ejemplo, si el individuo observado es un libro, podremos describirlo mediante los
caracteres peso, tamaño, número de hojas, color de las pastas, etc.
3/66
A cada carácter que se quiere estudiar se le asocia una variable estadística cuyos
valores son los que adopta el carácter de estudio.
Las variables estadísticas se pueden clasificar de la siguiente forma:
 Variable estadística cualitativa: representa un carácter no medible. Se

describen con palabras.
Ejemplo Sea X la variable estadística que indica el estado civil de una persona. X podrá
tomar los valores “soltero” o “casado”. Es una variable estadística cualitativa
 Variable estadística cuantitativa: representa un carácter medible. Se

expresa con números. Se clasifican en:
o Variable estadística discreta: Son aquellas que toman valores en

un conjunto numerable.
Ejemplo Sea X la variable estadística “número de hijos de una familia”, es una variable
estadística cuantitativa discreta
o Variable estadística continua: Son aquellas que pueden tomar

infinitos valores en un intervalo dado.
Ejemplo Sea Y la variable estadística “altura de una persona”, es una variable estadística
cuantitativa continua
Ejemplo Si se quiere estudiar el precio del litro de gasóleo en las gasolineras de España, la
variable estadística que podemos utilizar es X que indica el precio del litro en euros.
Tomamos una muestra del precio del litro en 100 gasolineras
x1  0.99€
x 2  0.81€
x3  0.95€
...
x100  1.03€
La población son todas las gasolineras de España. El tamaño de la muestra es 100. De entre
todas las gasolineras se eligen 100 para analizar el precio del litro del gasóleo. Esta elección
deberá ser representativa de todas las gasolineras si se quiere sacar alguna conclusión
rigurosa.
4. Ordenación de datos. Tabla de frecuencias
- Llamamos Frecuencia Absoluta de un valor x i de la variable estadística X , y

se representa por f i , al número de veces que aparece repetido dicho valor en el
conjunto de las observaciones realizadas.
- Llamamos Frecuencia Relativa de un valor x i de la variable estadística X , y se

representa por fri , a
fi

fri 4/66
n
donde n es el número total de individuos de la muestra o población.
- Llamamos Frecuencia Absoluta Acumulada de un valor x i de la variable

estadística X, y se representa por Fi , al valor:
i
Fi   f j
j 1
- Llamamos Frecuencia Relativa Acumulada de un valor x i de la variable

estadística X , y se representa por Fri , al valor:
Fi
Fri 
n
- Marca de clase: Si los valores de la variable estadística están agrupados por
intervalos o clases, la marca de clase es el punto medio de ese intervalo.
Ejemplo Sea X la variable estadística “calificación de un examen”. Se presentan 10 alumnos y

sus calificaciones son:
x1  5; x2  7; x3  3; x4  5; x5  5; x6  3; x7  8; x8  6; x9  4; x10  8
5/66
La información concerniente a la variable estadística X se muestra en la siguiente tabla de

frecuencias:
Calificación fi fri Fi Fri

3 2 0.2 2 0.2
4 1 0.1 3 0.3
5 3 0.3 6 0.6
6 1 0.1 7 0.7
7 1 0.1 8 0.8
8 2 0.2 10 1
Podría agruparse los datos en intervalos. Si se quiere tener 4 intervalos, la longitud de cada
10  0
uno de ellos será de  2.5 dando lugar a la siguiente tabla de frecuencias:
4
marca de
clase
fi fri Fi Fri
[0 , 2.5) 1.25 0 0 0 0
[2.5 , 5) 3.75 3 0.3 3 0.3
[5 , 7.5) 6.25 5 0.5 8 0.8
[7.5 , 10) 8.75 2 0.2 10 1
5. Representaciones gráficas
A continuación se muestran de distintas representaciones gráficas de datos
estadísticos. En primer lugar se debe de escribir la tabla de frecuencias y a
continuación representar la información.
Veámoslo con el ejemplo anterior, donde X es la variable estadística “calificación de un

examen”
Calificación X fi fri Fi Fri

3 2 0.2 2 0.2
4 1 0.1 3 0.3
5 3 0.3 6 0.6
6 1 0.1 7 0.7
7 1 0.1 8 0.8
8 2 0.2 10 1
6/66
3,5
2,5
2
Calificaciones
1,5
0,5
0
3 4 5 6 7 8
3,5
2,5
2
Calificaciones
1,5
0,5
0
3 4 5 6 7 8
7/66
Gráfica de frecuencias acumuladas:
12
10
0
3 4 5 6 7 8
La representación de variables cualitativas suele hacerse con diagrama de sectores.
Sea Y la variable estadística que indica la marca de los vehículos que son
clientes de una cadena de talleres mecánicos. La información, así como la frecuencia,
número de coches de cada modelo, se muestran en la siguiente tabla de frecuencias:
SEAT 350
RENAULT 200
CITROEN 111
OPEL 165
FORD 180
Otras 165
SEAT
RENAULT
CITROEN
OPEL
FORD
OTRAS
8/66
6. Medidas de Centralización
Es conveniente reducir la información obtenida a un solo valor para facilitar la

comparación entre las distintas muestras o poblaciones. Estos valores centralizan la
información y reciben el nombre de medidas de tendencia central o medidas de
centralización.
Definición:
Si x i son los distintos valores que toma la variable estadística X , se define la Media
Aritmética de X como x , donde
x i
x i 1
n
siendo n el tamaño de la muestra o población
Si la información estadística viene dada en función de las frecuencias, entonces la

media aritmética x se define también como:
k
fx i i
x i 1
n
Ejemplo Dados los siguientes valores {2, 4, 0, -6, -3, 6, 2, 10} relativos a una variable
estadística X , su media aritmética es:
x i
2  4  0  - 6  - 3  6  2  10 15
x i 1
   1.875
n 8 8
Ejemplo En el ejemplo anterior, X la variable estadística “calificación de un examen”, la media

aritmética es
fx i i
2·3  1·4  3·5  1·6  1·7  2·8 54
x i 1
   5.4
n 10 10
9/66
Otras medidas centralizadoras son:
Definición:
Media Armónica
n
H k
fi

i 1 x i
Definición:
Media Geométrica
1/ n
 k f 
G    xi  i 
 i 1 
Definición:
Mediana M e : es el valor central de los datos una vez ordenados de menor a mayor.
Si hubiese un par de valores centrales, la Mediana sería la media aritmética de estos
dos valores.
Ejemplo Dados los siguientes valores {2, 4, 0, -6, -3, 6, 2, 10} relativos a una variable
estadística. Calcular su mediana.
Los datos centrales una vez ordenados de menor a mayor son los subrayados: {-6, -3, 0, 2, 3,
4, 6, 10}
23
La mediana es la media aritmética de los valores centrales  2.5 . La mediana es 2.5.
2
La relación entre las distintas medias es:
Media Armónica Media Geométrica Media Aritmética
Definición:
Moda M o : valor de la variable estadística que se presenta con mayor frecuencia

absoluta. Si dos o más valores de las variables estadísticas tienen la misma
frecuencia mayor que las demás, tendremos una distribución bimodal o polimodal.
10/66
Ejemplo
Dados los siguientes valores {2, 4, 2, 6, -3, 6, 2, 10} relativos a una variable estadística Y , su
moda es 2.
Ejemplo
Dados los siguientes valores {2, 4, 2, 6, -3, 6, 3, 10} relativos a una variable estadística Y , su
moda es 2 y 6.
7. Medidas de Dispersión
Las mediadas de centralización necesitan de otras que las complementen en el
estudio de las distribuciones de frecuencia de las variables estadísticas. Las medidas
de dispersión informan de las desviaciones que sufren los datos respecto de los
valores centrales.
Definición:
Rango o amplitud de recorrido es la diferencia entre el mayor y el menor de los

datos.
Ejemplo
Dados los siguientes valores {2, 4, 0, 6, 3, 6, 2, 10} relativos a una variable estadística Y , su
 
rango es 10   6  16
Definición:
Varianza
 x 
n
2
i x
 2 i 1
Si la información estadística viene dada en función de las frecuencias, entonces la

media aritmética  2 se define también como:
 f x  x 
k 2
i i
 2 i 1
n
La varianza es siempre un valor mayor o igual que cero.  2 toma el valor cero solo
cuando todos los valores de la muestra son iguales.
2 0
11/66
A efectos de un cálculo de la varianza más sencillo, se desarrolla la expresión de  2

con lo que tenemos
 xi
2
2  i 1
 x 
2
Demostración:
 x  x   x    x 
n 2 n n n
 2·x  xi  n· x
2 2
 2·x·xi  x
2 2
i i i
2  i 1
 i 1
 i 1 i 1

n n n
n n
 xi x x 
2
i 2
 i 1
 2·x i 1
n 
n n n
n n n
x x x
2 2 2
   
i i i
2 2 2 2
 i 1
 2·x·x  x  i 1
 2· x  x  i 1
 x
n n n
k
fx 2

i i
2  i 1
 x
n
Ejemplo Cálculo sencillo de la varianza a partir de la tabla de frecuencias. Sea X la variable

estadística “calificación de un examen” del ejemplo anterior. Calcular la varianza de la muestra.
2 2
Calificación fi f i ·xi xi f i ·xi
3 2 6 9 18
4 1 4 16 16
5 3 15 25 75
6 1 6 36 36
7 1 7 49 49
8 2 16 64 128
totales 54 322
x  5.4
k
fx
2

i i
 5.4  3.04
2 322
2  i 1
 x 
2
n 10
12/66
Definición:
La Desviación Típica es la raíz cuadrada de la varianza:
  2
Ejemplo La desviación típica del ejemplo anterior es    2  3.04  1.7435
Definición:
Coeficiente de Variación

CV 
x
El Coeficiente de Variación sirve para comparar diferentes muestras, ya que un menor

coeficiente de variación indicará una menor variabilidad.
Ejemplo Sean X la variable estadística que indican la producción de leche en miles de litros.
Sean A y B dos granjas productoras de leche. Los datos obtenidos durante cuatro trimestres de
un año dado son
Granja A 12 25 2 60
Granja B 20 30 15 22
x  CV
Granja A 24.75 21.9245867 0.88584189
Granja B 21.75 5.4025457 0.24839291
A la vista de los resultados, la granja A tiene una mayor producción anual de leche si se
observa solo la media aritmética. Sin embargo, una desviación típica mayor de la granja A
indica una mayor variabilidad en la producción. Un CV menor de la granja B da a entender una
mayor fiabilidad de esta granja en la producción de leche, y será este el valor a tener en cuenta
si se quiere contratar una granja que asegure un suministro de leche al mercado.
8.
9. Introducción a la Estadística Bidimensional
13/66
Una Variable Estadística Bidimensional recogerá la información de dos caracteres

de un individuo, obteniéndose, por tanto, pares de resultados.
Una de las cuestiones que ofrece mayor interés en el estudio de las variables
bidimensionales es la de conocer el grado de relación que existe entre ambas
variables unidimensionales.
En el estudio de esta relación se plantean dos problemas diferentes, aunque

relacionados entre sí:
 Estudiar el grado de causas comunes entre ambas, problema denominado

correlación
 Analizar una de las variables, condicionándola a los comportamientos de otra.
Este problema recibe el nombre de regresión
Ejemplo
 
Es el caso de la variable estadística X , Y que mide el peso en Kg. y la estatura en cm. de
una persona; una observación de esta variable estadística podría ser
xi , yi  = (80kg, 185cm).
10. Variable Estadística Bidimensional

Los dos caracteres observados no tienen por qué ser de la misma clase. Se podrían
presentar las siguientes situaciones:
- Dos caracteres cualitativos: sexo y color del pelo de una persona.

- Dos caracteres cuantitativos: peso y estatura de una persona.
- Uno cualitativo y otro cuantitativo: empleo y años de servicio.
En el caso de caracteres cuantitativos, las variables que representan sus valores

podrían clasificarse:
- X discreta, Y discreta: Número de hermanos, número de hijos de una persona.

- X continua, Y continua: Perímetro craneal y perímetro torácico de una persona.
- X discreta, Y continua: Número de hijos de una familia, estatura del padre.
- X continua, Y discreta: Temperatura y pulsaciones.
14/66
11. Diagrama de dispersión. Nube de puntos
La representación sobre unos ejes cartesianos de los distintos valores de la variable

 X , Y  se denomina diagrama de dispersión. La forma que adquieren los datos
representados se conoce como nube de puntos.
Ejemplo El siguiente ejemplo muestra los valores de la variable estadística bidimensional (X, Y)
y su diagrama de dispersión. X recoge el valor de la nota en Física e Y el valor de la nota en
Matemáticas.
X: Física 7 9 3 2 6 8 4 3 8 5 6 3 2 8
Y: Matemáticas 5 10 4 2 8 8 5 2 6 5 7 5 2 7
12
10 9; 10
8 6; 8 8; 8
Y Física
6; 7 8; 7
6 8; 6
3; 5 4; 5 5; 5 7; 5
4 3; 4
2 2; 2 3; 2
0
0 2 4 6 8 10
X Matemáticas
Ejemplo
Sean los valores de la variable estadística bidimensional (X, Y) y su diagrama de dispersión. X

recoge el valor de la Esperanza de vida en años e Y la renta en unidades monetarias de una
muestra de 18 países.
X Y
1 89 300 100
2 86 270 90
3 72 260 80
4 62 230 70
5 45 190
60
Renta
6 82 260 Esperanza de vida /

7 80 266 50
Renta
8 86 267 40
9 62 245 30
10 45 160 20
11 87 310 10
12 85 290
0
13 75 280
14 76 296 150 200 250 300 350
15 72 250 Esperanza de vida
16 42 200
17 85 300
18 84 293
.
15/66
12. Tablas de doble entrada
Dada una variable estadística bidimensional  X , Y  , se considera el número de

modalidades distintas que adopta el carácter X y el número de modalidades que
adopta el carácter Y. Por ejemplo, si X indica si una persona es fumadora o no e Y el
sexo, tendremos que X tendrá dos modalidades (fuma o no fuma) e Y otras dos
(hombre o mujer).
El caso general vendría determinado cuando X e Y tenga las siguientes modalidades

distintas:
x1 , x2 ,..., xk 
y1 , y 2 ,..., y n 
 Se define f ij o frecuencia absoluta, al número de veces que se repite la
modalidad xi , yi  de la variable estadística  X , Y 
 Se define frecuencia relativa frij como:
fij
frij 
n
Donde n es el número de individuos objeto de estudio.
La tabla de doble entrada recogerá las frecuencias absolutas de cada modalidad

 
xi , y j , es decir, el número de veces que aparece esta combinación.
La tabla de doble entrada adopta la siguiente forma:
Y
X x1 x2 xi xn
y1 f 11 f 21 f i1 f nj
y2 f 12 f 22 fi2 f n2
yj f1 j f2 j fij f nj
ym f1m f 2m f im f nm
Donde fij es la frecuencia absoluta, las veces que se repite la modalidad xi , y j en  

la muestra o población a estudiar.
16/66
 
Ejemplo En el ejemplo de la variable X , Y , donde X indica si una persona es fumadora o no
e Y el sexo, se han recogido los datos de 10 pacientes:
La tabla de doble entrada:
Paciente X Y X ,Y  HOMBRE MUJER

1 SI HOMBRE SI 2 4
2 SI HOMBRE
3 NO HOMBRE NO 3 1
4 SI MUJER
5 SI MUJER
6 NO MUJER
7 SI MUJER
8 NO HOMBRE
9 SI MUJER
10 NO HOMBRE
13. Medidas Marginales

Dada una variable estadística bidimensional  X , Y  que toma los valores:
(x1, y1), (x2, y2), (x3, y3), …, (xn, yn)
Los datos asociados a cada variable se llaman datos marginales.
x1, x2… xn-1, xn son los datos marginales de la variable X

y1, y2… yn-1, yn son los datos marginales de la variable Y
La media aritmética marginal de X e Y respectivamente, es:

n
x i
x i 1
n
n
y i
y i 1
n
Se denomina centro medio o centro de gravedad al punto:
x, y 
17/66
La varianza marginal de X e Y respectivamente, es:
 x   y 
2 n 2
n
i x i y
 x2  i 1 y  2 i 1
n n
La desviación típica marginal de X e Y es:
 x  x 
n 2
i
x  i 1
n
 y 
n 2
i y
y  i 1
n
Ejemplo En una clase con 30 alumnos se ha hecho un estudio sobre el número de horas
diarias de estudio X y el número de suspensos Y, obteniéndose los siguientes resultados
representados:
(2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1), (4, 0), (0, 4), (2, 2), (2, 1), (2, 1), (4, 0), (3, 1), (2,
4), (2, 1), (1, 2), (2, 1), (2, 0), (3, 0), (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3),
(1, 4)
X/Y 0 1 2 3 4 Totales
0 0 0 2 1 2 5
1 0 0 8 2 0 10
2 0 2 5 1 0 8
3 0 2 0 0 0 2
4 1 1 1 0 0 3
5 2 0 0 0 0 2
Totales 3 5 16 4 2 30
Tabla de distribuciones marginales:
Y f X f
0 5 0 3
1 10 1 5
2 8 2 16
3 2 3 4
4 3 4 2
5 2
Medidas marginales:
Media aritmética marginal de X
18/66
fx i i
3·0  5·1  16·2  4·3  2·4
x i 1
  1.9
n 30
Media aritmética marginal de Y
fy i i
5·0  10·1  8·2  2·3  3·4  2·5
y i 1
  1.8
n 30
Varianza marginal de Y
k 2
 f i  yi  y 
 y2  i 1

n
5·(0  1.8) 2  10·(1  1.8) 2  8·(2  1.8) 2  2·(3  1.8) 2  3·(4  1.8) 2  2·(5  1.8) 2
  2.0266
30
De igual manera se calcula la Varianza marginal de X
 f x  x  i i
x 
2 i 1
 0.956
n
14. Covarianza
Uno de los objetivos del análisis estadístico bidimensional es detectar la relación que
pudiera existir entre cada una de las variables. Se tratará de medir la intensidad y el
sentido de la relación. Si existe relación estadística diremos que las variables están
correlacionadas o que hay correlación entre ellas. Esto permitirá, entre otras cosas,
estimar una variable a partir de otra.
Existe correlación directa cuando el aumento de una variable implica un aumento de

la otra.
Existe correlación inversa cuando el aumento de una variable implica una

disminución de la otra variable.
La Covarianza es la medida que permite saber el sentido de la correlación. Se define

como:
 x  x y  y 
n
i i
 xy  i 1
n
19/66
Si la covarianza es positiva la correlación es directa; si la covarianza es negativa la

correlación es inversa.
La covarianza también puede representarse como S xy o COV  X , Y 
Si la información estadística viene dada en función de las frecuencias, la covarianza se

expresa como:
 f x  
k
ij i  x yj  y
i 1, j 1
 xy 
n
Para una mayor facilidad de cálculo, se puede usar la expresión equivalente:
f
i 1, j 1
ij xi y j
 xy   x·y
n
15. Coeficiente de Correlación Lineal
El Coeficiente de Correlación Lineal mide también la correlación entre las variables

pero evita el efecto de escala de las variables X e Y. Se define como:
 xy
r
 x y
A “r” también se denomina Coeficiente de Correlación Lineal de Pearson
Propiedades del coeficiente de correlación lineal r :
 1  r  1
 r próximo a +1 indica que hay una alta correlación lineal directa.
 r próximo a -1 indica que hay una alta correlación lineal inversa.
 r próximo a 0 indica que la correlación lineal es débil.
 r  1 o r  1 indica que la correlación lineal es perfecta para los
datos analizados. La nube de puntos cae exactamente sobre la recta.
20/66
Ejemplo Una empresa dedicada a la elaboración y venta de ropa ha realizado los gastos en
publicidad y ha obtenido las ventas que figuran en la siguiente tabla. Los datos vienen
expresados en miles de euros y se refieren a los últimos 10 años.
Hallar el coeficiente de correlación lineal r:
Publicidad Ventas
7,5 200
8 205
8,5 230
10 240
10,5 250
12 270
13 280
14 300
15 310
18 325
Nube de puntos:
400
350
300
Ventas
250
200
150
100
5 7 9 11 13 15 17 19
Publicidad
Se muestra a continuación la tabla que facilita los cálculos estadísticos:

x2 y2
Publicidad Ventas x·y
7,5 200 56,25 40000 1500
8 205 64 42025 1640
8,5 230 72,25 52900 1955
10 240 100 57600 2400
10,5 250 110,25 62500 2625
12 270 144 72900 3240
13 280 169 78400 3640
14 300 196 90000 4200
15 310 225 96100 4650
18 325 324 105625 5850
totales 116,5 2610 1460,75 698050 31700
Para determinar de correlación lineal r, necesitamos conocer las medias marginales, varianzas
marginales y covarianza.
Medias aritméticas marginales:
n n
x i
116.5
y i
2610
x i 1
  11.65 y i 1
  261
n 10 n 10
21/66
Varianzas marginales:
 x   x 
n n 2
i x i
2 1460.75
x  2 i 1
 i 1
x   11.65 2  10.36
n n 10
 y   y 
n n 2
i y i
2 698050
y  2 i 1
 i 1
y   2612  1684.2816
n n 10
Desviaciones típicas marginales:
 x   x 2  10.36  3.22
 y   y 2  1684.2816  41.04
Covarianza:
k
f
i 1, j 1
ij xi y j
31700
 xy   x·y   11.65·261  129.35
n 10
Coeficiente de correlación lineal:
 xy 129.35
r   0.98
 x y 3.22·41.04
El grado de dependencia ente la variable X, gasto en publicidad e Y, ventas, es muy alto, están
directamente relacionadas.
16. Coeficiente de Determinación
Se define el Coeficiente de Determinación como:
2
  xy 
r 
2 
  
 x y
El coeficiente de determinación es siempre mayor o igual que 0 y menor o igual que 1.
0  r2 1
Ejemplo el coeficiente de determinación del Ejemplo 7.1 es:
2
  xy 
r 
2   0.982  0.9604
  
 x y 
22/66
17. Recta de Regresión de Y sobre X

En el supuesto de que sea una recta la función más parecida a la forma de la nube de
puntos, estaremos ante un problema de regresión lineal y estaremos ante dos casos:
 Recta de Regresión de Y sobre X

 Recta de Regresión de X sobre Y
En el primer caso obtendremos valores aproximados de Y conocidos los de la X.

En el segundo, obtendremos valores aproximados de la X conocidos los de la Y.
Por tanto, la recta de regresión permite estimar una variable a partir de otra.
Conviene recordar la ecuación de una recta en el plano: y  a·x  b , donde a es la

pendiente de la recta y b es el punto de corte en el eje de ordenadas o eje Y.
y=a·x+b
Si la variable independiente es X, y la dependiente Y, se define la recta de regresión de Y/X

como:
 xy
y y
x 2
xx  
Propiedades de la recta de regresión:
 La recta de regresión pasa por el punto: x, y  
 Pendiente de la recta. La pendiente tiene el mismo signo que el coeficiente de
correlación lineal.
 xy
 x2
23/66
Ejemplo
La recta de regresión Y/X del Ejemplo 7.1 tiene por ecuación:
 xy
yy x  x  y  261  129 .35
x  11.65  y  12.49·x  115.44
x 2
3.22 2
Por ejemplo, si x=25 mil euros, sustituyendo en la ecuación anterior y operando, obtenemos
una estimación de ventas de y=427.69 mil euros
18. Coeficiente de regresión de la recta Y/X
Se define el coeficiente de regresión de la recta Y/X como
 xy
Coef. de Regresión 
 x2
El coeficiente de regresión coincide con la pendiente de la recta de regresión.
 Si el coeficiente de regresión es mayor que 0, la recta es creciente.

 Si el coeficiente de regresión es menor que 0, la recta es decreciente.
 Si el coeficiente de regresión es igual que 0 la recta es horizontal.
Ejemplo el coeficiente de regresión de la recta Y/X del Ejemplo 7.1 es:

 xy
Coef. de Regresión   12.49
 x2
19. Recta de Regresión de X sobre Y
Si la variable independiente es Y, y la dependiente X, se define la recta de

regresión de X/Y como:
 xy
xx y  y
 y2
24/66
20. Coeficiente de regresión de la recta X/Y
Se define el coeficiente de regresión de la recta X/Y como

 xy
Coef. de Regresión 
 y2
 Si el coeficiente de regresión es mayor que 0, la recta es creciente.

 Si el coeficiente de regresión es menor que 0, la recta es decreciente.
 Si el coeficiente de regresión es igual que 0 la recta es vertical.
Observación: las dos rectas de regresión se cortan en el punto x, y  

Ejemplo
La siguiente tabla muestra la temperatura media en grados centígrados, y la precipitación en

3
mm tomadas en el Observatorio de Sierra Nevada durante un año.
 X , Y  Será la variable aleatoria bidimensional donde

X: Temperatura ºC
Y: Precipitaciones mm3
2 2
Temperatura Precipitación x i ·y i xi yi
Diciembre -3.65 152.4 -556.26 13.3225 23225.76
Enero -2.45 117.7 -288.365 6.0025 13853.29
Febrero -2.35 110.6 -259.91 5.5225 12232.36
Marzo -1.7 115.5 -196.35 2.89 13340.25
Abril -0.5 78.4 -39.2 0.25 6146.56
Mayo 6.15 74.7 459.405 37.8225 5580.09
Junio 9.6 31.7 304.32 92.16 1004.89
Julio 13.55 3.4 46.07 183.6025 11.56
Agosto 13.05 5.3 69.165 170.3025 28.09
Septiembre 7.6 61.7 468.92 57.76 3806.89
Octubre 3.85 105.4 405.79 14.8225 11109.16
Noviembre -0.2 124.4 -24.88 0.04 15475.36
totales 42.95 981.2 388.705 584.4975 105814.26
Diagrama de dispersión y la nube de puntos:
25/66
180
160
140
Precipitaciones 120
100
80
60
40
20
0
-5 0 5 10 15
Temperatura
180
160
140
Precipitaciones
120
100
80
60
40
20
0
-5 0 5 10 15
Temperatura
Observando la nube de puntos y su tendencia, se detecta una relación inversa entre

temperatura y precipitaciones.
- Medias aritméticas marginales:
x i
x i 1
 3.57916667
N
N
y i
y i 1
 81.7666667
N
- Covarianza:
 x  x  y i i  y N
 x  y   x  y 
1
 xy  i 1
 i i
N N i 1
 388.705 - 3.57916667  81.7666667   -260.26444

1
 xy 
12
26/66
Varianzas marginales:
 x  x
N
i N
1
x  i 1
 x  x  35.897691
2 2 2
i
N N i 1
2
 y  y
N
i
y  2 i 1
 2132.06722
N
- Coeficiente de Correlación lineal:
 xy - 260.264444
r   -0.9407649
 x y 35.897691 2132.06722
El coeficiente de correlación lineal r=-0.9407 próximo a -1, indica una alta correlación inversa
entre las variables X, Y.
- Coeficiente de Determinación:
2
  
r   xy   - 0.9407649  0.885038
2 2
  
 x y
 xy - 260.264444
- Coeficiente de Regresión de Y sobre X =   7.2501
 2
x 35.897691
 xy - 260.264444
- Coeficiente de Regresión de X sobre Y=   0.12207
 y2 2132.06722
- Recta de regresión de Y sobre X
 xy
y y  x  x 
 x2
y  81.7666667 
- 260.264444
x  3.57916667 
35.897691
y  7.2501·x  107.716241
27/66
160
140
120
100
80
60
40
20
0
-5 0 5 10 15
y  -7.25  x  107.72
- Recta de regresión de X sobre Y
 xy
xx  y  y
 y2
x  -0.12207141·y  13.5605387
180
160
140
120
100
Y
80
60
40
20
0
-5.970886364 X 13.56053867
28/66
Resumen de los cálculos estadísticos:
media x 3.579166667
media y 81.76666667
varianza x 35.89769097
varianza y 2132.067222
desviación típica x 5.991468182
desviación típica y 46.17431345
covarianza -260.2644444
coeficiente de correlación lineal -0.94076497
coeficiente de determinación 0.885038729
coeficiente regresión Y/X -7.250172292
coeficiente regresión X/Y -0.122071406
pendiente Y/X -7.250172292
pendiente X/Y -0.122071406
punto de corte ordenadas Y/X 107.7162417
punto de corte ordenadas Y/X 13.56053867
21. Experimentos aleatorios. Sucesos aleatorios

Un experimento se llama aleatorio cuando el resultado no puede predecirse con
certeza.
Ejemplo El lanzamiento de una moneda es un experimento aleatorio. No sabemos con certeza

si saldrá cara o cruz.
Al conjunto de todos los resultados que pueden obtenerse al realizar un experimento

aleatorio se le llama espacio muestral. Se suele representar por E o  .
Cada subconjunto del espacio muestral se denomina suceso.
Ejemplo En el lanzamiento de una moneda el espacio muestral consta de solo dos elementos
<<cara>> y <<cruz>>.
Algunos tipos de sucesos son:
29/66
- Un suceso se denomina elemental cuando consta de un solo elemento.

- Sucesos compuestos: son los formados por varios sucesos elementales.
- Suceso seguro es aquel que se verifica siempre.
- Suceso imposible es aquel que no puede verificarse.
- Suceso Unión de dos sucesos A y B es el suceso que se realiza cuando lo
hace A o B
- Suceso Intersección: de dos sucesos A y B es el suceso que se realiza
cuando lo hacen A y B
- Suceso Contrario de un suceso A es el suceso que se verifica cuando no se
verifica A. Se representa por A
Ejemplo Un experimento consiste en extraer una carta de la baraja española de 40 naipes. Si el

fenómeno que queremos observar es la carta que ha salido, el espacio muestral será <<as de
oros>>, <<dos de oros>>,…<<rey de bastos>>.
El suceso <<tres de espadas>> es elemental. El suceso <<oros>> no es elemental ya que está

formado por 10 sucesos elementales, <<as de oros>>, <<dos de oros>>,…<<rey de oros>>.
Extraer una carta de las 40 es un suceso seguro. Extraer as de copas y as de oros a la vez es
un suceso imposible.
Ejemplo En el experimento consistente en lanzar un dado, es un suceso elemental

A=<<obtener un 6>>; sin embargo, es un suceso compuesto B=<<obtener cifra par>> o
C=<<obtener múltiplo de 3>>. El suceso D=<<obtener par e impar>> es un suceso imposible.
Dos sucesos A y B son iguales, A=B, si y solo si A  B y B  A
30/66
22. Operaciones con sucesos

Se denomina E al espacio muestral.
Definición: Unión de dos sucesos A y B, es el suceso formado por todos los sucesos
elementales contenidos en A, B o ambos simultáneamente. Se representa por:
A B
Definición: Intersección de dos sucesos A y B, es el suceso formado por todos los
sucesos elementales comunes ambos sucesos. Se representa por:
A B
Dos sucesos A y B son incompatibles si su intersección es el conjunto vacío (A  B=
)
Definición: Complementario o Contrario del suceso A es el suceso que está formado

por todos los sucesos elementales que no están en A. Se representa por:
Ac o A
Definición: Diferencia de los sucesos A y B es el suceso formado por los sucesos
elementales que están contenidos en A, pero que no lo están en B. Se representa por:
A B  A B
Definición: Diferencia Simétrica de dos sucesos está formada por los sucesos
elementales que pertenecen a algunos de los dos sucesos, exceptuando los comunes.
Se representa por:
AB   A  B    A  B 
31/66
A  B es el suceso formado por todos los

Unión elementos de A y todos los elementos de
B.
Intersección
A  B es el suceso formado por todos los
elementos que son, a la vez, de A y de B.
Diferencia
A  B es el suceso formado por todos los
elementos de A que no son de B.
Suceso El suceso AC  E  A se llama suceso

contrario contrario de A.
Propiedades:
Unión Intersección
Conmutativa A B  B  A A B  B  A
Asociativa A  B  C    A  B  C A  B  C    A  B  C
Idempotente A A  A A A  A
Simplificación A  B  A  A A  B  A  A
Distributiva A  B  C    A  B   A  C  A  B  C    A  B   A  C 
Elemento neutro A  A A E  A
Absorción A E  E A  
Además:
A  
A  AC  E
Siendo E el espacio muestral.
32/66
22.1. Leyes de Morgan
( A  B ) c  Ac  B c
( A  B)c  Ac  Bc
Ejemplo
Sea el conjunto A formado por los elementos E1, E4, E6

Sea el conjunto B formado por los elementos E3, E4, E5, E6, E7
A  B  E1, E3, E 4, E5, E 6, E 7

A  B  E 4, E 6
AC  E 2, E3, E 4, E5, E 6, E 7, E8
B C  E1, E 2, E8
A  B  A  B C  E1
B  A  B  AC  E3, E5, E 6
( A  B) c  Ac  B c  E 2, E8
( A  B) c  Ac  B c  E1, E 2, E3, E5, E7, E8
23. Concepto de Probabilidad

La probabilidad es una medida de la aleatoriedad. Representa una medida de las
oportunidades que tiene un suceso de ocurrir.
33/66
Regla de Laplace: <<La probabilidad de un suceso A se obtiene dividiendo el número

de casos favorables al A entre el número de casos posibles>> La regla de Laplace se
aplica siempre si se supone que cada caso tiene igual probabilidad de ocurrir.
Número de casos favorables

P( A) 
Número de casos posibles
Ejemplo
La probabilidad de obtener un 5 al lanzar un dado es 1/6.
La probabilidad de sacar un rey de la baraja española es 4/40.
La probabilidad de tener el número premiado de la Lotería 1/100.000 suponiendo que los

números que se juegan son el 0 al 99.999
1
La probabilidad de acertar la lotería primitiva, haciendo una única apuesta es
 49 
 
6
Desde un punto de vista estadístico, si un experimento se repite n veces bajo las

mismas condiciones y el suceso A ha ocurrido n A veces, se define la probabilidad de
nA
A como el límite de , según n se hace cada vez mayor.
n
Ejemplo:
Supóngase, que en una serie muy larga de repeticiones de la experiencia <<lanzar una
moneda truncada>>, se ha constatado que el 70% de las veces aparece cara. En la práctica se
toma 0.7 como la probabilidad del suceso <<en un lanzamiento resulta cara>>
34/66
24. Definición axiomática de Probabilidad
Definición:
Sea E el conjunto de resultados posibles (espacio muestral) de un experimento

aleatorio. Se llama función de probabilidad a cualquier función de P(E ) en R que
asigna a cada suceso A un número real P( A) que cumple:
I. 0  P A  1
II. P( E )  1
III. P( A  B)  P( A)  P( B)  P( A  B)
Propiedades:

P( A)  P( Ac )  1
 A1, A2, A3,…, An sucesos incompatibles.
Si A  A1  A 2  A 3  ...  A n
P( A)  P( A1 )  P( A2 )  P( A3 )  ...  P( An )
 Si A y B son dos sucesos incompatibles, esto es P( A  B)  0 , entonces:

P( A  B)  P( A)  P( B)  P( A  B)
 La probabilidad de un suceso imposible es 0, P()  0
Ejemplo
Analice el experimento consistente observar el valor de un dado.
P(dado=1)=1/6 , P(dado=2)=1/6, P(dado=3)=1/6 , P(dado=4)=1/6 , P(dado=5)=1/6 ,

P(dado=6)=1/6
P(E)=P(sacar un número al tirar un dado)=1
Sea A sacar un número par y B sacar 5. Como A y B son incompatibles
P(AUB)= P(A)+ P(B)=3/6+1/6=4/6=2/3
Sea A sacar “1”, “2”, “5”.

c
P(A)+P(A )=P(“1”, “2”, “5”)+ P(“3”, “4”, “6”)=3/6+3/6=1
Sea A sacar un número par y B sacar un número divisible por 3. A={2, 4, 6} y B={3, 6}.
3 2 1 4 2
P( A  B)  P( A)  P( B)  P( A  B)     
6 6 6 6 3
35/66
c c
Probabilidad de no sacar 5. Sea A={1, 2, 3, 4, 6} y A ={5}. Como P(A)+P(A )=1 se puede
despejar P(A), P(A)=1-
c
P(A )=1-(1/6)=5/6
Probabilidad de sacar más de 3. A={4, 5, 6}; P(A)=3/6=1/2
Ejemplo De una baraja de 40 cartas se extrae una carta ¿cuál es la probabilidad de extraer
oros o figuras?
1
Sea el suceso A=<<la carta obtenida es oros>>, P( A) 
4
3
Sea el suceso B=<<la carta obtenida es una figura>>, P( B ) 
10
El suceso <<la carta obtenida es oros o figura >> corresponde a A  B
A  B y P A  B  
3
El suceso <<la carta obtenida es oros y figura >> corresponde a
40
P A  B   P A  PB   P A  B  
1 3 3 19
Entonces   
4 10 40 40
Si A es un suceso cualquiera y A es su contrario, PA  1  P A
Ejemplo Sea el suceso A =<<la carta obtenida es oros de una baraja de 40 cartas>>
1
P( A)  . La probabilidad del suceso A =<<la carta obtenida NO es oros de una baraja de
4
1 3
40 cartas>> es P( A)  1  
4 4
25. Probabilidad condicionada

Definición:
La Probabilidad Condicionada se define como la probabilidad de que aparezca un

suceso A sabiendo que ya se ha presentado el suceso B. Que se haya presentado el
suceso B nos da una información a la hora de calcular la probabilidad de A.
La probabilidad condicionada se expresa:
P( A  B)
P( A / B) 
P( B)
36/66
Ejemplo:
El experimento consistente observar el valor de un dado.

Sea A: el resultado es menor que 4. y A={1, 2, 3}. P(A)=3/6
Sea B: sacar un número par, B={2, 4, 6} P(B)=3/6
¿Cuál es la probabilidad de sacar un número menor que 4 sabiendo que el resultado ha sido
par?
Se pregunta por la probabilidad condicionada, donde la información que sabemos, el suceso A,

nos dice que el resultado es par.
1
P( A  B) P({2}) 1
P( A / B)   6
P( B) P({2,4,6}) 3 3
6
26. Independencia de Sucesos
Definición:
Dos sucesos A y B son independientes si y solo si P( A / B)  P( A)
Como consecuencia se verifica:
P( A  B)  P( A)  P( B)
Si A1, A2, A3,…, An son independientes, entonces:
P( A1  A2  A3 ...  An )  P( A1 )  P( A2 )  P( A3 )...  P( An )
Ejemplo
Se considera el experimento de lanzar dos monedas. El espacio muestral es: E={(CC), (CX),
(XC), (XX)}
Sean los sucesos A={(CX), (XC)} y B={(CX), (XX)}
P(A)=1/2 Y P(B)=1/2.
Luego los sucesos A y B son independientes.
P( A  B)  P((C, F ))  1 / 4  P( A)  P( B)
37/66
Ejemplo
En la lotería nacional se extraen 5 bolas numeradas del 0 al 9 de 5 bombos. El sacar bolas de

distintos bombos da idea de la independencia de estos sucesos, ya que en nada afecta lo que
salga en un bombo a la hora de extraer otra bola de otro bombo.
La probabilidad de que salga el número 00000 es 1/100000, un caso favorable entre 100000
números posibles.
Por otra parte, la probabilidad de que salga el número 00000 es la probabilidad de que salga el
0 en el bombo 1, 0, en el bombo 2… 0 en el bombo 5
P(“0” U “0” U “0” U “0” U “0” U “0” )= P(“0”) P(“0”) P(“0”) P(“0”) P(“0”)
5 5
P(“0”)=(P(“0”)) =(1/10) =1/100.000
Ejemplo: La probabilidad de que un hombre y una mujer vivan dentro de 25 años son 0.8 y 0.85
respectivamente. Hallar la probabilidad de que dentro de 25 años:
a) Vivan los dos

b) Viva uno de los dos
c) Ninguno viva
d) Viva solo la mujer
c c
Sea H y M los sucesos de que hombre y mujer vivan dentro de 25 años, y H y M los sucesos
de que no vivan dentro de 25 años. Por tanto:
c c
P(H)=0.8, P(M)=0.85, P(H )=0.20, P(M )=0.15
Por el contexto del problema, los sucesos H y M son independientes.
(a) P(H  M)= P(H) P(M)=0.8·0.85=0.68

(b) P(H  M)= P(H) +P(M)- P(H  M)=0.80+0.85-0.68=0.97
P(H  M )= P(H ) P(M )=0.2·0.15=0.03
c c c c
(c)
P(H  M)= P(H ) P(M)= 0.2·0.85=0.17
c c
(d)
H M
0.12 0.68 0.17
38/66
27. Probabilidad Total
Teorema de la Probabilidad Total: Si A1, A2, A3,…, An son sucesos incompatibles

(disjuntos entre sí) del espacio E, tal que
E=A1 U A2 U A3 U,…, U An
Entonces la probabilidad de cualquier suceso S  E verifica
P(S )  P( A1 ) P(S / A1 )  P( A2 ) P(S / A2 )  ...  P( An ) P(S / An )
Ejemplo
Consideremos un experimento aleatorio y supongamos que su espacio muestral asociado es E.

Sean los sucesos A1, A2, A3, A4 una partición de E, cuyas probabilidades se conocen. Sea B
un suceso cualquiera del espacio muestra. El siguiente esquema representa esta situación.
El Teorema de la Probabilidad Total indica que la probabilidad de B es :
P( B)  P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 )  P( A3 ) P( B / A3 )  P( A4 ) P( B / A4 )
Obsérvese que también se cumple:
P( B)  P( B  A1 )  P( B  A2 )  P( B  A3 )  P( B  A4 )
Ya que:
P( B  A1 )  P( A1 ) P( B / A1 )
P( B  A2 )  P( A2 ) P( B / A2 )
P( B  A3 )  P( A3 ) P( B / A3 )
P( B  A4 )  P( A4 ) P( B / A4 )
39/66
Ejemplo En una ciudad el 55% de la población en edad laboral son hombres, un 15% está en
paro. Entre las mujeres el paro es del 25%.Si en una ciudad se elige al azar una persona en
edad laboral ¿cuál es la probabilidad de que esté en paro?
Sean los sucesos H= hombre activo, M= mujer activa, P= parado. Los sucesos H: Hombre, M:
Mujer son incompatibles y su unión es el espacio muestral E, población en edad laboral.
Si elegimos una persona en edad laboral, la probabilidad de que esté en paro resulta ser,
aplicando el teorema de la probabilidad total:
P(P)=P(H)P(P/H)+ P(M)P(P/M)
P(H)=55/100 “probabilidad de ser hombre en edad laboral”
P(M)=45/100 “probabilidad de ser mujer en edad laboral”
P(P/H)=15/100 “probabilidad de estar parado siendo hombre”
P(P/H)=25/100 “probabilidad de estar parado siendo mujer”
Sustituyendo en la expresión de la probabilidad total:
P(P)=P(H)P(P/H)+ P(M)P(P/M)=(55/100)(15/100)+(45/100)(25/100)=0.195.
19.55% de probabilidad de estar en paro la persona elegida al azar.
40/66
28. Teorema de Bayes
Teorema de Bayes: Si A1, A2, A3,…, An son sucesos incompatibles (Ai  Aj=  si i≠j)
del espacio E, tal que
n
E=A1 U A2 U A3 U,…, U An= A
i 1
i
Entonces la probabilidad de que ocurrido el suceso S, la causa sea el suceso Ai es
P( Ai ) P( S / Ai ) P( Ai ) P( S / Ai )
P( Ai / S )  n

 P( A ) P( S / A )
P( S )
i i
i 1
P( Ai ) P( S / Ai )
P( Ai / S ) 
P( S )  P( A1 ) P( S / A1 )  P( A2 ) P( S / A2 )  ...  P( An ) P( S / An )
Ejemplo
Sea el mismo ejemplo anterior, donde se considera un experimento aleatorio y supongamos

que su espacio muestral asociado es E. Sean los sucesos A1, A2, A3, A4 una partición de E,
cuyas probabilidades se conocen. Sea B un suceso cualquiera del espacio muestra. El
siguiente esquema representa esta situación.
El Teorema Bayes permite obtener P( A1 / B) :
P( A1 ) P( B / A1 )
P( A1 / B) 
P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 )  P( A3 ) P( B / A3 )  P( A4 ) P( B / A4 )
41/66
Ejemplo: Un trabajador debe tomar el tren para ir al trabajo. Si coge el de las 7h la probabilidad
de llegar puntual a su trabajo es de 0.9; si lo pierde llega tarde el 40% de las veces. Sabiendo
que lo pierde el 20% de las veces, cual es la probabilidad de que:
a) Llegue puntual;
b) Haya cogido el tren de las 7h sabiendo que ha llegado puntual a su trabajo.
c) Haya perdido el tren si ha llegado tarde.
Los sucesos posibles son
C = coger el tren a las 7h
NC = no coger el tren
P = llegar puntual
T = llegar tarde
(a) Se aplica el teorema de la probabilidad total. “probabilidad de ser puntual” es P(P)
P(P)=P(C)P(P/C)+ P(NC)P(P/NC)=0.8·0.9+0.2·0.6=0.84
De aquí se deduce que si no llega puntual es que llega tarde, su complementario, y que
P(T)=1-P(P)=0.16
(b) Teorema de Bayes; P(C/P)
P(C ) P( P / C ) P(C ) P( P / C )
P(C / P)  
P(C ) P( P / C )  P( NC ) P( P / NC ) P( P)
P(C/P)=(0.8·0.9)/0.84=6/7
(c) Teorema de Bayes; P(NC/T)
P( NC ) P(T / NC ) P( NC ) P(T / NC )
P( NC / T )  
P( NC ) P(T / NC )  P(C ) P(T / C ) P(T )
P(NC/T)=(0.2·0.4)/0.16=1/2
42/66
29. Ejercicios
Ejercicio 1:
Describe el espacio muestral asociado a cada uno de los siguientes experimentos aleatorios:
a. Lanzar tres monedas.

b. Lanzar tres dados y anotar la suma de los puntos obtenidos.
c. Extracción de dos bolas de una urna que contiene cuatro bolas blancas y tres negras.
d. El tiempo, con relación a la lluvia, que hará durante tres días consecutivos.
Solución
a. Llamando C a obtener cara y X a la obtención de cruz, obtenemos el siguiente espacio

muestral:
E={(CCC),(CCX),(CXC),(XCC),(CXX),(XCX),(XXC),(XXX)}
b. E={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18}
c. Llamando B a sacar bola blanca y N a sacar bola negra, tenemos:
E={BB,BN,NN}
d. Si llamamos L al día lluvioso y N al día sin lluvia, para tres días consecutivos se obtiene
el siguiente espacio muestral:
E={(LLL),(LLN),(LNL),(NLL),(LNN),(NLN),(NNL),(NNN)}
Ejercicio 2:
Se considera el sexo de los hijos de las familias de tres hijos. Sea A el suceso el hijo mayor es
una hembra, y B el suceso los dos hijos pequeños son varones. ¿Cuáles son los elementos de
A y B?
Solución:
Llamando V a ser varón y H a ser hembra, el espacio muestral está formado por los sucesos
elementales:
E={(VVV),(VVH),(VHV),(HVV),(VHH),(HVH),(HHV),(HHH)}
Y los sucesos A y B son compuestos y están formados por los siguientes sucesos elementales:
A={(HHH),(HHV),(HVH),(HVV)}
B={(VVV),(HVV)}
Ejercicio 3
Tenemos una urna con nueve bolas numeradas del 1 al 9. Realizamos el experimento, que
consiste en sacar una bola de la urna, anotar el número y devolverla a la urna. Consideramos
los siguientes sucesos: A="salir un número primo" y B="salir un número cuadrado". Responde a
las cuestiones siguientes:
a. Calcula los sucesos y .

b. Los sucesos A y B, ¿son compatibles o incompatibles?.
c. Encuentra los sucesos contrarios de A y B.
43/66
Solución:
Los sucesos A y B están formados por los sucesos elementales que pueden verse a
continuación:
A = {2,3,5,7}
B = {1,4,9}
A partir de estos conjuntos, tenemos:
1. La unión e intersección de A y B son:
= {1,2,3,4,5,7,9}
=Ø
2. Al ser = Ø, los sucesos A y B son incompatibles.
3. El suceso contrario de A es = {1,4,6,8,9}

El suceso contrario de B es = {2,3,5,6,7,8}
Ejercicio 4:
Se lanzan dos dados equilibrados con seis caras marcadas con los números del 1 al 6. Se
pide:
a. Halla la probabilidad de que la suma de los valores que aparecen en la cara superior
sea múltiplo de tres.
b. ¿Cuál es la probabilidad de que los valores obtenidos difieran en una cantidad mayor
de dos?
Solución:
El espacio muestral del experimento es:
E = {(1,1); (1,2); (1,3); (1,4); (1,5); (1,6); (2,1); ...; (6,6)}
y está formado por 36 sucesos elementales equiprobables. Constituyen el número de casos

posibles del experimento.
Utilizando la regla de Laplace, calculamos las probabilidades de los sucesos que nos piden:
a. Si llamamos A al suceso "obtener una suma múltiplo de 3", los casos favorables al
suceso A son:
A = {(1,2); (2,1); (1,5); (2,4); (3,3); (4,2); (5,1); (3,6); (4,5); (5,4); (6,3); (6,6)}.
Por tanto, P( A ) = 12/36 = 1/3
b. Si llamamos B al suceso "obtener unos valores que se diferencian en una cantidad

mayor que dos", los casos favorables al suceso B son:
B = {(1,4); (4,1); (1,5); (5,1); (1,6); (6,1); (2,5); (5,2); (2,6); (6,2); (3,6); (6,3)}.
44/66
Por tanto, P( B ) = 12/36 = 1/3
Ejercicio 5:
Si escogemos al azar dos números de teléfono y observamos la última cifra de cada uno,
determina las probabilidades siguientes:
a. Que las dos cifras sean iguales.

b. Que su suma sea 11.
c. Que su suma sea mayor que 7 y menor que 13.
Solución:
El espacio muestral de este experimento está formado por los cien sucesos elementales: 00,
01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, ..., 98, 99. Para cada sucesos del enunciado
calculamos sus casos favorables, aplicamos la regla de Laplace y obtenemos:
a. Los casos favorables son: 00, 11, 22, ..., 99. La probabilidad de que las últimas cifras
sean iguales es:
P(últimas cifras iguales) = 10/100 = 1/10 = 0.1
b. Los casos favorables a que la suma de las últimas cifras sea 11 son: 29, 38, 47, 56, 65,
74, 83 y 92. Por tanto,
P(últimas cifras suman once) = 8/100 = 0.08
c. Deben contarse los números de dos cifras cuya suma sea 8, 9, 10, 11 y 12. Haciendo
un recuento ordenado, se obtienen 43 casos favorables. La probabilidad buscada es:
P(últimas cifras suman un valor mayor que 7 y menor que 13) = 43/100 = 0.43
Ejercicio 6:
En una caja tenemos 15 bolas blancas, 30 bolas negras y 45 bolas verdes. Si extraemos tres
bolas simultáneamente, ¿cuál es la probabilidad de que salga una bola de cada color?
Solución:
Calcularemos los casos posibles del experimento y los casos favorables al suceso del
enunciado para aplicar la regla de Laplace.
Los casos posibles son las distintas formas de extraer 3 bolas entre 90. Como el orden no debe
tenerse en cuenta, estos casos son:
Los casos favorables son 15 · 30 · 45 = 20 250. Éstas son las formas de agrupar tres bolas de
distinto color. La probabilidad pedida es:
45/66
Ejercicio 7:
Se tiran tres dados al mismo tiempo. Encuentra la probabilidad de que:
a. La suma de los números aparecidos sea menor que 8.

b. La suma de los números sea mayor que 4 y menor que 8.
Solución:
Los casos posibles de este experimento son las 216 ternas siguientes: 111, 112, 121, 211, ...,
665, 666.
Realizando un recuento ordenado de los casos favorables a los sucesos del enunciado,
obtenemos las siguientes probabilidades a y b respectivamente:
Ejercicio 8:
Se lanzan dos dados:
a. ¿Cuál es la probabilidad de obtener una suma de puntos igual a 7?

b. Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados
haya salido un tres?
Solución:
Sean los sucesos A="la suma de los puntos es 7" y B="en alguno de los dados ha salido un
tres".
a. Los casos posibles al lanzar dos dados son 36 y los casos favorables al suceso A son
los seis siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1). Por tanto, P( A )=6/36=1/6
b. En este caso, el suceso B/A es salir en algún dado 3, si la suma ha sido 7.

Observamos que esta situación ocurre en las parejas (3,4) y (4,3). Por tanto,
P( B/A )=2/6=1/3
Ejercicio 9:
Se consideran dos sucesos, A y B, asociados a un experimento aleatorio con P(A)=0.7;

P(B)=0.6; P( )=0.58.
a. ¿Son independientes A y B?
b. Si M A, ¿cuál es el valor de P( / )?
46/66
Solución:
a. Para ver si son independientes, comprobaremos si P( A B ) = P( A ) · P( B )
P( ) = P[(A B)c] = 1 - P(A B)
Por tanto, P(A B) = 1 - P( ) = 1 -0.58 = 0.42
Por otro lado, P( A ) · P( B ) = 0.7 · 0.6 = 0.42
Luego, A y B son independientes, pues P( A B ) = P( A ) · P( B ) = 0.42
b. M A . Por tanto,
Ejercicio 10:
Una compañía dedicada al transporte público explota tres líneas de una ciudad, de forma que
el 60% de los autobuses cubre el servicio de la primero línea, el 30% cubre la segunda y el
10% cubre el servicio de la tercera línea. Se sabe que la probabilidad de que, diariamente, un
autobús se averíe es del 2%, 4% y 1%, respectivamente, para cada línea. Determina la
probabilidad de que, en un día, un autobús sufra una avería.
Solución:
El suceso "sufrir una avería" (Av) puede producirse en las tres líneas, (L1, L2, L3). Según el
teorema de la probabilidad total y teniendo en cuenta las probabilidades del diagrama de árbol
adjunto, tenemos:
P(Av) = P(L1) · P(Av/L1) + P(L2) · P(Av/L2) + P(L3) · P(Av/L3) =

= 0.6 · 0.02 + 0.3 · 0.04 + 0.1 · 0.01 =
= 0.012 + 0.012 + 0.001 = 0.025
47/66
Ejercicio 11:
Una empresa del ramo de la alimentación elabora sus productos en cuatro factorías: F1, F2, F3
y F4. El porcentaje de producción total que se fabrica en cada factoría es del 40%, 30%, 20% y
10%, respectivamente, y además el porcentaje de envasado incorrecto en cada factoría es del
1%, 2%, 7% y 4%. Tomamos un producto de la empresa al azar. ¿Cuál es la probabilidad de
que se encuentre defectuosamente envasado?
Solución:
Llamando M = "el producto está defectuosamente envasado", se tiene que este producto puede
proceder de cada una de las cuatro factorías y, por tanto, según el teorema de la probabilidad
total y teniendo en cuenta las probabilidades del diagrama de árbol adjunto, tenemos:
P(M) = P(F1) · P(M/F1) + P(F2) · P(M/F2) + P(F3) · P(M/F3) + P(F4) · P(M/F4) =

= 0.4 · 0.01 + 0.3 · 0.02 + 0.2 · 0.07 + 0.1 · 0.04 =
= 0.004 + 0.006 + 0.014 + 0.004 = 0.028
Ejercicio 12:
Una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la
prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad de
que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno en el
que dé negativo?
p(+|NE) = 0,04 ; p(-|NE) = 0,96

p(-|E) = 0,05 ; p(+|E) = 0,95
p(E) = 0,07 ; p(NE) = 0,93
48/66
Ejercicio 13:
Tres máquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las
piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas
máquinas son del 3%, 4% y 5%.
a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.

b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber
sido producida por la máquina B.
c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza
defectuosa?
Solución:
Sea D= "la pieza es defectuosa" y N= "la pieza no es defectuosa". La información del problema
puede expresarse en el diagrama de árbol adjunto.
a. Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D), por la
propiedad de la probabilidad total,
P(D) = P(A) · P(D/A) + P(B) · P(D/B) + P(C) · P(D/C) =

= 0.45 · 0.03 + 0.30 · 0.04 + 0.25 · 0.05 = 0.038
b. Debemos calcular P(B/D). Por el teorema de Bayes,
c. Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D) ya calculado.

Aplicando el teorema de Bayes, obtenemos:
49/66
La máquina con mayor probabilidad de haber producido la pieza defectuosa es A
Ejercicio 14:
Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y C con 2
bolas rojas y 3 negras. Escogemos una urna al azar y extraemos una bola. Si la bola ha sido
roja, ¿cuál es la probabilidad de haber sido extraída de la urna A?
Solución:
Llamamos R= "sacar bola roja" y N= "sacar bola negra". En el diagrama de árbol adjunto
pueden verse las distintas probabilidades de ocurrencia de los sucesos R o N para cada una de
las tres urnas.
La probabilidad pedida es P(A/R). Utilizando el teorema de Bayes, tenemos:
50/66
30. Introducción a las funciones de Probabilidad

Se tratarán en este tema las características de un distribución de probabilidad, asignar
probabilidades a sucesos mediante una distribución de probabilidad, interpretar el
significado de la esperanza matemática (la media) y la varianza.
31. Distribución de Probabilidad Discreta

Cuando se realiza un experimento aleatorio y se hace recuento de las frecuencias se
tiene una distribución de frecuencias. Cuando las frecuencias se sustituyen por las
probabilidades teóricas se tiene una distribución de probabilidad.
La distribución de probabilidad es un modelo matemático (teórico) que trata de explicar
los resultados de un experimento aleatorio real. Este modelo permite asignar
probabilidades a los distintos sucesos o realizar conjeturas sin necesidad de llevar a
cabo el experimento.
51/66
Ejemplo En la mesa de dados de un casino se han jugado una noche 1000 partidas al juego de
azar de lanzar dos dados y apostar a la suma de los resultados. Un observador atento ha
anotado el número de veces que se ha producido cada suma, obteniéndose la siguiente
distribución de frecuencias:
SUMA 2 3 4 5 6 7 8 9 10 11 12
FRECUENCIAS 29 50 82 100 140 188 132 115 80 54 30
Teóricamente se pueden calcular las probabilidades de la suma de los dos da dos que son:
11 1
P(2)  P(sacar 1 y 1)  
6 6 36
11 11 2
P(3)  P(sacar 1 y 2 o sacar 2 y 1)   
6 6 6 6 36
11 11 11 3
P(4)  P(sacar 1 y 3 o sacar 3 y 1 o sacar 2 y 2)    
6 6 6 6 6 6 36
En la siguiente tabla muestra las probabilidades teóricas y el número aproximado de veces que
debería salir cada resultado con las esas probabilidades teóricas
SUMA 2 3 4 5 6 7 8 9 10 11 12
PROBABILIDAD 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
por 1000 partidas 28 56 83 111 139 166 139 111 83 56 28
52/66
32. Definición de la probabilidad a partir de las frecuencias

relativas
Este apartado trata de definir la probabilidad a partir de “un número muy grande de
observaciones”. A esta probabilidad se la llama a posteriori, pues se establece
después de haber realizado el experimento. Si un experimento se ha realizado n veces
y en m de ellas se ha verificado el suceso A, decimos que P(A)=m/n
Ejemplo En el ejemplo anterior las frecuencias determinan la probabilidad a posteriori
SUMA 2 3 4 5 6 7 8 9 10 11 12
FRECUENCIA 29 50 82 100 140 188 132 115 80 54 30
PROBABIDAD
29/100 50/10 82/10 100/10 10/10 188/10 132/10 115/10 80/10 54/10 30/10
A
0 00 00 00 00 00 00 00 00 00 00
POSTERIORI
Ejemplo
Si de 500 personas consultadas, oyen la radio 325, podemos decir que la probabilidad de oír la
radio es 325/500 (un 65% ya que (325/500)·100=0.65)
33. Variable aleatoria discreta

Definición:
Variable aleatoria es una función que toma valores de acuerdo con un experimento
aleatorio
Ejemplo En el lanzamiento de dos dados donde se observa la suma de los puntos obtenidos, la
variable aleatoria S=<<suma de sus resultados>> puede tomar los valores 2, 3, 4, 5, 6,…,12.
Definición:
Una variable aleatoria es discreta si puede tomar un conjunto finito de valores o un

conjunto numerable de valores.
53/66
Si X es una variable aleatoria discreta que puede tomar los valores x1, x2, x3, …, xn las
probabilidades respectivas serán:
P( X  x1 ), P( X  x2 ), P( X  x3 ), ..., P( X  xn )
Además, la suma de las probabilidades de estas probabilidades es 1.
 P( X  x ) P( X  x )  P( X  x
i 1
i 1 2 )  P( X  x3 )  ...  P( X  xn )  1
Ejemplo Se lanzan dos dados. El espacio muestral de 36 elementos es:
E  {(1,1), (1,2), (1,3)...(6,5), (6,6)}
Sea X la variable aleatoria discreta X =<<suma de sus resultados>>, entonces X podrá

tomar los siguientes valores:
X (1,1)  2
X (1,2)  3
X (1,3)  4
...
X (6,5)  11
X (6,6)  12
P X (1,1)  
1
La probabilidad de obtener un 2 es
36
P X (1,2) o X (2,1)  
2
36
P X (1,6) o X (6,1) o X (5,2) o X (2,5) o X (4,3) o X (3,4)  

6
36
xi 2 3 4 5 6 7 8 9 10 11 12
P X  x i  1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Además:
P( X  2)  P( X  3)  P( X  4)  ...  P( X  10)  P( X  11)  P( X  12) 

1 2 3 4 5 6 5 4 3 2 1
           1
36 36 36 36 36 36 36 36 36 36 36
54/66
34. Distribución de Probabilidad. Función de Distribución de

una variable aleatoria discreta
Definición:
Una función de probabilidad f (x) de una variable aleatoria discreta X es una

función tal que:
f ( x )  P  X  xi 
Queda determinada si conocemos cuanto vale la probabilidad de la variable aleatoria

discreta para cada suceso.
Si P( X  x1 ), P( X  x 2 ), P( X  x3 ), ..., P( X  x n )
entonces
f ( x1 )  P( X  x1 ); f ( x 2 )  P( X  x 2 ); f ( x3 )   P( X  x3 );...; f ( x n )  P( X  x n )
La función de probabilidad f (x) toma calores entre 0 y 1.
Ejemplo sea la variable aleatoria discreta X =<<suma de sus resultados>>, entonces X

tendrá una función de probabilidad:
xi 2 3 4 5 6 7 8 9 10 11 12
f  xi  1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Si f (x) es una función de probabilidad, entonces:
 f (x )  1
i 1
i
Ejemplo en el ejemplo anterior:
n
1 2 3 4 5 6 5 4 3 2 1
 f ( x )  36  36  36  36  36  36  36  36  36  36  36  1
i 1
i
55/66
Definición:
La Función de Distribución F (x) , de la variable aleatoria discreta X se define:
F ( xi )  P( X  xi )  P( X  x1 )  P( X  x2 ), ...,  P( X  xi )
o
F ( xi )  f ( x1 )  f ( x2 ), ...,  f ( xi )
o
F ( xi )   f ( xi )
xi  x
La función F (x) mide la probabilidad de que la variable aleatoria tome valores

menores o iguales que x.
Ejemplo sea la variable aleatoria discreta X =<<suma de los resultados al lanzar dos dados>>,
entonces X tendrá una función de distribución:
xi 2 3 4 5 6 7 8 9 10 11 12
F  xi  1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36
36/36
=1
Ejemplo: Al lanzar cuatro monedas se obtienen los siguientes resultados (variaciones con
4
repetición de 2 elementos cogidos de 4 en 4, 2 =16)
E={CCCC, CCCX, CCXC, CXCC, XCCC, CCXX, CXCX, CXXC, XCCX, XCXC, XXCC, CXXX,
XCXX, XXCX, XXXC, XXXX}
La variable aleatoria C=<<número de caras al lanzar cuatro monedas>> puede tomar los
valores 0, 1, 2, 3, 4. La función de distribución de probabilidad y la Función de distribución son:
Caras=n 0 1 2 3 4
Distribución de Probabilidad P(C=n) 1/16 4/16 6/16 4/16 1/16
Función de Distribución P(C<=n) 1/16 5/16 11/16 15/16 16/16=1
56/66
35. Media o Esperanza matemática de una distribución de

probabilidad discreta
Como sucede con las variables estadísticas, algunos rasgos significativos pueden
deducirse conociendo su media y su varianza.
Definición:
Dada una distribución de probabilidad f(x), se define la media o esperanza

matemática de la variable aleatoria X como:
n
   xi f ( xi )
i 1
n
   xi P ( X  xi )
i 1
La esperanza matemática o media, es un valor teórico. Indica el valor promedio que

cabría esperar al realizar un experimento aleatorio un gran número de veces.
Ejemplo La media de la variable aleatoria C=<<número de caras al lanzar cuatro monedas>>

del ejemplo anterior es:
1 4 6 4 16 0  4  12  12  4
  0·  1·  2·  3·  4·  2
16 16 16 16 16 16
Este valor esperado coincide con el número de caras que intuitivamente cabe esperar por
término medio.
36. Varianza de una distribución de probabilidad discreta
Definición:
La varianza es una medida del grado de concentración de los valores de la variable

aleatoria en torno a su media. Se define la Varianza de una variable aleatoria X
discreta como:
57/66
n
   P( X  xi )( xi   ) 2
2
i 1
n
   f ( xi )( xi   ) 2
2
i 1
Definición:
La Desviación Típica es la raíz cuadrada de la varianza:
  2
Al igual que la varianza de una variable estadística, la varianza de una variable

aleatoria discreta se puede expresar también como:
n n
 2   f ( xi )( xi   ) 2   f ( xi )( xi ) 2  
i 1 i 1
Ejemplo La varianza de la variable aleatoria X=<<número de caras al lanzar cuatro monedas>>

del ejemplo anterior es:
1 2 4 6 4 16 0  4  24  36  16
 2  02·  1 ·  22·  32·  42·  22   4 1
16 16 16 16 16 16
37. Distribución Binomial
La Distribución Binomial es una distribución discreta asociada a fenómenos

aleatorios con dos únicos resultados posibles que en general se denominarán éxito y
fracaso.
La distribución Binomial se caracteriza por las siguientes propiedades:
- Se realizan n ensayos, cada uno de los cuales tiene dos únicas opciones
complementarias que se denominan éxito (E) y fracaso (F).
- La probabilidad de éxito es la misma para cada ensayo, P(E)=p.
- La probabilidad de fracaso, P(F)=q, es la misma en cada ensayo y su valor es
q=1-p.
- La variable aleatorias X=<<número de éxitos en n ensayos>> puede tomar
valores 1, 2, 3,…, n.
Si la variable aleatoria X tiene una distribución binomial, se representa por B(n, p)
58/66
Ejemplo El experimento aleatorio consistente en lanzar 25 veces una moneda y anotar el

número de caras obtenidas corresponde a una distribución binomial B(25, ½); esto es n=25,
p=1/2, q=1
(1/2)=1/2.
Si X es una distribución binomial B(n, p), la probabilidad de r éxitos en n repeticiones

de experimento viene dado por
 n  r nr
P(X  r)    p q
r
En particular:
n  n
P(X  0)    p 0 q n0  q n ; P(X  n)    p n q nn  p n
0  n
La probabilidad de que el número de éxitos sea menor o igual que r es:
P(X  r)  P(X  0)  P(X  1)  P(X  2)  ...  P(X  r)
r
n
P(X  r)     p i q n i
i 0  i 
La probabilidad de que el número de éxitos sea mayor que r es:
P(X  r)  P(X  r  1)  P(X  r  2)  ...  P(X  n) ; P(X  r)  1  P(X  r)
59/66
Ejemplo
La probabilidad de que un jugador de baloncesto meta una canasta de 3 puntos es 0.25.
Si efectúa nueve lanzamientos de tres puntos ¿Cuál es la probabilidad de que meta dos
canastas?
La variable aleatoria X=<<número de canastas de tres puntos al lanzar 9 veces>> sigue una
distribución Binomial
B(9, 0.25).
9 9 9! 9!
P(X  2)    p 2 q 92   0.2520.757  0.2520.757  0.2520.757  0.30
 2  2 2!(9  2)! 2!·7!
¿Cuál es la probabilidad de que meta al menos dos canastas?
P(X  2)  P(X  2)  P(X  3)  ...  P(X  9)

Es mas corto calcular
9 9
P(X  2)  1 - P(X  2)  1 - P(X  0)  P(X  1)   1   0.2500.759   0.2510.758  0.6996
0 1
¿Cuál es la probabilidad de que falle seis?
Es igual que calcular la probabilidad de que acierte tres canastas.

9 9! 9·8·7·6!
P(X  3)   0.2530.756  0.2520.757  0.2530.756  0.2336
 3 3!(9  3)! 3!·6!
Ejemplo: En un cierto hospital se comprobó que la aplicación de un determinado tratamiento en

enfermos de cirrosis produce una cierta mejoría en el 80 por ciento de los casos.
Se aplica el tratamiento a 8 personas, se pide calcular
a) Probabilidad de que mejoren 5.
Si llamamos M a la variable aleatoria <<Número de personas que mejoran al aplicar el

tratamiento a 8 personas>>, la variable sigue una distribución binomial B(8, 0.8)
8 8!
P(M  5)   0.80 5 0.20 3  0.80 5 0.20 3  0.1468
 
5 5! (8  5)!
b) Probabilidad de que mejoren al menos 3

8 8
P(X  3)  1 - P(X  3)  1 - P(X  0)  P(X  1)   1   0.80 0 0.208   0.8010.20 7  0.9988
 0 1
37.1. Parámetros de una Distribución Binomial
60/66
La media de la distribución binomial B(n, p) es:
  n·p
La varianza de la distribución binomial B(n, p) es:
 2  n·p·q
La desviación típica de la distribución binomial B(n, p) es:
  n·p·q
Ejemplo Un examen consta de 100 preguntas con tres respuestas posibles cada una, de las
que solo una es cierta. Si se responde al azar, ¿cuál será la media de aciertos? ¿y la varianza?
Sea la variable aleatoria X=<<acertar la pregunta>>. La distribución de X es el de una

distribución binomial B(100, 1/3), ya que el examen consta de 100 preguntas y la probabilidad
de éxito es de 1/3.
La media será n·p=100·1/3 y la varianza n·p·q=100·1/3·2/3
Ejemplo En el ejemplo 8.3 ¿Cuál es el número de personas que se espera que mejoren?
El número de personas que se espera que mejoren es la media de la variable M, es decir

  n·p  8·0.8  6.4 personas.
Ejemplo En una ciudad se encontró que el 20 por ciento de los hogares estaban asegurados
contra incendios. Con objeto de establecer una encuesta en el área, una compañía de seguros
selecciona cinco hogares al azar.
¿Cuál es el número de hogares que se espera estén asegurados?
Sea A la variable <<estar asegurado al tomar cinco hogares>>, que se distribuye como una
Binomial B(5, 0.2).
El número de hogares que se espera estén asegurados es la media de A, por tanto es
  n·p  5·0.2  1
38. Distribución de Probabilidad Continua

Una distribución es continua cuando la variable aleatoria asociada puede tomar como
valores todos los números reales en un intervalo de la recta real.
61/66
En una distribución continua, las probabilidades no nulas se asignan a los intervalos,

mientras que la probabilidad de un valor concreto es cero. Por tanto, a diferencia de la
variable aleatoria discreta en que a cada valor le hacíamos corresponder una
probabilidad, en la variable aleatoria continua es a cada intervalo al que hacemos
corresponder una probabilidad.
Si una distribución de probabilidad está ligada a una variable aleatoria continua se

llama distribución de probabilidad continua.
Ejemplo: La probabilidad de que una persona mida exactamente 178.548564135485 cm. no

tiene sentido. Se dice que la probabilidad de elegir a una persona y que mida esa altura es
cero. Tiene sentido hablar de cual es la probabilidad de que una persona mide entre 175.5 y
180 cm.
Ejemplo Una carrera popular en la que participan miles de ciudadanos y emplean en el

recorrido desde 1 hora hasta 2 horas. La variable aleatoria X=<<duración de la carrera en
minutos>> es continua. A la hora de representar una variable aleatoria continua suele usarse
tablas con los datos agrupados en intervalos.
0,4
0,35
0,3
0,25
frecuencia
X absoluta 0,2
0,15
[60, 70) 0.05 0,1
[70, 80) 0.35 0,05

0
[80, 90) 0.3 [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120)
[90, 100) 0.15

[100, 110) 0.1
[110, 120) 0.05
TOTAL 1
39. Función de Densidad

Se tiene definida una función de probabilidad continua cuando se conoce una función
f(x). Esta función permite hallar, por medio del cálculo de áreas, las probabilidades en
las funciones de distribución continuas. A la función f(x) se la lama Función de
Densidad de la variable aleatoria X.
Definición:
Dada una variable aleatoria X, para que una función f(x) sea función de densidad de
X debe cumplir las siguientes propiedades:
- f(x)  0
-  f(x)dx  1
62/66
40. Función de Distribución

Definición:
Dada una variable aleatoria X que toma valores en el intervalo [a, b], se llama función
de distribución de X a la función F(x) definida por
F ( x)  P( X  x)
41. Distribución Normal

Multitud de fenómenos sociales y naturales se asocian se ajustan a esta distribución.
La estatura, el peso, el diámetro craneal, el consumo de agua per cápita, el cociente
intelectual de los individuos, la distribución de errores en una serie de medidas, etc.
son fenómenos que se rigen por una distribución normal.
La distribución normal se presenta en poblaciones donde los casos extremos son raros
y la mayoría de los valores se agrupan en torno a una media. Los tipos medios son los
que aparecen con mayor frecuencia.
La función de densidad de la distribución normal es una función de tipo

exponencial
1  x 
2
1   
2  
f ( x)  e
 2
Si X sigue una distribución normal, se representa por X ~ N ( ,  )
La representación gráfica de esta función se denomina campana de Gauss. Las

características de esta función son:
- El dominio de definición es toda la recta real.
- f(x) es simétrica respecto de la media.
- El máximo de f(x) se alcanza en x
- La curva tiene un asíntota horizontal en y=0 cuando x tiende a infinito y a
menos infinito.
- El área comprendida entre la curva y el eje OX desde menos infinito hasta k es
el valor de la probabilidad P(X<=k)
63/66
Distribución Normal
0.0120
0.0100
0.0080 El valor
de 
f(x)
0.0060
0.0040
determina
0.0020
la
amplitud
0.0000
210 270 330 390 450 510 570
1  X  
2 
1   
2  
f ( x)  e    X  ,      ,   0
2 
Características matemáticas Características estadísticas


1)  f (x)dx  1

1) Dado que la distribución normal es
continua, solamente pueden calcularse
2) f(x) > 0 para todo x probabilidades para intervalos del espacio
3) Cuando x =   f `(x) = 0 (má
(máximo en  ) muestral de X, ya que para culaquier x0,
Cuando x =  +  ó x =  -   f ``(x) = 0 P(X=x0) = 0
(dos puntos de inflexió
inflexión)
4) Es simétrica alrededor de  2) P(  -  < X <  +  ) = 0.6833
P(  - 2 < X <  + 2
2 ) = 0.9544
5) lim f ( x )  0 P(  - 3 < X <  + 3
3 ) = 0.997
x 
6) Es más o menos amplia según 
64/66
41.1. Distribución Normal estándar
La función de densidad de una variable aleatoria normal es complicada y por lo tanto

difícil de integrar. Se han tabulado las probabilidades de una clase particular de la
familia normal, que se llama Normal Estándar, N(0, 1).
Si la variable aleatoria. X tiene distribución N(, ) siempre se puede obtener la forma

estandarizada haciendo la transformación:
X 
Z

Y se dice que Z se distribuye N(0,1) o que Z tiene una distribución “normal
estandarizada”.
Al proceso de hallar Z se le denomina tipificación o normalización de la variable
aleatoria X.
Ejemplo Si X sigue una distribución normal de media 15 y varianza 9, esto es X ~ N (15,3) ,

entonces, la normalización de X es:
X  15
Z
3
Ejemplo Sea la variable aleatoria Z que sigue una distribución Normal N(60, 10). Sea conocida
la distribución de la N(0, 1)
Hallar a probabilidad P( Z  70)
 Z  60 70  60   Z  60 10   Z  60 
P( Z  70)  P    P    P  1  PN (0,1)  1  0.1587
 10 10   10 10   10 
42. Distribución Normal como aproximación de una Binomial

Bajo determinadas condiciones (para n grande y tanto p como q no estén próximos a
cero) la distribución Binomial B(n, p) se puede aproximar mediante una distribución
normal
B(n, p ) ~ N (  ,  )
  n· p
  n· p·q
B(n, p ) ~ N (n· p, n· p·q
65/66
Ejemplo Durante cierta epidemia de gripe, enferma el 30% de la población. En un aula con 200
estudiantes, determinar el tipo de distribución y aproximar a una normal B(200, 0.30) que
puede aproximarse a una normal

N 200·0.30,  
200·0.30·(1 - 0.30)  N 200·0.30,  
200·0.30·0.70  N 60, 42  La
media de la distribución es 60 y la varianza 42.
66/66

Esta Di Stica Probab Il I Dad

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Esta Di Stica Probab Il I Dad

Caricato da

Copyright:

Formati disponibili

ESTADÍSTICA Y PROBABILIDAD

32. DEFINICIÓN DE LA PROBABILIDAD A PARTIR DE LAS FRECUENCIAS RELATIVAS .......................... 53

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa

La Estadística, en general, es la ciencia que trata de la recopilación, organización

La Estadística descriptiva se ocupa de tomar los datos de un conjunto, organizarlos

La Estadística inferencial trata sobre la elaboración de conclusiones, partiendo de los

En la Estadística actual se utilizan métodos de Análisis Matemático, surgiendo la

 Población: conjunto de todos los elementos que son objeto de estudio

 Individuo: es cada uno de los elementos de la población.

Ejemplo Precio del litro de gasóleo de la gasolinera de la Avenida de la Aviación, Madrid.

 Muestra: subconjunto de elementos de la población. Se suelen tomar muestras

 Tamaño de la población: es el número de individuos de la población.

 Tamaño de la muestra: es el número de individuos de la muestra

Las variables estadísticas se pueden clasificar de la siguiente forma:

 Variable estadística cualitativa: representa un carácter no medible. Se

 Variable estadística cuantitativa: representa un carácter medible. Se

o Variable estadística discreta: Son aquellas que toman valores en

o Variable estadística continua: Son aquellas que pueden tomar

4. Ordenación de datos. Tabla de frecuencias

- Llamamos Frecuencia Absoluta de un valor x i de la variable estadística X , y

- Llamamos Frecuencia Relativa de un valor x i de la variable estadística X , y se

donde n es el número total de individuos de la muestra o población.

- Llamamos Frecuencia Absoluta Acumulada de un valor x i de la variable

- Llamamos Frecuencia Relativa Acumulada de un valor x i de la variable

Ejemplo Sea X la variable estadística “calificación de un examen”. Se presentan 10 alumnos y

La información concerniente a la variable estadística X se muestra en la siguiente tabla de

Calificación fi fri Fi Fri

Veámoslo con el ejemplo anterior, donde X es la variable estadística “calificación de un

Calificación X fi fri Fi Fri

Gráfica de frecuencias acumuladas:

La representación de variables cualitativas suele hacerse con diagrama de sectores.

Es conveniente reducir la información obtenida a un solo valor para facilitar la

Si la información estadística viene dada en función de las frecuencias, entonces la

Ejemplo En el ejemplo anterior, X la variable estadística “calificación de un examen”, la media

Otras medidas centralizadoras son:

La relación entre las distintas medias es:

Media Armónica Media Geométrica Media Aritmética

Moda M o : valor de la variable estadística que se presenta con mayor frecuencia

Rango o amplitud de recorrido es la diferencia entre el mayor y el menor de los

Si la información estadística viene dada en función de las frecuencias, entonces la

A efectos de un cálculo de la varianza más sencillo, se desarrolla la expresión de  2

Ejemplo Cálculo sencillo de la varianza a partir de la tabla de frecuencias. Sea X la variable

La Desviación Típica es la raíz cuadrada de la varianza:

Ejemplo La desviación típica del ejemplo anterior es    2  3.04  1.7435

El Coeficiente de Variación sirve para comparar diferentes muestras, ya que un menor

Una Variable Estadística Bidimensional recogerá la información de dos caracteres

En el estudio de esta relación se plantean dos problemas diferentes, aunque

 Estudiar el grado de causas comunes entre ambas, problema denominado

10. Variable Estadística Bidimensional

- Dos caracteres cualitativos: sexo y color del pelo de una persona.

En el caso de caracteres cuantitativos, las variables que representan sus valores

- X discreta, Y discreta: Número de hermanos, número de hijos de una persona.

11. Diagrama de dispersión. Nube de puntos

La representación sobre unos ejes cartesianos de los distintos valores de la variable

Sean los valores de la variable estadística bidimensional (X, Y) y su diagrama de dispersión. X

6 82 260 Esperanza de vida /

12. Tablas de doble entrada

Dada una variable estadística bidimensional  X , Y  , se considera el número de

El caso general vendría determinado cuando X e Y tenga las siguientes modalidades

 Se define frecuencia relativa frij como:

La tabla de doble entrada recogerá las frecuencias absolutas de cada modalidad

La tabla de doble entrada adopta la siguiente forma:

Donde fij es la frecuencia absoluta, las veces que se repite la modalidad xi , y j en  