Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADISTICA
1
UNIDAD I
2
Definición de Estadística
POBLACION Y MUESTRA
Población:
Muestra:
3
componentes de la población y la muestra. Al número de individuos que forman
la muestra se llama tamaño muestral (n). La muestra debe ser representativa
de la población y con ello queremos decir que cualquier individuo de la
población en estudio debe haber tenido la misma probabilidad de ser elegido.
o Ahorrar tiempo.
o Ahorrar costes.
o Estudiar la totalidad de los pacientes o personas con una
característica determinada en muchas ocasiones puede ser una tarea
inaccesible o imposible de realizar.
o Aumentar la calidad del estudio.
o La selección de muestras específicas nos permitirá reducir la
heterogeneidad de una población al indicar los criterios de inclusión
y/o exclusión.
Muestreo:
VARIABLES
4
a. Variables cuantitativas. Son las variables que pueden medirse,
cuantificarse o expresarse numéricamente. Las variables
cuantitativas pueden ser de dos tipos:
o Variables cuantitativas continuas, si admiten tomar
cualquier valor dentro de un rango numérico determinado
(edad, peso, talla).
o Variables cuantitativas discretas, si no admiten todos los
valores intermedios en un rango. Suelen tomar solamente
valores enteros (número de hijos, número de partos,
número de hermanos, etc).
5
Ejercicios
6
Tarea: Investigar 5 variables de cada tipo.
Tipos de muestreo
Muestreo probabilístico
Son de selección azarosa o aleatoria, tienen el mayor rigor científico, todos los
elementos de la población pueden ser escogidos para formar la muestra. Se
divide en:
7
Este procedimiento, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
1+Ne2 1+(60)(0.1)2
Sea k=N/n y sea h un número al azar entre los k primeros de una lista
de todos los elementos poblacionales.
8
población y que permite obtener la muestra del tamaño deseado. El
valor h se debe elegir aleatoriamente e indica el punto de inicio para
seleccionar los elementos de la muestra. Veamos unos ejemplos para
entenderlo mejor.
Ejemplo
2, 6, 10, 14, 8.
Ejemplo 2
9
Como en ese caso, k=20/6=3.33, el valor se redondea por abajo (se
trunca) es decir se toma k=3. Esto se hace así, porque si
redondeáramos hacia arriba, no habría elementos suficientes en la
población para extraer la muestra.
10
Muestreo no probabilístico: la muestra se obtiene atendiendo al criterio
del investigador, o por razones de tiempo, economía, material o
comunidad, no utiliza el azar. Puede ser:
11
12
Ejercicios Unidad 1 Estadística
Solución
25= ____x____
50 58,340
13
2. En una encuesta realizada a 223 alumnos de EMS sobre su preferencia
para comprar libros de texto, 78 prefieren comprar el libro de matemáticas,
¿Cuántos libros espera vender Editorial Santillana en la zona escolar si hay 8
escuelas con 300 alumnos cada una?
Solución
223 2,400
14
3. Se encuestó a un grupo de alumnos de la Institución para organizar un
evento donde tocará “grupo de rock”, se predijo que asistirán unos 1,240
chavos (as), pues de 350 encuestados, 84 confirmaron asistir a dicho evento,
¿Cuántas personas conforman la población?
Solución
N= 5,166.6
15
a. 10% error (90% confianza)
b. 5% error (95% confianza)
c. 1% error (99% confianza)
d. 0% error (100% confianza)
Es decir, cuando se quiere un error de 10% en los datos, basta con tener una
muestra de 93 alumnos.
Es decir, cuando se quiere un error de 5% en los datos, basta con tener una
muestra de 312 alumnos.
16
Elvira realizó este tipo de muestreo y obtuvo los siguientes números:
17
1) Muestreo aleatorio sistémico: donde s=600/24=25, si escogiera al 5
como número bse, la muestra estaría compuesta por: 5, 5 + 25, 30,
25….
2) Muestreo estratificado: obtener un alumno aleatoriamente de cada
grupo en particular.
3) Muestreo por conglomerado: obtener aleatoriamente un grupo y escoger
a 24 alumnos de dicho grupo.
Se producen 10 pantalones y se
someten a pruebas para ver su
resistencia y duración, una vez
satisfechas, las pruebas se lanza
al mercado a gran escala.
18
Tito desea saber quien de los
habitantes de su pequeña
población, no paga el servicio de
agua potable.
19
c) ¿De qué tamaño sería la muestra si e=0.05?
3. Usa una fórmula para calcular n con base a la población N. Anota tus
conclusiones y toma el valor de e=5% para todos los casos.
a) N=100 b) N=780
20
c) N= 25,340 d) N=3,428,326
21
b) Si hubiese usado el 1% de error, ¿cuántos chicos hubiera encuestado?
a) La empresa Mac sacará al mercado una nueva versión del iPad, ¿qué
variables a debe estudiar para que su lanzamiento sea exitoso????
22
b) La empresa HP fabrica mini-laps, algunas variables a considerar para que
sus productos sean de calidad son:
d) HBO lanzará una nueva serie juvenil, menciona algunas variables que puede
tomar en cuenta para concretar su proyecto:
23
Satisfacción del aula de medios de tu
Institución.
Postre favorito.
24
c) Un paquete de cartón de Bachoco contiene 24 huevos, uno se rompió
durante su transporte, si en un camión se espera que se rompan 300, ¿cuántos
huevos se transportaron en total?
Producto Final 1
25
ESTADÍSTICA DESCRIPTIVA
1. Introducción
26
La estadística inferencial se refiere a la estimación de parámetros y pruebas
de hipótesis acerca de las características de la población en base a los datos
obtenidos con una muestra.
xi xi
x̄=∑ μ=∑
n n
xi 19
x̄=∑ = =1 .73
n 11
~
Mediana: ( x ) Los datos de "n" observaciones son ordenados del más
pequeño al más grande, Si el tamaño de la muestra es "non" la mediana es
el valor ordenado en la posición (n+1)/2,
Cuando el tamaño de la muestra es "par" la mediana es el promedio de los
dos valores que se encuentran al centro del conjunto de valores. Se puede
calcular mediante:
( n/2 )+ ( [ n/2 ] + 1 )
2
27
Ordenando los datos de mayor a menor se obtiene:
1.60,1.65,1.67,1.67,1.70,1.73,1.74,1.79,1.79,1.82,1.84;
68.7,34.3,97.9,73.4,8.4,42.5,87.9,31.1,33.2,97.7,72.3,54.2,80.6,71.6,82.2,
8.4,31.1,33.2,34.3,42.5,54.2,68.7,71.6,72.3,73.4,80.6,82.2,87.9,97.7,97.9,
los valores a eliminar son: 8.4 y 97.9; calculando la media de los datos
(~x , .20 )=63. 82
restantes obtenemos
Medidas de dispersión
28
2, 3, 4, 5, 6 con media = 20/5 = 4
4 + 1 + 0 + 1 + 4 = 10
Es una medida que nos ayuda a comprender la variabilidad de los datos, que
tan distanciados están de la media
2 ( xi− x̄ )2
σ =∑
n
29
2
2 ( xi− x̄ )
s =∑
n−1
(xi− x̄ )2
Para el caso de una población
σ=
√ ∑ n
( xi− x̄ )2
Para el caso de una muestra
s=
√ ∑ n−1
12. 14
CV t = (100 )=12 . 05 %
78. 7
Por otra parte si la media de temperaturas es de 10 y su desviación estándar
de 2, el CVs de las temperaturas es:
30
2
CV s = (100 )=20 %
10
Muestra 1: Muestra 2
⃗x =248 ⃗x =248
n-1=5 n-1 = 5
790 7510
s= √ 5 = 12.56 s= √ 5 = 38.75
31
CV = 12.56/248*100= 5.06% CV = 38.75/248*100 = 15.625
Ejemplo 5:
Cada conjunto de datos ordenado tiene tres cuartiles que lo dividen en cuatro
partes iguales. El primer cuartil es ese valor debajo del cual clasifica el 25% de
las observaciones y sobre el cual se encuentra el 75% restante. El segundo
cuartil divide a los datos a la mitad similar a la mediana.
P
L p =(n+1 )
100
Donde:
32
Lp es el sitio del percentil deseado en una serie ordenada
n es el número de observaciones
P es el percentil deseado
3 10 19 27 34 38 48 56 67 74
4 12 20 29 34 39 48 59 67 74
7 14 21 31 36 43 52 62 69 76
9 15 25 31 37 45 53 63 72 79
10 17 27 34 38 47 56 64 73 80
35
L35=(50+1 ) =17 . 85
100
33
Q3: es el número que representa al percentil 75 (hay 75% de los datos
por debajo de este).
DIAGRAMA DE CAJA
1 10 4
1050
Weight
950
Q3 + 1.5 RIC
Q3 850
Q2 Mediana
Q1
Q1 – 1.5RIC
Rango
Intercuartílico
= RIC = Q3 – Valores
Q1 atípicos Bigotes
34
frecuencias. Para construir un histograma es necesario tener un mínimo de 50
a 100 datos. Se tienen las siguientes definiciones:
Ejemplo 6
2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
35
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
Menos de 50 5–7
50 a 100 6 – 10
100 a 250 7 – 12
Más de 250 10 – 20
36
Paso 5: Calcular los limites de clase de cada intervalo: [0-8], [ 9-17], etc.,
considerando que el tamaño del intervalo representa la diferencia entre dos
límites de clase adyacentes ya sean inferiores o superiores.
Paso 6: Contar el número de valores que caen en cada intervalo utilizando una
hoja de registro, de esta manera se obtiene la frecuencia para cada intervalo.
Tabla 1.
1 0 -8 IIIII 5
3 18-26 IIIII I 6
11 90-98 IIIII 5
Histograma
30
25
20
Frecuencia
15 Frecuencia
10
5
0
9 18 27 36 45 54 63 72 81 90 99
Clase
37
Diagrama de tallo y hojas
Es otra representación de la información, primero se ordenan los dígitos
principales a la izquierda de una línea vertical. A la derecha de esta línea se
registra el último dígito para cada dato conforme se revisan las observaciones
en el orden en que se registraron. Por ejemplo:
Con Minitab: Stat > EDA > Steam and leaf… Indicar columna de datos,
increment = 10
Stem-and-leaf of Respuest N = 50
2 6 89
8 7 233566
16 8 01123456
(11) 9 12224556788
23 10 002466678
14 11 2355899
7 12 4678
3 13 24
1 14 1
X̄ g =
∑ fM
n
38
Donde
Ejemplo:
(Presión) (días) M fM F
50 3935.0
3935
X̄ g = =78 . 7
50
39
Primero se identifica la clase donde se encuentra la mediana cuya F es >= n /
2, en este caso la clase de 70 a 79 con punto central de clase = 74.5.
n/2−F 50/2−10
Mediana=~
X =Lmd +
[ f md ]
(C )=70+
18 [ ]
10=78 . 33 pasajeros
Donde:
Primero se halla la clase que tenga la frecuencia más alta, en este caso la
clase 70 a 79.
Da
Moda=Lmo +
[ Db+ D a ] (C )=70+
[ 18−7
(18−12 )+(18−7 ) ]
10=76 . 47
Donde:
Lmo es el límite inferior de la clase modal con la frecuencia más alta (70).
40
Db es la diferencia entre la frecuencia de la clase modal y la clase que le sigue
(18 – 12 = 6)
2∑ fM 2 −n X̄ 2
s=
n−1
s= √ s2
3935.0 31690
2.50
41
3935
X̄ g = =78 . 7
50
2
2 316902. 50−50 (78 . 7 )
s= =147 . 31 pasajeros
49
s=12 .14 pasajeros
EL TEOREMA DE TCHEBYSHEV
1
(1− )%
Establece que para todo conjunto de datos por lo menos K2de las
observaciones se encuentran dentro de K desviaciones estándar de la media,
con K >= 1.
1 1
(1−
K2
)%= 1−
( )
32
%=88 . 89 %
42
95.5% de las observaciones se encuentran dentro de 2 desviaciones
estándar de la media
SESGO
En la distribución normal si no es simétrica y tiene una cola más amplia del lado
derecho, se dice que existe un sesgo a la derecha y viceversa.
3( X̄ −Mediana)
P=
s
43
Otra estimación del sesgo o coeficiente de asimetría se hace a través de
momentos estadísticos (diferencias contra la media) como lo sugiere Fisher:
(X i X)j
Mj i 1
j 1, 2,3, 4
n
n
1
∑ ( Xi− X̄ )3
n i=1
γ 1= 3 /2
M3 1
n
Sesgo= β^ 1 =
M 32 /2 o
( ∑ ( Xi− X̄ )2
n i =1 ) Para la distribución normal
debe ser 0.
Por ejemplo:
Ejemplo de una distribución con sesgo positivo o sesgada hacia la derecha con
Sesgo = 1.08
44
CURTOSIS
45
Ejemplo de curva más picuda que la normal Curtosis = 0.76
Indicar las variables de las cuales se quieren obtener las estadísticas básicas y
la variable categórica si se desean varios grupos.
46
Seleccionar las gráficas opcionales para los datos: Histograma, diagrama de
caja y de puntos.
47
Variable Línea Q3 Maximum
2 4121.5 4202.0
Boxplot of Caja
22.5
20.0
17.5
15.0
Caja
12.5
10.0
7.5
5.0
Histograma en Minitab:
48
Histogram of DATOS
40
Frequency 30
20
10
0
-10 20 50 80 110
DATOS
60
50
40
30
20
10
5
0.1
0 30 60 90 120
DATOS
49
USO DE EXCEL
Columna1
50.053769
Media 2
Error típico 1.9738137
Mediana 49.345
Moda 50.1
Desviación 22.504938
estándar 8
Varianza de la
muestra 506.47227
-
Curtosis 0.4466339
Coeficiente de -
asimetría 0.0352296
Rango 94.37
Mínimo 2.41
Máximo 96.78
Suma 6506.99
Cuenta 130
50
EJERCICIOS:
BTU.In_1
51
7.69 9.58 11.09 13.43
d) Establecer conclusiones
52
UNIDAD II
53
PERMUTACIONES
Permutación de 5 elementos
P5 = 5! Por lo que:
Pn = n!
P5 = 5! = 5 x 4 x 3 x 2 x 1 = 120
Ejemplo 1:
Solución:
P3 = 3! = 6
Ejemplo 2:
En una asamblea de accionistas, hay 6 personas que han solicitado hacer uso de la
palabra ¿En cuántas órdenes diferentes pueden hablar, si es que no se ha establecido
un orden de prioridades?
Solución:
Ejemplo 3:
Solución:
54
A B C D E F
P4 = 4! = 24 formas diferentes
n!
Pn,r = (n−r)!
Ejemplo 4:
Si : n = 5 y r = 3
5! 5 ! 120
= = =60
P5,3 = (5−3 )! 2! 2
Ejemplo 5:
Hay 7 candidatos para desempeñar 3 tareas, si todos los candidatos son igualmente
eficientes, ¿De cuántas maneras se puede efectuar la asignación?
Solución:
7! 7! 7.6.5.4!
= = =210
P7,3 = (7−3)! 4! 4!
Ejemplo 6:
3F 4T 4T 2C
P3 = 3! P4 = 4! P4 = 4! P2 = 2!
P4 = 4!
55
En conclusión… Qué es una permutación?
El orden si importa.
Si entran todos los elementos,
Pero no se repiten todos los elementos.
2. Sin repetición: por ejemplo los tres primeros en una carrera. No puedes
quedar primero y segundo a la vez.
Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las
permutaciones posibles son:
n × n × ... (r veces) = nr
Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y eliges 3
de ellos:
56
Así que la fórmula es simplemente:
nr
Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar? Después de elegir por ejemplo
la "14" no puedes elegirla otra vez.
16 × 15 × 14 × 13 ... = 20,922,789,888,000
Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.
4! = 4 × 3 × 2 × 1 = 24
7! = 7 × 6 × 5 × 4 × 3 × 2 × 1 = 5040
57
1! = 1
Así que si quieres elegir todas las bolas de billar las permutaciones serían:
16! = 20,922,789,888,000
Pero si sólo quieres elegir 3, tienes que dejar de multiplicar después de 14. ¿Cómo lo
escribimos? Hay un buen truco... dividimos entre 13!...
16 × 15 × 14 × 13 × 12 ...
= 16 × 15 × 14 = 3360
13 × 12 ...
La fórmula se escribe:
La fórmula se escribe:
Ejemplos:
58
16! 16! 20,922,789,888,000
= = = 3360
¿De cuántas maneras se pueden dar primer y segundo premio entre 10 personas?
= = = 90
(10-2)! 8! 40,320
Notación
59
1. Dibuja las combinaciones de las figuras si se hacen grupos de 4.
a)
b)
60
c)
d)
e)
61
2. Dibuja las permutaciones de las figuras, excluyendo la estrella, es decir, grupos de
2 figuras:
a) g)
b) h)
c) i)
62
d) j)
e) k)
d) l)
2. ¿De cuántas formas distintas pueden sentarse ocho personas en una fila de
butacas?
Sí importa el orden.
63
3. ¿ En cuántas formas diferentes pueden sacarse cuatro cartas (a la vez)de un
paquete de 52 cartas?
64
Combinaciones :
Una combinación de “ n ” elementos tomados de “ r ” en “ r ” es un subconjunto no
ordenado de “r” elementos con r ≤ n.
Ejemplo 1:
a) un elemento
Solución:
Notación: nCr;
(nr )
n!
Crn=
r !(n−r )!
Ejemplo :
Si n = 10 r = 7
65
Ejemplo 2:
La comisión directiva se forma con 6 integrantes y este año han sido propuestos 7
representantes mexicanos y 4 ingleses para ser electos. Se pide determinar de
cuántas maneras se puede integrar la comisión en los siguientes casos:
Solución:
7!
C74= =35
a) Los mexicanos se pueden escoger de: 4!. 3!
4!
C24 = =6
2 !.2!
7
Conjuntamente : C 4 . C24 = 35 x 6 = 210
4 7
1) 2 ingleses y 4 mexicanos: C2 C 4 = 6 x 35 = 210
Ejemplo 3:
66
practicadas por el departamento de personal. ¿De cuántas maneras pueden asignarse
las 3 plazas?
Solución:
a) C14
3 = 364
14 !
14 P3 = =2184
b) 11!
A uno de ellos se debe entregar el material a las 8:30 al otro a las 9:00 y al
siguiente a las 9:30 y así sucesivamente hasta el último . Si existe la posibilidad de
variar el orden de entrega de material a cada hospital, entonces de cuantas formas
distintas se entrega el material.
67
4. Cuántos objetos distintos deben existir para que el número de combinación que se
puede formar , tomándolos de 2 en 2 sea igual a 6 veces el número de objetos
5. Calcular :
35 !*28!
a )K =
27 !*36 !
29 !
b )K =
27 !+28 !
36 !+37 !
c ) K=
37 !−36 !
SESION 02
COMBINACIONES
Análisis Combinatorio
Suponga que una persona tiene 2 formas de ir de una ciudad A a otra ciudad B; y una
vez llegada a B, tiene 3 maneras de llegar a otra ciudad C, ¿De cuántas maneras podrá
realizar el viaje de A a C pasando por B?
68
La persona tuvo 6 formas diferentes de realizar el viaje que son:
Por lo que el principio fundamental del análisis combinatorio, puede expresarse así:
a x b x c x ... x z
Ejemplo 1: ¿De cuántas maneras diferentes podrá vestirse un joven que tiene 3
camisas diferentes, 4 pantalones y 2 pares de calzado?
Solución:
3 x 4 x 2 = 24 maneras diferentes
Ejemplo 2: En una ciudad los números de teléfono constan de 5 dígitos, cada uno de
los cuales se llama con alguno de los 10 dígitos (0 al 9). ¿Cuántos números diferentes
pueden formularse?
Solución:
69
10 x 10 x 10 x 10 x 10 = 100,000 números diferentes
Ejemplo 3:
¿Cuántos nombres debe proponer una persona para estar seguro que participa en el
sorteo público?
Notación Factorial
En algunos problemas de matemáticas se nos presentan multiplicaciones de números
naturales sucesivos tal como:
4 x 3 x 2 x 1 = 24 ; 3x2x1=6 ; 2 x 1 = 2.
Para abreviar estas expresiones, se usa una notación especial llamada notación
factorial y nos denota las multiplicaciones sucesivas de n hasta l y se define como:
70
4 x 3 x 2 x 1 = 4! Se lee: “cuatro factorial” o “factorial de cuatro”
Propiedades:
n! = n(n-1)!
Ejemplo: 7! = 7 x 6! = 7 x 6 x 5 x 4!
b) 0! = 1
Ejemplos:
1) 5! = 5 x 4 x 3 x 2 x 1 = 120
3)
4)
5)
Ejemplo:
71
INTRODUCCIÓN A LA PROBABILIDAD
Azar y Desconocimiento.
Azar e incertidumbre.
podemos tener una idea de qué tan probables son los diferentes resultados y
entonces tendremos una situación de riesgo. Esta última es la que llamamos
aleatoria o azarosa.
72
Espacio Muestral y Probabilidad.
ESPACIO MUESTRAL.
Si un juego consiste en tirar todos los volados que hagan falta hasta obtener
tres águilas seguidas o hasta que sean 15 volados, si nos fijamos en el número
de volados requeridos, el espacio muestral es: { 3, 4, 5, . . . , 15 }. Pero si nos
fijáramos en el número de soles que resultan, entonces el espacio muestral es:
{ 0, 1, 2, . . . , 15 }.
Qué se va a hacer.
Qué se va a observar o contar.
73
SUCESOS O EVENTOS.
En el caso de contar cuantos volados hacen falta para conseguir tres águilas
seguidas o tirar 15 volados; el espacio muestral son los números: 3, 4, 5, . . . ,
15.
AASAASSSAAA (aquí nos detenemos porque han caído ya, tres águilas
seguidas), el evento si se realizó porque el número necesario fue 11 y es n ó
n.
SSSAAA (aquí paramos porque ya hay tres águilas), el evento no se realizó.
Otro ejemplo más. Al comprar llantas para mi auto, puede ser que manifiesten
un defecto de fabricación dentro del período de garantía total y que el
fabricante deba reponerlas. También puede pasar que el defecto se manifieste
en el período de garantía parcial y que el fabricante bonifique sólo un
porcentaje o que el defecto se manifieste después de vencido el período de
garantía en cuyo caso el fabricante no paga nada. También puede pasar que
las llantas no tengan defecto de fabricación aparente y que no haya garantía
que reclamar. Como se puede considerar que las llantas que me vendieron se
74
escogieron al azar de entre toda la producción, tenemos un experimento
aleatorio.
Problemas Propuestos:
1. En una caja hay 8 focos de los cuales 3 están fundidos. Se van a sacar los
focos de uno en uno, hasta encontrar los tres fundidos. Si nos fijamos en el
número de focos que se quedan en la caja ¿cuál es el espacio muestral?
2. En el experimento de los volados mencionado arriba. Si nos fijamos en el
número de soles que salieron, describa en sus propias palabras, cuál es el
evento { 0, 1, 2 }. Si los resultados fueron AASAASAAA ¿Por qué se detuvo el
experimento? ¿Se realizó el evento?
3. Júntese con un compañero de este curso y entre los dos discutan y encuentren
un ejemplo de un experimento aleatorio relacionado con las personas que
están en la biblioteca después de las 10 de la noche. Expliquen cuál es el
espacio muestral. Expliquen qué información necesitarían para asignar
probabilidades.
4. Con su mismo compañero, encuentren un ejemplo de un experimento aleatorio
referente a las inscripciones. Detallen el espacio muestral. Propongan un
evento. Den un ejemplo de un resultado que implique que el evento no se
realizó y otro resultado donde el evento sí se haya realizado.
75
76
SESION 05
PRACTICA CALIFICADA
SESION 06
PROBABILIDAD
Aparte del espacio muestral, en cada experimento aleatorio hay una asignación
primaria de probabilidades. Basados en la experiencia o en razonamientos de
simetría, a cada elemento del espacio muestral le asignamos una evaluación
de qué tan factible es. Esta evaluación se refleja en un porcentaje (número
entre 0 y 1). Entre más factible sea el resultado, mayor es el porcentaje que se
le asigna. Los casos extremos son:
Un evento que no puede suceder, tiene probabilidad cero. Muchas veces estos
eventos con probabilidad cero son imposibles por alguna contradicción lógica
en su definición. Por ejemplo: ``que la suma de dos dados sea n ó n y los dos
dados tengan el mismo número''.
En el otro extremo hay eventos que siempre suceden y estos tienen
probabilidad uno. Por ejemplo: ``que el número de águilas en dos volados sea
menor o igual a 7.8'', aunque el evento pueda resultar extraño en su definición,
siempre sucede y tiene probabilidad igual a 1.
Esta función nos da las probabilidades de los eventos simples. Para un evento
compuesto, simplemente sumamos las probabilidades de los elementos que lo
componen.
77
EJEMPLOS.
El espacio muestral es { 1, 2, 3, 4, 5, 6 }.
78
Otro ejemplo: una urna con 50 papelitos numerados de los cuales se escoge
uno para que tenga un premio. El espacio muestral es { 1, 2, 3, . . . , 50 }. La
asignación de probabilidades es de 1 / 50 para cada resultado. Si yo compré
los números 1, 14 y 18; el evento de que yo gane es { 1, 14, 18 } y la
probabilidad de que gane es 3 / 50.
SESION 07
PROBABILIDAD DE SUCESOS
P(B) = 3 / 6 = 0,50
Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a),
es menor que la probabilidad del suceso que lo contiene, suceso b).
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
79
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga
número par, y b) que sea mayor que 3. La intersección de estos dos sucesos
tiene dos elementos: el 4 y el 6.
P(A B) = 2 / 6 = 0,33
SESION 08
PROBABILIDAD DE SUCESOS
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P (A B) = 2 / 6 = 0,33
Por lo tanto,
80
La probabilidad del suceso unión de estos dos sucesos será igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un número par, luego
su complementario, suceso (B), es que salga un número impar.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
Por lo tanto,
81
SESION 09
AXIOMAS DE LA PROBABILIDAD
Teniendo en cuenta las operaciones para hacer conjuntos nuevos, hay algunos
hechos fundamentales respecto a la probabilidad que se cumplen siempre:
P( vacío ) = 0
P(A') = 1- P(A)
P(A - B) = P(A) - P(A y B)
Si A está contenido en B entonces P(A) menor o igual a P(B)
P(A) menor o igual a 1
P(A ó B) = P(A) + P(B) - P(A y B).
82
P(A ó B) = P(A) + P(B) - P(A y B).
Problemas Propuestos
El espacio muestral.
La función de probabilidad.
83
El cálculo de la probabilidad de un evento se simplifica partiéndolo en eventos
más sencillos y uniendo los pedazos de acuerdo a la llamada ley de la adición
para probabilidades.
84
los pedazos son ajenos.
la probabilidad fue la suma de esos pedazos.
Problemas propuestos:
Resuelva estos ejercicios.
85
SESION 10
EXAMEN PARCIAL
SESION 11
PROBABILIDAD CONDICIONAL
86
pronto vamos a darle un nombre a las tres primeras: les llamamos probabilidad
condicional.
P( A | B ) = [P( A y B )] / [P( B )]
Fíjese que esta fórmula se usará cuando haya una manera fácil de calcular las
probabilidades no condicionales y la condicional sea difícil. Eso no fue el caso
con el color de la bola y las urnas.
87
Para ejemplificar el tipo de situación en que nos sirve la fórmula descrita,
considere este problema.
P(B) = 30 / 36.
Porque de las 36 parejas posibles, 6 tienen 5 en el primer dado.
P(A y B) = 4 / 36.
Porque sólo se obtiene 8, con las parejas (2,6), (3,5), (4,4) y (6,2) [La pareja (5,3)
sí suma ocho pero tiene un 5 en el primer dado].
También hubiéramos podido calcular sin la fórmula, pero esa cuenta requiere
más ingenio. En este ejemplo es fácil calcular las probabilidades no
condicionales.
88
1. La probabilidad condicional nos permite medir la información. En los ejemplos
vimos como cambia la probabilidad de A, antes de conocer nada: P(A) y
después de conocer la ocurrencia de el evento B: P(A | B).
2. En un extremo está el cambio enorme que corresponde a que A y B sean
excluyentes (ajenos). En este caso la probabilidad podría llegar incluso a ser
cero.
3. En el otro extremo están los eventos en los que sucede que P(A | B) = P(A).
Esto quiere decir que la información de que B ocurrió no cambia la probabilidad
de A y decimos que A y B son independientes.
89
la vez; en términos geométricos la idea de independencia se asemeja a la
perpendicularidad y la de ``ajenos'' al paralelismo.
Probabilidades conjuntas
Con:
o Para poder usar esta igualdad se necesita saber, de otras fuentes, que
A y B son independientes.
90
o Esta igualdad no es más que la versión de la de arriba cuando P(B | A)
= P(B).
por ejemplo:
91
La generalización de las fórmulas anteriores a más de tres eventos es
inmediata.
2. Cuando se tienen tres eventos, se puede presentar una situación muy curiosa.
Puede pasar que
o A y B sean independientes y
92
o A y C sean independientes y
o B y C también sean independientes.
Pero A, B y C NO sean independientes.
93
puede hacer simplemente multiplicando P(A) P(B) sino que se debe justificar de
alguna otra manera.
94
SESION 12
TEOREMA DE BAYES
prob. prop.
robot
Defect. Proces.
A 0.002 18%
B 0.005 42%
C 0.001 40%
95
Nuestra idea es empezar por descomponer el evento ``defectuoso'' en ``viene
del robot A y es defectuoso'' o ``viene del robot B y es defectuoso'' o ``viene del
robot C y es defectuoso''. En símbolos tendremos
(II) La segunda pregunta es, a la vez más simple y más complicada. Nos va a
llevar a lo que se conoce con el nombre de teorema de Bayes.
96
P( C | d)
P( C y d ) = P(C) P(d|C)
o sea
casi 14%.
O sea que si tomamos una pieza al azar, la probabilidad de que haya sido
soldada por el robot C es alta, 40%. Pero, como ese robot produce sólo 1 de
cada mil soldaduras defectuosas, al saber que la pieza seleccionada es
defectuosa, la probabilidad de que provenga del robot C disminuye a solamente
14%. Esto quiere decir que, en este caso el saber que la soldadura es
defectuosa, nos provee con una gran cantidad de información.
97
Si analizáramos, usando de nuevo la fórmula de Bayes las probabilidades de
los robots A y B, tendríamos
Comparadas con las probabilidades de cada máquina sin saber que la pieza es
defectuosa vemos un gran incremento en la probabilidad de B.
Para apreciar mejor el cambio, pongamos en una sola tabla las probabilidades
iniciales y las condicionales obtenidas bajo el conocimiento de la soldadura de
la pieza.
0.125
A 0.18 0.1802
9
0.734
B 0.42 0.4191
3
0.139
C 0.40 0.4007
9
Es tan grande el éxito de los tres robots en el soldado correcto que el saber
que la pieza no tiene defectos, prácticamente no altera las probabilidades de
producción en uno u otro.
Por el contrario, el robot C es tan bueno, comparado con el B que, al saber que
la pieza es defectuosa, las probabilidades cambian dramáticamente.
98
En este ejemplo el cálculo de probabilidades condicionales nos cuantifica algo
que el sentido común nos dice de otra forma. Note que la fórmula de Bayes nos
sirvió para pasar de las probabilidades no condicionales a las condicionales.
Otro ejemplo clásico del uso del teorema de Bayes es un problema de oro y
plata. Hay tres bolsas que tienen, cada una dos monedas. Las de la primera
son de oro, las de la segunda son de plata y las de la tercera son una de plata
y otra de oro. Se escoge una bolsa al azar y de ella una moneda también al
azar. Si la moneda es de oro, ¿cuál es la probabilidad de que la otra moneda
en la bolsa sea de oro también?
Primero notemos que la segunda bolsa no pudo haber sido elegida (porque no
tiene monedas de oro), sólo pudo haber sido seleccionada la primera o la
tercera. Si la bolsa elegida hubiese sido la tercera, el evento cuya probabilidad
nos interesa no se realiza. De modo que el evento que nos interesa es
equivalente a que se haya elegido la primera bolsa.
P(I|Au) = 2 / 3
99
Si Ud. piensa de acuerdo a este razonamiento (¡erróneo!), es muy difícil que
encuentre en qué se equivoca.
Lo que está mal es que lo que averiguamos, al saber que la moneda extraída
es de oro, es algo más que el rechazo de la segunda bolsa. Si sólo nos dijeran
que la bolsa escogida al azar no fue la segunda, sin informarnos del metal de la
moneda sacada, todavía tendríamos incertidumbre respecto a la primer
moneda; todavía podríamos apostar a si ésta es de oro o de plata. Al decirnos
que la moneda fue de oro, estamos aprendiendo algo más, y eso echa por
tierra el argumento de ``igual probabilidad para las dos bolsas restantes''.
Problemas Propuestos :
a) ¿Cual es la probabilidad de que de los tres hijos, ninguno esté afectado por
la enfermedad?
2. El 60% de los individuos de una población están vacunados contra una cierta
enfermedad. Durante una epidemia se sabe que el 20% la ha contraído y que 2
100
de cada 100 individuos están vacunados y son enfermos. Calcular el porcentaje
de vacunados que enferma y el de vacunados entre los que están enfermos..
101
a) Si a un individuo de tal población se le aplican los ultrasonidos y dan
positivos, ¿cuál es la probabilidad de que sufra la colelitiasis?
102
Se inocula un virus a un animal y contrae la enfermedad. ¿Cuál es la
probabilidad de que el virus que se inocule sea el C?
12. El 70% de los estudiantes aprueba una asignatura A y un 60% aprueba otra
asignatura B. Sabemos, además, que un 35% del total aprueba ambas. Elegido
un estudiante al azar, calcular las probabilidades de las siguientes situaciones:
103
UNIDAD III
104
DISTRIBUCIONES DISCRETAS
Distribución de probabilidad
Distribución Binomial
Para representar que una variable aleatoria X sigue una distribución binomial
de parámetros n y p, se escribe:
X ~ B(n, p)
DISTRIBUCIÓN BINOMIAL
Cada prueba tiene sólo dos posibles resultados: genéricamente los llamamos
éxito y fracaso. Los denotamos con 1 (éxito) y 0 (fracaso).
El resultado de cada prueba es independiente del resultado de las demás
pruebas.
La probabilidad de éxito no cambia de una prueba a otra.
105
Nos interesa sólo el número total de éxitos X y no el orden en que hayan
ocurrido.
donde me he visto obligado por la tipografía, a usar el símbolo poco usual nCk para
denotar las combinaciones de k objetos tomados de un total de n:
Ck = [n!] / [k!(n-k)!]
n
1. ¿En una familia de tres hijos, cuál es la probabilidad de que a lo más 2 sean
niñas? La probabilidad de niña es 0.5; el sexo de cada hijo es independiente
del de los demás; n=3 y p=0.5.
P(X <= 2) = P(X=0) + P(X=1) + P(X=2)
= 0.125 + 3(0.125) + 3(0.125)
= 0.875
106
3. De un lote con 1,000 artículos de los cuales el 10% son defectuosos, se
escogen al azar 10. ¿Cuál es la probabilidad de que haya más de 2
defectuosos? Aunque el muestreo se hace sin reemplazo, por la gran cantidad
de artículos que hay en el lote comparados con los que se escogen,
suponemos que son válidos los supuestos del modelo binomial. X es el número
de artículos defectuosos y la probabilidad que se nos pide es: P(X > 2).
Distribución Normal
107
La media está representada por un triángulo y se puede interpretar como un
punto de equilibrio. Al arrastrarlo se modifica también la media. El mismo efecto
tiene el mover el punto correspondiente en la cúspide de la curva.
Ejercicios.
a)
108
z = -0’84 = 10-15/s = -5/s→-5(-0'85)= 5'95
La distribución normal
De entre todas las distribuciones continuas tiene especial relevancia la distribución Normal o
de Gauss. Aparece frecuentemente en las situaciones más variadas.
Las variables que presentan una distribución Normal tienen características comunes tales
como la acumulación de valores en torno al valor de la media, la simetría en la distribución de
los valores y escasos valores alejados de la media, por ejemplo:
- Caracteres morfológicos de individuos: altura, peso, número de pie, tamaño del palmo,
etc.
Se dice que una variable aleatoria continua sigue una distribución normal de media y
X N ,
desviación típica , y se escribe , cuando tiene la función de densidad:
2
−1 x− μ
f (x )=
1
e
( )
2 σ
σ √2 π
109
1
(μ , )
- Ffx) tiene un máximo absoluto en σ √2 π
- f(x) tiene dos puntos de inflexión en x= μ+σ y x=μ-σ.
x x −1 t−μ 2
F( X )=P( X≤x)= ∫ f (t )dt=
1 2 ( ) dt
.
σ
−∞
∫e
σ √ 2 π −∞ .
Para x=a este valor representa la probabilidad de que la v.a.X tome valores menores o
iguales que a y graficamente representa el área encerrada bajo la curva, el eje OX y la recta
x=a.
Puede observarse la dificultad de la integral, es por ello y dado lo habitual que es el uso de
esta distribución, que se utiliza una tabla ya confeccionada para el calculo de
probabilidades.
Pero como bien estarás pensando es imposible realizar una tabla para cada valor de μ y de
σ que pueden tomar los parámetros en la distribución.
Las curvas de las diferentes funciones de densidad son en realidad la misma curva variando
su máximo y su curvatura en función de μ y σ, por esto el área encerrada bajo la curva es
siempre la misma (como función de densidad que es vale 1) aunque repartida de forma
diferente.
Los anteriores argumentos justifican el uso de la N(0,1) como distribución estandar, para la
cual existe la tabla de valores de la función de distribución. A partir de ella y mediante un
cambio de variable, que denominamos tipificación podemos calcular las probabilidades
para cualquier distribución N(μ,σ)
110
Uso de tablas
− x2
1 2
f (x )= e
√2 π
Las tablas nos ofrecen el valor de F(z0)= P(Z≤ z0) para valores de z0 de 0 a 4 . La primera
columna corresponde a valores desde 0,0 a 3,9 y el segundo decimal se completa con los
valores de la primera fila que van desde 0,00 a 0,09. En la intersección de la fila y la
columna correspondiente se encuentra el valor de dicha probabilidad.
111
Tenemos en cuenta que el àrea total encerrada por la curva es 1 y procedemos por “paso
al contrario”
Caso 3: P(Z≤ -1,56) Habrás observado que en tabla sólo aparecen valores positivos de
la variable. Tenemos en cuenta que la función y sus valores son simétricos y por tanto
Caso 6:P(- 0,48 ≤Z≤ 1,56) = P(Z≤1,56) - P(Z≤ - 0,48) = P( Z≤ 1,56) – P(Z≥
0,48) =P(Z≤ 1,56) – (1- P(Z≤ 0,48) ) =P(Z≤1,56) + P(Z≤ 0,48) -1
= 0.9406 + 0,6844 – 1 = 0,625
112
Caso 8: Hallar z0 si P(Z≤ z0) = 0,0594
Tipificación de la variable
La tipificación consiste en pasar de la v.a. X con distribución N(μ,σ) a una nueva v.a. Z con
distribución N(0,1) mediante la expresión
x
Z
a) P(X<70)
70−60
z 0= =2
Para x0 = 70 su correspondiente valor tipificado es 5
entonces segun la tabla de N(0,1) , P(X<70) = P(Z<2) = 0,9772
113
c) P(70<X<75)
P(70 < X < 75) =P(2 < Z < 3) = P(Z< 3) – P(Z< 2 ) = 0,9987 – 0,9772
= 0,0215
La zona sombreada representa el 95,44% del área total P( μ-2σ < X < μ +2σ ) = P(-2 < Z < 2) =
0,9544
La zona sombreada representa el 99,74% del área total P( μ-3σ< X<μ +3σ ) = P(-3 < Z < 3) =
0,9974
114
Además cuando n es muy grande los cálculo en la distribución binomial
se vuelven muy complicados y con muchos sumandos.
Teorema de Moivre
115
b)
116
puntuación directa que supera el 84’13% de la distribución y X2 la puntuación
directa que es superada
a)
b)
⎧X = x2 +10
⎩X= x1 -10
117
Tablas : z = 1 deja a su izquierda un área 0’8413 :
⇒ s=10
118