Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA Y
PROBABILÍSTICA
INGENIERÍA DE SISTEMAS
Estadística y Probabilística
© Corporación Universitaria
2
Remington
Segunda edición
2018
Estadística y Probabilística
Pablo Emilio Botero Tobón
Facultad de Ciencias Básicas e Ingeniería
Editorial Uniremington
Medellín, Colombia
Derechos Reservados ©2011
Responsables
Jorge Mauricio Sepúlveda Castaño
Decana de la Facultad de Ciencias Básicas e Ingeniería
jsepulveda@uniremington.edu.co
Edición y Montaje
Vicerrectoría de Educación a Distancia y Virtual
Equipo de diseño gráfico
www.uniremington.edu.co
virtual@uniremington.edu.co
3 TABLA DE CONTENIDO
Pág.
3.3 TEMA 2 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS CUANTITATIVOS AGRUPADOS
4 EN INTERVALOS DE CLASE 86
3.3.1 EJERCICIO DE APRENDIZAJE 90
3.4 TEMA 3 medidas de posición relativa para datos cuantitativos agrupados en intervalos de clase 91
3.4.1 EJERCICIO DE APRENDIZAJE: 92
3.4.2 EJERCICIO DE APRENDIZAJE: 94
3.4.3 EJERCICIO DE APRENDIZAJE 95
3.4.4 EJERCICIOS DE ENTRENAMIENTO 96
7 GLOSARIO 238
8 BIBLIOGRAFÍA 240
Estadística y Probabilística
6 PROPÓSITO GENERAL
ESTADÍSTICA Y
PROBABILÍSTICA
La estadística es la ciencia de los datos, por tanto, cuando se aplica el método estadístico, se recolectan, se sintetizan,
se organizan, se analizan y se interpretan los datos.
En todas las profesiones se necesita información, para poder avanzar y cualificar los procesos, por lo tanto, necesita
recoger, organizar, analizar y presentar datos con el fin de tomar decisiones que favorezcan este desarrollo
profesional; esta herramienta se la proporciona la Estadística Descriptiva, de la cual se realizará un amplio detalle a
través de este módulo que le presenta la Corporación Universitaria Remington.
La estadística descriptiva se encarga de describir los datos por medio de tablas, gráficos y medidas; en este módulo
se explicará cómo lograrlo. Se pretende que el estudiante, aplicando paulatinamente cada paso que se explica, lo
logre.
Para alcanzar el propósito del módulo, éste se ha diseñado de forma innovadora: se estudiarán métodos de
organización, análisis y presentación de un conjunto de datos asociados a una situación problémica por medio del
modelo de representación estadístico y aprenderá a caracterizar un conjunto de datos, a partir de mediciones
estadísticas, para obtener conclusiones que sirvan de apoyo en la toma de decisiones.
En la primera parte se definen los conceptos generales que se requieren en estadística, las unidades se han dividido
de acuerdo con los tipos de datos, a saber: datos cualitativos, datos cuantitativos ordenados en fila y datos
cuantitativos agrupados en intervalos explicando como:
Se pueden identificar. Se pueden recolectar, Se pueden organizar, Se pueden describir por medio de tablas gráficos
y medidas
Una vez determinados estos elementos se puedan obtener conclusiones, que permitan tomar decisiones acertadas y
que beneficien los procesos en los cuales se está realizando el estudio estadístico.
El módulo está construido con un lenguaje sencillo y con ejercicios aplicados a la cotidianidad y a situaciones prácticas,
coherentes a los planes de estudio de las asignaturas que lo contemplan en su desarrollo académico, con el fin de
que, en una forma pedagógica, aprenda y logre los objetivos propuestos en el mismo.
Debido a que el estudiante de educación a distancia, de La Corporación Universitaria Remington, requiere un método
de aprendizaje de forma tal que más que un profesor, sea un tutor (orientador y acompañante del proceso) y que el
estudiante sea autogenerador de su conocimiento, obviamente con la asesoría del tutor, se ha creado este módulo.
Este módulo está diseñado con un lenguaje sencillo y con ejercicios que son aplicados a la cotidianidad del estudiante,
a su entorno social y laboral pues de esta forma podrá realizar investigaciones estadísticas en un futuro, ya sea a corto
plazo, en otras asignaturas, o a largo plazo cuando esté realizando su labor como profesional.
Lo que se busca con la aplicación de la Estadística Probabilística lineal es resolver problemas comunes y a la vez muy
variados de la empresa en donde en general se tienen necesidades por satisfacer con cierto número de recursos
limitados o escasos y con el objetivo de lograrlo en forma óptima. Esto significa la búsqueda de un valor máximo
cuando se trata de beneficios; o bien la búsqueda de un mínimo cuando se trata de esfuerzos a desarrollar.
Estadística y Probabilística
7
ESTADÍSTICA Y
PROBABILÍSTICA
OBJETIVO GENERAL
Aplicar técnicas de análisis estadístico en la solución de problemas, partiendo de un conjunto de
datos y mediciones, para la obtención de conclusiones que permitan la proyección de la estadística
hacia la solución de situaciones problémicas en las diferentes áreas, manejando además técnicas
de análisis estadístico probabilístico en la solución de problemas, partiendo de un conjunto de
datos y mediciones, para la obtención de conclusiones que permitan la proyección de la estadística
hacia la solución de situaciones problémicas en las diferentes áreas.
OBJETIVOS ESPECÍFICOS
Explicar los conceptos generales de la estadística, analizando datos cualitativos y
describiendo por medio de tablas, gráficas y medidas los datos ordenados en fila.
CONCEPTO DEFINICIÓN
ESTADÍSTICA INFERENCIAL “Se puede definir como aquellos métodos que hacen
posible la estimación de la población o la toma de una
decisión referente a una población, basándose sólo en los
resultados de una muestra” (Berenson y Levine, 1996, p.3).
Es la rama de la estadística que trata de los procesos y
Estadística y Probabilística
Deporte favorito
Comida preferida.
Período de duración de un
automóvil.
El diámetro de las ruedas de varios
coches.
Número de acciones
vendidas cada día
en la Bolsa.
Temperaturas
registradas cada
hora en un
observatorio.
Período de duración
de un automóvil.
El diámetro de las
ruedas de varios
coches.
Número de hijos de
50 familias.
Número de alumnos
de curso.
15 TIPS
Recuerde que: Como que como se ha citado anteriormente la
Estadística trata sobre el recuento, ordenación y clasificación de
los datos obtenidos por las observaciones, para poder hacer
comparaciones y sacar conclusiones.
Se entiende por redondear un número, reducir el número de cifras del mismo, consiguiendo un
valor parecido, pero que se nos haga más fácil de utilizar en los procesos a desarrollar.
Por ejemplo: si se tiene el número 52, pero se están analizando los múltiplos de número 10, por
facilidad aproximaríamos dicho número a 50, que es el múltiplo más próximo, pero si el número
fuese 57 lo aproximaríamos a 60 que es el más cercano.
Número y condición de
Redondeo Razón
redondeo
Número y condición de
Redondeo Razón
redondeo
Nota: Si el número empieza por ceros, estos no se cuentan, estos ceros indican
únicamente lo pequeño que es el número.
Estadística y Probabilística
18 Número y condición de
Redondeo Razón
redondeo
Cuando se hace la estadística descriptiva se debe dar una información general sobre la
investigación que se hizo. Esta información contiene:
Entre las familias de Medellín se eligieron aleatoriamente 5.000 con el fin de investigar el
número de hijos por familia.
En la Corporación Universitaria Remington, sede Medellín, se realizó una encuesta entre 300
estudiantes, con el fin de conocer el medio de transporte utilizado en sus desplazamientos
hacia la universidad, en metro, en carro particular, en bus de servicio público o en otro
medio diferente a los mencionados, para determinar cuál de ellos era el más utilizado y
proponer alternativas diferentes de movilización, para favorecer la llegada a tiempo a sus
horas de clase
Muestra 300estudiantes
Enunciado:
Población
Muestra
Descripción de la variable
Tipo de variable
Enunciado:
Población
Muestra
Descripción de la variable
Tipo de variable
Enunciado:
Estadística y Probabilística
22 Población
Muestra
Descripción de la variable
Tipo de variable
TIPS
Recuerde que: La correcta redacción de la ficha técnica es
importante para garantizar la satisfacción del consumidor,
especialmente en los casos donde la incorrecta utilización de un
producto puede resultar en daños personales o materiales o
responsabilidades civiles o penales.
ELEMENTO DEFINICIÓN
𝒇𝒂𝒊
𝒇𝒓𝒊 =
𝒏 𝒐 𝑵
Frecuencia Relativa
𝒇𝒓𝒊 𝒐 𝒉𝒊
𝒏𝒊
𝒉𝒊 =
𝒏 𝒐 𝑵
24 TIPS
Recuerde que: Una distribución de frecuencia: es la agrupación
de datos en categorías mutuamente excluyentes que indica el
número de observaciones en cada categoría.
B R R R R R B B B
B R M M M R B B B
B M R R R R B R R
R R B M M M R R R
R R B M B R R R R
Dónde:
B: Bueno
R: Regular
M: Malo
Estadística y Probabilística
25
Nota: Esto indica que el primer contador dijo que el paquete era bueno, el segundo,
regular y así sucesivamente, el último dijo que era regular. Como tenemos 45
resultados este fue el total de contadores encuestados, además como nos dicen que
se escogiera aleatoriamente, es una muestra.
𝟏𝟑 𝟎. 𝟐𝟖𝟗 × 𝟏𝟎𝟎
𝑩𝒖𝒆𝒏𝒐 𝟏𝟑 𝟒𝟓
= 𝟎. 𝟐𝟖𝟖𝟖.. *𝟐𝟖. 𝟗%
𝟐𝟒
𝑹𝒆𝒈𝒖𝒍𝒂𝒓 𝟐𝟒 𝟒𝟓 𝟎. 𝟓𝟑𝟑 × 𝟏𝟎𝟎
= 𝟎. 𝟓𝟑𝟑𝟑..
Estadística y Probabilística
26 ∗ 𝟓𝟑. 𝟑%
𝟖 𝟎. 𝟏𝟕𝟖 × 𝟏𝟎𝟎
𝑴𝒂𝒍𝒐 𝟖 𝟒𝟓
= 𝟎. 𝟏𝟕𝟕𝟕 … ∗ 𝟏𝟕. 𝟖%
𝑻𝒐𝒕𝒂𝒍 𝒏 = 𝟒𝟓 𝟏 𝟏𝟎𝟎%
13 El paquete es bueno.
24 El paquete es regular.
8 El paquete es malo.
Estadística y Probabilística
b) Frecuencia relativa:
27
El grupo de contadores evaluó el paquete de nómina de la siguiente forma:
Una vez construida la tabla de frecuencias, estas se pueden representar mediante distintos
gráficos el estudio estadístico realizado. Entre los gráficos más utilizado podemos destacar:
a) Diagrama de Barras
Son dos ejes perpendiculares y una barra o un rectángulo para cada uno de los valores de la
variable. Por lo general, en el eje horizontal (eje x del plano cartesiano) se colocan los valores de
la variable y el otro eje (eje y del plano cartesiano), se gradúa de acuerdo al valor de las
frecuencias.
En este diagrama se dibuja una barra o un rectángulo por cada uno de los valores de la variable
con una altura igual a la respectiva frecuencia, de la siguiente forma:
Estadística y Probabilística
b) Histograma
Es un caso particular del diagrama de barras para variables continuas; en la representación gráfica
los rectángulos aparecen pegados y de igual base (ver gráfica) si los intervalos son iguales (tienen
la misma amplitud); en caso de que la amplitud no sea igual para todos los intervalos, se debe
hacer coincidir el área del rectángulo con la frecuencia de cada uno de los intervalos
determinados en el problema.
c) Polígono de frecuencias
Son dos ejes perpendiculares, en el eje horizontal se colocan los valores de la variable y en el eje
vertical el valor de las frecuencias.
Se determina un par ordenado que tiene como primera coordenada el valor de la variable y como
segunda coordenada el valor de la frecuencia, esto es en forma general:
Estadística y Probabilística
𝑷 (𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆, 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂),, luego se unen estos puntos y se obtiene una Línea Poligonal que
29 corresponde a la representación buscada.
Nótese que la línea poligonal une el centro de cada uno de los lados de los rectángulos, cada uno
de esos puntos corresponde a un par ordenado.
Es un diagrama que se utiliza para expresar los porcentajes, cada sector del gráfico indica la
categoría y es proporcional a su porcentaje.
Estadística y Probabilística
30
Nota: Todo gráfico estadístico debe tener un título, relacionado con lo que se está
investigando.
31
EVALUACIÓN DE UN PAQUETE DE
NÓMINA
número de contadores
30
25
20
15
10
5
0
BUENO REGULAR MALO
Evaluación
MALO
evaluación
REGULAR
BUENO
0 5 10 15 20 25 30
número de contadores
33
EVALUACIÓN DE UN PAQUETE DE
NÓMINA
MALO
BUENO
18%
29%
REGULAR
53%
Nota: Siempre se debe seleccionar uno de los gráficos de acuerdo con lo que se quiere
mostrar, cantidad o porcentaje.
CONCLUSIONES:
De acuerdo a los resultados obtenidos, el paquete no tuvo la acogida y resultados que se
esperaban entre los contadores, por lo tanto, la empresa productora del software debe
reformarlo basándose en las exigencias de los contadores.
Estadística y Probabilística
1) DATOS CUALITATIVOS
35
Para cada uno de los ejercicios planteados a continuación:
a) La compañía “los Dulces” desea lanzar al mercado una nueva chocolatina. Por tal razón realizó
una encuesta entre los niños de las escuelas de Medellín para evaluar el producto y seleccionó
una muestra al azar con los siguientes resultados (en miles):
𝒙𝒊 𝒇𝒂𝒊
Bueno 321
Regular 105
Malo 195
b) Entre las amas de casa de Medellín se elaboró una encuesta con el fin de investigar la
efectividad de un detergente. Para tal fin se seleccionó una muestra al azar con los siguientes
resultados (en miles):
𝒙𝒊 𝒇𝒂𝒊
Excelente 225
Bueno 104
Estadística y Probabilística
36 Regular 291
Malo 120
c) Se realizó una encuesta entre los visitantes al Éxito de San Antonio en diciembre de 2002
para seleccionar entre 4 artículos: A1, A2, A3, A4 el de mejor calidad. se seleccionó una muestra
al azar con los siguientes resultados (en miles):
𝒙𝒊 𝒇𝒂𝒊
𝑨𝟏 25
𝑨𝟐 100
𝑨𝟑 125
𝑨𝟒 7
d) El secretario de gobierno de Medellín ordenó un informe sobre las causas de muertes violentas
ocurridas en Medellín durante el último trimestre, para tal fin seleccionó una muestra aleatoria y
los resultados fueron los siguientes:
𝒙𝒊 𝒇𝒂𝒊
𝑷𝒐𝒓 𝒂𝒄𝒄𝒊𝒅𝒆𝒏𝒕𝒆 𝒅𝒆 𝒕𝒓á𝒏𝒔𝒊𝒕𝒐 65
𝑷𝒐𝒓 𝒕𝒆𝒓𝒓𝒐𝒓𝒊𝒔𝒎𝒐 90
e) Un investigador judicial realizó un informe sobre el número de reclusos que hay en las
cárceles del Área Metropolitana discriminados por sexo, los resultados fueron los siguientes:
Estadística y Probabilística
37 𝒙𝒊 𝒇𝒂𝒊
𝑴𝒂𝒔𝒄𝒖𝒍𝒊𝒏𝒐 11.538
𝑭𝒆𝒎𝒆𝒏𝒊𝒏𝒐 8.983
f) Para cada uno de los siguientes ejercicios, tome los datos de la siguiente tabla:
2 2 2 4 4 4 4 1 1 1 1 1 3 3 1
1 1 3 4 1 1 1 1 3 3 3 4 4 4 4
1 1 1 1 1 2 2 2 4 4 4 1 1 1 1
2 2 3 3 1 1 4 4 1 1 2 3 4 4 1
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
______________________________________________________________________________
______________________________________________________________________________
Estadística y Probabilística
______________________________________________________________________________
38 __________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
5) En la institución “Despertar” el psicólogo clasificó a los niños sobre el grado de retardo mental
según el DSMIV: 1. leve, 2. moderado, 3. grave 4. Profundo. (Ver datos de la tabla)
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
__________________
1 1 2 1 1 3 1 1 2 1 2 4
Estadística y Probabilística
39 2 3 4 4 1 4 5 3 4 3 4 1
1 2 3 2 2 2 2 1 2 4 1 5
3 3 3 3 1 1 2 3 2 2 3 4 3
3 3 4 4 3 3 2 2 2 2 1 4 2
1 3 3 3 2 2 2 1 4 4 2 3 2
2 2 3 3 3 3 2 2 2 1 1 2 1
4 4 3 3 3 1 3 1 3 3 3 2 1
𝒙𝒊 𝒇𝒂𝒊
𝑬𝒙𝒄𝒆𝒍𝒆𝒏𝒕𝒆 400
𝑩𝒖𝒆𝒏𝒐 900
𝑹𝒆𝒈𝒖𝒍𝒂𝒓 225
𝑫𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 15
j) A los extranjeros que visitaron la embajada de Colombia en Estados Unidos durante el último
trimestre se les preguntó sobre su visita a Colombia y respondieron lo siguiente:
Estadística y Probabilística
40 𝒙𝒊 𝒇𝒂𝒊
𝑽𝒆𝒏𝒅𝒓á𝒏 257
𝑵𝒖𝒏𝒄𝒂 𝒗𝒆𝒏𝒅𝒓á𝒏 10
k) Se hizo una selección aleatoria entre los estudiantes de Corporación Universitaria Remington
y se les preguntó ¿En qué dedican su tiempo libre? y respondieron lo siguiente:
𝒙𝒊 𝒇𝒂𝒊
𝑰𝒓 𝒂𝒄𝒊𝒏𝒆 159
𝑰𝒓 𝒂 𝒅𝒊𝒔𝒄𝒐𝒕𝒆𝒄𝒂 98
𝑳𝒆𝒆𝒓 105
l) Dado el siguiente diagrama de sectores, responda: Verdadero (V) o Falso (F), según sea el
caso, justificando la respuesta
Estadística y Probabilística
7%
14% 28%
Administración
Contaduría
Sistemas
Secretariado
18% Psicología
33%
m) Como ejercicio final realiza una investigación estadística, sobre datos cualitativos en tu
42 medio; ya sea tu lugar de trabajo, tu ciudad o tu familia y realiza todo el proceso: tablas, gráficos
y conclusiones o decisiones finales. (Recuerde los pasos a seguir para desarrollar esta actividad)
Estadística y Probabilística
45 1 3 8 5 3 5 4 5 5 5
4 6 5 5 2 6 6 7 4 1
3 5 1 5 6 4 5 1 4 8
5 8 5 4 5 6 6 3 8 5
5 6 5 1 3 4 5 5 6 5
3 7 2 3 5 2 5 3 2 4
Enunciado: El jefe de personal de la compañía “Aceros S.A.” preocupado por las llegadas tarde
de sus empleados, seleccionó una muestra aleatoria entre los empleados que han llegado
tarde al trabajo durante los últimos cuatro meses y anotó el número de llegadas tarde de cada
uno de dichos empleados y los resultados fueron los siguientes:
1 5 5 5 𝟖, 𝟑 0,083 𝟖, 𝟑
= 0,083
60
2 4 5+4=9 4 𝟔, 𝟕 0,150 𝟏𝟓
= 0,067
60
𝒏 = 𝟔𝟎 ∑=1 ∑ = 100
Como los datos fueron organizados de menor a mayor, entonces siempre el primer dato será el
menor y el último dato será el mayor; además recuerde que los datos siempre están en 𝒙𝒊 y
que la frecuencia absoluta indica el número de veces que se presenta el dato.
DATO CARACTERÍSTICA
Estadística y Probabilística
25 21
20
empleados
número de
15
8 8 8
10 5 4 4
5 2
0
`1 2 `3 `4 `5 `6 `7 `8
número de llegadas tarde
Estadística y Probabilística
49 TIPS
La Ficha Técnica
Interprete dato: mayor, menor, más frecuente y menos frecuente.
Elabore el diagrama de barras e interprételo.
12 10 10 8 4 3 0 2 1 12
12 11 9 2 6 4 8 0 7 11
5 9 9 3 7 6 9 0 8 8
4 10 9 7 8 7 9 1 7 8
6 10 4 8 11 10 7 12 9 8
2) En la feria Expo - navidad del año pasado se realizó un estudio sobre lo que los visitantes tenían
disponible para gastar en regalos navideños. Se seleccionó una muestra al azar con los siguientes
resultados: (el dinero disponible está dado en miles):
Estadística y Probabilística
50 𝒙𝒊 𝒇𝒂𝒊
50 10
200 25
400 15
600 10
800 8
1000 8
1500 2
2500 3
Esta referencia está dada por unos elementos estadísticos denominados Medidas de Tendencia Central,
las cuales nos permiten una interpretación de los datos obtenidos en cualquier medición que se realice.
Sirve como un método para comparar cualquier puntaje, con el puntaje central o típico.
51
Sirve como un método para comparar el puntaje obtenido por una misma persona, obtenido
en dos o más ocasiones.
Sirve como método para comparar los resultados medios obtenidos por dos o más grupos.
Estas medidas centralizan los datos y dan información sobre la parte de la distribución hacia
donde se están agrupando los datos
Nota: Las medidas de tendencia central más importantes son: Media aritmética, la
moda y la mediana.
“Es la medida más conocida, más fácil de calcular y con la que siempre estamos más
familiarizados” (Martínez Bencardino, C. 2004, p. 74) Es el promedio de los datos y se representa:
52
La media aritmética se obtiene sumando todos los valores y dividiendo
esa suma por el número de valores de la medición.
̅=
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏
𝝁 𝒐𝑿
𝑵 𝒐 𝒏
Ejemplo 1: Un estudiante obtuvo las siguientes notas en matemáticas 4.3, 2.5, 3.3, 4.2, 3.1, 2.9 y
quiere conocer el promedio (Media Aritmética) de las mismas:
Ejemplo 2: A continuación, se dan los valores de las boletas para las diferentes tribunas del
estadio Atanasio Girardot de Medellín:
Solución: Para conocer el promedio del valor de la boleta se aplica el concepto de la media
aritmética, esto es:
Estadística y Probabilística
∑𝒏
𝟏 𝒙𝒊 𝒇𝒂
̅=
𝝁 𝒐𝑿 𝒊
𝑵 𝒐 𝒏
Estadística y Probabilística
𝒙𝒊 𝒇𝒂𝒊 𝒙𝒊 ∗ 𝒇𝒂𝒊
1 6 6
2 5 10
3 7 21
4 9 36
5 13 65
6 12 72
7 8 56
8 4 32
9 8 72
10 10 100
𝒏 = 𝟖𝟐 ∑ 𝟒𝟕𝟎
𝟒𝟕𝟎
̅=
𝑿 = 𝟓, 𝟕𝟑𝟏
𝟖𝟐
El promedio (la media aritmética) para el problema anterior es 𝟓, 𝟕𝟑𝟏
La media aritmética, de un conjunto de datos, es única es decir, sólo existe una media
3. aritmética.
Estadística y Probabilística
55 4.
Cuando se tienen valores extremos (es decir, muy altos o muy bajos) la media
aritmética no puede tomarse como representativa de los datos.
LA MODA (Mo)
“Es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente” (Spiegel, M. R.,
1995).
Características de la Moda
1 Existen distribuciones que tienen varias modas, esto es: Bimodal cuando tiene dos
modas, si tiene más de dos, se llama Multimodal.
3 En el gráfico de barras verticales la moda se identifica como la barra más alta y su valor
se ubica en el eje 𝑿.
La Mediana (𝑴𝒆 )
Es aquel valor de la serie de datos que se ubica exactamente en la mitad (en el centro) de los
mismos.
Estadística y Probabilística
También se puede decir que es el valor que ocupa el lugar central de todos los datos, cuando
56
éstos están ordenados de menor a mayor.
Características de la Mediana
Cálculo de la Mediana
1. Para calcular la Mediana se tienen que ordenar los datos de menor a mayor.
2. Si el ordenamiento tiene un número impar de datos, la mediana está dada por el dato
central de la misma, esto es:
1
3
5
6
7
8
9
Estadística y Probabilística
57 11
12
13
14
Como el número de datos es impar (11), la mediana sería entonces el dato del centro, esto es:
𝑴𝒆 = 𝟖
Si el ordenamiento tiene un número par de datos, la mediana está dada por la media
aritmética entre los dos datos centrales, esto es:
1
3
5
6
7
9
11
12
13
14
17
18
20
21
Estadística y Probabilística
Quedan, exactamente, 6 valores por encima de 11 y 12, (1,3,5,6,7,9) y 6 valores por debajo
58
(13,14,17,18,20,21) , por lo tanto, la Mediana sería:
𝟏𝟏 + 𝟏𝟐 𝟐𝟑
𝑴𝒆 = = = 𝟏𝟏. 𝟓
𝟐 𝟐
Como conclusión: Cuando se tiene la distribución de frecuencias para ubicar la mediana se
procede así:
𝒏+𝟏
Si el número de datos ( 𝒏 𝒐 𝑵) es par, se calcula y se busca la Frecuencia Absoluta
𝟐
Acumulada (𝒇𝒂𝒂 ), el correspondiente 𝒙𝒊 , es la Mediana (Me).
2.3.2 EJEMPLOS
1. Dada la siguiente tabla ordenada de datos, calcular la Mediana:
𝒙𝒊 𝒇𝒂𝒊 𝒇𝒂𝒂𝒊
𝟑. 𝟖 𝟏 𝟏
𝟒. 𝟎 𝟏 𝟐
𝟒. 𝟓 𝟑 𝟓
𝑵=𝟓
𝟓+𝟏
𝑴𝒆 = =𝟑
𝟐
Corresponde al tercer dato que es 𝟒. 𝟓
Estadística y Probabilística
𝒏
59 Si el número de datos ( 𝒏 𝒐 𝑵) es par, se calcula y su consecutivo, se buscan en la
𝟐
Frecuencia Absoluta Acumulada (𝒇𝒂𝒂 ) y el promedio (Media Aritmética) de los
correspondientes datos (𝒙𝒊 ), es la Mediana (Me).
𝒙𝒊 𝒇𝒂𝒊 𝒇𝒂𝒂𝒊
𝟑. 𝟖 𝟐 𝟐
𝟒. 𝟎 𝟏 𝟑
𝟒. 𝟓 𝟑 𝟔
𝑵=𝟔
𝟔
𝑴𝒆 = 𝟐 = 𝟑 que corresponde a 4.0 y su consecutivo que es el 4 y corresponde a 𝟒. 𝟓,
por lo tanto la Mediana sería:
𝟒. 𝟎 + 𝟒. 𝟓
𝑴𝒆 = = 𝟒. 𝟑
𝟐
Recuerde que son seis datos y ordenados de menor a mayor y con su respectiva
frecuencia se tiene:
Estadística y Probabilística
60 1 2 3 4 5 6
Nota:
Recuerde que, para solucionar estos ejercicios, se deben ordenar los datos de menor a mayor.
Revise los ejercicios de aprendizaje resueltos en el desarrollo del tema.
1. La profesora de estadística realizó una prueba a un grupo de alumnos que constaba de 12
puntos. Eligió una muestra al azar y los resultados del número de respuestas acertadas fueron
los siguientes:
12 10 10 8 4 3 0 1 12 2
12 11 9 2 6 4 8 0 7 11
5 9 9 3 7 6 90 0 8 8
4 10 9 7 8 7 9 1 7 8
6 10 4 8 11 10 7 12 9 8
2. En la feria Expo - navidad del año pasado se realizó un estudio sobre lo que los visitantes
tenían disponible para gastar en regalos navideños. Se seleccionó una muestra al azar con los
siguientes resultados: (el dinero disponible está dado en miles)
Estadística y Probabilística
61 𝒙𝒊 𝒇𝒂𝒊
50 3
200 4
400 10
600 9
800 8
1000 8
1500 7
1600 4
2000 11
3. Se seleccionó una muestra aleatoria entre los habitantes de la tercera edad que viven en el
Área Metropolitana y se clasificaron de acuerdo con su estatura, los siguientes son los datos:
1,45 6
1,50 10
1,55 10
1,60 18
Estadística y Probabilística
62 1,65 18
1,70 12
1,75 10
1,80 7
1,85 3
1,90 1
4. Termine la tabla y responda verdadero (V) o falso (f), de acuerdo a la distribución anterior, las
siguientes preguntas, justificando debidamente su respuesta:
Pregunta V F Justificación
b) 1,60
c) 1,638
b) 1,90
c) 1,60 y 1,65
b) 1,70
c) 1,65
Estadística y Probabilística
64 TIPS
Recuerde que: Las medidas de Tendencia central, nos permiten
una interpretación de los datos obtenidos en cualquier medición
que se realice.
Para encontrar la media, la moda y la mediana, se deben ordenar
los datos de menor a mayor.
Estadística y Probabilística
Para agrupar los datos en intervalos existen varios métodos, entre ellos tenemos, el siguiente:
Li , Ls .
Estadística y Probabilística
Li , Ls
Para utilizar este método se debe realizar el siguiente procedimiento:
𝐾 = 1 + 3.3 × log 𝑛
Dónde:
𝑲: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔
𝒏: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔
3. Se calcula la Amplitud (𝑨: es la misma para todos los intervalos) de cada uno de los
intervalos mediante la ecuación:
Estadística y Probabilística
68 𝑅
𝐴=
𝐾
Dónde:
𝑹: 𝑹𝒂𝒏𝒈𝒐
𝑲: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔
Nota: La Amplitud (A) se debe subir un poco (así el resultado sea entero). Es un error
dejar la amplitud igual, ya que esto ocasiona que el dato mayor quede por fuera del
último intervalo.
𝑳𝒊 = 𝑫𝒂𝒕𝒐 𝑴𝒆𝒏𝒐𝒓
b. El límite derecho o límite superior de cualquier intervalo es igual al límite izquierdo del
mismo intervalo más la amplitud.
𝑳𝒔 = 𝑳𝒊 + 𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅
Estadística y Probabilística
69 Nota: Los intervalos son abiertos a derecha. Quiere decir que el límite derecho de un
intervalo se cuenta en el intervalo que se encuentra exactamente debajo de dicho
intervalo.
𝑳𝒊 = 𝑳𝒔 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝒂𝒏𝒕𝒆𝒓𝒊𝒐𝒓
Es un valor que identifica a cada intervalo “es el punto medio de cada intervalo”, está dada
por la siguiente ecuación:
𝑳 𝒊 + 𝑳𝒔
𝒙𝒊 =
𝟐
(Berenson, M. L. Y LEVINE, D. M., 1996, p. 38).
70 25 36 40 45 48 32 17 22 18 20
21 44 46 19 19 26 24 28 29 31
39 36 35 33 32 34 41 42 31 30
20 45 43 23 22 21 38 34 37 43
19 20 23 25 22 25 27 24 19 18
20 21 22 25 24 27 29 19 23 21
CONCEPTO CARACTERÍSTICA
Estudiantes de Administración de
Población
UNIREMINGTON.
b. PROCEDIMIENTO
71
Se realiza de acuerdo a los pasos indicados en la definición de conceptos, esto es:
Reemplazando, se tiene:
𝑹 = 𝟒𝟖 − 𝟏𝟕 = 𝟑𝟏
𝑹 = 𝟑𝟏
𝐾 = 1 + 3.3 × log 𝑛
Reemplazando, se tiene:
𝑲 = 𝟏 + 𝟑. 𝟑 × 𝐥𝐨𝐠 𝒏 → 𝑲 = 𝟏 + 𝟑. 𝟑 × 𝐥𝐨𝐠 𝟔𝟎 →
𝑲 = 6,868, utilizando el concepto de redondeo (ver unidad 1) a números enteros, se tiene que:
𝑲 = 𝟕.
𝑅
𝐴=
𝐾
Reemplazando, se tiene:
31
𝐴= = 4,428
7
Estadística y Probabilística
Por norma (determinada en la definición del concepto) se sube un poco la amplitud, por lo tanto:
72
𝑨 = 𝟒, 𝟓
𝑳𝒊 = 𝑫𝒂𝒕𝒐 𝑴𝒆𝒏𝒐𝒓
Reemplazando, se tiene:
𝑳𝒊 = 𝟏𝟕
Para determinar el primer límite superior, se tiene que todo el intervalo tiene la misma
amplitud, por lo tanto:
Para el primer intervalo, se tiene entonces que: los datos son mayores o iguales que 17 y menores
que 21,5: en total se encontraron 16 datos con esta característica, siendo esta la primera
Frecuencia Absoluta.
Para calcular el segundo límite superior se aplica la fórmula 𝑳𝒔 = 𝑳𝒊 + 𝑨, se tiene entonces que el
segundo intervalo tiene como límite inferior 21,5 y como límite superior, 𝑳𝒔 = 𝟐𝟏, 𝟓 + 𝟒, 𝟓 = 𝟐𝟔,
se encontraron 14 datos que cumplen esta característica siendo esta será la segunda frecuencia
absoluta.
Estadística y Probabilística
73
Nota: Este procedimiento se repite tantas veces sea necesario, hasta que queden
incluidos todos los datos del programa.
25 36 40 45 48 32 17 22 18 20
21 44 46 19 19 26 24 28 29 31
39 36 35 33 32 34 41 42 31 30
20 45 43 23 22 21 38 34 37 43
19 20 23 25 22 25 27 24 19 18
20 21 22 25 24 27 29 19 23 21
𝑳𝒊 𝑳𝒔 Conteo
17 21,5 Corresponde a las celdas llenas con el color rojo (16)
21,5 26 Corresponde a las celdas llenas con color azul (14)
26 30,5 Corresponde a las celdas llenas con color verde (6)
30,5 35 Corresponde a las celdas sin llenar (8)
35 39,5 Corresponde a las celdas llenas con color amarillos (6)
39,5 44 Corresponde a las celdas llenas con azul obscuro (5)
44 48,5 Corresponde a las celdas llenas con púrpura (5)
Estadística y Probabilística
𝑵 = 𝟔𝟎 ∑ = 1 ∑ = 100
𝑳𝒊 𝑳𝒔 𝑳𝒊 ≤ 𝑿 < 𝑳𝒔,
17 21,5 [𝟏𝟕, 𝟐𝟏, 𝟓)
21,5 26 [𝟐𝟏, 𝟓, 𝟐𝟔)
26 30,5 [𝟐𝟔, 𝟑𝟎. 𝟓)
30,5 35 [𝟑𝟎, 𝟓, 𝟑𝟓)
35 39,5 [𝟑𝟓, 𝟑𝟗, 𝟓)
49,5 44 [𝟑𝟗, 𝟓, 𝟒𝟒)
44 48,5 [𝟒𝟒, 𝟒𝟖, 𝟓)
Donde:
Estadística y Probabilística
Ejercicio 2: Los siguientes son los sueldos de los tecnólogos de Medellín de acuerdo con una
muestra elegida aleatoriamente (en miles de pesos).
Nota: En este caso ya están los datos agrupados, por tanto, no hay que aplicar los pasos para
calcular los intervalos, simplemente se complementa la tabla.
𝑳𝒊 𝑳𝒔 𝑳𝒊 ≤ 𝑿 < 𝑳𝒔, 𝒇𝒂
400 600 [𝟒𝟎𝟎, 𝟔𝟎𝟎) 30
600 800 [𝟔𝟎𝟎, 𝟖𝟎𝟎) 100
800 1000 [𝟖𝟎𝟎, 𝟏𝟎𝟎𝟎) 55
1000 1200 [𝟏𝟎𝟎𝟎, 𝟏𝟐𝟎𝟎) 240
1200 1400 [𝟏𝟐𝟎𝟎, 𝟏𝟒𝟎𝟎) 25
1400 1600 [𝟏𝟒𝟎𝟎, 𝟏𝟔𝟎𝟎) 20
77 595 506 580 333 310 572 590 533 479 394
355 346 520 511 466 480 490 547 383 555
R 293
Amplitud. A 41,857... A 41,9 La amplitud siempre se debe subir un
k 7
poquito.
La secuencia para determinar los demás límites de la distribución es la misma que para los
intervalos uno y dos, hasta completar los 7 intervalos, como se puede ver a continuación en la
siguiente tabla borrador.
Número de Límite
Límite inferior
intervalos superior
1 302 302 + 41,9 = 343,9
Estadística y Probabilística
Conteo. Para realizar el conteo recomendable utilizar colores en la tabla dónde se registró la
información y tomar una tabla con los intervalos.
302 315 420 460 530 590 306 580 470 310
372 570 348 417 440 483 455 322 417 560
483 405 430 452 570 360 390 422 511 558
595 506 580 333 310 572 590 533 479 394
355 346 520 511 466 480 490 547 383 555
TIEMPO (HORAS)
80
EL HISTOGRAMA: “Son diagramas de barras verticales en los que se construyen barras
rectangulares en los límites de cada clase”.
𝑳 𝒊 + 𝑳𝒔
𝒙𝒊 =
𝟐
(Berenson, M. L. Y LEVINE, D. M., 1996, p. 38).
POLÍGONO: “Se puede obtener uniendo cada punto medio (marca de clase) de los
rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y
al final marcas de clase adicionales, con el objeto de asegurar la igualdad del área”.
http://sitios.ingenieriausac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html
Estadística y Probabilística
60
PORCENTAJE DE
50
INGENIEROS
40
30
20
10
0
`500 `700 `900 `1100 ´1300 `1500 `1700
SUELDOS (en miles de $)
Este modelo de población presenta la característica que la moda, el promedio y la mediana tienen
igual valor o son aproximadamente iguales. Presenta muchas aplicaciones en la inferencia
estadística, ya que en la práctica hay muchas poblaciones que presentan un comportamiento de
población con distribución normal. La forma de una distribución normal es la siguiente:
CURVA NORMAL
83 M0 Me x
Se presenta cuando la media aritmética es menor que la mediana y que la moda. En esta curva
la cola más larga se encuentra a la izquierda.
Su forma la podemos ver en el gráfico:
Mo M e x
Cuando se presenta este modelo en participación en el mercado, o en producción, o en ventas;
es bueno, quiere decir que la mayoría de ventas o de utilidades superan el promedio.
Estadística y Probabilística
En este modelo la cola más larga está a la derecha. Su forma es la mostrada en la figura.
M0 Me x
OJIVA: “Es el polígono de frecuencias acumuladas, es decir, que en ella se permite
ver cuántas observaciones se encuentran por encima o por debajo de ciertos valores,
en lugar de solo exhibir los números asignados a cada intervalo”.
Esta Ojiva puede ser de: frecuencias absolutas acumuladas o de porcentajes acumulados.
85
Se grafica tomando:
500
INGENIEROS
400
NÚMERO DE
300
200
100
0
`400 `600 `800 `1000 ´1200 `1400 `1600
SUELDOS (en miles de $)
Calcule e interprete: las medidas de tendencia central, las medidas de posición relativas y las
86 medidas de variabilidad.
1. En la compañía “La Delicia” se hizo un estudio sobre los sueldos, a continuación, se dan los
resultados, en miles de $.
900 500 450 1900 1200 1250 2500 550 1650 1200
1000 550 950 600 750 1300 850 350 1400 700
300 1100 300 600 1600 1500 1000 1800 900 500
650 2000 450 750 850 600 300 1950 3000 1500
TIPS
Recuerde que: Cuando, en un estadístico, se obtienen muchos
datos en la medición y la frecuencia de cada uno de los datos es
muy baja, es necesario agruparlos por clase o por categoría y
cada una de éstas distribuciones se dispondrá en un intervalo
determinado.
∑ 𝑋𝑖 ∗ 𝑓𝑎𝑖
𝑋̅ 𝑜 𝜇 =
𝑛𝑜𝑁
Para el ejemplo 1
Estadística y Probabilística
87 𝑳𝒊 𝑳𝒔 𝒇𝒂𝒊 𝒙𝒊 𝒙𝒊 ∗ 𝒇 𝒂𝒊
15 20 12 17,5 210
20 25 18 22,5 405
25 30 7 27,5 192,5
30 35 8 32,5 260
35 40 6 37,5 225
40 45 7 42,5 297,5
45 50 2 47,5 95
𝑵 = 𝟔𝟎 ∑ 𝟏𝟔𝟖𝟓
1685
𝑋̅ 𝑜 𝜇 = 60 → 𝑋̅ 𝑜 𝜇 = 28,03
El promedio (la media aritmética) de la edad en que iniciaron sus estudios en la universidad los
estudiantes de Administración de UNIREMINGTON es de 28,03 años. Para el ejemplo 2
𝑳𝒊 𝑳𝒔 𝒇𝒂𝒊 𝒙𝒊 𝒙𝒊 ∗ 𝒇 𝒂𝒊
461.000
𝑋̅ 𝑜 𝜇 = → 𝑋̅ 𝑜 𝜇 = 980,851
470
El promedio (la media aritmética) de los sueldos de los tecnólogos de Medellín es de $980.851
Estadística y Probabilística
2. La moda (𝑴𝒐 )
88
𝒅𝟏
𝑴𝒐 = 𝑳 𝒊 + ( )∗𝑨
𝒅 𝟏 + 𝒅𝟐
Done:
𝒅𝟏 = 𝒇𝒂𝒊 − 𝒇𝒂(𝒊−𝟏)
𝒅𝟐 = 𝒇𝒂𝒊 − 𝒇𝒂(𝒊+𝟏)
𝑨 = 𝑳𝒔𝒊 − 𝑳𝒍𝒊
Por lo tanto, el intervalo que contiene la Moda es el más frecuente.
El intervalo más frecuente es el rojo (ver ***) en las tablas, por lo tanto:
𝑳𝒍 = 𝟐𝟎
𝒅𝟏 = 𝟏𝟖 − 𝟏𝟐 = 𝟔
𝒅𝟐 = 𝟏𝟖 − 𝟕 = 𝟏𝟏
𝑨 = 𝟐𝟓 − 𝟐𝟎 = 𝟓
𝟔
𝑴𝒐 = 𝟐𝟎 + ( ) ∗ 𝟓 → 𝑴𝒐 = 𝟐𝟏, 𝟕𝟔𝟒
𝟔 + 𝟏𝟏
La edad en que iniciaron sus estudios en la universidad los estudiantes de Administración de
UNIREMINGTON más frecuente es de 21,764 años.
𝒅𝟏 = 𝟐𝟒𝟎 − 𝟓𝟓 = 𝟏𝟖𝟓
89
𝒅𝟐 = 𝟐𝟒𝟎 − 𝟐𝟓 = 𝟐𝟏𝟓
𝟏𝟖𝟓
𝑴𝒐 = 𝟏𝟎𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 → 𝑴𝒐 = 𝟏𝟎𝟗𝟐, 𝟓
𝟏𝟖𝟓 + 𝟐𝟏𝟓
3. Mediana (𝑴𝒆 ):
𝒏
− 𝒇𝒂𝒂(𝒊−𝟏)
𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗𝑨
𝒇𝒂𝒊
Para ubicar el intervalo que contiene la mediana se puede hacer por:
𝒏
1. y se busca en 𝒇𝒂𝒂
𝟐
Para el ejemplo 1
𝒏 𝟔𝟎
El intervalo que contiene la mediana lo ubicamos en = = 𝟑𝟎 60/2 = este valor,
𝟐 𝟐
buscando en la frecuencia absoluta acumulada, está en el 2º intervalo es el mismo de la moda,
Estadística y Probabilística
pero no siempre dan en el mismo, existen ciertas distribuciones que cumplen con esta
90 característica. Si observamos, acá está el 50% en el porcentaje acumulado. Reemplazando en la
fórmula, se tiene que:
𝒏
− 𝒇𝒂𝒂(𝒊−𝟏) 𝟑𝟎 − 𝟏𝟐
𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗ 𝑨 → 𝑴𝒆 = 𝟐𝟎 + ( )∗𝟓
𝒇𝒂𝒊 𝟏𝟖
𝑴𝒆 = 𝟐𝟓
Para el ejemplo 2
𝒏
El intervalo que contiene la mediana lo ubicamos = 𝟐𝟑𝟓, este valor está en 425 en el
𝟐
mismo de la moda, no siempre dan en el mismo, existen ciertas distribuciones que cumplen con
esta característica. Si observamos, acá está el 50% en el porcentaje acumulado. Reemplazando
en la fórmula, se tiene que:
𝒏
− 𝒇𝒂𝒂(𝒊−𝟏) 𝟐𝟑𝟓 − 𝟏𝟖𝟓
𝑴𝒆 = 𝑳𝒊 + 𝟐 ∗ 𝑨 → 𝑴𝒆 = 𝟏𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎
𝒇𝒂𝒊 𝟐𝟒𝟎
𝑴𝒆 = 𝟏𝟎𝟒𝟏, 𝟔𝟔𝟕
Como está dado en miles, se multiplica por 1000, esto es:
91 𝑳𝒊 𝑳𝒔 𝒇𝒂𝒊
0 1 15
1 2 15
2 3 20
3 4 28
4 5 22
TIPS
Recuerde que: El intervalo que contiene la Moda es el más
frecuente.
Una vez definidos los conceptos básicos en el estudio de una distribución de frecuencias de una
variable, se estudiarán las distintas formas de resumir dichas distribuciones mediante medidas de
posición (o de centralización), teniendo presente el error cometido en el resumen mediante las
correspondientes medidas de dispersión.
Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de
manejar todos los datos sobre las variables, tarea que puede ser pesada, se puede caracterizar
su distribución de frecuencias mediante algunos valores numéricos, eligiendo como resumen de
los datos un valor central alrededor del cual se encuentran distribuidos los valores de la variable.
Tomado
de:http://www.monografias.com/trabajos14/medidasposicion/medidasposicion.shtml#ixzz3DQ
Ms8KcO
Estadística y Probabilística
Estas medidas dividen la distribución en partes iguales, así como La Mediana, por lo tanto, se
92 calculan e interpretan similar a ella. Entre estas medidas de posición relativa se tienen:
𝑸𝟏 = 𝟐𝟓%
𝑸𝟐 = 𝟓𝟎%
𝑸𝟏 = 𝟕𝟓%
𝑸𝟏 = 𝟏𝟎𝟎%
Se calcula con la siguiente ecuación:
𝒏
#𝑸 × − 𝒇𝒂𝒂(𝒊−𝟏)
𝑸 = 𝑳𝒊 + ( 𝟒 )∗𝑨
𝒇𝒂𝒊
#𝑸∗𝒏
1. y se busca en 𝒇𝒂𝒂
𝟒
2. El porcentaje respectivo se busca en el porcentaje acumulado.
𝟏∗𝟒𝟕𝟎
𝑸𝟏 = → 𝑸𝟏 = 𝟏𝟏𝟕, 𝟓, en la 𝒇𝒂𝒂𝒊 está en 130 o el 25% está acá también
𝟒
(en la tabla es el intervalo azul); Reemplazando en la fórmula, se tiene:
Estadística y Probabilística
𝟏𝟏𝟕, 𝟓 − 𝟑𝟎
93 𝑸𝟏 = 𝟔𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 → 𝑸𝟏 = 𝟕𝟕𝟓
𝟏𝟎𝟎
Como está dado en miles de pesos: 𝟕𝟕𝟓 × 𝟏𝟎𝟎𝟎 = 𝟕𝟕𝟓. 𝟎𝟎𝟎
El 25% de los sueldos de los tecnólogos de Medellín es de $ 775.000 o menos.
𝑫𝟏 = 𝟏𝟎%
𝑫𝟐 = 𝟐𝟎%
𝑫𝟑 = 𝟑𝟎%
𝑫𝟒 = 𝟒𝟎%
⋮
𝑫𝟏𝟎 = 𝟏𝟎𝟎%
Se calcula con la siguiente ecuación:
𝒏
# 𝑫 ∗ 𝟏𝟎 − 𝒇𝒂𝒂(𝒊−𝟏)
𝑫 = 𝑳𝒊 + ( )∗𝑨
𝒇𝒂𝒊
#𝑫∗𝒏
1. y se busca en 𝒇𝒂𝒂
𝟏𝟎
2. El porcentaje respectivo se busca en el porcentaje acumulado.
Estadística y Probabilística
Se tiene que:
𝟒𝟕𝟎
𝑫𝟑 = 𝟑 ∗ → 𝑫𝟑 = 𝟏𝟒𝟏, en la 𝒇𝒂𝒂𝒊 está en 185 o el 𝟑𝟎% está acá también (En la
𝟏𝟎
tabla es el intervalo de color marrón).
𝒏
#𝑫∗ − 𝒇𝒂𝒂(𝒊−𝟏) 𝟏𝟒𝟏 − 𝟏𝟑𝟎
𝑫𝟑 = 𝑳𝒊 + ( 𝟏𝟎 ) ∗ 𝑨 = 𝟖𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 →
𝒇𝒂𝒊 𝟓𝟓
𝑫𝟑 = 𝟖𝟒𝟎
𝑷𝟏 = 𝟏%
𝑷𝟐 = 𝟐%
𝑷𝟑 = 𝟑%
𝑷𝟒 = 𝟒%
⋮
𝑷𝟏𝟎𝟎 = 𝟏𝟎𝟎%
Se calcula con la siguiente ecuación:
Estadística y Probabilística
95 𝒏
# 𝑷 ∗ 𝟏𝟎𝟎 − 𝒇𝒂𝒂(𝒊−𝟏)
𝑷 = 𝑳𝒊 + ( )∗𝑨
𝒇𝒂𝒊
#𝑷∗𝒏
1. y se busca en 𝒇𝒂𝒂
𝟏𝟎𝟎
2. El porcentaje respectivo se busca en el porcentaje acumulado.
Se tiene que:
𝟒𝟕𝟎
𝑷𝟓 = 𝟓 ∗ → 𝑷𝟓 = 𝟐𝟑, 𝟓 En la 𝒇𝒂𝒂𝒊 está en 𝟑𝟎 𝒐 𝒆𝒍 𝟓% está acá también (En la
𝟏𝟎𝟎
tabla es el intervalo de color Fucsia).
𝟐𝟑, 𝟓 − 𝟎
𝑷𝟓 = 𝟒𝟎𝟎 + ( ) ∗ 𝟐𝟎𝟎 → 𝑷𝟓 = 𝟓𝟓𝟔, 𝟔𝟔𝟕
𝟑𝟎
Como está dado en miles de pesos:
1. Las siguientes son las notas de dos grupos de estadística de UNIREMINGTON, de una muestra
tomada al azar:
GRUPO I
𝒙𝒊 (𝒏𝒐𝒕𝒂) 𝒇𝒂𝒊 (# 𝒆𝒔𝒕𝒖𝒅𝒊𝒂𝒏𝒕𝒆𝒔)
1 4
2 11
3 10
4 5
5 12
𝑁𝑃: 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑟𝑜𝑛 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 4
GRUPO II
𝒙𝒊 (𝒏𝒐𝒕𝒂) 𝒇𝒂𝒊 (# 𝒆𝒔𝒕𝒖𝒅𝒊𝒂𝒏𝒕𝒆𝒔)
1 17
2 16
3 2
4 3
5 4
𝑁𝑃: 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑟𝑜𝑛 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 6
Estadística y Probabilística
TIPS
Recuerde que: Una vez definidos los conceptos básicos en el
estudio de una distribución de frecuencias de una variable, se
estudiarán las distintas formas de resumir dichas distribuciones
mediante medidas de posición (o de centralización), teniendo
presente el error cometido en el resumen mediante las
correspondientes medidas de dispersión.
Entre más grande sea el grado de variación, menores uniformidades tendrán los datos (sinónimo
de heterogeneidad) y por lo tanto menor representatividad o confiabilidad del promedio de
tendencia central o localización por haber sido obtenido de datos dispersos.
Por el contrario, si este valor es pequeño (respecto a la unidad de medida) entonces, hay una
gran uniformidad entre los datos. Cuando es cero quiere decir que todos los datos son iguales.
Estadística y Probabilística
Hay básicamente dos tipos de medidas de dispersión: Medidas Absolutas y Medidas Relativas.
98
Las medidas absolutas se caracterizan por ser números concretos, es decir, valores expresados
en las mismas unidades de la variable en estudio y que por lo tanto no permiten comparaciones
o análisis respecto a la mayor o menor dispersión de series expresadas en diferentes unidades.
Estas medidas son: la varianza, la desviación estándar y el rango intercuartilico.
Las medidas relativas de dispersión son valores abstractos, es decir, medidas adimensionales y
por lo tanto no expresadas en ninguna unidad específica, obviando así el inconveniente señalado
para las medidas absolutas. La principal medida es el coeficiente de variación”.
Para tener una mejor comprensión de estos conceptos, veamos el siguiente ejemplo:
A continuación, se tiene el número de unidades producidas por hora durante un día por dos
operarios:
A 60 30 40 100 20 80 60 40
B 50 60 60 40 80 50 50 40
Para calcular el promedio (la media aritmética) de las unidades producidas por hora en el día de
cada operario, se aplica la fórmula correspondiente a la media aritmética, esto es:
Operario A:
𝟔𝟎 + 𝟑𝟎 + 𝟒𝟎 + 𝟏𝟎𝟎 + 𝟐𝟎 + 𝟖𝟎 + 𝟔𝟎 + 𝟒𝟎 𝟒𝟑𝟎
𝝁𝑨 = → 𝝁𝑨 =
𝟖 𝟖
𝝁𝑨 = 𝟓𝟑. 𝟕𝟓 𝒖𝒏𝒊𝒅𝒂𝒅𝒆𝒔
Operario B:
𝟓𝟎 + 𝟔𝟎 + 𝟔𝟎 + 𝟒𝟎 + 𝟖𝟎 + 𝟓𝟎 + 𝟓𝟎 + 𝟒𝟎 𝟒𝟑𝟎
𝝁𝑩 = → 𝝁𝑩 =
𝟖 𝟖
Estadística y Probabilística
𝝁𝑩 = 𝟓𝟑. 𝟕𝟓 𝒖𝒏𝒊𝒅𝒂𝒅𝒆𝒔
99
De acuerdo a los resultados obtenidos, ambos operarios tienen el mismo promedio. Pero
analicemos algo adicional, se traza un diagrama de líneas para cada operario:
120
número de horas trabajadas
100
80 oper A
60 oper B
40 promedio
20
0
1 2 3 4 5 6 7 8
hora
Analizando el gráfico obtenido se tiene que: el operario A presenta mayor variación con respecto
al promedio que el operario B.
Para analizar cómo varía un conjunto de datos con relación a su propio promedio.
Para comparar la variabilidad de dos o más conjuntos de datos entre sí.
1. La Varianza
Se define como:
Estadística y Probabilística
100 “La varianza es la medida aritmética del cuadrado de las desviaciones respecto a la
media de una distribución estadística”.
a. Si los datos no están organizados en una tabla de frecuencias, la varianza se calcula así:
1. Como parámetro, es decir, si los datos se toman de una población:
𝟐
(𝒙𝟏 − 𝝁)𝟐 + (𝒙𝟐 − 𝝁)𝟐 + (𝒙𝟑 − 𝝁)𝟐 + ⋯ + (𝒙𝒏 − 𝝁)𝟐
𝝈 = →
𝑵
𝟐
∑(𝒙𝒊 − 𝝁)𝟐
𝝈 =
𝑵
2. Como estadística, es decir, si los datos se toman de una muestra:
𝟐
̅)𝟐 + (𝒙𝟐 − 𝒙
(𝒙𝟏 − 𝒙 ̅)𝟐 + (𝒙𝟑 − 𝒙
̅)𝟐 + ⋯ + (𝒙𝒏 − 𝒙
̅ )𝟐
𝑺 = →
𝒏−𝟏
𝟐
̅ )𝟐
∑(𝒙𝒊 − 𝒙
𝝈 =
𝒏−𝟏
𝑶𝑷𝑬𝑹𝑨𝑹𝑰𝑶 𝑨
Estadística y Probabilística
101 (𝒙𝒊 − 𝝁𝑨 )𝟐
𝒙𝒊
∑ = 𝟒𝟑𝟎 ∑ = 𝟒𝟗𝟖𝟕, 𝟓
∑ 𝒙𝒊 𝟒𝟑𝟎
𝝁𝑨 = → 𝝁𝑨 = → 𝝁𝑨 = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐(
∑(𝒙𝒊 − 𝝁)𝟐 𝟒𝟗𝟖𝟕, 𝟓
𝝈 𝑨) = → 𝝈𝟐 (𝑨) = → 𝝈𝟐 (𝑨) = 𝟔𝟐𝟑, 𝟒𝟑𝟖
𝑵 𝟖
𝑶𝑷𝑬𝑹𝑨𝑹𝑰𝑶 𝑩
Estadística y Probabilística
102 (𝒙𝒊 − 𝝁𝑩 )𝟐
𝒙𝒊
∑ = 𝟒𝟑𝟎 ∑ = 𝟏𝟏𝟖𝟕, 𝟓
∑ 𝒙𝒊 𝟒𝟑𝟎
𝝁𝑩 = → 𝝁𝑩 = → 𝝁𝑩 = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐(
∑(𝒙𝒊 − 𝝁)𝟐 𝟏𝟏𝟖𝟕, 𝟓
𝝈 𝑩) = → 𝝈𝟐 (𝑩) = → 𝝈𝟐 (𝑨) = 𝟏𝟒𝟖, 𝟒𝟑𝟖
𝑵 𝟖
Estadística y Probabilística
(𝒙𝟏 − 𝝁)𝟐 𝒇𝒂𝟏 + (𝒙𝟐 − 𝝁)𝟐 𝒇𝒂𝟐 + (𝒙𝟑 − 𝝁)𝟐 𝒇𝒂𝟑 + ⋯ + (𝒙𝒏 − 𝝁)𝟐 𝒇𝒂𝒏
𝝈𝟐 =
𝑵
𝟐
∑(𝒙𝒊 − 𝝁)𝟐 𝒇𝒂𝒊
𝝈 =
𝑵
𝟐
̅)𝟐 𝒇𝒂𝒊
∑(𝒙𝒊 − 𝒙
𝝈 =
𝒏−𝟏
OPERARIO A
𝟏𝟎𝟎 𝟏 𝟏𝟎𝟎 ∗ 𝟏 = 𝟏𝟎𝟎 (𝟏𝟎𝟎 − 𝟓𝟑, 𝟕𝟓)𝟐 ∗ 𝟏 = (𝟒𝟔, 𝟐𝟓)𝟐 ∗ 𝟏 = 𝟐𝟏𝟑𝟗, 𝟎𝟔𝟐𝟓
∑ 𝒙𝒊 ∗ 𝒇𝒂𝒊 𝟒𝟑𝟎
𝝁𝑨 = = = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐
∑(𝒙𝒊 − 𝝁)𝟐 𝒇𝒂𝒊 𝟒𝟗𝟖𝟕, 𝟓
𝝈 = = = 𝟔𝟐𝟑, 𝟒𝟑𝟖
𝑵 𝟖
OPERARIO B
∑ 𝒙𝒊 ∗ 𝒇𝒂𝒊 𝟒𝟑𝟎
105 𝝁𝑩 = = = 𝟓𝟑, 𝟕𝟓
𝑵 𝟖
𝟐
∑(𝒙𝒊 − 𝝁)𝟐 𝒇𝒂𝒊 𝟏𝟏𝟖𝟕, 𝟓
𝝈 = = = 𝟏𝟒𝟖, 𝟒𝟑𝟖
𝑵 𝟖
Cálculo de la Varianza
̅
1. Se calcula el promedio o Media Aritmética 𝝁 𝒐 𝒙.
2. DESVIACIÓN ESTÁNDAR
106
También se conoce como Desviación Típica, se define como:
(http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp#introduccion)
a. Si los datos no están organizados en una tabla de frecuencias, la varianza se calcula así:
1. Como parámetro, es decir, si los datos se toman de una población:
(𝒙𝟏 − 𝝁)𝟐 𝒇𝒂𝟏 + (𝒙𝟐 − 𝝁)𝟐 𝒇𝒂𝟐 + (𝒙𝟑 − 𝝁)𝟐 𝒇𝒂𝟑 + ⋯ + (𝒙𝒏 − 𝝁)𝟐 𝒇𝒂𝒏
𝝈= √
𝑁
A simple vista parece ser que el operario D tiene 3 veces más variabilidad que el operario C; pero
debe tenerse en cuenta que el operario D produce unidades en promedio 4 veces más que el
operario C; para evaluar este tipo de resultados se tiene un elemento denominado Coeficiente
de Dispersión o de variación, cuya conceptualización es la siguiente:
Es conocida como variación relativa, puesto que muestra en qué porcentaje está variando un
conjunto de datos; es decir, que no está expresado en las unidades de investigación, se calcula
de la siguiente forma:
𝝈
𝐶. 𝑽 = 𝒙̅ ∗ 𝟏𝟎𝟎 (𝒑𝒂𝒓𝒂 𝒖𝒏𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏)
𝑺
𝑪. 𝑽 = 𝒙̅ ∗ 𝟏𝟎𝟎 (𝒑𝒂𝒓𝒂 𝒖𝒏𝒂 𝒎𝒖𝒆𝒔𝒕𝒓𝒂)
Para el ejercicio anterior:
𝟓
𝐶. 𝑽𝑪 = 𝟒𝟎 ∗ 𝟏𝟎𝟎 = 𝟏𝟐. 𝟓%
𝟏𝟓
𝐶. 𝑽𝑫 = 𝟏𝟔𝟎 ∗ 𝟏𝟎𝟎 = 𝟗. 𝟒%
𝐶. 𝑽𝑨 =
𝟐𝟒,𝟗𝟔𝟗
∗ 𝟏𝟎𝟎 = 𝟒𝟔, 𝟒𝟓𝟒 %
108 𝟓𝟑,𝟕𝟓
𝐶. 𝑽𝑩 =
𝟏𝟐,𝟏𝟖𝟒
𝟓𝟑,𝟕𝟓
∗ 𝟏𝟎𝟎 = 𝟐𝟐, 𝟔𝟔𝟖 %
𝑳𝒊 𝑳𝒔 𝒇𝒂 𝒊 𝒙𝒊 𝒙 𝒊 ∗ 𝒇𝒂 𝒊 ( 𝒙 𝒊 − 𝝁 ) 𝟐 ∗ 𝒇𝒂 𝒊
𝑵 = 𝟖𝟏 ∑ 𝟐𝟖𝟏𝟎. 𝟓 ∑ 𝟕𝟏𝟕𝟐. 𝟖𝟒
Estadística y Probabilística
∑ 𝒙𝒊 ∗𝒇𝒂𝒊 𝟐𝟖𝟏𝟎.𝟓
109 𝝁= = = 𝟑𝟒, 𝟔𝟗𝟖 Promedio de edad de los empleados.
𝑵 𝟖𝟏
∑(𝒙𝒊 −𝝁)𝟐 𝒇𝒂𝒊 𝟕𝟏𝟕𝟐,𝟖𝟒
𝟐
𝝈 = = = 𝟖𝟖, 𝟓𝟓𝟒 , no se interpreta.
𝑵 𝟖𝟏
Las edades de los empleados de la empresa tienen una Desviación Promedio de 9,41 años, con
relación al promedio que es de 34,689 años.
Mónica 88 68 90 101 89
Alex 77 89 90 87 78
2. Los siguientes son los ingresos semanales (en millones de pesos) de 2 centros de atención
psicológica durante los últimos 2 años, de acuerdo con una muestra aleatoria:
0 1 13 0 1 33
1 2 40 1 2 10
2 3 10 2 3 10
3 4 24 3 4 40
4 5 3 4 5 7
d. Los ingresos menos frecuentes del Centro psicológico B están dos intervalos:
1. Verdadero
2. Falso
Estadística y Probabilística
TIPS
Recuerde que: Hay básicamente dos tipos de medidas de
dispersión: Medidas Absolutas y Medidas Relativas.
Evento simple: Un suceso o evento simple es un subconjunto del espacio muestral que
113 contiene un único elemento.
Combinación: Técnica de conteo que permite calcular el número de arreglos que pueden
realizarse con todos o con una parte de los elementos de un solo conjunto, en donde no
interesa el orden de los elementos.
Determinar a través del análisis combinatorio, como método rápido y eficaz, el conteo
del número de maneras o formas en que pueden ordenarse o seleccionarse elementos de
un conjunto, con elementos tales como: La Permutación, La Variación y La Combinación
Estadística y Probabilística
La rama de las matemáticas que: estudia, mide o determina los experimentos o fenómenos
aleatorios.
La frecuencia relativa con que se presenta un evento se puede llegar a repetir una cierta
cantidad de veces, y el otro es que
Definición de Probabilística
La probabilidad mide la frecuencia con la que ocurre un resultado en un experimento bajo
condiciones suficientemente estables, para sacar conclusiones sobre la probabilidad de
Estadística y Probabilística
FENÓMENOS EJEMPLOS
Espacio Muestral
Por ejemplo:
𝛀 = {1, 2, 3, 4, 5, 6}
116
Nota: Se define como un Suceso Aleatorio (Evento Simple) a cualquier subconjunto del
Espacio Muestral, se representa con una letra mayúscula, por ejemplo, que:
Una bolsa contiene bolas blancas y negras, se extraen sucesivamente tres bolas, entonces se
da el siguiente evento:
𝛀
= {(𝐛, 𝐛, 𝐛), (𝐛, 𝐛, 𝐧), (𝐛, 𝐧, 𝐛), (𝐧, 𝐛, 𝐛), (𝐛, 𝐧, 𝐧), (𝐧, 𝐛, 𝐧), (𝐧, 𝐧, 𝐛), (𝐧, 𝐧, 𝐧)}
Se piden tres sucesos aleatorios:
𝐀 ⊂ 𝛀: 𝑨 𝒆𝒔 𝒔𝒖𝒃𝒄𝒐𝒏𝒋𝒖𝒏𝒕𝒐 𝒅𝒆 𝛀.
𝐁 = {(𝐛, 𝐛, 𝐛), (𝐛, 𝐛, 𝐧), (𝐛, 𝐧, 𝐛), (𝐧, 𝐛, 𝐛), (𝐛, 𝐧, 𝐧), (𝐧, 𝐛, 𝐧), (𝐧, 𝐧, 𝐛)}
𝐁 ⊂ 𝛀: 𝑩𝒆𝒔 𝒔𝒖𝒃𝒄𝒐𝒏𝒋𝒖𝒏𝒕𝒐 𝒅𝒆 𝛀
Estadística y Probabilística
117
c. El suceso 𝐂 = { 𝐄𝐱𝐭𝐫𝐚𝐞𝐫 𝐮𝐧𝐚 𝐬𝐨𝐥𝐚 𝐛𝐨𝐥𝐚 𝐧𝐞𝐠𝐫𝐚}
𝐂 ⊂ 𝛀: 𝑪 𝒆𝒔 𝒔𝒖𝒃𝒄𝒐𝒏𝒋𝒖𝒏𝒕𝒐 𝒅𝒆 𝛀
elementos), se
118 representa por la letra
griega 𝝓, que significa
conjunto vacío.
Se da la compatibilidad, ya que se
puede obtener el 6 y este es par
y múltiplo de 6.
119 SUCESOS DEPENDIENTES Dos sucesos A y B son Extraer dos caratas de una
Dependientes cuando baraja, sin reposición, son dos
la probabilidad de que sucesos dependientes.
suceda A, se ve
afectada por que haya
sucedido o no B.
a. Eventos Simples
Se definen como la forma simple de representar un evento o experimento.
Es un subconjunto del espacio muestral que contiene un solo elemento, por ejemplo:
1. Si se trata de contar objetos o cosas y el espacio muestral es:
2. Si se lanza una moneda dos veces, el espacio muestral está dado por:
𝛀 = {𝐜𝐜, 𝐜𝐬, 𝐬𝐜, 𝐬𝐬}, donde C: cara y S: sello, los sucesos simples o elementales
son, entonces:
b. Evento Compuesto
Puede considerarse que un evento es una composición de dos o más eventos distintos. Se
da de dos formas:
1. Unión
2. Intersección
Estadística y Probabilística
121
La intersección de dos eventos 𝑨 𝒚 𝑩 es el evento que ocurre si tanto 𝑨 como 𝑩
tienen elementos en común. Se representa por ∩.
3. Eventos Complementarios
a. Regla de la Adición
b. Regla de la Multiplicación
Primero, definimos los eventos. Como queremos que ella saque unos blancos en su tercer
intento, es necesario que no saque blancos en su primer y segundo intentos
Los eventos son independientes, porque cada resultado eliminado es reemplazado. Los
eventos anteriores no cambian las probabilidades de eventos posteriores
Ahora revisa si son independientes. Beth elimina un resultado cuando saca un par de
calcetines, pero luego lo regresa al cajón, entonces las probabilidades no cambiarán
El tamaño de espacio muestral para cada evento es 10 (Hay 10 pares de calcetines de donde
escoger)
El tamaño del espacio de eventos para el Evento A y el Evento B es 7. (Hay 7 pares que no
son blancos)
Estadística y Probabilística
123 El tamaño del espacio de eventos del Evento C es 3. (Hay 3 pares que son blancos)
P(A y B y C)=P(A).P(B).P(C)=7/10×7/10×3/10=147/1000 (Para obtener calcetines blancos en
tres intentos)
𝑷 (𝑨 ∩ 𝑩) = 𝑷(𝑨). 𝑷(𝑩)
2) Si los eventos son dependientes:
Estadística y Probabilística
TIPS
Estadística y Probabilística
125
Recuerde que: En las operaciones con eventos, dados dos eventos, A
y B, se llaman:
AUB Es EL Evento
formado por todos los
Unión elementos de A y
todos los elementos
de B. Sin repetir
elementos.
AnB Es el evento
formado por todos los
elementos que son, a
la vez, de A y de B. O
Intersección sea, sólo los
elementos que se
repiten (comunes a
los 2 conjuntos)
A-B es el evento
formado por todos los
Diferencia elementos de A que
no son de B
El evento A´ se llama
evento
Evento complementario de
Complementario A. Y se cumple que
A´= S-A
Dos eventos A y B, se
llaman mutuamente
excluyentes, cuando
Eventos no tienen ningún
elemento en común.
Mutuamente Es decir, cuando
Excluyentes AnB=∅.
También se le llaman
eventos disjuntos.
Estadística y Probabilística
A través del análisis combinatorio se pueden resolver muchos problemas prácticos del
entorno, tales como: cuántos números diferentes de teléfonos, placas o loterías se pueden
generar utilizando un conjunto dado de números y letras.
La Regla multiplicativa:
Si hay 𝒏𝟏 formas de hacer una cosa y 𝒏𝟐 formas de hacer otra, hay
𝒏𝟏 ∗ 𝒏𝟐 Formas de realizarlas ambas.
127
# DE FORMAS 𝒏𝟏 = 𝟐 𝒏𝟐 = 𝟐
𝒏𝟏 ∗ 𝒏𝟐 = 𝟒
Admón. de
PROCEDIMIENTO Hoja Electrónica Cálculo
personal
# DE FORMAS 𝒏𝟏 = 𝟐 𝒏𝟐 = 𝟒 𝒏𝟑 = 𝟑
Estadística y Probabilística
128
𝒏𝟏 ∗ 𝒏𝟐 ∗ 𝒏𝟑 = 𝟐𝟒
Solución:
Datos: 𝒏𝟏 = 𝟒, 𝒏𝟐 = 𝟕, 𝒏𝟑 = 𝟐 𝒚 𝒏𝟒 = 𝟐 Entonces,
𝒏𝟏 ∗ 𝒏𝟐 ∗ 𝒏𝟑 ∗ 𝒏𝟒 = 𝟒 ∗ 𝟕 ∗ 𝟐 ∗ 𝟐 = 𝟏𝟏𝟐
𝒏𝟏 = 𝟒, 𝒏𝟐 = 𝟐, 𝒏𝟑 = 𝟓 Entonces,
𝒏𝟏 ∗ 𝒏𝟐 ∗ 𝒏𝟑 = 𝟒 ∗ 𝟐 ∗ 𝟓 = 𝟒𝟎
Estadística y Probabilística
3. Se lanza una moneda 2 veces y un dado una vez ¿Cuántos resultados son posibles?
129
PROCEDIMIENTO Moneda 1 Moneda 2 Dado
# DE FORMAS 𝒏𝟏 = 𝟐 𝒏𝟐 = 𝟐 𝒏𝟑 = 𝟔
𝒏𝟏 ∗ 𝒏𝟐 ∗ 𝒏𝟑 = 𝟐 ∗ 𝟐 ∗ 𝟔 = 𝟐𝟒
4. ¿De cuantas formas se puede responder un examen si el examen tiene 3 preguntas de
opción múltiple con 4 opciones cada una?
# DE FORMAS 𝒏𝟏 = 𝟒 𝒏𝟐 = 𝟒 𝒏𝟑 = 𝟒
𝒏𝟏 ∗ 𝒏𝟐 ∗ 𝒏𝟑 = 𝟒 ∗ 𝟒 ∗ 𝟒 = 𝟔𝟒
PERMUTACIONES
También se puede definir como todo arreglo de elementos en donde nos interesa el lugar o
posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
Nota: Para obtener las fórmulas de permutaciones y de combinaciones hay que definir
primero lo que es 𝒏! (ene factorial), elemento matemático involucrado en las fórmulas
utilizadas para la resolución de problemas.
Factorial
Definición: El factorial de un número entero positivo (ℤ+ ), se define como el producto de
todos los números enteros positivos desde el número 1 (los números naturales) hasta el
número 𝒏, esto se da como:
Estadística y Probabilística
𝒏 𝒏!
𝟏𝟑
𝟏𝟓 1.307.674.368.000
𝟐𝟎 2.432.902.008.176.640.000
𝟑𝟎
𝟒𝟎
3. Halle el resultado de las siguientes expresiones, pero antes de hacerlo simplifique hasta
donde sea posible, se resolverá el primer ejercicio para que lo tomes como modelo:
Estadística y Probabilística
𝟕! 𝟕×𝟔×𝟓×𝟒×𝟑×𝟐×𝟏
131 a)
𝟓! ∗ 𝟑!
=
𝟓×𝟒×𝟑×𝟐×𝟏∗𝟑×𝟐×𝟏
, simplificando en el numerador y en el
𝟕!
denominador, se tiene: =𝟕
𝟓! ∗ 𝟑!
15!
b) R/360360
(15 5)!
8!
c) R/1680
(8 4)!
6!
d) R/20
3!(6 3)!
10!
e) R/210
4!(10 4)!
# de formas 𝑛1 = 7 𝑛2 = 6 𝑛3 = 5 𝑛4 = 4 𝑛5 = 3 𝑛6 = 2 𝑛7 = 1
𝟕! = 𝟕 × 𝟔 × 𝟓 × 𝟒 × 𝟑 × 𝟐 × 𝟏 = 𝟓𝟎𝟒𝟎 ∗
2. ¿De cuántas formas se pueden ordenar las letras del siguiente conjunto:
132
M = {x, y, z, ¿w}?
Solución:
# de formas 𝑛1 = 4 𝑛2 = 3 𝑛3 = 2 𝑛4 = 1
𝟒! = 𝟒 × 𝟑 × 𝟐 × 𝟏 = 𝟐𝟒 ∗
Solución:
# de formas 𝑛1 = 6 𝑛2 = 5 𝑛3 = 4 𝑛4 = 3 𝑛5 = 2 𝑛6 = 1
𝟔! = 𝟔 × 𝟓 × 𝟒 × 𝟑 × 𝟐 × 𝟏 = 𝟕𝟐𝟎 ∗
Son las ordenaciones de varios objetos en subgrupos sin repetición, el orden de estos
133 subgrupos es importante; cuando se cambia el orden de los elementos, el grupo cambia, es
otro totalmente diferente.
Se dice entonces que:
𝒏!
𝑷𝒏𝒓 =
(𝒏 − 𝒓)!
𝒏!
𝑷𝒏𝒓 = (𝒏−𝒓)!, se tiene, entonces:
𝟕! 𝟕! 𝟕×𝟔×𝟓×𝟒×𝟑!
𝑷𝟕𝟒 = (𝟕−𝟒)! = 𝟑! = , simplificando, se tiene que:
𝟑!
𝑷𝟕𝟒 = 𝟕 × 𝟔 × 𝟓 × 𝟒 = 𝟖𝟒𝟎
Nota: Con la regla multiplicativa la solución sería:
𝟕 × 𝟔 × 𝟓 × 𝟒 = 𝟖𝟒𝟎
Puesto que
Estadística y Probabilística
Es decir:
𝑁° 𝑑𝑒 𝑓𝑜𝑟𝑚𝑎𝑠 𝒏𝟏 = 𝟕 𝒏𝟐 = 𝟔 𝒏𝟑 = 𝟓 𝒏𝟒 = 𝟒
1. En el ejemplo (¿De cuántas formas se pueden ordenar las letras del siguiente conjunto:
M = {x, y, z, ¿w}?)
Solución:
a. Mecánicamente: 𝒙𝒚, 𝒙𝒛, 𝒙𝒘, 𝒚𝒙, 𝒚𝒛, 𝒚𝒘, 𝒛𝒙, 𝒛𝒚, 𝒛𝒘, 𝒘𝒙, 𝒘𝒚, 𝒘𝒛
Estadística y Probabilística
N° DE FORMAS 𝒏𝟏 = 𝟒 𝒏𝟐 = 𝟑
2. ¿Cuántas palabras de 3 letras se pueden formar con las letras ABCDE sin repetir letra?
Solución:
Datos
5 letras: ABCDE
Palabras de tres letras que se pueden formar.
𝒏! 5! 5 × 4 × 3 × 2 × 1 5 × 4 × 3 × 2 × 1 120
𝑷𝟓𝟑 = = = = =
(𝒏 − 𝒓)! (5 − 3)! 2! 2×1 2
= 60
Puesto que en la primera posición se puede poner cualquiera de las 5 letras, En la segunda
posición se puede poner cualquiera de las 4 letras restantes y en la tercera posición se puede
poner cualquiera de las 3 letras restantes.
Estadística y Probabilística
N° DE FORMAS 𝒏𝟏 = 𝟓 𝒏𝟐 = 𝟒 𝒏𝟏 = 𝟑
VARIACIONES
Dado un conjunto de 𝒏 elementos, se sabe que si se toman todos y se ordena de todas las
formas posibles se tendrán permutaciones de 𝒏 elementos; pero si en lugar de tomar todos
los elementos se toma una parte o un subconjunto de ellos y se ordenan de todas las formas
posibles, se obtendrán variaciones.
También se define una variación como cada una de las tuplas (una secuencia ordenada de
objetos) de cierto orden que pueden formarse tomando elementos de un conjunto.
Nota: Las tuplas se emplean para describir objetos matemáticos que tienen estructura,
es decir, que pueden ser descompuestos en un cierto número de componentes
𝒎!
𝑽𝒏𝒎 =
(𝒎 − 𝒏)!
Dónde:
Estadística y Probabilística
137 𝒎: 𝑷𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏
𝒏: 𝑴𝒖𝒆𝒔𝒕𝒓𝒂
Procedimiento:
Se forman subconjuntos de tres elementos distintos, en los que nos importa el orden 123,
es distinto de 321.
Se formarán, entonces:
𝒎! 𝟔! 𝟔! 𝟔 × 𝟓 × 𝟒 × 𝟑 × 𝟐 × 𝟏
𝑽𝒏𝒎 = → 𝑽𝟑𝟔 = = = = 𝟔 × 𝟓 × 𝟒 = 𝟏𝟐𝟎
(𝒎 − 𝒏)! (𝟔 − 𝟑)! 𝟑! 𝟑×𝟐×𝟏
2. En la final de unas olimpiadas corren la final de 100m 8 atletas. ¿De cuántas formas se
puede configurar el pódium?
Nota: Recuerde que al pódium de una competencia solo suben tres participantes (el 1°, el 2°
y el 3°), por eso se toma 𝒏 = 𝟑.
Estadística y Probabilística
𝑽𝑹𝒏𝒎 = 𝒎𝒏
¿Cuántas apuestas distintas se pueden hacer en la quiniela para cubrir todas las
posibilidades? Nota: Incluido el pleno al 15.
Para rellenar una quiniela se usan tres signos 1, X, 2, luego se tienen tres elementos. Se
rellenan 15 casillas, por tanto, se agrupan de 15 en 15, entonces:
Combinaciones
𝑛 =( 𝑚+𝑛−1 (𝑚+𝑛−1)!
𝐶𝑅𝑚 )=
𝑛 𝑛!(𝑚−1)!
Procedimiento
De acuerdo a ***, se tiene que:
Sí se repiten los elementos. Puede elegir más de una botella del mismo tipo.
𝑛 = (𝑚+𝑛−1)!
𝐶𝑅𝑚 𝑛!(𝑚−1)!
Estadística y Probabilística
140 4 = (5+4−1)! =
8!
=
8×7×6×5×4×3×2×1
)
𝐶𝑅5 4!(5−1)! 4!.4! 4×3×2×1.4×3×2×1
8 × 7 × 6 × 5 1680
𝐶𝑅54 = = = 70
4×3×2×1 24
𝑛
𝑛
𝑉𝑚
𝐶𝑚 =
𝑃𝑛
Nota 1: Las combinaciones se pueden calcular mediante factoriales, utilizando la siguiente
ecuación:
𝑛
𝑚!
𝐶𝑚 =
𝑛! (𝑚 − 𝑛)!
Nota 2: Las combinaciones se denotan por:
Estadística y Probabilística
Procedimiento
a. Aplicando:
𝑛
𝑉𝑚𝑛 10 × 9 × 8 × 7 5040
𝐶𝑚 = = = = 210
𝑃𝑛 4×3×2×1 24
b. Aplicando:
𝑛
𝑚! 10! 10!
𝐶𝑚 = = = →
𝑛! (𝑚 − 𝑛)! 4!. (10 − 4)! 4! .6!
𝑛
10 × 9 × 8 × 7 × 6!
𝐶𝑚 = →
(4 × 3 × 2 × 1).6!
𝑛
5040
𝐶𝑚 = = 210
24
3. En una clase de 35 alumnos se quiere elegir un comité formado por tres alumnos.
¿Cuántos comités diferentes se pueden formar?
Procedimiento
b. Se aplica la ecuación:
Estadística y Probabilística
142 35.34.33
3
𝐶35 = = 6545
3.2.1
Solución: Se pueden formar 6545 grupos de tres estudiantes.
Tipos de probabilidades
1. Probabilidad Clásica
La probabilidad de que el suceso A ocurra dado que, o a condición de que, haya ocurrido ya
el suceso B se denomina Probabilidad Condicional, y está determinado por:
Diagrama de Árbol
Estadística y Probabilística
Cuando se tiene que hallar las probabilidades de varios sucesos conjuntos, suele ser útil de
143 dibujar un árbol de probabilidades.
“Un diagrama de árbol es una herramienta que se utiliza para determinar todos los posibles
resultados de un experimento aleatorio.
En el cálculo de la probabilidad se requiere conocer el número de objetos que forman parte
del espacio muestral, estos se pueden determinar con la construcción de un diagrama de
árbol.
Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una
de las posibilidades, acompañada de su probabilidad. Cada una de estas ramas se conoce
como rama de primera generación.
En el final de cada rama de primera generación se constituye a su vez, un nudo del cual
parten nuevas ramas conocidas como ramas de segunda generación, según las posibilidades
del siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final).
Hay que tener en cuenta que la construcción de un árbol no depende de tener el mismo
número de ramas de segunda generación que salen de cada rama de primera generación y
que la suma de probabilidades de las ramas de cada nudo ha de dar 1.
Existe un principio sencillo de los diagramas de árbol que hace que éstos sean mucho más
útiles para los cálculos rápidos de probabilidad: multiplicamos las probabilidades, si se trata
de ramas adyacentes (contiguas), el ejemplo de alumna de la primera facultad, o bien las
sumamos si se trata de ramas separadas que emergen de un mismo punto, el ejemplo de
encontrar un alumno.
Estadística y Probabilística
Teorema de Bayes
Dónde:
Estadística y Probabilística
La probabilidad de B en la hipótesis de A.
𝑷 (𝑩⁄𝑨 )
𝒊
proveedor 1 y el 35% restante del proveedor 2; es decir que, si se selecciona una parte al azar,
147 las probabilidades previas:
𝐏(𝐀𝟏 ) = 𝟎, 𝟔𝟓 y
𝐏(𝐀𝟐 ) = 𝟎, 𝟑𝟓
Además, se tienen datos históricos, B representa el evento de que una parte es buena y M
representa el evento de que una parte es mala o defectuosa:
𝑷 (𝑩⁄𝑨 ) = 𝟎, 𝟗𝟖 Probabilidad de que la parte sea buena dado que venga del
𝟏
proveedor 1.
𝑷 (𝑩⁄𝑨 ) = 𝟎, 𝟗𝟓 Probabilidad de que la parte sea buena dado que venga del
𝟐
proveedor 2.
𝑷 (𝑴⁄𝑨 ) = 𝟎𝟎𝟐 Probabilidad de que la parte sea mala o defectuosa dado que
𝟏
venga del proveedor 1.
𝑷(𝑨𝟏 ) ∗ 𝑷(𝑩/𝑨𝟏 )
𝑷(𝑨𝟏 ∖ 𝑩) =
𝑷(𝑨𝟏 ) ∗ 𝑷(𝑩/𝑨𝟏 ) + 𝑷(𝑨𝟐 ) ∗ 𝑷(𝑩/𝑨𝟐 )
𝑷(𝑨𝟐 ) ∗ 𝑷(𝑩/𝑨𝟐 )
𝑷(𝑨𝟐 ∖ 𝑩) =
𝑷(𝑨𝟏 ) ∗ 𝑷(𝑩/𝑨𝟏 ) + 𝑷(𝑨𝟐 ) ∗ 𝑷(𝑩/𝑨𝟐 )
𝟎, 𝟔𝟓 ∗ 𝟎, 𝟎𝟐 𝟎, 𝟎𝟏𝟑
𝑷(𝑨𝟏 ∖ 𝑴) = = = 𝟎, 𝟒𝟏𝟗
𝟎, 𝟔𝟓 ∗ 𝟎, 𝟎𝟐 + 𝟎, 𝟑𝟓 ∗ 𝟎, 𝟎𝟓 𝟎, 𝟎𝟏𝟑 + 𝟎, 𝟎𝟏𝟖
Nota: Este teorema se puede generalizar para casos donde hay 𝒏 eventos mutuamente
excluyentes 𝑨𝟏 , 𝑨𝟐 , … , 𝑨𝒏 y cuya unión es el espacio muestral
P( Ai ) * P( B / Ai )
P( Ai / B) =
P( A1) * P( B / A1) P( A2) * P( B / A2) ... P( An ) * P( B / An )
Método tabular:
149
Es otro método para calcular dichas probabilidades, las columnas respectivas de la tabla son
así:
COLUMNA DEFINICIÓN
B: En este caso se toma como la nueva información el evento de que la parte sea mala.
Estadística y Probabilística
𝑨𝟏 𝟎, 𝟔𝟓 𝟎, 𝟎𝟐 𝟎, 𝟔𝟓 ∗ 𝟎, 𝟎𝟐 𝟎, 𝟎𝟏𝟑/𝟎, 𝟎𝟑𝟏
= 𝟎, 𝟎𝟏𝟑 = 𝟎, 𝟓𝟖𝟏
𝑨𝟐 𝟎, 𝟑𝟓 𝟎, 𝟎𝟓 𝟎, 𝟑𝟓 ∗ 𝟎, 𝟎𝟓 𝟎, 𝟎𝟏𝟖/𝟎, 𝟎𝟑𝟏
= 𝟎, 𝟎𝟏𝟖 = 𝟎, 𝟒𝟏𝟗
∑=𝟏 ∑=𝟏
COLUMNA DESCRIPCIÓN
P (𝑨𝟏 ) = 0,2
P (𝑨𝟐 ) = 0,5
P (𝑨𝟑 ) = 0,3
Las probabilidades condicionales del evento B dados 𝑨𝟏 , 𝑨𝟐 , y 𝑨𝟑 son:
P (B/ 𝑨𝟏 ) = 0,5
P (B/ 𝑨𝟐 ) = 0,4
P (B/ 𝑨𝟑 ) = 0,3
Calcular las probabilidades posteriores.
Estadística y Probabilística
𝑨𝟏 𝟎, 𝟐 𝟎, 𝟓 𝟎, 𝟐 ∗ 𝟎, 𝟓 𝟎, 𝟎𝟏/𝟎, 𝟑𝟗
= 𝟎, 𝟏 = 𝟎, 𝟐𝟓𝟔
𝑨𝟐 𝟎, 𝟓 𝟎, 𝟒 𝟎, 𝟓 ∗ 𝟎, 𝟒 𝟎, 𝟐/𝟎, 𝟑𝟗
= 𝟎, 𝟐 = 𝟎, 𝟓𝟏𝟐
𝑨𝟑 𝟎, 𝟑 𝟎, 𝟑 𝟎, 𝟑 ∗ 𝟎, 𝟑 0,09⁄0,39 = 0,231
= 𝟎, 𝟎𝟗
TIPS
a. En las combinaciones con Repetición: De m elementos
tomados de n en n, dónde m ≥ n, son los distintos grupos
formados por n elementos de forma tal que:
***
No entran todos los elementos
No importa el orden
Si se repiten los elementos
****
No entran todos los elementos
No importa el orden
No se repiten los elementos
Estadística y Probabilística
4. Si una moneda se lanza dos veces al aire, cual es la probabilidad de que ambos
lanzamientos su resultado sea sello es:
(1/2) x (1/2) = (1/4)
8. ¿De cuantas maneras de distintas formas se pueden colocar en un estante en fila 5 bolas
blancas, 4 verdes, 3 rojas, 7 azules y 5 negras?
10. En una oficina de consultoría estadística se cuentan con 7 secretarias para 3 despachos.
¿De cuantas formas se puede asignar a cada despacho las secretarias?
11. (Variación con repetición) ¿Cuántas palabras de diez letras se pueden usar con las letras
del alfabeto a y b?
Vmn = nm
V102 = 210
V102 = 1024
12. ¿Cuantos números se pueden llegar a formar con tres cifras de nueve cifras del sistema
decimal?
13. (Combinación sin repetición) De cuantas maneras se pueden sacar 10 naranjas de una
caja que contiene 20 naranjas?
nCm : n! / m! (n - m)!
20C10 : 20! / 10! (20 - 10)!
20C10 : 184756
14. Cuantos grupos de 5 alumnos se pueden formar con 25 de una clase de matemáticas, si
uno es distinto del otro por un estudiante.
Estadística y Probabilística
15. (Combinación con repetición) En una pastelería hay 6 tipos diferentes de pasteles. ¿De
155 cuantas maneras se pueden seleccionar 3 pasteles?
nCm : (n + m - 1)! / m! (n - 1)!
6C3 = (6 + 3 - 1)! / 3! (6 - 1)!
6C3 = 56 maneras
16. En una fiesta de disfraces hay 22 variedades de estilos. ¿De cuantas formas se pueden
elegir 12 de ellos?
17. (Probabilidad Clásica) ¿Cuál es la probabilidad de lanzar una moneda al aire y caiga cara?
Población: La moneda tiene dos lados cara y sello: 2
Muestra: cara: 1
P(A) = 1 /2 = 0,5 *100= 50%
La probabilidad de caer cara en un lanzamiento es del 50%.
18. ¿Cuál es la probabilidad del evento de caer un número par al lanzar un dado?
19. De una urna que contiene 6 bolas blancas, 2 grises y 3 negras. ¿Cuál es la probabilidad
de que al extraerla salga gris?
20. (Probabilidad Conjunta) En una reunión familiar, el 60% de los invitados son mujeres y
el resto hombres, de estos miembros el 25% fuma. ¿Cuál es la probabilidad de que sea
hombre y no fume?
P (M) = 0,60
P (H) = 1 – P (M) = 1- 0,6 = 0,4
P (F) = 0,25
P (NO F) = 1 – P (F) = 1 – 0,25 = 0,75
P (H NO F) = P (H) * P ( NO F)
P (H NO F) = 0,4 * 0,75 = 0,30 * 100 = 30%
21. En una urna hay 9 bolas, 4 rojas, 3 verdes y 2 negras, se extra una bola y se vuelve a
introducir, luego se extrae otra. ¿Cuál es la probabilidad de sacar una verde y una negra?
22. En una oficina bancaria hay 20 personas esperando pagar por cheque, de las cuales el
45% son mujeres y el 20% van a pagar tarjeta VISA. ¿Cuál es la probabilidad de que vaya a
pagar se hombre y vaya hacer otra transición?
Estadística y Probabilística
24. El meteorólogo pronostica que hoy habrá día de sol, con probabilidad del 55% y
mañana lloverá con probabilidad del 46%, y que hoy y mañana habrá sol del 58%. ¿Cuál es
la probabilidad de que llueva mañana dado que hoy hizo sol?
26. Observe que el observatorio astronómico clasifica cada día según las condiciones
del viento en calma o brisa, según la cantidad de lluvia en húmedo y seco, y según la
temperatura en un día cálido, normal o frio. ¿Cuál es la probabilidad de que un día sea de
viento en calma, seco y normal?
Estadística y Probabilística
157
Se toma una pieza al azar y resulta que es defectuosa. ¿Cuál es la probabilidad de que sea
158 producida por la maquina A?
¿Cuál es la máquina que produce mayor cantidad de piezas defectuosas?
Sea
D= Piezas Defectuosas
No D= No piezas Defectuosas
P (A) = 0,40 P(B)= 0,33 P(C)= 0,27
P (D/A) = 0,04 P(D/B) = 0,03 P(D/C) = 0,02
31. En un distrito electoral 40% de los votantes son liberales, 35% son conservadores y el
resto son independientes. En la última elección de la primera vuelta el 15% de los liberales,
el 20% de los conservadores y el 10% de los independientes votaron. Encuentre la
probabilidad de que una persona que votó a) Sea liberal b) Sea conservador c) Sea
independiente.
35. Una perfumería envía muestras de su último perfume al 70% de sus clientes. El 10%
de los que recibieron la muestra empezaron a usar el perfume también el 20% de los clientes
que no recibieron el perfume, empezaron a usarlo. ¿Cuál es la probabilidad de que un cliente
que esté usando el perfume haya recibido la muestra otorgada por la perfumería?
Estadística y Probabilística
Variable discreta: una variable discreta es una variable que sólo puede tomar valores dentro de
162 un conjunto numerable, es decir, no acepta cualquier valor sino sólo aquellos que pertenecen al
conjunto.
Variable continua: una variable continua puede tomar un valor cualquiera dentro de un intervalo
predeterminado.
Distribución de probabilidad: es una función que asigna a cada suceso definido sobre la variable
aleatoria, la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está
definida sobre el conjunto de todos los sucesos, cada uno de los sucesos es el rango de valores
de la variable aleatoria.
VARIABLE ALEATORIA
Es una variable cuyos valores están determinados por el resultado de un proceso al azar o
aleatorio; por tanto, una variable aleatoria se puede definir como la descripción numérica del
resultado de un experimento; por ejemplo si se lanza una moneda dos veces, el número de
caras que pueden aparecer puede tomar valores de 0,1, 2.
Ejemplos:
Ejemplo 1: lanzar un dado, la variable aleatoria “Y” indica el número que aparece en la cara
superior Y = 1, 2, 3, 4, 5, 6
Ejemplo 2: lanzar una moneda sucesivamente hasta que salga cara Z = 1, 2, 3….
Ejemplo 3: un estudiante está realizando un examen y el tiempo límite es de una hora; si “X” es
el número de minutos que le lleva para terminar el examen entonces 0 < X ≤ 60 la variable
aleatoria es un intervalo.
Estadística y Probabilística
Nota: Esta variable no admite valores intermedios entre dos valores determinados o
específicos.
Una variable discreta también se puede definir como aquella que establece categorías en
términos cualitativos entre elementos. Ejemplo: estado civil, sexo, servicios de un centro de
salud, entre otros.
En el siguiente video encontrarás una amplia explicación y ejemplos de lo que son las variables
Discreta y Continua
1. 1.
Estadística y Probabilística
166 2. 2.
3. 3.
4. 4.
5. 5.
6. 6.
7. 7.
8. 8.
9. 9.
10. 10.
La distribución de probabilidad para una variable aleatoria discreta 𝒙 es una tabla, gráfica o
fórmula que da la probabilidad 𝑷(𝑿 = 𝒙) asociada a cada posible valor de 𝒙.
Distribución aleatoria: Una variable aleatoria es discreta cuando sólo puede tomar unos
ciertos valores enteros.
Distribución de probabilidad
Características
A cada valor de la Variable Aleatoria 𝒙𝒊 se le hace corresponder una probabilidad
esperada teórica 𝒑𝒊 .
Cara superior 1 2 3 4 5 6
Número de
40 39 42 38 42 39
veces
Se pide:
1
Nota: Si un dado es perfecto la Probabilidad de cada una de las caras es la misma: 6
Procedimiento
40
1 40 =0,1667
240
39
2 39 =0,1625
240
42
3 42 =0,1750
240
Estadística y Probabilística
169 4 38 38
=0,1583
240
42
5 42 =0,1750
240
39
6 39 =0,1625
240
∑ 𝑓𝑖 = 240 ∑ ℎ𝑖 = 1
1 40 1
= 0,1667
6
2 40 1
= 0,1667
6
3 40 1
= 0,1667
6
4 40 1
= 0,1667
6
5 40 1
= 0,1667
6
6 40 1
= 0,1667
6
Estadística y Probabilística
En la gráfica de los valores esperados, se observa que a cada valor de la variable aleatoria 𝒙𝒊
"cara del dado" se le hace corresponder su probabilidad teórica. A esta ley se le llama
distribución de probabilidad.
171 La suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho
suceso.
Nota 2: Cabe decir que el valor que toma la esperanza matemática en algunos casos puede no
ser "esperado", en el sentido más general de la palabra - el valor de la esperanza puede ser
improbable o incluso imposible.
𝟏+𝟐+𝟑+𝟒+𝟓+𝟔
𝑬[𝑿] = = 𝟑, 𝟓
𝟔
Conclusión: 3,5 no es un valor posible al rodar el dado. En este caso, en el que todos los sucesos
son de igual probabilidad, la esperanza es igual a la media aritmética.
2. Una aplicación común de la esperanza matemática es en las apuestas o los juegos de azar.
Por ejemplo, la ruleta americana tiene 38 casillas equiprobables. La ganancia para acertar una
apuesta a un solo número paga de 35 a 1 (es decir, se cobra 35 veces lo que se ha apostado y se
recupera la apuesta, así que se recibe 36 veces lo que se ha apostado). Por tanto, considerando
los 38 posibles resultados, la esperanza matemática del beneficio para apostar a un solo número
es:
37 1
(−1 ∗ ) + (35 ∗ ) = −0,0526
38 38
Estadística y Probabilística
Por lo tanto, uno esperaría, en media, perder unos 5 centavos por cada euro que apuesta, y el
172 valor esperado para apostar 1 euro son 0.9474 euros. En el mundo de las apuestas, un juego
donde el beneficio esperado es cero (no se gana ni se pierde) se llama un "juego justo".
Nota 1: El primer paréntesis es la "esperanza" de perder la apuesta de 1€, por eso es negativo
el valor.
Nota 2: El segundo paréntesis es la esperanza matemática de ganar los 35€.
Nota 3: La esperanza matemática del beneficio (EMB) es:
𝑬𝑴𝑩 = 𝑬𝒍 𝒗𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐 𝒂 𝒈𝒂𝒏𝒂𝒓 − 𝑬𝒍 𝒗𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐 𝒂 𝒑𝒆𝒓𝒅𝒆𝒓
Tomado de: Esperanza matemática - Wikipedia, la enciclopedia libre
es.wikipedia.org/wiki/Esperanza_matemátic
𝑥 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑟𝑎𝑠 ⟶ 𝑥 = 0, 1, 2
Distribución de probabilidades:
173
En el Ejercicio:
El valor esperado de obtener caras al lanzar dos monedas es 1.
El número de caras que se obtienen al lanzar dos monedas se desvían 𝟎. 𝟕𝟎𝟕 de su promedio
1 (√𝟎. 𝟓 = 𝟎. 𝟕𝟎𝟕 ∗∗).
Tabla de Frecuencias
𝟎 𝟏 𝟏 𝟎. 𝟐𝟓
= 𝟎. 𝟐𝟓 𝟎∗ =𝟎
𝟒 𝟒
𝟏 𝟐 𝟐 𝟎
= 𝟎. 𝟓 𝟏∗ = 𝟎. 𝟓
𝟒 𝟒
𝟐 𝟏 𝟏 𝟎. 𝟐𝟓
= 𝟎. 𝟐𝟓 𝟐∗ = 𝟎. 𝟓
𝟒 𝟒
𝟒 ∑ = 𝟎. 𝟓 = 𝝈𝟐 **
∑=𝟏 ∑= 𝝁=𝟏
𝟒
Nota: Siempre se debe cumplir que: 𝒇(𝒙) ≥ 𝟎 y que ∑ 𝒇(𝒙) = 𝟏 por las propiedades de las
probabilidades.
174
Número de caras al lanzar dos
Monedas
0,6
0,5
0,4
f(X) 0,3
0,2
0,1
0
`0 `1 `2
X (número de caras)
2. A continuación, se tienen los datos sobre la cantidad de salas de operación en uso durante
20 días de un hospital:
𝟏 3 𝟎. 𝟏𝟓 𝟏 ∗ 𝟎. 𝟏𝟓 𝟎. 𝟒𝟎𝟖
= 𝟎. 𝟏𝟓
𝟐 5 𝟎. 𝟐𝟓 𝟐 ∗ 𝟎. 𝟐𝟓 = 𝟎𝟓 𝟎. 𝟏𝟎𝟔
𝟑 8 𝟎. 𝟒 𝟑 ∗ 𝟎. 𝟒 = 𝟏. 𝟐 𝟎. 𝟎𝟒𝟗
𝟒 4 𝟎. 𝟐 𝟒 ∗ 𝟎. 𝟐 = 𝟎. 𝟖 𝟎. 𝟑𝟔𝟓
Estadística y Probabilística
=𝝁
2) Las salas de operación en uso del hospital se desvían 0,963 (√𝟎. 𝟗𝟐𝟖 = 𝟎. 𝟗𝟔𝟑 ∗∗∗) de su
promedio 2,65.
E(AX)=A.E(X)
2. Al sumar a todos los valores de una variable una misma constante, el valor esperado de ésta
queda incrementado por el valor de la constante
E(X+A)=E(X)+A
3. Si se tienen dos variables X e Y, discretas o continuas, el valor esperado de su suma o diferencia
es la suma o diferencia de sus valores esperados
E(X±Y)=E(X)±E(Y)
4. Si las variables X e Y son variables aleatorias independientes ocurre que el valor esperado de
su producto es igual al producto de sus valores esperados.
E(X.Y)=E(X).E(Y)
Pruebas de Bernoulli.
La Distribución de Bernoulli, llamada también Distribución Dicotómica, es una distribución de
Probabilidad Discreta que:
Sea 𝑿 una variable Aleatoria que mide el número de éxitos y se realiza un único experimento
con dos posibles resultados – éxito o Fracaso - se dice entonces que la variable Aleatoria 𝑿 se
distribuye como una Bernoulli de Parámetro P y se denota de la siguiente forma:
𝑿~𝑩𝒆 (𝒑)
La fórmula para determinar esta distribución está dada por:
𝒑 𝒔𝒊 𝒙 = 𝟏
𝑓(𝑥, 𝑝) { 𝒒 𝒔𝒊 𝑿 = 𝟎 }
𝟎 𝑬𝒏 𝒄𝒖𝒂𝒍𝒒𝒖𝒊𝒆𝒓 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐
Ejemplos:
En la práctica, estos ensayos, solo se utilizan para modelar fenómenos aleatorios que solo tienen dos resultados
posibles:
Cuando se lanza un dado, verificar si se obtiene un tres (es un éxito) o cualquier otro valor
es un fracaso.
¿Era el recién nacido niña?
Nota: Se debe tener claro que éxito y fracaso son etiquetas para los resultados y no deben
ser interpretados literalmente
Estadística y Probabilística
Procedimiento
a. Al lanzar un dado se tienen 6 posibilidades de resultado, por lo tanto el espacio muestral (S),
es:
𝑆 = {1, 2, 3, 4, 5, 6}
𝟏
b. Sacar 2 se considera Éxito, la probabilidad es 𝑷 = 𝟔 (ver espacio muestral).
c. No sacar 2 se considera un Fracaso, entonces:
𝟏 𝟔−𝟏 𝟓
𝒒=𝟏−𝒑→𝒒=𝟏− →𝒒= →𝒒=
𝟔 𝟔 𝟔
La probabilidad de que salga un 2 está definida por:
𝟏 𝟎 𝟏 𝟏−𝟎 𝟓 𝟏
𝑷(𝒙 = 𝟎) = ( ) ∗ (𝟏 − ) → 𝑷(𝒙 = 𝟏) = 𝟏 ∗ ( )
𝟔 𝟔 𝟔
Estadística y Probabilística
𝟓
179 𝑷(𝒙 = 𝟎) = → 𝑷(𝒙 = 𝟎) = 𝟎, 𝟖𝟑𝟑
𝟔
𝑷(𝒙 = 𝟎) = 𝟎, 𝟖𝟑𝟑 𝒆𝒔 𝒍𝒂 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒅𝒆 𝒒𝒖𝒆 𝒏𝒐 𝒔𝒂𝒍𝒈𝒂 𝒖𝒏 𝟐
LA DISTRIBUCIÓN BINOMIAL
Recomendación: http://www.jorgegalbiati.cl/nuevo_06/binomial.pdf
Es una distribución aleatoria discreta que cumple con las siguientes características:
4. La probabilidad de cada resultado posible que se clasifique como éxito es constante de ensayo
en ensayo; lo mismo ocurre con la probabilidad de fracaso.
Procedimiento
1. Son 20 ensayos u observaciones.
2. Los resultados son P = 0.08 salir defectuoso y 1-P = 0.92 no salir defectuoso.
𝒏= tamaño de la muestra.
𝑷= probabilidad de éxito.
𝟏 − 𝒑= probabilidad de fracaso.
𝒓= número de éxitos en la muestra
Procedimiento
𝒏= tamaño de la muestra= 𝟑
𝑷= probabilidad de éxito, que el cliente compre= 𝟎, 𝟑
𝟏 − 𝒑= probabilidad de fracaso, que el cliente no compre
𝟏 − 𝒑 = 𝟏 − 𝟎, 𝟑 = 𝟎, 𝟕
𝒓= número de éxitos en la muestra= 𝟐
b. Se aplica la fórmula:
𝒇(𝒙) = 𝟑 ∗ 𝟎, 𝟎𝟗 ∗ 𝟎, 𝟕 = 𝟎, 𝟏𝟖𝟗
Solución: La posibilidad que dos de ellos compren es de 𝟎, 𝟏𝟖𝟗, que en porcentaje es
𝟏𝟖, 𝟗%
Procedimiento
a. Se tiene que:
𝟖! 𝟏 𝟖! 𝟏 𝟏
𝑷(𝒙 < 𝟐) = ∗𝟏∗ + ∗ ∗ →
𝟎! ∗ 𝟖! 𝟐𝟓𝟔 𝟏! ∗ 𝟕! 𝟐 𝟏𝟐𝟖
𝟏 𝟏 𝟏 𝟗
𝑷(𝒙 < 𝟐) = 𝟏 ∗ 𝟏 ∗ +𝟖∗ ∗ =
𝟐𝟓𝟔 𝟐 𝟏𝟐𝟖 𝟐𝟓𝟔
c. Reemplazando, se tiene:
𝟗
𝑷(𝒙 ≥ 𝟐) = 𝟏 − 𝑷(𝒙 < 𝟐) = 𝟏 − = 𝟎, 𝟗𝟔𝟒𝟖
𝟐𝟓𝟔
Nota: Además se pueden encontrar en la tabla de la distribución binomial, r se reemplaza por x
y los demás datos quedan igual
Estadística y Probabilística
DISTRIBUCIÓN BINOMIAL
1. Para un grupo de personas, 20% de sus impuestos son auditados cada año. Se eligen 5 personas
al azar ¿Cuál es la probabilidad de que exactamente 2 tendrán auditoría?
2. Un estudiante realiza un examen de 10 preguntas de falso y verdadero si él adivina Cuál es la
probabilidad de que:
a) Obtenga 8 preguntas correctas.
b) Gane el examen, es decir que responda 6 preguntas correctas o más.
c) Si el examen en vez de las 10 preguntas de falso y verdadero fueran de opción múltiple y cada
pregunta fuera de 4 opciones, responda a) y b)
3. De acuerdo con ciertos datos, el 25% están a favor de la reelección y el resto en contra. Se
eligen 4 personas al azar, cuál es la probabilidad de que:
a) Todos estén a favor de la reelección.
b) Todos estén en contra.
c) Al menos 1 esté en contra.
5. El 30% del Senado de Colombia está conformado por mujeres; si se seleccionan 7 Senadores al
azar, cuál es la probabilidad de que:
a) Todos sean mujeres.
b) Todos sean hombres.
Estadística y Probabilística
DISTRIBUCIÓN POISSON
Nota: Esta probabilidad fue descubierta por Siméon Denis POisson quién la dio a conocer en 1.838
en su obra:
Cuando en un Espacio Aleatorio (𝑬. 𝑨) se define una variable Aleatoria(𝑿), con una
184
probabilidad de ocurrencia pequeña, esta se determina como una generalización de la
Distribución Binomial.
Tiempo: Segundo, minuto, hora, día, semana, mes, año, entre otros.
Área: Centímetro cuadrado, pulgada cuadrada, entre otras.
Volumen: Litro, galón, onza, entre otras.
Ejemplo
Ejemplos de estos eventos que pueden ser modelados por la distribución de Poisson incluyen:
El número de autos que pasan a través de un cierto punto en una ruta (suficientemente
distantes de los semáforos) durante un periodo definido de tiempo.
El número de errores de ortografía que uno comete al escribir una única página.
El número de llamadas telefónicas en una central telefónica por minuto.
El número de servidores web accedidos por minuto.
El número de animales muertos encontrados por unidad de longitud de ruta.
El número de mutaciones de determinada cadena de ADN después de cierta cantidad de
radiación.
El número de núcleos atómicos inestables que se han desintegrado en
un determinado período.
El número de estrellas en un determinado volumen de espacio.
La distribución de receptores visuales en la retina del ojo humana.
La inventiva de un inventor a lo largo de su carrera
La distribución de la riqueza humana
Número de defectos por 𝒎𝟐 .en piezas similares de un material
Número de personas que llegan a un taller automotriz en un lapso de tiempo específico.
Número de impulsos electrónicos errados transmitidos durante espacio de tiempo específico.
Número de llamadas telefónicas que ingresan a un conmutador por minuto.
Número de interrupciones en servicios de energía en intervalos de un día.
Estadística y Probabilística
Ecuación de Poisson
Esta ecuación está dada por:
𝑒 −𝜆 𝜆𝑘
𝑓(𝑘, 𝜆) =
𝑘!
Dónde:
Si un suceso tiene lugar en promedio cada 2 segundos y se está interesado de que ocurra k veces
durante 15 segundos, el modelo de distribución de Poisson se determina con:
𝜆 = 15 × 2 = 30
𝒆: Es la base de los logaritmos naturales (𝑒 = 2,71828 … )
Tanto el valor esperado como la varianza de una variable aleatoria con distribución de
186 La función generadora de momentos de la distribución de Poisson con valor esperado 𝜆 es:
∞ ∞
𝒕𝑿 ) 𝒕𝒌 𝒕𝒌
𝝀𝒌 𝒆− 𝝀 𝒕
𝑬(𝒆 = ∑ 𝒆 𝒇(𝒌, 𝝀) = ∑ 𝒆 = 𝒆 𝝀(𝒆 −𝟏)
𝒌!
𝒌=𝟎 𝒌=𝟎
Las variables aleatorias de Poisson tienen la propiedad de ser infinitamente divisibles.
Distribución de Poisson
187
Parámetros
Dominio
Función de
probabilidad(fp)
Función de
distribución(cdf) (dónde es laFunción gamma
incompleta)
Media
Mediana
Estadística y Probabilística
188 Moda
Varianza
Coeficiente de
simetría
Curtosis
Entropía
Función generadora
de momentos(mgf)
Función característica
Intervalo de Confianza
Un criterio fácil y rápido para calcular un intervalo de confianza aproximada de 𝝀 es propuesto
por Guerriero (2012).
Dada una serie de eventos 𝒌 (al menos el 15 - 20) en un periodo de tiempo T, los límites del
intervalo de confianza para la frecuencia vienen dadas por:
Estadística y Probabilística
189 𝟏, 𝟗𝟔
𝒌
𝑭𝒍𝒐𝒘 = (𝟏 − )
√𝒌 − 𝟏 𝑻
𝟏, 𝟗𝟔
𝒌
𝑭𝒖𝒑𝒑 = (𝟏 + )
√𝒌 − 𝟏 𝑻
Entonces, los límites del parámetro 𝝀 están dadas por:
𝝀𝒍𝒐𝒘 = 𝑭𝒍𝒐𝒘 𝑻
𝝀𝒖𝒖𝒑 = 𝑭𝒖𝒖𝒑 𝑻
Relación de Poisson con otras Distribuciones
Sumas de variables aleatorias de Poisson
La suma de variables aleatorias de Poisson independientes es otra variable aleatoria de Poisson
cuyo parámetro es la suma de los parámetros de las originales. Dicho de otra manera, si:
𝑿𝒊 ∼ 𝑷𝒐𝒊 (𝝀𝒊 ), 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝑵
Son 𝑵 variables aleatorias de Poisson independientes, por lo tanto:
𝑁 𝑵
𝑌 = ∑ 𝑿𝒊 ∼ 𝑷𝒐𝒊 (∑ 𝝀𝒊
𝑖=1 𝒊=𝟏
Distribución binomial
Aproximación Normal
Como consecuencia del teorema central del límite, para valores grandes de 𝝀, una variable
aleatoria de Poisson 𝑿 puede aproximarse por otra normal dado que:
𝑋−𝝀
𝑌= , converge a una distribución normal de Media Nula y Varianza igual a 1.
√𝝀
Distribución exponencial
Supóngase que para cada valor 𝒕 > 𝟎, que representa el tiempo, el número de sucesos de
cierto fenómeno aleatorio sigue una distribución de Poisson de parámetro 𝝀𝒕. Entonces, los
tiempos transcurridos entre dos sucesos sucesivos sigue la distribución exponencial.
𝟖𝟓 𝒆−𝟖
𝑷(𝟓, 𝟖) = = 𝟎, 𝟎𝟗𝟐
𝟓!
Estadística y Probabilística
En los siguientes enlaces encontrarás las tablas de Distribución de Poisson, realiza una revisión
completa de los mismos para que los apliques correctamente en el momento que realices
actividades que involucren estos conceptos
http://web.frm.utn.edu.ar/estadistica/TablasEstadisticas/TD4_PoissonAcumulada.pdf
𝒙
𝑭(𝒙) = ∫ 𝒇(𝒕) 𝒅𝒕
−∞
Se puede determinar claramente que:
La esperanza matemática para una variable aleatoria continua, con una función de Densidad 𝑓𝑥 ,
está determinada por:
+∞
𝑬(𝑿) = ∫ 𝒙 𝒇(𝒙)𝒅𝒙
−∞
Propiedades
VARIANZA
+∞
𝟐 (𝒙 − 𝝁)𝟐 𝒇(𝒙)𝒅𝒙
𝑽𝒂𝒓(𝑿) = 𝝈 = ∫
−∞
+∞
𝟐
𝑽𝒂𝒓(𝒙) = 𝝈 = ∫ 𝒙𝟐 𝒇(𝒙)𝒅𝒙−𝝁𝟐
−∞
Propiedades de la varianza:
𝟐]
𝟏. 𝑽𝒂𝒓(𝑿) = 𝝈𝟐 = 𝑬 [(𝑿 − 𝑬(𝑿)) = 𝑬(𝑿𝟐 ) − [𝑬(𝑿)]𝟐 = 𝜶𝟐 − 𝝁𝟐
Media 𝝁 ,y
𝟐
Varianza 𝝈
Nota: Esta Tipificación es válida tanto para variables discretas, como para variables
continuas.
𝑬(𝒁) = 𝟎
1. La variable Tipificada tiene Varianza igual a 1:
𝑉𝑎𝑟(𝑍) = 1
En otras palabras se dice que una variable aleatoria 𝐗 sigue una distribución Uniforme Continua
195 si y solo sí su función de Densidad es:
𝟏
𝒇(𝒙) = 𝒔𝒊 𝒚 𝒔𝒐𝒍𝒐 𝒔í 𝒂 < 𝒙 < 𝒃, y
𝒃−𝒂
Gráficamente sería:
1
----------
𝑏−𝑎
𝑎 𝑏
∗ 𝑈(𝑎, 𝑏)
Estadística y Probabilística
(𝑎+𝑏)
𝑴𝒆𝒅𝒊𝒂:
2
(𝒃−𝒂)𝟐
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂:
𝟏𝟐
(𝒃−𝒂)𝟐
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑬𝒔𝒕á𝒏𝒅𝒂𝒓: √
𝟏𝟐
Distribución de Probabilidad Normal
(𝑿 − 𝝁)
𝒁=
𝝈
LA CURVA NORMAL
197
La campana de Gauss, curva de Gauss o curva normal, es una función de probabilidad continua,
simétrica, donde:
Tiene dos puntos de inflexión situados a ambos lados de la media, a una distancia (𝝈)
de ella.
Nota 1: Esta curva fue descrita por el matemático alemán Carl Friederich Gauss, estudiando los
errores que se producen al medir reiteradamente una cierta magnitud.
Nota 2: La gran importancia de esta distribución se debe a la enorme frecuencia con la que
aparece en las situaciones más variadas.
La mayoría de los rasgos humanos tiene representaciones en la curva normal:
CARACTERES DESCRIPCIÓN
Texto Texto
media
Título
Título
Título
Nota: Por ser una distribución de probabilidad, el área bajo una curva normal cualquiera es 1
(100% de los casos). Esta área se distribuye, expresando la probabilidad en tantos por ciento del
siguiente modo (tomando un ejemplo predeterminado):
Estadística y Probabilística
200
Procedimiento:
𝝁 − 𝝈 = 𝟏𝟎𝟎 − 𝟏𝟓 = 𝟖𝟓 y
Estadística y Probabilística
Procedimiento:
Es un valor transformado que indica a cuantas desviaciones estándar por encima o por debajo
de la media se encuentra un dato, está dado por:
𝑋−𝜇
𝑍=
𝜎
Dónde:
Eje Y
0,5 ó 50% 0,5 ó 50%
Título
203
Título
Título
Título
Estadística y Probabilística
Título
𝑋−𝜇 80 − 100
𝑍= →𝑍= → 𝑍 = −1,33
𝜎 15
Título
𝑋−𝜇 80 − 100
𝑍= →𝑍= → 𝑍 = −1,33
𝜎 15
Estadística y Probabilística
205 0,4082 →
Valor en la tabla:
Título
De 100 a 80 sería 0,4082 y de 100 a 120 sería 0,4082, se suman, entonces sería:
0,4082+0,4082=0,8164*100 =81,64%
a) Más de 55 kilos.
b) Menos de 42 kilos.
c) Entre 48 kilos y 56 kilos.
d) Entre 46 kilos y 56 kilos.
e) Entre 45 kilos y 55 kilos.
𝟎 𝑷𝒂𝒓𝒂 𝒙 < 𝟎
𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙) = {
𝟏 − 𝒆−𝝀𝒙 𝒑𝒂𝒓𝒂 𝒙 ≥ 𝟎
Nota 1: 𝒆 representa el número e (2,73…).
Nota 2: El valor esperado (E) de una variable aleatoria X con distribución exponencial está dado
por:
𝟏
𝑬[𝑿] =
𝝀
Nota 3: La varianza (V) de una variable aleatoria X con distribución exponencial está dado por:
𝟏
𝑽(𝑿) = 𝟐
𝝀
Estadística y Probabilística
Parámetros
Estadística y Probabilística
208 Dominio
Media
Mediana
Moda
Varianza
Coeficiente de simetría
Curtosis
Entropía
Función característica
Estadística y Probabilística
El tiempo transcurrido en un call center hasta recibir la primera llamada del día se podría
modelar como una exponencial.
El intervalo de tiempo entre terremotos (de una determinada magnitud) sigue una
distribución exponencial.
Supongamos una máquina que produce hilo de alambre, la cantidad de metros de alambre
hasta encontrar una falla en el alambre se podría modelar como una exponencial.
En fiabilidad de sistemas, un dispositivo con tasa de fallo constante sigue una distribución
exponencial.
Cálculo de las Variables Aleatorias
Una variable aleatoria de Distribución Exponencial 𝑥 se puede calcular por medio de una variable
aleatoria de Distribución Uniforme: 𝒖 = 𝑼(𝟎, 𝟏):
𝟏
𝒙 = − 𝐥𝐧(𝟏 − 𝒖)
𝝀
Pero (𝟏 − 𝒖) también es una variable aleatoria con una distribución 𝑼(𝟎, 𝟏), se puede utilizar
una versión mucho más eficiente, dada por:
𝟏
𝒙 = − 𝐥𝐧(𝒖)
𝝀
Relaciones
Estadística y Probabilística
210
La suma de 𝒌 variables aleatorias independientes de distribución exponencial con parámetro
𝝀 es una variable aleatoria de Distribución Gamma
P (D) = 1/6
E(X)= 1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)
E(X) = 2,5
2) (Prueba de Bernoulli) ¿Cuál es la probabilidad de que al lanzar una moneda doce veces caiga
una vez cara?
SELLO =0
CARA= 1
P (CARA) = ½
3) (Prueba de Bernoulli) Cual es la probabilidad de que al lanzar una dado 5 veces caiga una vez
6?
Número diferente a 6 =0
Seis= 1
P (Seis) = 1/6
Estadística y Probabilística
4) (Distribución binomial) Una máquina de una fábrica de tornillos produce un 5 por 5000 de
211 piezas defectuosas. ¿Cuál es la probabilidad de que al examinar un grupo de 60 piezas se
encuentren 3 defectuosas?
P= 5/5000=0,001
212 solución del mismoLa probabilidad de que un paciente se alivie con una vacuna contra una
gripa es del 85%. Se pide determinar que una vez administrada a 22 pacientes:
2. La probabilidad de que un alumno saque cinco en una notas es del 15%. Si en el grupo hay
20 personas, se pide:
3. Un grupo de excursionistas salen de paseo para la costa, a la hora de llegar al hotel el 75%
piden la cama doble. Cual es la probabilidad de que en un grupo de 50 personas se
encuentren:
Alumnos Minutos
215 60
1
5. El número de pasajeros que llegan al metro sigue una distribución de Poisson. Si el número
promedio es de 522 pasajeros por hora. ¿Cuál es la probabilidad de que en un minuto
lleguen 21 pasajeros lleguen al metro?
∫0 (6x) dx = 6
∫0 X(12x-7) dx =
∫0 (12x2 – 7X) dx = 12 – 7 = 5
Estadística y Probabilística
10. Hallar el valor esperado de variable aleatoria continua de 21X2 +24X – 17 en el intervalo de
214 0a1
11. (Distribución Uniforme) Una empresa de calzado de Colombia tiene una función de costos
dada por f(c)= 2000+4x; siendo x el numero zapatos. En el mercado se nde cada unidad a
$50.000. La demanda entre artículos es uniforme entre 5.000 a 20.000 unidades. Cual es el
beneficio esperado?
Entonces
X= cantidad de artículos
12. (Distribución Uniforme) Una empresa de dulces de Colombia tiene una función de costos
dada por f(c)= 125+4x; siendo x el numero dulces. En el mercado se vende cada unidad a
$150. La demanda entre artículos es uniforme entre 2550 a 3820 unidades. Cuál es el
beneficio esperado?
13. (Distribución Normal) Un docente de estadística ha observado que las notas obtenidas por
sus alumnos en los exámenes de la materia siguen una distribución Normal con media 4 y
desviación estándar de 3, ¿cuántos sacaron un 4,5?
Z= (X - µ) /
Z= (4,5 – 4) / 3
Z= O,17
15. (Distribución Normal) La media de los pesos de los estudiantes de una institución privada
es de 70 kg y desviación típica de 3 kg, se conoce que esta tiene 3250 alumnos. Hallar:
a. Entre 55 kg y 60 kg.
b. Más de 85 kg.
c. Menos de 65 kg.
d. Exactamente 64 kg
e. 75 kg o menos
F(t) = e -t si t ≥ 0
F(t )= 1 - e -t
19. Responda las siguientes preguntas de acuerdo a los conceptos desarrollados en la unidad:
TIPS
Recuerde que: Los métodos utilizados para una distribución de
aproximación a la normal son:
1. Construcción de histogramas de frecuencia relativa o diagrama
de tallo y hojas para los datos.
2. Calculo del rango intercuartílico y la desviación estándar.
3. La construcción del grafico de probabilidad normal para los datos.
217
Estadística y Probabilística
www.vitutor.com/estadistica/inferencia/estadistica_inferencial.htm
Parámetro estadístico; una función definida sobre valores numéricos que caracteriza una
población o un modelo.
Estadística y Probabilística
Muestral Aleatorio Simple: Es considerado el método más sencillo. Mediante una tabla de
números al azar se eligen las zonas que se quieren muestrear. Este tipo de muestreo posee
algunos inconvenientes. Por un lado, supone definir de antemano los límites de un yacimiento, y
no siempre se conocen con certeza. Por otro lado, el carácter aleatorio de las tablas numéricas
provoca que en algunas áreas se acumulen las muestras, mientras que en otras permanecen
intactas.
Intervalos de Confianza: En estadística, se llama a un par o varios pares de números entre los
cuales se estima que estará cierto valor desconocido con una determinada probabilidad de
acierto.
Prueba Hipótesis nula: En estadística, una hipótesis nula es una hipótesis construida para anular
o refutar, con el objetivo de apoyar una hipótesis alternativa. Cuando se utiliza, la hipótesis nula
se presume verdadera hasta que una prueba estadística en la forma de una prueba empírica de
la hipótesis indique lo contrario. Si la hipótesis nula no es rechazada, esto no quiere decir que sea
verdadera.
Definiciones tomadas de: Wikipedia, la enciclopedia libre
es.wikipedia.org/wiki
ASPECTOS CARACTERÍSTICA
1. Homogeneidad
Los elementos se deben seleccionar de la
misma población.
2. Independencia
Cada dato no debe de ser condicionado
mutuamente entre sí.
3. Representatividad
La muestra debe ser el mejor valor de los
elementos del conjunto que proviene.
PARÁMETROS
Un parámetro es una medida que me permite calcular el comportamiento de una variable de
una población.
ESTIMADOR
Estadística y Probabilística
La mejor manera de seleccionar una muestra aleatoria de una población es mediante los
números aleatorios. Estos se pueden determinar mediante la generación de valores por medio
de una computadora o una tabla de números aleatorios.
Distribuciones Muestrales
Si se toman varios valores de una muestra de una población, las poblaciones seleccionadas todas
no serían iguales, y varia de una muestra a otra por alguna observación.
𝝈
222 𝑵(𝝁, )
√𝒏
Para una mejor comprensión de esta distribución se realizará un Ejercicio para el Aprendizaje,
este se tomó de:
DISTRIBUCIÓN DE LA MEDIA MUESTRAL 1.
www2.uah.es/jmmartinezmediano/.../MCCSS%20Tema%2009d%20Prob
𝑿
Considerar una población en la que se estudia una característica , que sigue una distribución
normal de 𝑴𝒆𝒅𝒊𝒂 = 𝟏𝟐 y 𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 = 𝝈𝟐 = 𝟏𝟔, se pide:
Procedimiento:
Entonces:
𝟔−𝝁
𝑷(𝒙 > 𝟏𝟒) = 𝑷 ( ) = 𝑷(𝒁 > 𝟎, 𝟓) = 𝟏 − 𝑷(𝒁 < 𝟎, 𝟓) = 𝟏 − 𝟎, 𝟔𝟗𝟏𝟓 = 𝟎, 𝟑𝟎𝟖𝟓
𝝈
𝝈
[𝑿 ∈ 𝑵(𝝁, )]
√𝒏
𝝈 𝟒 𝟒
En este caso: 𝑵 (𝝁, ) → 𝑵(𝟏𝟐, ) → 𝑵(𝟏𝟐, )
√𝒏 √𝟗 𝟑
Estadística y Probabilística
Por lo tanto:
223
̅ > 𝟏𝟒) = 𝑷 [𝒁 > 𝟏𝟒−𝟏𝟐
𝑃(𝑿 𝟒 ] = 𝑷(𝒁 > 𝟏, 𝟓) = 𝟏 − 𝑷(𝒁 < 𝟏, 𝟓) = 𝟏 − 𝟎, 𝟗𝟑𝟑𝟐 = 𝟎, 𝟎𝟔𝟔𝟖
⁄𝟑
Se recomienda revisar y analizar el siguiente enlace *, en el cual detallan con precisión este tipo
de distribuciones:
*Enlace: Distribucion muestral de proporciones - SlideShare
es.slideshare.net/eraperez/distribucion-muestral-de-proporciones
Nota: Cuando las muestras de tamaño 𝑛 > 30 la distribución muestral de proporciones sigue la
siguiente distribución normal:
𝒑𝒒
𝑵(𝒑, √ )
𝒏
Dónde:
Si se tira una moneda no trucada 100 veces, ¿cuál es la probabilidad de que se obtengan más de
55 caras?
Estadística y Probabilística
Procedimiento
224
a. En una moneda no trucada la proporción de caras es 0,5 con lo que:
𝒑 = 𝟎, 𝟓
𝒒 = 𝟎, 𝟓
𝒏 = 𝟏𝟎𝟎
b. La distribución Muestral de proporciones se distribuye: 𝑵(𝟎, 𝟓; 𝟎, 𝟓)
c. Si 𝒑′ es la proporción en la muestra, se calcula entonces la probabilidad de la siguiente
forma:
Distribución Muestral
Es una distribución de probabilidad donde se describe la media y la desviación estándar o en su
caso la proporción.
Esta distribución resulta de considerar todas las muestras posibles de una población; permite
calcular la probabilidad que, dada una sola muestra, se tiene de acercarse al parámetro de la
población.
A través de esta distribución se puede estimar el error para cualquier tamaño de muestra
dado.
Por lo tanto, dado lo anterior, la distribución de muestreo es totalmente determinada por dos
valores: la media y la desviación estándar.
Nota: Estos parámetros son importantes para calcular la distribución de muestreo dada la
distribución normal de toda la población.
𝝈
𝝈𝒙̅ =
√𝒏
Dónde:
𝝈: 𝑬𝒔 𝒍𝒂 𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑬𝒔𝒕á𝒏𝒅𝒂𝒓, y
𝝈𝒙̅ : 𝑬𝒔 𝒍𝒂 𝒎𝒆𝒅𝒊𝒂 𝒅𝒆 𝒍𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏
Otras distribuciones
Estadística y Probabilística
Nota 1: Cuando la distribución es normal, una de las distribuciones de probabilidad más simples, es
muy fácil de estudiar y analizar. Se pueden encontrar fácilmente fórmulas matemáticas para las
estadísticas de distribución muestral que se quieren encontrar.
Nota 2: Cuando la distribución no es normal, puede ser muy complicado y tales formulaciones
matemáticas sencillas podrían ser difíciles de encontrar o hasta imposibles en algunos casos.
En estos casos, se utilizan métodos aproximados porque encontrar el valor exacto implicará el estudio
de cada muestra de tamaño n tomada de la población, lo que es muy difícil y requiere mucho tiempo.
Este error cuantifica las oscilaciones de la media muestral (o sea la media obtenida en los datos)
alrededor de la media poblacional (verdadero valor de la media).
Se denomina como.
𝑺
𝑺 𝑬𝒙̅ =
√𝒏
Dónde:
Estadística y Probabilística
𝝈
𝑺𝑫𝒙̅ =
√𝒏
Dónde:
Si 𝑺𝒏 es la suma de:
𝒏 Variables aleatorias independientes, y de
Varianza no nula pero finita,
228 1 (𝑥−𝜇)2
−
𝑓𝜇𝜎2 (𝑥) = 𝑒 2𝜎2
√2𝜋𝜎 2
Dónde:
𝝁: 𝑴𝒆𝒅𝒊𝒂:
𝝈𝟐 : 𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂
Nota: El caso en el que su función de densidad sea 𝑵(𝟎, 𝟏) , a la distribución se le conoce como
distribución Normal Estándar.
Independientes,
Idénticamente distribuidas, y
𝟐 𝟐
Con una media 𝝁 y varianza 𝝈 finitas (𝝈 ≠ 𝟎).
𝑺𝒏 = 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏
Entonces, la media de 𝑺𝒏 es 𝒏 ∗ 𝝁 y la varianza es 𝒏 ∗ 𝝈𝟐
Nota: Se da lo anterior ya que son variables aleatorias independientes.
𝑺𝒏 − 𝒏𝝁
𝒁𝒏 =
𝝈√𝒏
Nota: Se da esto para que la media de la nueva variable sea igual a cero y la desviación estándar sea igual
a 1.
Así, las variables 𝒁𝒏 convergerán en distribución a la distribución normal estándar 𝑵(𝟎, 𝟏),
cuando:
Estadística y Probabilística
𝑷𝒓 : 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅
Enunciado formal
𝝁: 𝑴𝒆𝒅𝒊𝒂
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂: 𝟎 < 𝝈𝟐 < ∞
𝑺𝒏 = 𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏
Se da entonces que:
𝑺𝒏 − 𝒏𝝁
𝐥𝐢𝐦 𝑷𝒓 ( ≤ 𝒛) = 𝚽 (𝒁)
𝒏→∞ 𝝈√𝒏
Ocurre con bastante frecuencia encontrar esta formulación con la variable estandarizada 𝒁𝒏 en función
de la media muestral ̅̅̅̅
𝑿 𝒏 de la siguiente forma:
𝑿𝒏 − 𝝁
𝝈
⁄ 𝒏
√
Ya que son equivalentes.
Estadística y Probabilística
1
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 tiene aproximadamente una distribución normal con:
𝑛
𝝁𝑿̅ = 𝝁 , y
𝟐
𝝈𝟐𝒙̅ = 𝝈 ⁄𝒏
Propiedades
La media de la distribución de muestreo de la media será igual a la media de la población.
El teorema del límite central garantiza una distribución normal cuando n es suficientemente
grande.
Estadística y Probabilística
231 Existen diferentes versiones del teorema, en función de las condiciones utilizadas para
asegurar la convergencia. Una de las más simples establece que es suficiente que las variables
que se suman sean:
Independientes,
Idénticamente distribuidas,
Con valor esperado finito, y
Varianza finita.
Tipos de Estimación
Existen dos tipos de estimaciones de una población:
ESTIMACIONES CARACTERÍSTICAS
𝒔 𝒔
̅ − 𝒁𝜶 (
𝒙 ̅ + 𝒁𝜶 ( )
)<𝝁<𝒙
√𝒏 √𝒏
Estadística y Probabilística
6.2.5.3 HIPÓTESIS:
Es una suposición acerca de un parámetro desconocido.
Procedimiento
Procedimiento
Z=( - µ ) \ ( \ √ n)
Z= 50 \ 12,65 Z= 3,95
2. Se ha seleccionado una muestra aleatoria para prever la inflación en el año 2000, en siete de
los países. Las previsiones han sido de
1,2,2,1,2,3,1,2,9,9,2,1,9,1,2,1,2,2,1,2,3,1,2,9,9,2,1,9,1,2. Se utilizan los datos para construir
un intervalo de la media muestral con un nivel de confianza del 99%, en estos 30 países.
Procedimiento
- Z2 (s√n) µ + Z2 (s√n)
2,5 µ 3,65
3. Una fábrica de tornillos se tiene que 2% es defectuoso. Una empresa que utiliza de estos
tornillos para equipos de sonido dice que el 2% de estos son más defectuosos de los que
Estadística y Probabilística
compran. Con un nivel de confianza del 95%, un investigador de esta empresa selecciono una
235 muestra de 1500 tornillos de que se tenga una media de 2,5%.
Procedimiento
Ho: µ ≤ 0,02
Z = (0,005) ((0,00001307)
Z= 382
Como el valor calculado es mayor que el de la tabla, se concluye que no hay evidencias suficientes
que el porciento de tornillos defectuosos es mayor que el 2%.
1. La estatura media de los alumnos de un colegio es de 170 cm, con una desviación
estándar de 8 cm.
a) Encontrar la media muestral cuando n es de 60 personas.
b) ¿Cuál es la probabilidad de que una muestra de 60 estudiantes tenga una estatura
mayor de 172 cm?
c) ¿Cuál es la probabilidad de que una muestra de 60 estudiantes tenga una estatura
entre 165cm y 172 cm?
5. Una muestra aleatoria de 125 individuos a los que se ha medido el nivel de glucosa en
sangre, obteniéndose una media muestral de 115 mg/cc. Se sabe que la desviación
típica de la población es de 25 mg/cc. Obtener un intervalo de confianza, al 70%, para
el nivel de glucosa en sangre en la población.
7. En un colegio el peso de los estudiantes cumple una distribución normal con media de
55 kg y una desviación típica de 15 kg. Si se extrae una muestra aleatoria de 30 jóvenes
y para un nivel de significación del 10%, ¿En qué condiciones se rechazaría la hipótesis
de que la media de la población es de 55 kgs?
8. En una Universidad de Antioquia Secundaria hay matriculados 5000 estudiantes. Una
muestra seleccionada aleatoriamente de un 30% de estos, se les preguntó si utilizaban
la cafetería de la institución. A lo que contestaron que no de 50.
a) Estima el porcentaje de estudiantes que utilizan la cafetería del instituto
b) Determinar con un nivel de confianza del 85%, el error máximo cometido con dicha
estimación.
10. En un barrio se escogió al azar una muestra de 250 personas cuya media de ingresos
mensuales resultaba igual a $515.000. con una desviación típica de $25.000 Si se toma
un nivel de confianza del 90%, ¿cuál es el intervalo de confianza para la media de los
ingresos mensuales de toda la población?
11. La duración de las que bombillas de 110 w que una empresa fabrica sigue una
distribución normal con una desviación estándar de 80 horas de duración. Su vida media
se encuentra garantizada con una duración mínima de 750 horas. Se seleccionó al azar
Estadística y Probabilística
una muestra de 45 lámparas de un lote y, después de ser adquiridas, con una vida media
237 de duración de 620 horas y con un valor de significancia del 5%. ¿La duración de las
lámparas corresponde a su vida media?
238 7 GLOSARIO
Estadística inferencial: La estadística inferencial es una parte de la estadística que
comprende los métodos y procedimientos que por medio de la inducción determina
propiedades de una población estadística, a partir de una pequeña parte de la misma.
Muestreo: En estadística se conoce como muestreo a la técnica para la selección de
una muestra a partir de una población.
Parámetro estadístico; una función definida sobre valores numéricos que caracteriza una
población o un modelo.
Estimador: En estadística, un estimador es un estadístico (esto es, una función de la muestra)
usado para estimar un parámetro desconocido de la población
Muestral Aleatorio Simple: Es considerado el método más sencillo. Mediante una tabla de
números al azar se eligen las zonas que se quieren muestrear. Este tipo de muestreo posee
algunos inconvenientes. Por un lado, supone definir de antemano los límites de un
yacimiento, y no siempre se conocen con certeza. Por otro lado, el carácter aleatorio de las
tablas numéricas provoca que en algunas áreas se acumulen las muestras, mientras que en
otras permanecen intactas.
Intervalos de Confianza: En estadística, se llama a un par o varios pares de números entre los
cuales se estima que estará cierto valor desconocido con una determinada probabilidad de
acierto.
Prueba Hipótesis nula: En estadística, una hipótesis nula es una hipótesis construida para
anular o refutar, con el objetivo de apoyar una hipótesis alternativa. Cuando se utiliza, la
hipótesis nula se presume verdadera hasta que una prueba estadística en la forma de una
Estadística y Probabilística
Frecuencias: Indica en forma numérica (absoluta) o en forma porcentual (relativa) las veces
que se presenta cada dato.
Dispersión: Indica cómo se dispersan o varían los datos en la distribución; existen varias
medidas para analizar dicha dispersión; las más utilizadas son las que varían con relación al
promedio.
Frecuencias acumuladas: Las frecuencias absolutas y las relativas, se acumulan por cada clase
y se utilizan para hacer interpretaciones de los datos como: mayor o igual, menor, menor o
igual.
Interpretación de datos: mayor, dato menor, dato más frecuente, dato menos frecuente.
Consiste en el análisis de los datos con el fin de analizar el comportamiento de ellos y concluir
.
Estadística y Probabilística
240 8 BIBLIOGRAFÍA
Anderson, D., Sweeney, D. & Berenson, M. L. & Levine, D. M.
Williams, T. (1999). Estadística para (1996). Estadística básica en
Administración y Economía. (7ª edición). Administración. (6ª edición). México:
México: Internacional Thomson Editores. Prentice-Hall.