Sei sulla pagina 1di 129

UNIVERSIDAD MAYOR DE SAN ANDRES

FACULTAD DE INGENIERIA

APUNTES - CALCULO DE PROBABILIDADES


SEMESTRE II-2018
ESTUDIANTES:

AGUILERA POZO NATHALYE CARMEN

APAZA TITERICO ROGER

CARDENAS RAMOS KARMINIA LIZETH

CARRILLO LEON ANNET IRAN

CHURATA PAUCARA ARIEL

CONDORI ATAHUICHI SERGIO CLAUDIO

DELGADO MAMANI JHONATAN EDWIN

HUAYCHO TABORGA PILAR NEIZA

LAURA VILLCA DAGNER

NOMBRE DEL DOCENTE: M. Sc. ING. MOISES ARTEAGA MIRANDA

La Paz, Bolivia
ÍNDICE

CAPITULO 1 INTRODUCCION
CAPITULO 2 ESTADISTICA DESCRIPTIVA
CAPITULO 3 PROBABILIDADES
CAPITULO 4 VARIABLE ALEATORIA UNIDIMENSIONAL
CAPITULO 5 DISTRIBUCIONES DISCRETAS
DISTRIBUCIONES CONTINUAS Y
CAPITULO 6
MUESTRALES
CAPITULO 7 VARIABLE ALEATORIA BIDIMENSIONAL
Capitulo 1

INTRODUCCIÓN DE CONCEPTOS
FUNDAMENTALES
Como resultado de cualquier proceso de investigación se obtiene un conjunto de
datos u observaciones que representan a una variable de estudio, sobe la cual
necesitamos tomar decisiones

El área que nos ayuda a estructurar lo anterior se denomina estadística.

DEFINICIÓN: Es la ciencia que se encarga de manejar un conjunto de datos


también llamadas observaciones de un objeto o variable de estudio que se obtiene
a partir de una muestra que se extrae de una población con el objetivo de
encontrar indicadores y posteriormente inferir resultados generales asociándoles
un margen de certidumbre (probabilidad) que permite generar una toma correcto
de decisiones.

CLASIFICACIÓN

 ESTADÍSTICA DESCRIPTIVA Es aquella que organiza clasifica y


estructura el conjunto de observaciones de un objeto variable de estudio
para encontrar los indicadores o estadígrafos mas representativos
 ESTADÍSTICA INFERENCIAL Es la que se encarga de generalizar los
resultados asociándolos una probabilidad para una correcta toma de
decisiones.

POBLACIÓN Es el conjunto universo que contiene a la variable de estudio que es


usualmente una característica de ella

 Universo finito "N" (tamaño población)


 Universo infinito, no es numerable con exactitud

MUESTRA Es un subconjunto de la población que es representativo para la


variable objeto de estudio. Al proceso de obtener y determinar el proceso de la
muestra se denomina muestreo.

DATOS U OBSERVACIÓN Es el valor numérico del objeto variable de estudio que


es la característica estudiada

VARIABLE Es la característica a estudiar de la muestra

CLASIFICACIÓN DE VARIABLE
 POR LA REPRESENTATIVIDAD
o Variable cualitativa ► Cualidad de la muestra
o Variable cuantitativa ► Cantidad
 POR EL VALOR NUMÉRICO
o Variable discreta ► Valores exactos
o Variable continua ► Infinitos valores

ESTRUCTURA DE LA ESTADÍSTICA DESCRIPTIVA

 Planificación
 Muestreo
o Muestreo por conglomerados
o Muestreo aleatorio
o Muestreo estratificado
o Muestreo mixtos
o Muestreo por atributos
o Muestreo por atributos
o Muestreo por variables
 Obtener la información a través de
o Encuesta
o Entrevista
o Datos históricos
 Organizar, clasificar y obtener indicadores ► valor representativo
 Inferencia y generalización
Capítulo 2

ESTADÍSTICA DESCRIPTIVA
ORGANIZACIÓN, CLASIFICACIÓN DE LOS DATOS

Una vez que se tienen los resultados de la medición de la característica y objeto


variable de estudio se deben ordenar los datos en función ascendente de valor
numérico que representa, para luego clasificarlo en función de los siguientes
conceptos.

FRECUENCIA ABSOLUTA Simbolizada por "fi" es la cantidad de veces que se


repite un dato

FRECUENCIA RELATIVA Se define como la razón de la frecuencia absoluta a la


cantidad de observaciones, esta simbolizada por "hi"

𝑓𝑖
ℎ𝑖 =
𝑛
n = cantidad de observaciones (tamaño de la muestra)

FRECUENCIA ABSOLUTA ACUMULADA Simbolizada por "FI" se define como la


sumatoria de las frecuencias absolutas anteriores e iguales al nivel del i-esima dato.

𝐹𝑖 = 𝑓1 + 𝑓2 + 𝑓3 … … … … . . +𝑓𝑖

FRECUENCIA RELATIVA ACUMULADA Se define como la sumatoria de todas las


frecuencias relativas anteriores e igual al nivel de la i-esima observación
simbolizada por "HI"

𝐻𝑖 = ℎ1 + ℎ2 + ℎ3 … … … … . . +ℎ𝑖

FRECUENCIA RELATIVA PORCENTUAL

ℎ𝑖 𝑥 100%

FRECUENCIA RELATIVA PORCENTUAL ACUMULADA

𝐻𝑖 𝑥 100%

Para organizar los datos de acuerdo a los criterios de frecuencias se estructura una
tabla de frecuencias y dependiendo de la cantidad se agrupan o no los datos.

TABLA DE DATOS NO AGRUPADOS Corresponde cuando n<60, para ello:


TABLA DE FRECUENCIAS

Dato
𝒙𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊 𝒉𝒊 × 𝟏𝟎𝟎% 𝑯𝒊 × 𝟏𝟎𝟎%

𝒙𝟏 𝑓1 ℎ1 𝑓1 ℎ1 − −
𝒙𝟐 𝑓2 ℎ2 𝑓1 + 𝑓2 ℎ1 + ℎ2 − −
𝒙𝟑 𝑓3 ℎ3 𝑓1 + 𝑓2 + 𝑓3 𝐻3 − −
….. ….. ….. ….. ….. − −
𝒙𝒋 𝑓𝑗 ℎ𝑗 𝐹 𝐻𝑗 − −

PARA LOS DATOS AGRUPADOS Implica que previamente los datos deben ser
agrupados por intervalos:

 CANTIDAD DE INTERVALOS

𝐾 = √𝑛 𝑘∈𝑁 𝑝 <𝑘 <𝑝+1

𝐾 = 1 + 3.22 ∗ 𝑙𝑜𝑔𝑛

Criterio de Investigador ► 𝑘=𝑝 por defecto

𝑘 =𝑝+1 por exceso

 RANGO

𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

 AMPLITUD DE INTERVALOS.- Se simboliza por "C" y existen 2 tipos de


amplitud
o Intervalos de la misma amplitud

𝑅𝑎𝑛𝑔𝑜
𝐶=
𝐾
o los intervalos tienen distinta amplitud a criterio del investigador
TIPOS DE INTERVALOS

 Intervalos Aparentes [𝐿𝑖𝑛𝑓 , 𝐿𝑠𝑢𝑝 [ ► 𝐿𝑠𝑢𝑝 = 𝐿𝑖𝑛𝑓 + 𝐶


 Intervalos Reales [𝐿𝑖𝑛𝑓 , 𝐿𝑠𝑢𝑝 ] ► 𝐿𝑠𝑢𝑝 = 𝐿𝑖𝑛𝑓 + 𝐶

En la tabla se debe tener el intervalo de cada nivel

aparentes reales

𝐿𝑖 − 𝐿𝑖+1 𝐿𝑖 − 𝐿𝑖+1 𝐿𝑖 − 𝐿𝑖+1

[𝑋𝑚𝑖𝑛 , 𝑋𝑚𝑖𝑛 + 𝐶[ 𝐿1 − 𝐿2 𝐿1 − 𝐿2

[𝑋𝑚𝑖𝑛 + 𝐶 , 𝑋𝑚𝑖𝑛 + 2𝐶[ 𝐿2 − 𝐿3 𝐿2 − 𝐿3

MARCA DE CLASE Es el promedio de los limites de cada intervalo y se simboliza


por "Xi"
𝐿𝑠𝑢𝑝 + 𝐿𝑖𝑛𝑓
𝑥𝑖 =
2

TABLA PARA DATOS AGRUPADOS

Dato Marca de
𝒙𝒊 clase 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊 𝒉𝒊 × 𝟏𝟎𝟎% 𝑯𝒊
𝒙𝒊 × 𝟏𝟎𝟎%
𝑳𝟏 − 𝑳𝟐 𝑥1 𝑓1 𝑓1 ℎ1 ℎ1 − −
𝑳𝟐 − 𝑳𝟑 𝑥2 𝑓2 𝑓1 + 𝑓2 ℎ2 ℎ1 + ℎ2 − −
𝑳𝟑 − 𝑳𝟒 𝑥3 𝑓3 𝑓1 + 𝑓2 + 𝑓3 ℎ3 𝐻3 − −
….. ….. ….. ….. ….. ….. − −
….. 𝑥𝑗 𝑓𝑗 𝑛 ℎ𝑗 1 − 100%
Total 𝑛 1 100%
Dónde: fi representa la cantidad de observaciones dentro de intervalo

Generalmente se utilizan aparentes y se puede convertir los reales en aparentes


sumando y restando a cada límite la mitad de la unidad de medida.
PROPIEDADES DE LAS FRECUENCIAS

Si: n = cantidad de observaciones

k = cantidad de intervalos

se cumple:

i. ∑𝑖=1 𝑓𝑖 = 𝑛
ii. 𝐹𝐾 = 𝑛
iii. ∑𝑖=1 ℎ𝑖 = 1
iv. 𝐻𝐾 = 1
v. ∑ ℎ𝑖 × 100 = 100%
vi. ∑ 𝐻𝑖 × 100 = 100%

Las filas de las tablas de frecuencias se pueden interpretar por razones o


proporciones.
𝑎
 RAZÓN 𝑎<𝑏
𝑏

𝑎
× 100% ► 𝑇𝑎𝑧𝑎
𝑏

 PROPORCIÓN Es una razón entre intervalos

𝑏−𝑎

𝐿𝑖𝑛𝑓 𝐿𝑠𝑢𝑝 𝐿𝑠𝑢𝑝 −𝐿𝑖𝑛𝑓

𝑏 − 𝑎 < 𝐿𝑠𝑢𝑝 −𝐿𝑖𝑛𝑓

𝑏−𝑎
× 100% ► 𝑁𝑢𝑚𝑒𝑟𝑜 𝑖𝑛𝑑𝑖𝑐𝑒
𝐿𝑠𝑢𝑝 −𝐿𝑖𝑛𝑓

REPRESENTACIÓN GRAFICA

 Barras dobles
8

VARIABLES 6

0
TIEMPO

 Diagramas de barras

5
VARIABLES

4
3
2
1
0
TIEMPO

 Diagramas de sectores


Para ordenar los datos generalmente se utiliza un diagrama de tallos y hojas

Tallo Hoja d=decena

d u u=unidad

entero decimal

Solo en clases vamos a agrupar en intervalos cuando n<60

Ejemplo

En una empresa de congelados la demanda diaria de lotes de producto durante 30


días de trabajo se ha registrado en la siguiente tabla

38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56
Se pide:

a) Organizar los datos en una tabla de frecuencias agrupando en intervalos


b) Qué porcentaje de los lotes de productos están entre 40 y 55 lotes
c) ¿Cuántos datos existe mayor a 50 lotes?
d) Si el 25% representa la cantidad de lotes entre 45 y z, cual es el valor de z
e) Realice una grafica del histograma de frecuencias absolutas y de la ojiva de
frecuencias relativas menor que

Solución

TALLO HOJA
2 8,5
3 8,5,3,6,2
4 8,9,8,2,7,4,4
5 8,9,3,1,7,2,8,6
6 7,3,9,1,6
7 6,8,2
𝐾 = √𝑛 = √30 = 5,477 ► 𝑘 = 5

Rango= 78-25 =53


𝑅𝑎𝑛𝑔𝑜 53
𝐶= = ► 𝐶 = 10,6 ► 𝐶 = 11
𝐾 5

𝑯𝒊 ∗
𝑳𝒊 − 𝑳𝒊+𝟏 𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊 𝒉𝒊 × 𝟏𝟎𝟎%

𝟐𝟓 − 𝟑𝟔 30,5 5 5 0.17 0.17 17% 1


𝟑𝟔 − 𝟒𝟕 41.5 5 10 0.17 0.34 17% 0.83
𝟒𝟕 − 𝟓𝟖 52.5 9 19 0.30 0.64 30% 0.66
𝟓𝟖 − 𝟔𝟗 63.5 7 26 0.23 0.87 23% 0.36
𝟔𝟗 − 𝟖𝟎 74.5 4 30 0.13 1 13% 0.13
Total 30 1 100%

25+36 𝑓1 5
Marca de clase 𝑥1 =
2
= 30.5 ℎ1 =
𝑛
=
30
= 0.166

36+47 𝑓2 5
𝑥2 = 2
= 41.5 ℎ2 = 𝑛
= 30 = 0.166
47+58 𝑓1 9
𝑥3 = 2
= 52.5 ℎ1 = 𝑛
= 30 = 0.3

b) % datos 40 y 55 lotes

36 40 47 55 58

17% 30%
47−40 55−47
(47−36) × 17% + (58−47) × 30% = 32.64%

c) # datos mayor a 50

47 50 58 69 80

9 7 4
58−50
(58−47) × 9 + 7 + 4 = 17 𝑙𝑜𝑡𝑒𝑠 𝑑𝑒 𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠

d) 25%entre 45 y z

25%

21,91%

36 45 47 z 58

17% 30%
47−45
(47−36) × 17% = 3.09%

25 − 3.09 = 21.91%
𝑧−47
(58−47) × 30% = 21.91%
𝑧 = 55.03 ► 𝑧 = 55

e) histograma frecuencias absolutas

Ojiva frecuencias relativas menor que:

FI

25 36 47 58 69 80 LI

HI
1

0.83 Ojiva menor que

0.66

0.36

0.13

25 36 47 58 69 80 LI

MEDIDAS DE TENDENCIA CENTRAL O ESTADÍGRAFOS CENTRALES Son


aquellos indicadores que representan el valor central del conjunto de
observaciones las más conocidas son: Media Aritmética, Mediana, Moda

MEDIA ARITMÉTICA Es el promedio ponderado de las observaciones, se


̅"
simboliza por " X

o Para datos NO AGRUPADOS

∑𝑲
𝒊=𝟏 𝑿𝒊
"𝑿 " = n=cantidad de observaciones
𝒏

o Para datos AGRUPADOS


∑𝑲
𝒊=𝟏 𝑿𝒊 𝒇𝒊
̅"=
"𝑿 k=cantidad de intervalos
𝒏

f=frecuencia absoluta del i-esimo intervalo

x=marca de clase del i-esimo intervalo

n=cantidad de observaciones

VENTAJAS Y DESVENTAJAS

 VENTAJAS:
o Es de fácil cálculo
o Es manipulable algebraicamente.
 DESVENTAJAS:
o Es sensible a valores extremos.

Ejemplo

a) 5,8,9,9,12,15

5 + 8 + 9 + 9 + 12 + 15
̅=
X = 9,67
6
b) 5,8,9,9,12,35

5 + 8 + 9 + 9 + 12 + 35
̅=
X = 13
6
Toma en cuenta a todas las observaciones

PROPIEDADES

a) ∑𝐾 ̅
𝑖=1 𝑓𝑖 ∗ (𝑋𝑖 − X )=0 → La suma de las desviaciones es cero
̅
b) si X es la media aritmética de 𝑋1 , 𝑋2 , 𝑋3 , 𝑋𝐾−1,……., 𝑋𝐾 y sumamos una
constante b entonces se tiene:𝑋1 + 𝑏1 , 𝑋2 +𝑏1 , 𝑋3 + 𝑏1 , 𝑋𝐾−1 + 𝑏𝐾−1 , 𝑋𝐾 + 𝑏𝐾
̅+𝑏
La media aritmética es: X
̅+𝑏
Es decir: 𝑦𝑖 = 𝑋𝑖 + 𝑏 → 𝑦̅ = X
̅
c) Si 𝑦𝑖 = 𝑎𝑋𝑖 →𝑦̅ = 𝑎X
d) Si 𝑦𝑖 = 𝑎𝑋𝑖 + 𝑏 →𝑦𝑖 = 𝑎𝑋𝑖 + 𝑏
e) Si se tiene un conjunto de datos únicos: a,a,a,a,a,a ̅=a
X
MEDIA ARITMÉTICA PONDERADA Si se tienen "k" conjuntos de observaciones,
cada una de tamaño n1, n2, n3, … nk con sus propias medias aritméticas x1, x2, x3,
… xk. Es posible hallar una media aritmética para todas las observaciones llamada
media ponderada

∑𝑘𝑖=1 𝑛𝑖 ∗ 𝑋̅𝑖
𝑋̅𝑝 =
∑𝑘𝑖=1 𝑛𝑖

Cuando: n1=n2=n3= … =nk=n se utilizan factores de ponderación "W I"

̅ 𝒊 ∗ 𝑾𝒊
∑𝒌𝒊=𝟏 𝑿
̅𝒑 =
𝑿
∑𝒌𝒊=𝟏 𝑾𝒊

MEDIANA Se define como aquel valor que divide al conjunto de observaciones en


2 partes iguales.

o Para datos NO AGRUPADOS


 Si n= impar → 𝑋̃ = 𝑋𝑛+1
2

𝑋𝑛 +𝑋𝑛
+1
 Si n= par → 𝑋̃ = 2 2
2

La mediana se simboliza generalmente 𝑋̃

o Para datos AGRUPADOS

Se utiliza la siguiente formula heurística


𝒏
a) Calculamos 𝟐
𝒏
b) Buscamos en la columna de las FI que intervalo contiene a ese
𝟐
intervalo se denomina intervalo de la mediana
𝒏
− 𝑭𝑲−𝟏
̃ = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝟐
𝑿 )∗𝑪
𝑭𝑲 − 𝑭𝑲−𝟏

Donde:

𝒍𝒊𝒎𝒊𝒏𝒇 = Limite inferior del intervalo de la mediana

𝑪 = Amplitud inferior del intervalo de la mediana

𝑭𝑲 = Frecuencia absoluta acumulada de la mediana

𝑭𝑲−𝟏 = Frecuencia absoluta acumulada anterior al intervalo de la mediana


Mediana. - Se define como aquel valor que divide al conjunto de observaciones en
dos partes iguales

 Para datos no agrupados:

Si n= impar ̃ = 𝑿𝒏+𝟏
𝑿
𝟐

𝑿𝒏 +𝑿𝒏
+𝟏
Si n= par ̃=
𝑿 𝟐 𝟐
𝟐

La mediana se simboliza generalmente 𝑋̃

 Para datos agrupados:


Se utiliza la siguiente Formula heuristica
𝑛
1. Calculamos 2
𝑛
2. Buscamos en la columna de las 𝐹𝑖 que intervalo contiene a se ha
2

definido el intervalo de la mediana.

Entonces:

𝒏
−𝑭
̃ = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝟐 𝑲−𝟏 ) 𝑪
𝑿 𝑭 −𝑭
𝑲 𝑲−𝟏

Dónde:

liminf = Límite inferior del intervalo de la mediana.

C = Amplitud del intervalo de la mediana.

FK = Frecuencia Absoluta Acumulada del intervalo de la mediana.

FK−1 = Frecuencia Absoluta Acumulada Anterior al intervalo de la mediana.

También:

𝟏
− 𝑯𝑲−𝟏
̃ = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝟐
𝑿 )𝑪
𝑯𝑲 − 𝑯𝑲−𝟏
Ventajas y desventajas

- No es sensible a datos extremos.


- Es de fácil cálculo.
- No toma en cuenta a todas las observaciones.
- No es manipulable algebraicamente.

Moda. – Simbolizada por Mod(x) se define como el dato que se repite más veces.

 Para datos no agrupados


𝑀𝑜𝑑(𝑥) = 𝑋0 ↔ 𝑓𝑋𝑜 𝑒𝑠 𝑙𝑎 𝑚𝑎𝑥𝑖𝑚𝑎
 Para datos agrupados

𝐹1 = 𝐹𝑚𝑎𝑥.

𝐹1 = Frecuencia anterior al
intervalo modal.

𝐹1 = Frecuencia posterior al
intervalo modal.

∆1 = 𝐹𝑀𝑜 − 𝐹1 = ℎ𝑀𝑜 − ℎ1

∆2 = 𝐹𝑀𝑜 − 𝐹2 = ℎ𝑀𝑜 − ℎ2

La moda se calcula mediante:

∆𝟏
𝑴𝒐𝒅(𝒙) = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( )𝑪
∆𝟏 + ∆𝟐

Donde:

𝑙𝑖𝑚𝑖𝑛𝑓 = Limite inferioir del intervalo de la moda.

𝐶 = Amplitud del intervalo de la moda.


Ventajas y desventajas

- Es de fácil calculo
- No toma en cuenta a todas las observaciones.
- Puede existir más de una moda.

Dos modas → Bimodal

Tres modas → Trimodal

Relación Media, mediana y moda

Los tres indicadores centrales guardan una relación entre ellos de la siguiente
manera:

Mod(x)= 𝑋̃ = 𝑋̅

M
𝑋̅ < 𝑋̃ < 𝑀𝑜𝑑(𝑥)

Las tres medidas centrales cumplen aproximadamente la siguiente ecuación:

̅ -Mod(x) ≅ 𝟑(𝑿
𝑿 ̅−𝑿
̃)

Otras medidas centrales secundarias

Media Geométrica

𝒏
𝑿𝑮 = √∏𝒌𝒊=𝟏 𝑿𝒊 𝒇𝒊
̅̅̅̅ o 𝑿𝑮 = ∏𝒌𝒊=𝟏 𝑿𝒊 𝒉𝒊
̅̅̅̅

Donde:

𝑥𝑖 = Marca de clase.

𝑛 = Cantidad de intervalos.

𝐹𝑖 = Frecuencia absoluta.

ℎ𝑖 = Frecuencia relativa.

Media Cuadrática

𝑘
̅̅̅̅ ∑ 𝒌 𝒇𝒙 𝟐 O
𝑿𝑪 = √ 𝒊=𝟏𝒏 𝒊 𝒊 ̅𝑋̅̅𝐶̅ = √∑ ℎ𝑖 𝑥𝑖2
𝑖=1
Media armónica
𝒏 𝟏
̅̅̅̅
𝑿𝑯 = 𝒇𝒊 o ̅̅̅̅
𝑿𝑯 = 𝒉𝒊
∑𝑲
𝒊=𝟏 ∑𝑲
𝒊=𝟏
𝑿𝒊 𝑿𝒊

Ejemplo:

La siguiente tabla de Frecuencias muestra los pesos en Kg de una muestra


de 45 estudiantes:
a) Determine la media, mediana y moda.

b) Determine la media geométrica y la armónica.

Peso en kg ºN de Alumnos
40-45 4
45-50 10
50-55 15
55-60 8
50-65 5
65-70 3

Tabla de frecuencias

𝑳𝒊 − 𝑳𝒊+𝟏 𝒙𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝒇𝒊 𝒙𝒊
40-45 42,5 4 0,089 4 179
45-50 47,5 10 0,222 14 475
50-55 52,5 15 0,333 29 787,5
55-60 57,5 8 0,178 37 460
50-65 62,5 5 0,111 42 312,5
65-70 67,5 3 0,067 45 202,5
Total 45 1 2407,5
a) Media
∑𝐾𝑖=1 𝑓𝑖 𝑥𝑖 2407,5
𝑋̅ = =
𝑛 45
𝑋̅ = 53,5 𝐾𝑔
Mediana
𝑛 45
Donde: 2= 2 = 22,5
𝑛
− 𝐹𝐾−1 22,5 − 14
𝑋̃ = 𝑙𝑖𝑚𝑖𝑛𝑓 + ( 2 ) 𝐶 = 50 + ( )5
𝐹𝐾 − 𝐹𝐾−1 29 − 14

𝑋̃ = 52,7167 𝐾𝑔

Moda
∆𝟏 = 15 − 10 = 5
∆𝟐 = 15 − 8 = 7
∆1 5
𝑀𝑜𝑑(𝑥) = 𝑙𝑖𝑚𝑖𝑛𝑓 + ( ) 𝐶 = 50 + ( )5
∆1 + ∆2 5+7

𝑀𝑜𝑑(𝑥) = 52,083 𝑘𝑔

b) Media geométrica
𝑛 𝑓𝑖
̅̅
𝑋̅̅ 𝑘
𝐺 = √∏𝑖=1 𝑋𝑖 𝑋𝐺 = ∏𝑘𝑖=1 𝑋𝑖 ℎ𝑖
= ̅̅̅̅

̅̅̅̅
𝑋𝐺 = (42,50,089 )(47,50,222 )(52,50,333 )(57,50,178 )(62,50,111 )(67,50,067 )

̅̅̅̅
𝑋𝐺 = 53,1 𝐾𝑔
Media Armónica
𝑛 45
̅̅̅̅
𝑋 𝐻 = =
𝑓𝑖 4 10 15 8 5 3
∑𝐾 + + + + +
𝑖=1 𝑋𝑖 42,5 47,5 52,5 57,5 62,5 67,5
̅̅̅̅
𝑋 𝐻 = 52,366 𝐾𝑔
Ejemplo:
Una distribución de Frecuencias sobre las notas de un grupo de estudiantes de
estadística presenta las frecuencias relativas 3 y 5 borrosas. Se sabe que la media
fue 7,9. Determinar la mediana y moda de la distribución

Nota de Frecuencias
estudiantes Relativas
0,5-2,5 0,02

2,5-4,5 0,10
4,5-6,5
6,5-8,5 0,16

8,5-10,5
10,5-12,5 0,10
12,5-14,5 0,02
14,5 o mas 0

Tabla de frecuencias

𝑳𝒊 − 𝑳𝒊+𝟏 𝒙𝒊 𝒉𝒊 𝑯𝒊 𝒉𝒊 𝒙 𝒊
0,5-2,5 1,5 0,02 0,02 0,03
2,5-4,5 3,5 0,10 0,12 3,5
4,5-6,5 5,5 0,20 0,32 5,5ℎ3
6,5-8,5 7,5 0,16 0,48 1,20
8,5-10,5 9,5 0,40 0,88 9,5ℎ5
10,5-12,5 11,5 0,10 0,98 1,15
12,5-14,5 13,5 0,02 1 0,27
14,5 o mas 15,5 0 1 0
Total 1
De las ecuaciones:

∑ ℎ𝑖 = 0,02+0,10+ℎ3 +0,16+ℎ5 +0,10+0,02 = 1


∑ ℎ𝑖 = ℎ3 +ℎ5 = 0,6 (1)

De la media

𝑋̅ = ∑𝐾
𝑖=1 ℎ𝑖 𝑥𝑖 = 3+5,5ℎ3 +9,5ℎ5 =7,9

5,5ℎ3 +9,5ℎ5 =4,9 (2)

Resolviendo ecuación 1 y 2
ℎ3 = 0,20
ℎ5 = 0,40

Para la mediana:
1
Donde: 2=0,5
1
− 𝐻𝐾−1 0,5 − 0,48
𝑋̃ = 𝑙𝑖𝑚𝑖𝑛𝑓 + ( 2 ) 𝐶 = 8,5 + ( )2
𝐻𝐾 − 𝐻𝐾−1 0,88 − 0,48

𝑋̃ = 8,6

Para moda
∆𝟏 = 0,40 − 0,16 = 0,24
∆𝟐 = 0,40 − 0,10 = 0,30
∆1 0,24
𝑀𝑜𝑑(𝑥) = 𝑙𝑖𝑚𝑖𝑛𝑓 + ( ) 𝐶 = 8,5 + ( )2
∆1 + ∆2 0,24 + 0,30

𝑀𝑜𝑑(𝑥) = 9,389

NOTA: No es necesario calcular la cantidad de observaciones si nos dan como


dato las Frecuencias relativas.
Ejemplo:
Los salarios de una empresa son en promedio 500$us, con posterioridad se
incorporan a la empresa un grupo de obreros igual al 25% de las que estaban
anteriormente. El nuevo grupo ingresa a la empresa con un salario medio igual al
60% de los antiguos. Dos meses más tarde la empresa concede un aumento de
salario de 30$us/trabajador. Se pide:
a) El promedio de salario del total de obreros.

b) Si el incremento hubiera sido del 20% del salario, ¿Cuál habría sido la media
salarial ajustada?

Si inicialmente se tenía “n” trabajadores, entonces:

𝑋̅ = 500$𝑢𝑠
Se incorpora:
𝑛 60
25%𝑛 = → 𝑦̅ = 𝑋̅
4 100
3
𝑦̅ = (500)
5
𝑦̅ = 300$𝑢𝑠

Incremento 30$us/ trabajador

Cantidad ̅
𝑿
Antiguos n 500$us
Nuevos 𝑛 300$us
4

a) Promedio ponderado

𝑧 = 𝑥 + 30
𝑧̅ = 𝑥̅ + 30

𝑛
𝑛(500 + 300) + 4 (300 + 30)
̅𝑋̅̅𝑝̅ =
𝑛
𝑛+4
̅𝑋̅̅𝑝̅ = 490$𝑢𝑠

b) Media salarial ajustada, ahora es:

20 𝑋̅
𝑋̅ =
100 5

𝑥 6
𝑧=𝑥+ = 𝑋
5 5
6
𝑧̅ = 𝑥̅
5
Entonces:

6 𝑛 6
𝑛 ( (500)) + 4 ( (300))
̅𝑋̅̅𝑝̅ = 5 5
𝑛
𝑛+4
̅𝑋̅̅𝑝̅ = 552$𝑢𝑠

Medidas de Agrupación. - Tienen el objetivo de mostrar el valor representativo


cuando los datos se agrupan en función de cierto criterio. Los más utilizados son:

 Cuartiles
 Deciles
 Percentiles

Cuartiles. - Son los valores que representan a los daros cuando se los agrupa de
1/4 en ¼ o de 25% en 25%

3
4

𝑋𝑀𝐼𝑁 1°cuartil 2°cuartil 3°cuartil 𝑋𝑀𝐴𝑋

1
4

2
4
Pero: 𝑄2 = 𝑋̅

𝒏
− 𝑭𝑲−𝟏
𝑸𝟐 = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝟐 )𝑪
𝑭𝑲 − 𝑭𝑲−𝟏

𝑛 3𝑛
Utilizamos la expresión de la mediana ajustada a y
4 4

𝟏 𝒏
−𝑯𝑲−𝟏 −𝑭𝑲−𝟏
𝑸𝟏 = 𝒍𝒊𝒎𝒊𝒏𝒇 + (𝑯𝟒 )𝑪 o 𝑸𝟏 = 𝒍𝒊𝒎𝒊𝒏𝒇 + (𝑭𝟒 −𝑭 )𝑪
𝑲 −𝑯𝑲−𝟏 𝑲 𝑲−𝟏

𝟑 𝒏
−𝑯𝑲−𝟏 𝟑∗ −𝑭𝑲−𝟏
𝑸𝟑 = 𝒍𝒊𝒎𝒊𝒏𝒇 + (𝑯𝟒 )𝑪 o 𝑸𝟑 = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝑭 𝟒−𝑭 )𝑪
𝑲 −𝑯𝑲−𝟏 𝑲 𝑲−𝟏

Deciles. - Son valores que representan a las observaciones cuando se las agrupa
de 10% en 10% o de 1/10 en 1/10

5
10

𝐷1 𝐷2 𝐷3 𝐷4 𝐷5 𝐷6 𝐷7 𝐷8 𝐷9

𝑋𝑀𝑖𝑛 𝑋𝑀𝑎𝑥

1
10

2
10

Pero: 𝐷5 ≅ 𝑋̃
En ese sentido

𝒏 𝟏
𝒊 −𝑭𝑲−𝟏 𝒊 −𝑯𝑲−𝟏
𝑫𝒊 = 𝒍𝒊𝒎𝒊𝒏𝒇 + (𝑭𝟏𝟎−𝑭 )𝑪 o 𝑫𝒊 = 𝒍𝒊𝒎𝒊𝒏𝒇 + (𝑯𝟏𝟎 −𝑯 )𝑪
𝑲 𝑲−𝟏 𝑲 𝑲−𝟏

Dónde: i = 1,2,3,4, 5…9

Percentiles. - Son valores que representan a los datos cuando se los acumula de
1/100 en 1/100 o de 1% en 1%

𝑃1 𝑃2 𝑃3 𝑃4 𝑃50 𝑃67 𝑃72 𝑃80 𝑃99

𝑋𝑀𝑖𝑛 𝑋𝑀𝑎𝑥

Pero: 𝑃50 ≅ 𝑋̃

En consecuencia:

𝒏 𝟏
𝒊 −𝑭𝑲−𝟏 𝒊 −𝑯𝑲−𝟏
𝟏𝟎𝟎 𝟏𝟎𝟎
𝑷𝒊 = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝑭 )𝑪 o 𝑷𝒊 = 𝒍𝒊𝒎𝒊𝒏𝒇 + ( 𝑯 )𝑪
𝑲 −𝑭𝑲−𝟏 𝑲 −𝑯𝑲−𝟏

Dónde: i = 1,2,3,4, 5…9

Ejemplo
Se tiene la siguiente información respecto de una tabla de frecuencias de los
intervalos de igual amplitud.
𝑋̅ = 35,3 ; 𝑋̅ = 35 ; ℎ1 = 0,04 ; 𝐻2 = 0,10 ; ℎ3 = 0,4 ; ℎ3 = 0,35 ; 𝐻5 = 0,98
Determinar:

a) El valor máximo por debajo del cual está el 25% de las observaciones.
b) La moda.
c) Los dos cuartiles, el tercer decil y el 1/66 percentil
𝑳𝒊𝒏𝒇 − 𝑳𝑺𝒖𝒑 𝒙𝒊 𝒉𝒊 𝑯𝒊
5-15 10 0,004 0,04
15-25 20 0,06 0,10
25-35 30 0,40 0,50
35-45 40 0,35 0,85
45-55 50 0,13 0,98
55-65 60 0,02 1
Total 1

Para completar tabla:

1
Donde: 𝑋̃ = 2=0,5
1
− 𝐻𝐾−1 0,5 − 0,10
𝑋̃ = 𝑙𝑖𝑚𝑖𝑛𝑓3 + ( 2 ) 𝐶 = 𝑙𝑖𝑚𝑖𝑛𝑓3 + ( )𝐶
𝐻𝐾 − 𝐻𝐾−1 0,5 − 0,20

𝑋̃ = 𝑙𝑖𝑚𝑖𝑛𝑓3 + 𝐶 = 35
𝑙𝑖𝑚𝑆𝑢𝑝3 = 35
Para marca de clase:

35 − 3𝐶 + 35 − 2𝐶
𝑥1 =
2

Donde:
𝐾
5 3 1
𝑋̅ = ∑ ℎ𝑖 𝑥𝑖 = (35 − 𝐶) (0,04) + (35 − 𝐶) (0,06) + (35 − 𝐶) (0,40)
2 2 2
𝑖=1

1 3 5
+ (35 − 𝐶) (0,35) + (35 − 𝐶) (0,13) + (35 − 𝐶) (0,02)
2 2 2
𝑋̅ = 35,3 = 35 + 0,03𝐶

Inciso a) Valor máximo 25% 𝐶 = 10


Vmax
15%
5 15 25 𝑥 35

4% 6% 40%

10%

Entonces:

𝑥 − 25
( ) 40% = 15%
35 − 25
𝑥𝑚𝑎𝑥 = 28,75
Inciso b) Para moda

∆𝟏 = 0,40 − 0,06 = 0,34


∆𝟐 = 0,40 − 0,35 = 0,05
∆1 0,34
𝑀𝑜𝑑(𝑥) = 𝑙𝑖𝑚𝑖𝑛𝑓 + ( ) 𝐶 = 8,5 + ( ) 10
∆1 + ∆2 0,34 + 0,05

𝑀𝑜𝑑(𝑥) = 33,72
Inciso c)
1 0,25 − 0,10
𝑄1 = = 0,25 → 𝑄1 = 25 + ( ) (10)
4 0,50 − 0,10
𝑄1 = 28,75
3 0,75 − 0,50
𝑄3 = = 0,75 → 𝑄3 = 35 + ( ) (10)
4 0,85 − 0,50
𝑄3 = 42,14

3 0,3 − 0,10
𝐷3 = = 0,3 → 𝐷3 = 25 + ( ) (10)
10 0,50 − 0,10
𝐷3 = 30
66 0,66 − 0,50
𝑃66 = = 0,66 → 𝑄3 = 35 + ( ) (10)
100 0,85 − 0,50
𝑃66 = 39,57

Medidas de dispersión

Este conjunto de estadígrafos tiene por objeto mostrar cuan dispersas están las
observaciones respecto a algún valor central.

Las más utilizadas son:

Medida absoluta

𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

Rango Intercuartico

𝑅𝑞 = 𝑄3 − 𝑄1

Rango Semi intercuartico

𝑄3 − 𝑄1
𝑅𝑆𝑞 =
2

Desviación Media. - Tiene por objeto la ponderación de las desviaciones de los


datos con respecto a la media o a la mediana.

Se define como el promedio ponderado del valor absoluto de las observaciones de


las marcas de clase con respecto al valor central elegido.

∑𝑲 ̃
𝒊=𝟏 𝒇𝒊 |𝑿𝒊 − 𝑿|
̃) =
𝑫𝑴 (𝑿
𝒏

𝑲
̃ ) = ∑ 𝒉𝒊 |𝑿𝒊 − 𝑿
𝑫𝑴 (𝑿 ̃|
𝒊=𝟏
Con respecto a la mediana:

∑𝑲 ̃
𝒊=𝟏 𝒇𝒊 |𝑿𝒊 − 𝑿|
̃) =
𝑫𝑴 (𝑿
𝒏

𝑲
̃ ) = ∑ 𝒉𝒊 |𝑿𝒊 − 𝑿
𝑫𝑴 (𝑿 ̃|
𝒊=𝟏

Su desventaja es que el valor absoluto no toma en cuenta el signo de la


desviación.

Varianza y la desviación estándar

Para una muestra: La varianza muestra se simboliza por 𝑆 2 (𝑋) y se define como
el promedio ponderado del cuadrado de las desviaciones con respecto a la media
aritmética

∑𝑲 ̅ 𝟐
𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿)
𝟐 (𝑿)
𝑺 =
𝒏−𝟏

La desviación estándar es la raíz cuadrada de la varianza

̅ )𝟐
∑𝑲 𝒇𝒊 (𝑿𝒊 − 𝑿
𝑺(𝑿) = √ 𝒊=𝟏
𝒏−𝟏

Podemos inferir la varianza y la desviación estándar para la población


considerando que 𝑋 es la media poblacional “𝜇”

𝑋̅ = 𝜇

La varianza es:

𝟐 (𝑿)
∑𝑲
𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝝁)
𝟐
𝝈 =
𝑵

La desviación estándar es:


∑𝑲 𝒇𝒊 (𝑿𝒊 − 𝝁)𝟐
𝝈(𝑿) = √ 𝒊=𝟏
𝑵

En forma general se simboliza a la varianza como “𝑉𝑎𝑟(𝑥)” si n>120 entonces:

𝑺𝟐 (𝒙) ≅ 𝝈𝟐 (𝒙)

Una expresión alternativa para 𝑺𝟐 (𝒙) :

𝑘
1
𝑆 2
(𝑥) = ∗ (∑ 𝑓𝑖 ∗ (𝑋𝑖 − 𝑋̅)2 )
𝑛−1
𝑖=1

𝑘
1
𝑆 2
(𝑥) = ∗ (∑ 𝑓𝑖 ∗ (𝑋𝑖2 − 2𝑋𝑖 ∗ 𝑋̅ + 𝑋̅ 2 ))
𝑛−1
𝑖=1

𝑘 𝑘 𝑘
1
𝑆 2
(𝑥) = ∗ (∑ 𝑓𝑖 ∗ (𝑋𝑖2 ) − 2𝑋̅𝑛 ∗ ∑ 𝑓𝑖 ∗ 𝑋𝑖 + 𝑋̅ 2 ∗ ∑ 𝑓𝑖 )
𝑛−1
𝑖=1 𝑖=1 𝑖=1

Como:
𝑘
∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖
𝑋̅ = 𝑦 𝑛 = ∑ 𝑓𝑖
𝑛
𝑖=1

𝑘 𝑘
1 ∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖
𝑆 2
(𝑥) = ∗ (∑ 𝑓𝑖 ∗ (𝑋𝑖2 ) − 2𝑋̅ ∗ 𝑛 ∗ + 𝑋̅ 2 ∗ ∑ 𝑓𝑖 )
𝑛−1 𝑛
𝑖=1 𝑖=1

𝑘
1
𝑆 2 (𝑥) = ∗ (∑ 𝑓𝑖 ∗ 𝑋𝑖2 − 2𝑛 ∗ 𝑋̅ 2 + 𝑋̅ 2 ∗ 𝑛)
𝑛−1
𝑖=1

𝒌
𝟏
𝑺𝟐 (𝒙) = ̅ 𝟐)
∗ (∑ 𝒇𝒊 ∗ 𝑿𝟐𝒊 − 𝒏 ∗ 𝑿
𝒏−𝟏
𝒊=𝟏

INTRA E INTERVARIANZA
Cuando se tienen “𝜌” estudios de una misma variable, cada uno con su propia
media aritmética y varianza, se puede encontrar una varianza global para todos
los estudios.

∑𝝆𝒊=𝟏(𝒏 − 𝟏) ∗ 𝑺𝟐𝒊 (𝒙) ∑𝝆𝒊=𝟏(𝑿


̅ 𝟐𝒊 − 𝑿
̅ 𝟐𝒑 ) ∗ 𝒏𝒊
𝑺𝟐𝑮 (𝒙) = −
∑𝝆𝒊=𝟏 𝒏𝒊 ∑𝝆𝒊=𝟏 𝒏𝒊

Intravarinza Intervarianza

𝜌 = Total de estudios.

𝑛𝑖 = Tamaño de la muestra del iesimo estudio.

𝑋̅𝑖 = Media de muestra del iesimo estudio.

𝑋̅𝑝 = Media de muestra del iesimo estudio.

Muestra ̅
𝑿 𝑺𝟐𝒊 (𝒙)
𝒊
𝒏𝒊 ̅𝟏
𝑿 𝑺𝟐𝟏 (𝒙)
𝒏𝒊 ̅
𝑿 𝑺𝟐𝟐 (𝒙)
𝟐

𝒏𝒊 ̅𝟑
𝑿 𝑺𝟐𝟑 (𝒙)
. . .
. . .
. . .
. . .
𝒏𝒑 ̅
𝑿𝒑 𝑺𝟐𝒑
(𝒙)

La varianza se la puede entender gráficamente de la siguiente manera:


0,4

0,3

0,2

0,1

0,0
̅ − 𝑲𝑺𝑿 0 ̅ + 𝑲𝑺𝑿
𝑿 ̅ 𝑿
𝑿
El valor de K= 1,2,3,……….

- Entonces cuando K=1 [𝑋̅ − 𝑆(𝑋) , 𝑋̅ + 𝑆(𝑋) ]

Se encuentra el 68,27 % de las observaciones

- cuando k=2 [𝑋̅ − 2𝑆(𝑋) , 𝑋̅ + 2𝑆(𝑋) ]

Se halla el 95,45 % de los datos observados

- cuando k=3 [𝑋̅ − 3𝑆(𝑋) , 𝑋̅ + 3𝑆(𝑋) ]

Se halla el 99,73 % de los datos observados

- cuando k=4 [𝑋̅ − 4𝑆(𝑋) , 𝑋̅ + 4𝑆(𝑋) ]

Se halla el 100% de los datos observados

PROPIEDADES

i) 𝑽𝒂𝒓(𝒂 ∗ 𝑿𝒊 ) = 𝒂𝟐 ∗ 𝑽𝒂𝒓(𝑿𝒊 )
ii) 𝑽𝒂𝒓(𝑿𝒊 + 𝒃) = 𝑽𝒂𝒓(𝑿𝒊 )
iii) 𝑽𝒂𝒓(𝒂 ∗ 𝑿𝒊 + 𝒃) = 𝒂𝟐 ∗ 𝑽𝒂𝒓(𝑿𝒊 )
COEFICIENTE DE VARIACIÓN

Simbolizado por C.V.(X) es la razón de la Desviación Estándar a la media


aritmética.

𝑺(𝑿)
𝑪. 𝑽.(𝑿) = ∗ 𝟏𝟎𝟎%
̅
𝑿

- ̅.
Si el C.V. es < 50%, los datos están más concentrados sobre 𝑿
- ̅.
Si el C.V. es > 50%, los datos están más concentrados sobre 𝑿

MOMENTOS DE UN CONJUNTO DE OBSERVACIONES

Se definen como el promedio ponderado de la r- sima potencia de la desviación


con respecto al origen a la media aritmética.

∑𝒌𝒊=𝟏 𝒇𝒊 ∗𝑿𝒓𝒊
Al origen: 𝑴𝒓 = ; r =orden del momento
𝒏

∑𝒌𝒊=𝟏 𝒇𝒊 ∗ 𝑿𝒊
𝑴𝟏 = ̅
=𝑿
𝒏

∑𝒌𝒊=𝟏 𝒇𝒊 ∗ 𝑿𝟐𝒊
𝑴𝟏 =
𝒏

∑𝒌𝒊=𝟏 𝒇𝒊 ∗ 𝑿𝟑𝒊
𝑴𝟏 =
𝒏

A la media aritmética

̅ )𝒓
∑𝒌𝒊=𝟏 𝒇𝒊 ∗ (𝑿𝒊 − 𝑿
𝑴𝒓(𝑿̅) =
𝒏

̅)
∑𝒌𝒊=𝟏 𝒇𝒊 ∗ (𝑿𝒊 − 𝑿
𝑴𝟏(𝑿̅) = =𝟎
𝒏
̅ )𝟐
∑𝒌𝒊=𝟏 𝒇𝒊 ∗ (𝑿𝒊 − 𝑿
𝑴𝟐(𝑿̅) = = 𝝈𝟐(𝑿)
𝒏

̅ )𝟑
∑𝒌𝒊=𝟏 𝒇𝒊 ∗ (𝑿𝒊 − 𝑿
𝑴𝟐(𝑿̅) =
𝒏

MEDIDAS DE DEFORMACIÓN

Estos indicadores analizan cuan deformada esta la curva de distribución de


frecuencias ya sea horizontalmente o verticalmente. Las medidas de deformación
horizontal se llaman medidas de asimetría “As” y gráficamente se interpretan
como:

As< 0 As= 0 As> 0


Sesgo negativo Simétrica Sesgo positiva

Existen varios criterios para hallar As:

1er coeficiente de Pearson

̅ − 𝑴𝒐𝒅(𝒙) 𝟑(𝑿
𝑿 ̅−𝑿 ̃)
𝑨𝒔𝑰 = ≅
𝑺(𝒙) 𝑺(𝒙)

2do coeficiente de Pearson:

̃
𝑸𝟑 + 𝑸𝟏 − 𝟐𝑿
𝑨𝒔𝑰𝑰 =
𝑸𝟑 − 𝑸𝟏
Coeficiente de Fisher:

𝑴𝟑(𝑿̅) ̅−𝑿
𝟏 ∑𝒏𝒊=𝟏 𝒇𝒊 ∗ (𝑿 ̃ )𝟑
𝑨𝒔𝑰𝑰 = ≅ ∗
𝑺𝟑(𝑿) 𝒏 𝑺𝟑(𝑿)

Las medidas de deformación vertical se denominan “Medidas de Curtosis” y


gráficamente se tiene los siguientes casos:

Existen dos criterios para el coeficiente de Curtosis “K”.

CURTOSIS PERCENTÍLICA

𝑸𝟑 − 𝑸𝟏
𝑲=
𝟐 ∗ (𝑷𝟗𝟎 − 𝑷𝟏𝟎 )
Si: K= 0,263 Mesocúrtica

K< 0,263 leptocúrtica

K> 0,263 platicúrtica

CURTOSIS DE FISHER

𝑴𝟒(𝑿̅)
𝑲𝑭 = −𝟑
𝑺𝟒(𝑿)

Si: KF = 3 Mesocúrtica ; KF=0

KF < 0,263 leptocúrtica ; KF<0

KF > 0,263 platicúrtica ; KF>0

Ejemplo.-Los siguientes datos pertenecen a una distribución simétrica de


frecuencias de un estudio sobre las mediciones en pulgadas de una cantidad
determinada de tubos de acero y en el que se conoce:

𝐻6 − 𝐻2 = 0,88 ; 𝐻5 − 𝐻3 = 0,60 ; 𝐻4 + 𝐻6 = 1,68 ; 𝑃90 − 𝑃10 = (𝐾 − 4) ∗ 𝐶

𝑃10 + 𝑋2 = 11,1 ; 𝑃90 − 𝑋2 = 0,7 ; 𝑋𝑚𝑖𝑛 = 5,2 𝐷𝑜𝑛𝑑𝑒 𝑋𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

Se pide:

a) Reconstruir la tabla de frecuencias.


b) Hallar la varianza y el coeficiente de variación.
c) Determinar el coeficiente de asimetría y de curtosis.

Solución:

𝐻6 − 𝐻2 = 0,88 … (1); 𝐻5 − 𝐻3 = 0,60. . (2); 𝐻4 + 𝐻6 = 1,68. . (3)

𝑃90 − 𝑃10 = (𝐾 − 4) ∗ 𝐶 … (4); 𝑃10 + 𝑋2 = 11,1 … (5): 𝑃90 − 𝑋2 = 0,7 … (6)

(5) + (6) 𝑃10 + 𝑃90 = 11,8 … . (∝)

𝑿𝒎𝒊𝒏 𝑷𝟏𝟎 ̅
𝑿 𝑷𝟗𝟎 𝑿𝑴𝒂𝒙

𝒂 𝒅 𝒅 𝒂
Del gráfico:
𝑃 = 𝑋̅ − 𝑑
{ 10 } 𝑒𝑛 (∝)
𝑃90 = 𝑋̅ + 𝑑
̅ + 𝑑 = 11,8
𝑋̅ − 𝑑 + 𝑋 ̅ = 11,8
2𝑋 ̅ = 𝟓, 𝟗
→ 𝑿

Entonces: ̅=𝑿
𝑿 ̃ = 𝑴𝒐𝒅(𝒙) = 𝟓, 𝟗

(6) - (5)

𝑃90 − 𝑃10 − 2𝑋2 = −10,4 ← 𝑃90 − 𝑃10 = (𝐾 − 4) ∗ 𝐶

(𝐾 − 4) ∗ 𝐶 + 10,4
(𝐾 − 4) ∗ 𝐶 − 2𝑋2 = −10,4 𝑋2 =
2

𝒍𝒊 + 𝒍𝒊+𝟏 𝑿𝒊
5,2 + 5,2 + C
5,2 - 5,2+C
2
5,2 + C + 5,2 + 2C
5,2+C - 5,2+2C
2

5,2 + C + 5,2 + 2C 3 (𝐾 − 4) ∗ 𝐶 + 10,4


𝑋2 = → 𝑋2 = 5,2 + ∗𝐶 =
2 2 2
3 (𝐾 − 4) ∗ 𝐶 3 (𝐾 − 4) ∗ 𝐶
5,2 + ∗ 𝐶 = + 5,2 5,2 + ∗ 𝐶 = + 5,2
2 2 2 2

𝑲=𝟕
En (1) ya que es simétrica ℎ1 = ℎ7 ; ℎ2 = ℎ6 ; ℎ3 = ℎ5 ; ℎ4 ;

ℎ1 + 2ℎ2 + 2ℎ3 + ℎ4 − ℎ1 − ℎ2 = 0,88

ℎ2 + 2ℎ3 + ℎ4 = 0,88 … . (𝐼)

En (2)

ℎ1 + ℎ2 + 2ℎ3 + ℎ4 − ℎ1 − ℎ2 − ℎ3 = 0,88

ℎ3 + ℎ4 = 0,60 … . (𝐼𝐼)

En (2)

ℎ1 + 2ℎ2 + 2ℎ3 + ℎ4 + ℎ1 + ℎ2 + ℎ3 + ℎ4 = 1,68

2ℎ1 + 3ℎ2 + 3ℎ3 + 2ℎ4 = 1,68 … . (𝐼𝐼𝐼)


Por ultimo:

2ℎ1 + 2ℎ2 + 2ℎ3 + ℎ4 = 1 … . (𝐼𝑉)

Del sistema de ecuaciones:

ℎ2 + 2ℎ3 + ℎ4 = 0,88
ℎ3 + ℎ4 = 0,60
{ }
2ℎ1 + 3ℎ2 + 3ℎ3 + 2ℎ4 = 1,68
2ℎ1 + 2ℎ2 + 2ℎ3 + ℎ4 = 1

ℎ1 = 0,02 ; ℎ2 = 0,08 ; ℎ3 = 0,20 ; ℎ4 = 0,40

Como:

𝑋̅ = 𝑋̃ = 𝑀𝑜𝑑(𝑥) = 5,9 → 0,5

1⁄2 − 0,3 𝐶
5,9 = 𝑙𝑖𝑛𝑓4 + ( )∗𝐶 → 5,9 = 5,2 + 3𝐶 +
0,7 − 0,3 2

𝑪 = 𝟎, 𝟐

𝒍𝒊 + 𝒍𝒊+𝟏 𝑿𝒊 𝒉𝒊 𝑯𝒊 𝒉𝒊 ∗ 𝑿𝟐𝒊
5,2 - 5,4 5,3 0,02 0,02 0,5618
5,4 - 5,6 5,5 0,08 0,1 2,42
5,6 - 5,8 5,7 0,2 0,3 6,498
5,8 - 6,0 5,9 0,4 0,7 13,924
6,0 - 6,2 6,1 0,2 0,9 7,442
6,2 - 6,4 6,3 0,08 0,98 3,1752
6,4 - 6,6 6,5 0,02 1 0,845
1 34,866

b) 𝑽𝒂𝒓(𝑿), 𝑪𝑽 𝒏 =? 𝒗𝒂𝒎𝒐𝒔 𝒂 𝒂𝒔𝒖𝒎𝒊𝒓 𝒏 ≥ 𝟏𝟐𝟎

2 1
𝑉𝑎𝑟(𝑋) = 𝑆(𝑥) = ∗ (∑ 𝑓𝑖 ∗ 𝑋𝑖2 − 𝑛 ∗ 𝑋̅ 2 )
𝑛−1
Pero n-1=n
2
𝑆(𝑥) = (∑ ℎ𝑖 ∗ 𝑋𝑖2 − 𝑋̅ 2 )

𝑉𝑎𝑟(𝑋) = 34,866 − 5,92


2
𝑆(𝑋) = 0,056 𝑺(𝑿) = 𝟎, 𝟐𝟑𝟕
𝑆(𝑋) 0,237
𝐶. 𝑉. = ∗ 100% 𝐶. 𝑉. = ∗ 100% 𝐶. 𝑉. = 0,04 ∗ 100%
𝑋̅ 5,9

𝑪. 𝑽. = 𝟒% 𝑨𝒍𝒕𝒂 𝑪𝒐𝒏𝒄𝒆𝒏𝒕𝒓𝒂𝒄𝒊ó𝒏

c)
𝑃10 + 𝑋2 = 11,1 → 𝑃10 = 11,1 − 5,5 = 5,6 𝑷𝟏𝟎 = 𝟓, 𝟔

𝑃90 − 𝑋2 = 0,7 → 𝑃90 = 0,7 + 5,5 = 6,2 𝑷𝟗𝟎 = 𝟔, 𝟐

̅ −𝑿
𝟑( 𝑿 ̃)
̅=𝑿
𝑿 ̃ = 𝑴𝒐𝒅(𝒙) 𝑨𝒔𝑰 = =𝟎
𝑺(𝒙)

𝑨𝒔𝑰 = 𝟎

𝑸𝟑 − 𝑸𝟏
𝑲=
𝟐 ∗ (𝑷𝟗𝟎 − 𝑷𝟏𝟎 )

1⁄ 0,25 − 0,1
4 → 𝑸𝟏 = 5,6 + ( ) ∗ 0,2 = 5,75 𝑸𝟏 = 𝟓, 𝟕𝟓
0,3 − 0,1

3⁄ 0,75 − 0,7
4 → 𝑸𝟑 = 6 + ( ) ∗ 0,2 = 6,05 𝑸𝟏 = 𝟔, 𝟎𝟓
0,9 − 0,7

6,05 − 5,75
𝐾= = 0,25
2 ∗ (6,2 − 5,6)

𝑲 = 𝟎, 𝟐𝟓
K < 0,263 es Leptocúrtica

Ejemplo.-

Si ∑𝑛 𝑛 2
𝑖=1 𝑋𝑖 = 1000 ; ∑𝑖=1 𝑋𝑖 = 25000 ; 𝑉𝑎𝑟(𝑋) = 100 ;

2𝑋 + 17
𝑌=
9
Hallar el 𝐶𝑉(𝑌) :

Solución:

2
√𝑆(𝑌) 2 17
𝐶𝑉(𝑌) = 𝑐𝑜𝑚𝑜: 𝑌= ∗𝑋+
𝑌̅ 9 9
2 17
𝑌̅ = ∗ 𝑋̅ +
9 9

2 2 2 2 2 2
𝑉𝑎𝑟(𝑌) = 𝑆(𝑌) = (9) ∗ 𝑉𝑎𝑟(𝑋) 𝑆(𝑌) = (9) ∗ 100

𝟒𝟎𝟎
𝑺𝟐(𝒀) =
𝟖𝟏
̅ utilizamos:
Para 𝑿
2
1 ∑ 𝑋𝑖
𝑉𝑎𝑟(𝑋) = ∗ (∑ 𝑋𝑖2 − 𝑛 ( ) )
𝑛 𝑛

1000 2
𝑛 ∗ 100 = 25000 − 𝑛 ( )
𝑛

100 ∗ 𝑛2 − 25000𝑛 − 10002 = 0

𝒏𝟏 = 𝟐𝟎𝟎
𝒏𝟐 = 𝟓𝟎 ∗ 𝑿
pero n >120 n2=50 ∄
∑ 𝑋𝑖 1000
𝑋̅ = = =5
𝑛 200
2 17 27 𝟐𝟕
𝑌̅ = ∗5+ = ̅=
𝒀
9 9 9 𝟗
2 17 27 𝟐𝟕
𝑌̅ = ∗5+ = ̅=
𝒀
9 9 9 𝟗
400
𝑆(𝑋)
𝐶. 𝑉. = 𝐶. 𝑉. = 81 𝐶. 𝑉. = 1,65
𝑋̅ 27
9

𝑪. 𝑽. = 𝟏, 𝟔𝟓

Ejemplo.-Una compañía tiene 100 trabajadores profesionales; para los


nombrados el haber básico máximo es de 450 $us y el mínimo de 60 $us
mensuales hay un 5% de practicantes que trabajan adonoren o perciben
compensaciones inferiores a los 60$us, 15 profesionales tienen haberes inferiores
a 400$us, con esta información calcular:

a) ¿Cuántos trabajadores ganan más de 200 $us?.


b) Las tres medidas controles.
c) El coeficiente de variación.
d) El coeficiente de asimetría y curtosis.

Solución.-

n = 100

Salario Máximo = 450 $us/mes

Salario Mínimo = 60 $us/mes

5% de practicantes ℎ2 + ℎ3 + ℎ4 = 0,85

15 ´Profesionales haberes inferiores a 250 $us

85% de los profesionales inferiores a 400 $us


15
ℎ2 + ℎ3 = 0,85 → ℎ2 = 100 = 0,15 𝒉𝟐 = 𝟎, 𝟏𝟓 ; 𝒉𝟑 = 𝟎, 𝟕𝟎
ℎ1 + ℎ2 + ℎ3 + ℎ4 = 1 → ℎ3 + ℎ4 = 0,80 𝒉𝟒 = 𝟎, 𝟖𝟎 − 𝟎. 𝟕𝟎 ; 𝒉𝟒
= 𝟎, 𝟏𝟎

𝒇𝟏 = 𝟎, 𝟎𝟓 ∗ 𝟏𝟎𝟎 = 𝟓

𝒍𝒊 + 𝒍𝒊+𝟏 𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊 𝒇𝒊 ∗ 𝑿𝒊 𝒉𝒊 ∗ 𝑿𝟐𝒊
0 - 60 30 5 5 0,05 0,05 150 4500
60 - 250 155 15 20 0,15 0,20 2325 360375
250 - 400 325 70 90 0,70 0,90 22750 7393750
400 - 450 425 10 100 0,10 1,00 4250 1806250
100 1,00 29475 9564875

a) 200
0 60
250

250 − 200 15
( ) ∗ 15 + 70 + 10 = 83 𝑝𝑟𝑜𝑓𝑒𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠
250 − 60

𝟖𝟑 𝒑𝒓𝒐𝒇𝒆𝒄𝒊𝒐𝒏𝒂𝒍𝒆𝒔

$𝑢𝑠
b) 𝑋̅ = 294,75 𝑚𝑒𝑠
1 0,5 − 0,20 $𝑢𝑠
→ 𝑋̃ = 250 + ( ) ∗ 150 → 𝑋̃ = 314,28
2 0,9 − 0,20 𝑚𝑒𝑠

𝑓𝑚𝑜 = 70 ; 𝑓1 = 15 ; 𝑓2 = 10

70 − 15
𝑀𝑜𝑑(𝑥) = 250 + ( ) ∗ 150
70 − 15 + 70 − 10

$𝑢𝑠
𝑀𝑜𝑑(𝑥) = 321,74
𝑚𝑒𝑠
c)
2 1 2
𝑆(𝑋) = 99 ∗ {9564875 − 100 ∗ (294,75)2 } → 𝑆(𝑋) = 8859,78 → 𝑺(𝑿) = 𝟗𝟒, 𝟏𝟐

94,12
𝐶. 𝑉. = = 0,32 𝑪. 𝑽. = 𝟎, 𝟑𝟐
294,75

d)
̅ −𝑿
𝟑( 𝑿 ̃) 3(294,75 − 314,28)
𝑨𝒔𝑰 = 𝐴𝑠𝐼 = = −0,622
𝑺(𝒙) 94,12

𝑨𝒔𝑰 = −𝟎, 𝟔𝟐𝟐

Asimetria negativa
𝑸𝟑 − 𝑸𝟏
𝑲=
𝟐 ∗ (𝑷𝟗𝟎 − 𝑷𝟏𝟎 )
1 0,25 − 0,20
→ 𝑄1 = 250 + ( ) ∗ 150 = 𝑄1 = 260,71
4 0,90 − 0,20
3 0,75 − 0,20
→ 𝑄3 = 250 + ( ) ∗ 150 = 𝑄3 = 367,86
4 0,90 − 0,20
10 0,10 − 0,05
→ 𝑃10 = 60 + ( ) ∗ 190 = 𝑃10 = 123,33
100 0,20 − 0,05
90 0,90 − 0,20
→ 𝑃90 = 250 + ( ) ∗ 150 = 𝑃10 = 400
100 0,90 − 0,20

367,86 − 260,71
𝑲= = 𝟎, 𝟏𝟗𝟒
𝟐 ∗ (400 − 123,33)

𝑲 = 𝟎, 𝟏𝟗𝟒

K < 0,263 es Leptocúrtica


Capítulo 3

PROBABILIDADES
Introducción

En el espacio muestral determinado por Ω se pueden definir una serie de eventos


o sucesos. “A” que son el resultado en la experimentación en Ω

En forma general se tienen dos tipos de experimentos:

Experimentos Determinísticos.- los cuales se caracterizan por que el resultado


puede ser predicho sin la necesidad de realizar el experimento

 Todos los experimentos de laboratorio


Experimentos no Determinísticos.- el resultado no puede ser predicho hasta
realizar el ensayo

 Experimentos aleatorios
 Experimentos asociados al análisis combinatorio
 Experimentos asociados a la parte frecuencial
Como el espacio muestral Ω es el conjunto universo, los eventos o sucesos son
subconjuntos de Ω y se puede operar según el algebra de conjuntos.

Lo que interesa es determinar la cantidad posible de veces en las que el evento o


suceso “A” se puede dar dentro de Ω (cardinalidad).

i) 𝑛(𝐴𝐶 ) = 𝑛(Ω) − 𝑛(𝐴)

ii) 𝑛(𝐴 ∪ 𝐵) = 𝑛(𝐴) + 𝑛(𝐵) − 𝑛(𝐴 ∩ 𝐵)


iii) 𝑛(𝐴 − 𝐵) = 𝑛(𝐴) − 𝑛(𝐴 ∩ 𝐵)

vi) 𝑛(𝐴∆𝐵) = 𝑛(𝐴) + 𝑛(𝐵) − 2𝑛(𝐴 ∩ 𝐵)

v)𝑛(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑛(𝐴) + 𝑛(𝐵) + 𝑛(𝐶) − 𝑛(𝐴 ∩ 𝐵) − 𝑛(𝐴 ∩ 𝐶) − 𝑛(𝐵 ∩ 𝐶) + 𝑛(𝐴 ∩


𝐵 ∩ 𝐶)

Cuando el experimento este asociado a criterios de ordenamiento, entonces


hablamos del análisis combinatorio

Si interesa el arreglo:

𝑚!
sin repeticion 𝑚𝐴𝑛 = (𝑚−𝑛)!
 Variación o arreglo: {
con repeticion 𝑚𝐴𝑅𝑛 = 𝑚𝑛

𝑃𝑛 = 𝑛!
 Permutación: { 𝐶
𝑃𝑛 = (𝑛 − 1)!
 Con repetición
𝑛!
𝑛𝑃𝑅𝑛1 ,𝑛2 ,𝑛3 ,…..,𝑛𝑘 = 𝑛
1 !∗𝑛2 !∗……∗𝑛𝑘 !

∑ 𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝑘 = 𝑛

Si no interesa el orden:

𝑛 𝑛!
sin repeticion: 𝑛𝐶𝑚 = ( ) =
𝑚 (𝑛 − 𝑚)! ∗ 𝑚!
(𝑛 + 𝑚 − 1)!
con repeticion: 𝑛𝐶 ∗ 𝑅𝑚 =
{ (𝑛 − 1)! ∗ 𝑚!

Los eventos o sucesos pueden ser: incluyentes (evento A incluye al evento B),
excluyentes (evento A no incluye al evento B).

El análisis combinatorio se puede determinar en función del principio de adición o


del principio de multiplicación.

DEFINICION DE PROBABILIDAD

La probabilidad es el grado de incertidumbre que un evento o suceso sea un éxito

Definición de la place.- la probabilidad es la razón de la cantidad de veces en las


que se puede dar el evento o suceso “A”a las opciones totales en el espacio
muestral Ω
𝑛𝐴
𝑃(𝐴) =
𝑛Ω

Definición frecuencial.- la probabilidad de un evento A es el cociente de la


cantidad de veces que se repite A al numero total de observaciones realizadas

𝐹𝐴
𝑃(𝐴) = = ℎ𝐴
𝑛
Definición subjetiva.-

𝑃(𝐴) = 0 (Evento A ha sido un fracaso)

𝑃(𝐴) = 1 (Evento A ha sido un éxito)

Ejemplo.-

Con los dígitos 0, 1, 2, 3, 4, 5, 6,7 se desean formar números de cuatro cifras

a) determinar cuál es la cantidad de números que se pueden formar sin repetición.

b) cuántos de estos números son pares.

c) ¿Cuál es la probabilidad de que un número elegido al azar de los anteriores sea


impar?

d) ¿Cuál es la probabilidad de que el numero elegido al azar este entre 2000 y


4000

Solución

 8 dijitos → # 4 cifras

7 7 6 5

𝑛Ω == 𝟕(𝟕) ∗ 𝟔(𝟓) = 𝟏𝟒𝟕𝟎 𝑵𝑼𝑴𝑬𝑹𝑶𝑺

 pares

6 6 5 4

𝑛𝑨 = 𝟕𝟐𝟎 𝑵𝑼𝑴𝑬𝑹𝑶𝑺 𝑷𝑨𝑹𝑬𝑺

 impares
𝑛𝐵 = 1470 − 720

𝑛𝐵 = 750 𝑁𝑈𝑀𝐸𝑅𝑂𝑆 𝐼𝑀𝑃𝐴𝑅𝐸𝑆

Entonces….
𝑛𝐵 750
𝑃𝐵 = = = 0.51
𝑛Ω 1470

Probabilidad del 51% de números impares

 entre 2000 y 4000


2 7 6 5

𝑛𝐶 = 𝟕𝟔𝟎

𝑛𝐶 760
𝑃𝐵 = = = 0.517
𝑛Ω 1470

Probabilidad del 51,7% de números entre 2000 y 4000

Ejemplo:

Si 𝑃𝐴 = 0,4 ; 𝑃𝐵 = 0,5 ; 𝑃𝐴∩𝐵 = 0,3. Hallar 𝑃𝐴∪𝐵 , 𝑃𝐴∩𝐵𝐶 𝑃𝐴𝐶 ∩𝐵𝐶

Solución

A)

𝑛𝐴∪𝐵 = 𝑛𝐴 + 𝑛𝐵 − 𝑛𝐴∩𝐵 \\ ÷ 𝑛Ω
𝑛𝐴∪𝐵 𝑛 𝑛 𝑛𝐴∩𝐵
= 𝑛𝐴 + 𝑛𝐵 −
𝑛Ω Ω Ω 𝑛Ω

𝑃𝐴∪𝐵 = 𝑃𝐴 + 𝑃𝐵 − 𝑃𝐴∩𝐵

𝑃𝐴∪𝐵 = 0.4 + 0.5 − 0.3

𝑃𝐴∪𝐵 = 0.6

B)

𝑛𝐴∩𝐵𝐶 = 𝑛𝐴 − 𝑛𝐴∩𝐵 \\ ÷ 𝑛Ω
𝑛𝐴∩𝐵𝐶 𝑛 𝑛𝐴∩𝐵
= 𝑛𝐴 −
𝑛Ω Ω 𝑛Ω

𝑃𝐴∩𝐵𝐶 = 𝑃𝐴 − 𝑃𝐴∩𝐵
𝑃𝐴∩𝐵𝐶 = 0.4 − 0.3

𝑃𝐴∩𝐵𝐶 = 0.1

C)

𝑛𝐴𝐶∩𝐵𝐶 = 𝑛Ω − 𝑛𝐴∪𝐵 \\ ÷ 𝑛Ω
𝑛𝐴𝐶 ∩𝐵𝐶 𝑛 𝑛𝐴∪𝐵
= 𝑛Ω −
𝑛Ω Ω 𝑛Ω

𝑃𝐴𝐶 ∩𝐵𝐶 = 𝟏 − 𝑃𝐴∪𝐵

𝑃𝐴𝐶 ∩𝐵𝐶 = 1 − 0.6

𝑃𝐴𝐶 ∩𝐵𝐶 = 0.1

AXIOMAS DE PROBABILIDAD

 𝑃(𝛺) = 1
 𝑃(∅) = 1
 𝑃(𝐴𝐶 ) = 1 − 𝑃(𝐴)
 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
 𝑃(𝐴 ∩ 𝐵 𝐶 ) = 𝑃(𝐴 − 𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)
 𝑃(𝐴𝐶 ∩ 𝐵) = 𝑃(𝐵 − 𝐴) = 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) +
+𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)

Ejemplo.-

En una urna hay 2 bolas azules una blanca y 3 rojas se extraen alazar 3 bolas sin
reposición. Calcule la probabilidad de que las dos bolas sean rojas, o una blanca y
otra azul.

Solución.-

2 azules
1 blanca
3 rojas
Total= 3 bolas
RR o BA → elementos excluyentes no hay bolas mitad rojas ni mitad azul →
𝑃(𝐴 ∩ 𝐶) = 0

6!
𝑛𝛺 = 𝐶62 = = 15
4! ∗ 2!

A: dos bolas son rojas

𝐶32 3
𝑃𝐴 = =
15 15

1
𝑃𝐴 =
5

B: una blanca y otra azul

𝐶11 ∗ 𝐶21 2
𝑃𝐵 = =
15 15

Entonces…

1 2
𝑃(𝐴 ∪ 𝐵) = +
5 15

1
𝑃(𝐴 ∪ 𝐵) =
3

Ejemplo.-

El gerente de una planta química se entera de la notificación de un pleito en la


corte, la compañía puede ser culpable de contaminación. Mas aun el sabe que si
la encuentran culpable debe instalar un sistema de purificación, pagar una multa o
ambos. Hasta ahora solo un 10% de las compañías en casos similares han tenido
que pagar la multa e instalar el sistema de purificación. Adicionalmente cuando la
decisión de la corte no obliga a las dos penas, una compañía ah tenido 3 veces
mas, la probabilidad de ser multada de que ser requerida para instalar el sistema
de purificación. Si el 28% de las compañías han sido culpables ¿Cuál es la
probabilidad de que esta compañía sea requerida para instalar el sistema de
purificación?

Solución

A: instale el sistema de purificación

B: pagar la multa

𝑃(𝐴 ∩ 𝐵) = 0.1

𝑃(𝐵) = 3𝑃(𝐴)

𝑃(Ω) = 0.28

𝐴∪𝐵 =Ω

𝑃(𝐴) =?

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)


𝑃(Ω) = 𝑃(𝐴) + 3𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)
𝑃(Ω) + 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴) =
4
0.28 + 0.10
𝑃(𝐴) =
4
𝑃(𝐴) = 0.095 ≅ 9.5%

Ejemplo.-

de 250 empleados se sabe que 130 fuman cigarrillos, hay 150 hombres de la
compañía de los cuales 85 fuman cigarrillos. Si un empleado es seleccionado al
azar ¿ cual es la probabilidad de que?

a) Que no fume cigarrillos


b) Sea mujer y fume cigarrillos
c) Sea hombre o fume cigarrillos
Solución.-

fuman no fuman total


hombres 85 65 150
mujeres 45 55 100
total 130 120 250\250

a)
120 12
𝑃(𝑛𝑜 𝑓𝑢𝑚𝑎) = =
250 25
b)
45 9
𝑃(𝑚𝑢𝑗𝑒𝑟 𝑦 𝑓𝑢𝑚𝑒) = =
250 50
c)

𝑃(𝐻𝑜𝑚𝑏𝑟𝑒 ∪ 𝐹𝑢𝑚𝑒) = 𝑃(𝐻) + 𝑃(𝐹) − 𝑃(𝐻 ∩ 𝐹)

150 130 85
𝑃(𝐻𝑜𝑚𝑏𝑟𝑒 ∪ 𝐹𝑢𝑚𝑒) = + −
250 250 250

195 39
𝑃(𝐻𝑜𝑚𝑏𝑟𝑒 ∪ 𝐹𝑢𝑚𝑒) = =
250 50

PROBABILIDAD CONDICIONAL

El objetivo de este tipo de probabilidades es encontrar la probabilidad de un


evento A dado que otro evento B del mismo espacio muestral ya ha sucedido.

AyB∈ Ω
Nomenclatura
𝑃 (𝐴 / 𝐵) = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴 𝑐𝑜𝑛𝑑𝑖𝑐𝑖𝑜𝑛𝑎𝑑𝑎 𝑎 𝐵

𝑃(𝐴 ∩ 𝐵)
𝑃 (𝐴 / 𝐵) =
𝑃(𝐵)
Como:

𝑛(𝐴∩𝐵) 𝑛(𝐵)
𝑃 (𝐴 ∩ 𝐵) = ^ 𝑃 (𝐵) =
𝑛 𝑛

Tambien:

𝑛(𝐴 ∩ 𝐵)
𝑃 (𝐴 / 𝐵) = 𝑛
𝑛(𝐵)
𝑛

𝑛(𝐴 ∩ 𝐵)
𝑃 (𝐴 / 𝐵) =
𝑛(𝐵)

AXIOMAS
1. 𝑃(𝐴𝐶 /𝐵) = 1 − 𝑃(𝐴/𝐵)
2. 𝑃(𝐴 ∪ 𝐵/𝐶) = 𝑃(𝐴/𝐶) + 𝑃(𝐵/𝐶) − 𝑃(𝐴 ∩ 𝐵/𝐶)
3. 𝑃(𝐴/𝐵) ≠ 𝑃(𝐵/𝐴)

TEOREMA DE LA MULTIPLICACION
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴 / 𝐵) =
𝑃(𝐵)

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) ∗ 𝑃(𝐴 / 𝐵)


Cuando un espacio muestral está dividido en k superficies muestrales tales que no
existe intersección entre ellos.

𝐵𝒊 ∩ 𝐵𝒋 ≠ 𝟎

∀𝒊 ≠ 𝑗

Entonces es posible dibujar un árbol


de probabilidades

Ejemplo.-

Un aparato electrónico consta de dos partes la probabilidad de que falle la primera


es 0.20, que falle las dos partes 0.15 y que falle solo la segunda parte 0.45
calcular la probabilidad que:

a) Falle solo la primera parte


b) Falle la primera cuando se sabe que fallo la segunda
Solución.-

Datos:

𝑃(𝐴 ∩ 𝐵) = 0.15

𝑃(𝐴) = 0.20
𝑃(𝑠𝑜𝑙𝑜 𝐵) = 0.45

𝑃(𝐴/𝐵) =? ?

𝑃(𝑠𝑜𝑙𝑜 𝐴) =?

a) 𝑃(𝑠𝑜𝑙𝑜 𝐴) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)

𝑃(𝑠𝑜𝑙𝑜 𝐴) = 0.20 − 0.15

𝑃(𝑠𝑜𝑙𝑜 𝐴) = 0.05

b)

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴 / 𝐵) =
𝑃(𝐵)

𝑃(𝑠𝑜𝑙𝑜 𝐵) + 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵)

𝑃(𝐵) = 0.45 − 0.15

𝑃(𝐵) = 0,60

Entonces:

0.15
𝑃(𝐴 / 𝐵) = → 𝑃(𝐴 / 𝐵) = 1⁄4
0.60

Ejemplo

Considere 3 urnas, la urna 1 contiene 2 bolas blancas y 4 rojas, la 2 ocho blancas


y 4 rojas y la 3 una blanca y 3 rojas. Se selecciona una bola de cada una.¿ cual es
la probabilidad que la bola seleccionada de la urna 1 sea blanca dado que la
muestra contiene exactamente 2 bolas blancas?

Solución.-

A: la bola extraída de la urna I sea blanca


B: 2 de las 3 bolas seleccionadas son blancas

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴 / 𝐵) =
𝑃(𝐵)

𝐵 = {(𝑏𝑏𝑟, 𝑏𝑟𝑏, 𝑟𝑏𝑏)}

2 8 3 2 4 1 4 8 1
𝑃𝐵 = ∗ ∗ + ∗ ∗ + ∗ ∗
6 12 4 6 12 4 6 12 4

48 + 8 + 32 88
𝑃𝐵 = =
6 ∗ 12 ∗ 4 6 ∗ 12 ∗ 4

2 8 3 2 4 1 56
𝑃(𝐴 ∩ 𝐵) = ∗ ∗ + ∗ ∗ =
6 12 4 6 12 4 6 ∗ 12 ∗ 4

56
𝑃(𝐴 / 𝐵) = 6 ∗ 12 ∗ 4
88
6 ∗ 12 ∗ 4

7
𝑃(𝐴 / 𝐵) =
11

TEOREMA DE LA PROBABILIDAD TOTAL

Sea un espacio muestral Ω particionado en B1, B2, B3,……, Bk sub espacios


muestrales tales que no existe intersección entre 2 de ellos cualquiera
𝐵1 ∩ 𝐵2 ∩ 𝐵3 ∩ … … .∩ 𝐵𝑘 = Ω

Sea un elemento A común a todas las particiones del cual se desea encontrar su
probabilidad, entonces

De la probabilidad condicional:

𝑃(𝐴 ∩ 𝐵)
𝑃 (𝐴 ⁄ 𝐵) = → 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) ∗ 𝑃(𝐴/𝐵)
𝑃(𝐵)

Entonces:

𝐴 𝐴 𝐴 𝐴
𝑃(𝐴) = 𝑃(𝐵1 ) ∗ 𝑃( ) + 𝑃(𝐵2 ) ∗ 𝑃( ) + 𝑃(𝐵3 ) ∗ 𝑃( ) + ⋯ … + 𝑃(𝐵𝑛 ) ∗ 𝑃( )
𝐵1 𝐵2 𝐵3 𝐵𝑛

𝐴
𝑃(𝐴) = ∑𝑃(𝐵𝑖 ) ∗ 𝑃( )
𝐵𝑖

TEOREMA DE BAYES

Si se tiene un espacio muestral Ω particiado en B1, B2, B3,……..,Bk sub espacios


muestrales y se conoce la probabilidad del evento A común a todas las
particiones, el objetivo es hallar la probabilidad que provenga de la j – esima
partición dado que le evento A ha sucedido.

𝑃(𝐵𝑖 /𝐴) =?
𝐴 𝑃(𝐵𝑖 ∩𝐴) 𝑃(𝐴∩𝐵𝑖 )
𝑃(𝐵 ) = =
𝑖 𝑃(𝐴) 𝑃(𝐴)

𝐴 𝑃(𝐵𝑖 ) ∗ 𝑃(𝐴/𝐵𝑖 )
𝑃( ) =
𝐵𝑖 𝐴
∑𝑃(𝐵𝑖 ) ∗ 𝑃(𝐵 )
𝑖

Ejemplo.-

Se tiene 5 fusiles que cuando son apuntados apropiadamente tienen


probabilidades de dar en el blanco respectivamente como sigue: 0.5, 0.6, 0.7, 0.8,
0.9 se escoge aleatoriamente uno de los fusiles, se apunta y dispara. ¿Cuál es la
probabilidad de que no dé en el blanco?

1 0.5
2 0,6
1
5 fusiles 3 0,7 se elige uno al azar =F 𝑃𝐹 = 5
4 0,8
{5 0,9

A: el fusil disparado da en el blanco

Por el teorema de probabilidad total

𝐴
𝑃(𝐴) = ∑𝑃(𝐵𝑖 ) ∗ 𝑃( )
𝐵𝑖
𝐴 𝐴 𝐴 𝐴
𝑃(𝐴) = 𝑃(𝐵1 ) ∗ 𝑃( ) + 𝑃(𝐵2 ) ∗ 𝑃( ) + 𝑃(𝐵3 ) ∗ 𝑃( ) + ⋯ … + 𝑃(𝐵5 ) ∗ 𝑃( )
𝐵1 𝐵2 𝐵3 𝐵5

1 5 1 6 1 7 1 8 1 9
𝑃(𝐴) = ∗ + ∗ + ∗ + ∗ + ∗
5 10 5 10 5 10 5 10 5 10
1 5+6+7+8+9
𝑃(𝐴) = [ ]
5 10
35
𝑃(𝐴) = = 0.7
50

𝑃(𝐴𝐶 ) = 1 − 𝑃(𝐴)
𝑃(𝐴𝐶 ) = 1 − 0.7 → 𝑃(𝐴𝐶 ) = 0.3

Ejemplo.-
En vista de los gastos que suponen reparación o sustitución de mercadería
defectuosa, la gerencia desea vigilarla taza de imperfectos en el proceso de
producción. Le pide al ingeniero industrial que examine un plan propuesto para un
nuevo proceso de producción de grandes transformadores, en realidad el nuevo
proceso supone 2 procesos separados, cada uno de los cuales produce al
transformador como ultima etapa del proceso total. El examen de las maquinas y
de las operaciones que intervieven en cada mitad del proceso de producción
convence al ingeniero de que hay una probabilidad de 0.0014 de que una parte del
proceso produzca un defectuoso y otra de 0,0025 de que la otra parte produzca el
defectuoso.
a) Que porcentaje de la producción total ha de estimarse defectuosa
b) Si se elige un transformador al azar y resulta ser defectuoso. ¿Cuál es la
probabilidad de que haya manufacturado en la 1ra parte del proceso?

P. DEFECTUOSO
1ra PARTE 0.0014
2da PARTE 0.0025 1
𝑃(1𝑟𝑎 𝑃𝐴𝑅𝑇𝐸) = 𝑃(2𝑑𝑎 𝑃𝐴𝑅𝑇𝐸) = 2

Del teorema de probabilidad total

𝐷 𝐷
𝑃(𝐷) = 𝑃(1𝑟𝑎) ∗ 𝑃( ) + 𝑃(2𝑑𝑎) ∗ 𝑃( )
1𝑟𝑎1 2𝑑𝑎

1 1
𝑃(𝐷) = ∗ 0.0014 + ∗ 0.0025
2 2
𝑃(𝐷) = 0.00195 ≅ 0.195%

b) se elige un transformador→ defectuoso por BAYES


𝑃(1𝑟𝑎 ∩ 𝐷) 𝑃(1𝑟𝑎) ∗ 𝑃 (𝐷⁄1𝑟𝑎)
𝑃 (1𝑟𝑎⁄𝐷) = =
𝑃(𝐷) 𝑃(𝐷)

0.5 ∗ 0.0014
𝑃 (1𝑟𝑎⁄𝐷) = → 𝑃 (1𝑟𝑎⁄𝐷 ) = 0.3590
0.00195

Ejemplo.-

un experimento consiste en lanzar un par de dados y sumar la suma de los


números que aparecen en las caras superiores ¿Cuál es la probabilidad que la
suma 4 salga antes de la suma 6?

Solución.-

Espacio muestral

(1,1); (1,2); (1,3); (1,4); (1,5); (1,6);


(2,1); (2,2); (2,3); (2,4); (2,5); (2,6);
(3,1); (3,2); (3,3); (3,4); (3,5); (3,6);
(4,1); (4,2); (4,3); (4,4); (4,5); (4,6);
(5,1); (5,2); (5,3); (5,4); (5,5); (5,6);
{ (6,1); (6,2); (6,3); (6,4); (6,5); (6,6);

𝑛Ω = 𝟑𝟔

A: la suma es 4

B: la suma es 6

𝐸𝒏 : la suma no sea 4 ni 6 o salga 6 antes de 4


3
𝑃𝑨 = 36
5
𝑃𝐵 =
36
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
3 5
𝑃(𝐴 ∪ 𝐵) = + −0
36 36
8
𝑃(𝐴 ∪ 𝐵) =
36
𝑃(𝐸𝒏 ) = [1 − 𝑃(𝐴 ∪ 𝐵)] ∗ [1 − 𝑃(𝐴 ∪ 𝐵)][1 − 𝑃(𝐴 ∪ 𝐵)] ∗ … . .∗ [1 − 𝑃(𝐴 ∪ 𝐵)] ∗ 𝑃(𝐴)
8 8 8 8 3 28 𝑛−1 3
𝑃(𝐸𝒏 ) = [1 − ] ∗ [1 − ] [1 − ] ∗ … . .∗ [1 − ] ∗ =( ) ∗
36 36 36 36 36 36 36

Entonces…

3 28 𝑛−1
𝑃(𝐸𝒏 ) = ∑ ∗( )
36 36
𝑛=1

1 7 𝑛−1
𝑃(𝐸𝒏 ) = ∑∞
𝑛=1 12 ∗ (9) Progresión geométrica infinita
1 7
𝑎 ∗9
𝑃(𝐸𝒏 ) = = 12
1−𝑟 1−7
9

7
𝑃(𝐸𝒏 ) =
24
7
𝑃(𝑠𝑎𝑙𝑔𝑎 𝑠𝑢𝑚𝑎 4 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 6) = 𝑃(𝐸𝑛 𝐶 ) = 1 −
24

17
𝑃(𝑠𝑎𝑙𝑔𝑎 𝑠𝑢𝑚𝑎 4 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 6) =
24
PROBABILIDAD DE EVENTOS INDEPENDIENTES
Dos eventos son independientes si cada uno de ellos no depende del otro; pero
ambos forman parte del mismo espacio muestral, entonces se utiliza el teorema de
multiplicación.

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)

Si existe una secuencia de eventos independientes

𝑃(𝐴 ∩ 𝐵) = ∏ 𝑃(𝐴) ∗ 𝑃(𝐵)


𝑖=1
Se cumple:
𝑃(𝐴∩𝐵)
 𝑃(𝐴⁄𝐵 ) = = 𝑃(𝐴)
𝑃(𝐵)
𝑃(𝐵∩𝐴)
 𝑃(𝐵⁄𝐴) = = 𝑃(𝐵)
𝑃(𝐴)

Ejemplo.-

El dado A tiene 4 caras rojas y 2 blancas, el dado B tiene 2 caras negras y 4


blancas, se elige uno de estos dados al azar, se lanza “n” veces y en todas ellas
sale cara roja, la probabilidad de que haya lanzado el dado A es 32\33 ¿Cuántas
veces se lanzó el dado?

4𝑅 2𝑅
𝐴={ 𝐵={
2𝐵 4𝐵

32 1 4 4 4 1 2 2 2
𝑃(𝐴⁄𝑐𝑎𝑟𝑎 𝑟𝑜𝑗𝑎) = 33 𝑃𝑨 = 2 ∗ 6 ∗ 6 ∗ 6 ∗ … … … + 2 ∗ 6 ∗ 6 ∗ 6 ∗ … ..
1 4 𝑛 1 2 𝑛
𝑃𝑨 = 2 ∗ (6) + 2 ∗ (6)

A: se lanzan n veces y sale cara roja

1 4 𝑛
𝑃(𝐷𝐴 ⁄𝐴) =
𝑃(𝐷𝐴 ∩ 𝐴)
= 2 ∗ (6) 32
𝑛 𝑛 =
𝑃(𝐴) 1 4 1 2 33
2 ∗ (6) + 2 ∗ (6)
Entonces…
4 𝑛
( ) 4𝑛 32
6
4 𝑛 2 𝑛
= 4𝑛 +2𝑛 = 33
( ) +( )
6 6

32[(2𝑛 )2 + 2𝑛 ] = 33(2𝑛 )2

32 ∗ 2𝑛 = (2𝑛 )2

(2𝑛 )2 − 32 ∗ 2𝑛 = 0
(2𝑛 )(2𝑛 − 32) = 0

2𝑛 = 32 → 2𝑛 = 25 𝑛=5 →→ 𝑠𝑒 𝑙𝑎𝑛𝑧𝑎 5 𝑣𝑒𝑐𝑒𝑠

Ejemplo.-

Para que funcione adecuadamente un equipo electrónico debe tener las dos
componentes conectadas que aparecen en el diagrama en correcto
funcionamiento. El diagrama muestra que A debe funcionar y lo mismo alguno de
los 2 B. suponga que las componentes B funcionan independientemente de A, e
independientemente una de otra y que la confiabilidad de A es 0,9 y la de B1 y B2
es 0.8. Calcular la confiabilidad del equipo.

𝑃(𝐴) = 0,9

𝑃(𝐵1) = 𝑃(𝐵2) = 0,8

E: el equipo funcione correctamente

𝑃(𝐸) = 𝑃(𝐴) ∗ 𝑃(𝐵)

Pero…

𝑃(𝐵) = 𝑃(𝐵1) ∗ 𝑃(𝐵2)

𝑃(𝐸) = 0.9 ∗ 0.82

𝑃(𝐸) = 0,576
Capítulo 4

VARIABLE ALEATORIA UNIDIMENSIONAL

Hasta el momento se ha las probabilidades de eventos particulares, para poder


generalizar necesitamos definimos los experimentos asociados al evento.

Experimentos Determinísticos

En los cuales se puede determinar al resolver sin necesidad de realizar el


experimento.

Ejemplo:

Experimentos de laboratorio

Experimentos no determinísticos

Son aquellos que el resultado se obtiene al realizar el experimento.

Ejemplo:

Experimentos asociados al control de calidad

Experimentos asociados al azar

Variable aleatoria unidimensional

Es una función que es asociada a todo evento de espacio muestral de un


experimento no determinístico un valor real que está ligado a la característica del
objeto de estudio.

𝑋 = 𝑥(𝑤𝑖 )
Clasificación

Variable aleatoria discreta

Cuando el valor asignado es único dentro de un intervalo

Variable aleatoria continúa

Cuando se pueden asignar infinitos valores dentro de un intervalo

Al ser una variable aleatoria una función

𝐷𝑓 = 𝐷𝑜𝑚𝑖𝑛𝑖𝑜 𝑓 ⊂ Ω

𝑅𝑓 ⊂ ℝ

Ejemplo:

Una fábrica produce 10 paracaídas diariamente, sea la variable x el número de


paracaídas defectuosos.

a) ¿Es x una variable aleatoria?, que tipo de variable aleatoria será?


b) Si lo fuera halle el dominio y rango de la variable aleatoria.
Solución.-
Producen 10 paracaídas al día
X=número de paracaídas defectuosos

Si anotamos por día


D = {10 paracaídas
X=es una variable aleatoria puesto que el evento es no determinístico
Es una variable discreta
𝑅𝑥 = {𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 paracaídas 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠}
𝑅𝑥 = {0,1,2,3,4,5,6,7,8,9,10}

Ejemplo:

Una urna continua 5 bolas enumeradas de 1 a 5 , se extrae dos bolas sin


reemplazamiento , se define x como la suma de numero obtenidos en las
bolas , determinar :

a) El dominio de “x”

b) El rango de “x”

c) Las probabilidades de x=3 , x=5 y x entre 6 y 8 inclusive


X= la suma de los valores en las dos bolas

𝐷𝑥 = {1,2,3,4,5}

𝑅𝑥 = {3,4,5,6,7,8,9}

X 3 4 5 6 7 8 9
1/10 1/10 2/10 2/10 2/10 1/10 1/10

5! 5!
i. 𝜂Ω = 5ℂ2 = (52) = 2!∗(5−2)! = 2!∗3! = 10

1 1 2
𝑝(𝑥 = 3) = 𝑝(𝑥 = 4) = 𝑝(𝑥 = 5) =
10 10 10
2 2 1 1
𝑝(𝑥 = 6) = 𝑝(𝑥 = 7) = 𝑝(𝑥 = 8) = 𝑝(𝑥 = 9) =
10 10 10 10
2 2 1 5 1
ii. 𝑝(6 ≤ 𝑥 ≤ 8) = 𝑝(𝑥 = 6) + 𝑝(𝑥 = 7) + 𝑝(𝑥 = 8) = 10 + 10 + 10 = 10 = 2

1
𝑝(6 ≤ 𝑥 ≤ 8) =
2
Función o ley de probabilidad

Es una función que asocia a toda variable aleatoria un valor de probabilidad entre
0 y 1.

Si X = 𝑋(𝑊𝑖 )entonces: P(𝑊𝑖 ) = P(𝑥𝑖 )

Equivalencia de eventos
Al ser x una variable aleatoria discreta ò variable aleatoria continúa, la función P(x)
también está para variable aleatoria discreta ò variable aleatoria continúa.

*Para variable aleatoria discreta se verifica que es un único valor

Como 𝑊1 , 𝑊2 , 𝑊3 , … … … … … . , 𝑊𝑛 ⊂ Ω , entonces:

𝑃(Ω) = 𝑝(𝑊1 ) + 𝑝(𝑊2 ) + 𝑝(𝑊3 ) + 𝑝(𝑊4 ) + 𝑝(𝑊𝑛 ) 𝑦 𝑃(Ω) = 1

∴ ∑ 𝑝(𝑥𝑖 )
𝑖=1
=1

Función de
distribución

Las dos anteriores funciones se puede tabular en una tabla.

X X1 X2 X3 X4 X5 ….. Xi

p(X) p(X1) p(X2) p(X3) p(X4) p(X5) ….. p(Xi)

P(X) p(X1) p(X1)+ p(X1) p(X1) p(X1) …….. 1


p(X2) +p(X2) +p(X2) +p(X2)
+p(X3) +p(X3) +p(X3)
+p(X4) +p(X4)
+p(X5)
Para variable aleatoria continúa

𝑋∈ℝ

Entonces P(W1 ) ≅ P(x1 )

Como: 𝑤1 ∪ 𝑤2 ∪ 𝑤3 ∪ 𝑤4 , … ∪ 𝑤𝑘 = Ω

𝑃(𝑤1 ∪ 𝑤2 ∪ 𝑤3 ∪ 𝑤4 , … ∪ 𝑤𝑘 ) = 1

∑≅∫

∫ 𝑝(𝑥) 𝑑𝑥 = 1
ℝ𝑥

A la función p(x) se denomina función de densidad, la función acumulada de


probabilidad viene dada por p(x)
x
𝑝(𝑥) = ∫ 𝑝(𝑥) 𝑑𝑥
𝑅𝑥
Sus graficas vienen dadas

Propiedades de las funciones de distribución

i. P(x) es una función continua y creciente


ii. lim 𝑝(𝑥) = 1
𝑥→∞

Para evauar las funciones de distribución se deben tomar en cuenta

En variable aleatoria discreta:

i. 𝑝(𝑥 ≤ 𝑥0 ) = 𝑝(𝑥 = 𝑥0 )
ii. 𝑝(𝑥 ≥ 𝑥0 ) = 1 − 𝑝(𝑥 < 𝑥0 )
iii. 𝑝(𝑎 < 𝑥 ≤ 𝑏) = 𝑝(𝑥 = 𝑏) − 𝑝(𝑥 = 𝑎)
iv. 𝑝(𝑎 ≤ 𝑥 ≤ 𝑏) = 𝑝(𝑥 = 𝑏) − 𝑝(𝑥 = 𝑎)
v. 𝑝(𝑎 < 𝑥 < 𝑏) = 𝑝(𝑥 = 𝑏) − 𝑝(𝑥 = 𝑎) − 𝑝(𝑥 = 𝑏)

En variable aleatoria continua

vi. 𝑝(𝑥 ≤ 𝑥0 ) = 𝑝(𝑥 = 𝑥0 )


vii. 𝑝(𝑥 ≥ 𝑥0 ) = 1 − 𝑝(𝑥 < 𝑥0 )
viii. 𝑝(𝑎 ≤ 𝑥 ≤ 𝑏) = 𝑝(𝑥 = 𝑏) − 𝑝(𝑥 = 𝑎)

Ejemplo: Se tiene una urna con tres fichas negras y dos rojas. Se extraen
sucesivamente una ficha sin reposición hasta que salga una roja .sea x la variable
aleatoria, el número de extracciones que hay que realizar. Determinar:

a) Los valores que puede tomar la variable aleatoria y sus respectivas


probabilidades.
b) La función de cuantía y la función de distribución con sus respectivas
gráficas.

Se extrae de una en una

𝑥1 =1
𝑥 =2
𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎 { 2
𝑥3 =3
𝑥4 =4

a)

2 3 2 6
𝑝(𝑥1 ) = 𝑝(𝑥2 ) = ∗ =
5 5 4 20
3 2 2 12 3 2 1 2 6
𝑝(𝑥3 ) = ∗ ∗ = 𝑝(𝑥4 ) = ∗ ∗ ∗ =
5 4 3 60 5 4 3 2 60
X 1 2 3 4
p(X) 24/60 18/60 12/60 6/60
P(X) 24/60 42/60 57/60 1

b)
La funcion de distribucion de la variable aleatoria x esta dada por

0 𝑠𝑖 𝑥 < −1
0.5 𝑠𝑖 −1≤𝑥 ≤0
𝑃(𝑥) = {
0.8 𝑠𝑖 0≤𝑥≤2
1 𝑠𝑖 𝑥 ≥2

Determinar:

a) 𝑝(𝑥 ≤ −0.5) + 𝑝(𝑥 ≥ 1.5)


b) La función de cuantía

𝑝(𝑥 ≤ −0.5) = 𝑝(𝑥 = −0.5)

𝑝(𝑥 ≥ 1.5) = 1 − 𝑝(𝑥 < 1.5) = 1 − 0.8 = 0.2


Sumando ambas
𝑝(𝑥 ≤ −0.5) + 𝑝(𝑥 ≥ 1.5) = 0.5 + 0.2 = 0.7

x -1 0 2
p(x) 0,5 0,3 0,2
P(x) 0,5 0,8 1
Sea la función de probabilidad
𝑎𝑥 2 𝑠𝑖 0≤𝑥≤1
𝑝(𝑥) = {𝑎(2 − 𝑥)2 𝑠𝑖 0≤𝑥≤2
0 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠

a) hallar el valor de a

b) Hallar el valor de la función de distribución


1 3
c) Hallar 𝑝(2 ≤ 𝑥 < 2)


∫ 𝑝(𝑥) 𝑑𝑥 = 1
ℝ𝑥

0 1 1 ∞
2 2
∫ 0 𝑑𝑥 + ∫ 𝑎𝑥 𝑑𝑥 + ∫ 𝑎(2 − 𝑥) 𝑑𝑥 + ∫ 0 𝑑𝑥 = 1
−∞ 0 0 1

1 2
𝑥3 (2 − 𝑥)3
(𝑎 ) + (𝑎 ) =1
3 0 3 1

𝑎 𝑎(0 − 1)
− =1
3 3
2𝑎 3
=1 →𝑎=
3 2
3 2
𝑥 𝑠𝑖 0≤𝑥≤1
2
𝑝(𝑥) = 3
(2 − 𝑥)2 𝑠𝑖 0≤𝑥≤2
2
{ 0 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠

b)
x
𝑝(𝑥) = ∫ 𝑝(𝑥) 𝑑𝑥
𝑅𝑥

En [0.1[
x 𝑥
3 2 3 𝑥3
𝑝1 (𝑥) = ∫ 𝑥 𝑑𝑥 = ( )
0 2 2 3 0

𝑥3
𝑝(𝑥) =
2
En [1.2[
1 x
3 2 3
𝑝2 (𝑥) = ∫ 𝑥 𝑑𝑥 + ∫ (2 − 𝑥)2 𝑑𝑥
0 2 1 2

1 𝑥
3 𝑥3 3 (2 − 𝑥)3 1 (2 − 𝑥)3 1
𝑝2 (𝑥) = ( ) +( ) = − +
2 3 0 2 3 1
2 2 2

En [2. ∞[ 𝑝3 (𝑥) = 1

𝑥3
𝑠𝑖 0≤𝑥≤1
3
𝑝(𝑥) = (2 − 𝑥)3
𝑠𝑖 0≤𝑥≤2
2
{ 1 𝑠𝑖 𝑥≥2

c)
1 3 3 1
𝑝 ( ≤ 𝑥 < ) = 𝑝 (𝑥 = ) − 𝑝 (𝑥 = )
2 2 2 2

3 3
1 3 1 (2 − 2) 1 1 3
𝑝( ≤ 𝑥 < ) = 1 − − ( )
2 2 2 2 2

1 3 1 1
𝑝( ≤ 𝑥 < ) = 1− −
2 2 16 16

1 3 7
𝑝( ≤ 𝑥 < ) =
2 2 8
Distribuciones mixtas

Algunas ocasiones la variable aleatoria se comporta como discreta en algún


intervalo y como continuas en otros
∞ ∞
∑ 𝑝(𝑥) + ∫ 𝑝(𝑥) 𝑑𝑥 = 1
ℝ𝑥 ℝ𝑥
En variable aleatoria continua se verifica

𝑑𝑝(𝑥)
𝑝(𝑥) =
𝑑𝑥

Ejemplo:

Una variable aleatoria x tiene función de distribución cuyo grafico es :

Hallar:

1 3
𝑝( ≤ 𝑥 < )
2 2

𝑝((𝑥 − 1) < 1)

1
𝑝(|𝑥 − 1|) ∶ 𝑝 (𝑥 = − )
2
Solución:

0 𝑠𝑖 𝑥 < −1
1
𝑠𝑖 − 1 ≤ 𝑥 ≤ 0
𝑝(𝑥) 2
𝑥 − 1 𝑠𝑖 1≤𝑥≤2
{1 𝑠𝑖 𝑥≥2

1 1
𝑝 ( < 𝑥 < 2) = 𝑝(𝑥 = 2) − 𝑝 (𝑥 = )
2 2

1 1 1
𝑝 ( < 𝑥 < 2) = 1 − (− + 1)
2 2 2

1 3
𝑝 ( < 𝑥 < 2) =
2 4

b)
|𝑥 − 1| < 1

−1 < 𝑥 − 1 < 1

0<𝑥<2

𝑝(0 < 𝑥 < 2) = 𝑝(𝑥 = 2) − 𝑝(𝑥 = 0)


1 1
𝑝(0 < 𝑥 < 2) = 1 − =
2 2

c)
𝑝(𝑥 > 1) = 1 − 𝑝(𝑥 < 1)

𝑝(𝑥 > 1) = 1 − 𝑝(𝑥 = 1)

𝑝(𝑥 > 1) = 1

1 1 1 1
𝑝 (𝑥 = − ) = (− + 1) =
2 2 2 4

0 𝑠𝑖: 𝑥 < −1
1
𝑠𝑖: − 1 ≤ 𝑥 ≤ 0
𝑝(𝑥) 2
0 𝑠𝑖: 0≤𝑥≤1
1 𝑠𝑖: 1≤𝑥≤2
{ 0 𝑠𝑖: 𝑥≥2

Función de variable aleatoria

Sea “x” una variable aleatoria de la cual se tiene su función de probabilidad. Es


posible generar otra función en términos de “x” que corresponde

Ω 𝑥∈ℝ 𝑦 𝐻(𝑖) ∈ ℝ

P(𝑊𝑖 ) ≅ P(𝑥𝑖 ) ≅ P(𝑦𝑖 )

𝑦 = 𝐻(𝑖)
Esperanza matemática y valor promedio esperado

La esperanza matemática “E(x)” se define como la función que representa a la


media poblacional.

Se defina como:

E(x) = 𝑥P(x)

Entonces en variable aleatoria discreta

E(x) = ∑ 𝑥 ∗ p(x)
ℝ𝑥

En variable aleatoria continúa



E(x) = ∫ 𝑥 ∗ p(x) 𝑑𝑥
ℝ𝑥

El valor promedio esperado es el valor de una variable aleatoria que representa a


la media poblacional

𝜇 = 𝐸(𝑥)

PROPIEDADES

i. E (c ) = c

ii. E ( x + b ) = E (x ) + b

iii. E ( ax) = aE(x)

iv. E (a x + b ) = a E (x ) + b

v. Si 𝑦 = 𝐻𝑥 → 𝐸(𝑦) = 𝐸(𝐻(𝑥) )

Varianza y desviación estándar de la variable aleatoria

Sea “x” una variable aleatoria, se define la varianza en “x” como:

𝑉𝑎𝑟(𝑥) = 𝐸((𝑥 − 𝑢)2 )


Var(x) = 𝜎 2 = ∑Rx(𝑥 − 𝑢)2 ∗ 𝑝(𝑥) En variable aleatoria discreta

Var(x) = 𝛼 2 = ∫𝑅𝑥(𝑥 − 𝑢)2 ∗ 𝑝(𝑥) 𝑑𝑥 En variable aleatoria continua

En forma general:

σ = √𝑉𝑎𝑟(𝑥) Desviación estándar 𝑉𝑎𝑟(𝑥) ≅ 𝜎 2 varianza


poblacional

Una expresión reducida para la varianza se obtiene a partir de la definición

Var(x) = E((𝑥 − 𝑢)2 )

Var(x) = E(𝑥 2 − 2𝑥𝑢 + 𝑢2 )

Var(x) = E(𝑥 2 ) − 𝐸(2𝑥𝑢) + 𝐸(𝑢2 )

Var(x) = E(𝑥 2 ) − 2𝑢𝐸(𝑥) + 𝑢2

Pero: 𝐸(𝑥) ≅ 𝑢

Var(x) = E(𝑥 2 ) − 𝑢2

Donde

E(x 2 ) = ∑ 𝑥 2 ∗ p(x)
ℝ𝑥


2)
E(x = ∫ 𝑥 2 ∗ p(x) 𝑑𝑥
ℝ𝑥

Mediana y Moda de la variable aleatoria

1
𝑚𝑒𝑑(𝑥) = 𝑥𝑏 <=> 𝑃(𝑥 = 𝑋0 ) =
2

m𝑜𝑑(𝑥) = 𝑥0 <=> 𝑃(𝑥 = 𝑋0 ) Tiene un máximo

Métodos de agrupación

Tomando de los percentiles se tiene:

𝑖
𝑃𝑖 (𝑥) = 𝑥0 <=> 𝑃(𝑥 = 𝑋0 ) =
100
Donde i=1,2, 3…,99

Momento de la variable aleatoria

Mr (x) = E((𝑥 − 𝑢)𝑟 )

M3 (x) = E((𝑥 − 𝑢)𝑟3 )

𝑀4 (x) = E((𝑥 − 𝑢)4 )

Mr (x) = ∑Rx(𝑥 − 𝑢)𝑟 ∗ 𝑝(𝑥) En variable aleatoria discreta


Mr (x) = ∫𝑅𝑥(𝑥 − 𝑢)𝑟 ∗ 𝑝(𝑥) 𝑑𝑥 En variable aleatoria continua

Medidas de deformación

Asimetría:

M3 (x)
As =
σ3
Si 𝐴𝑠 < 0 𝑠𝑒𝑠𝑔𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜

𝐴𝑠 = 0 𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑐𝑎

𝐴𝑠 > 0 𝑠𝑒𝑠𝑔𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜

Vertical:

𝑀4 (𝑥)
𝑘=
𝜎 4 (𝑥)

Si k< 3 𝑝𝑙𝑎𝑡𝑖𝑐𝑢𝑟𝑡𝑖𝑐𝑎

𝑘 = 3 𝑚𝑒𝑠𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎

k > 3 𝑙𝑒𝑝𝑡𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎
Ejemplo:

En una feria se deben pagar 50 centavos. Para participar en un juego que consiste
en lanzar anillos .se dan 3 anillos a una persona, la cual trata de lanzarlos una a
una hacia una clavija; si se logra insertar un anillo el premio es de 1 bs. Si se
insertar dos anillos el anillo el premio es de 2 bs si se insertan los tres entonces el
premio es de 10 bs. Suponiendo que la probabilidad de insertar en la clavija sea
del 0,10 en cada lanzamiento ¿Cuál es la ganancia promedio esperada si se juega
una vez; diez veces?

Pagar por jugar 50 centavos

3 anillos

𝑠𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑎 𝑒𝑛 ∶ 1 → 1 𝑏𝑠
𝑠𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑎 𝑒𝑛 ∶ 2 → 2 𝑏𝑠
𝑠𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑎 𝑒𝑛 ∶ 3 → 10 𝑏𝑠

a) Ganancia esperada al jugar 1 vez


b) 10 veces

x 0 1 2 3
p(x) 0,729 0,243 0,027 0,001
P(x) 0,729 0,972 0,999 1
y -0,5 0,5 1,5 9,5

𝐸(𝑦) = ∑ 𝑦𝑝(𝑦) = −0.5 ∗ 0.729 + 0.5 ∗ 0.243 + 1.5 ∗ 0.027 + 9.5 ∗ 0.001
𝑖=0

𝐸(𝑦) = −0.193 𝜇𝑦 = −0.5

Ejemplo:

Cierta elación se forma al combinar la mezcla fundida de dos metales la aleación


que resulta contiene cierto porcentaje de plomo x que se pude considerar como
una variable aleatoria. Supongamos que x es una función de densidad.

𝑝(𝑥) = 𝑎𝑥(100 − 𝑥) 𝑠𝑖: 0 ≤ 𝑥 ≤ 100


Suponga que p es la utilidad neta obtenida al vender esta aleación por libra , la
siguiente aleación del porcentaje del contenido de plano que relaciona a x y la
utilidad es:

𝑝 = 𝐶1 + 𝐶2 𝑥 (𝑢𝑡𝑖𝑙𝑖𝑑𝑎𝑑)

Calcular la utilidad por libra.

Solución:

∫ 𝑝(𝑥) 𝑑𝑥 = 1
ℝ𝑥

100
∫ 𝑎𝑥(100 − 𝑥) 𝑑𝑥
0
=1
100 100
∫ 𝑎100𝑥 𝑑𝑥 − ∫ 𝑎𝑥 2 𝑑𝑥 = 1
0 0

100 100
𝑎100𝑥 2 𝑥3
( ) − (𝑎 ) =1
2 0
3 0

𝑎1003
2
𝑎50 ∗ 100 − =1
3
500000 3
𝑎 = 1 → 𝑎 = 10−5
3 5
E(p) = E(𝐶1 + 𝐶2 𝑥) = E(𝐶1 ) + 𝐶2 E(𝑥)

100 100
3 3 𝑥3 𝑥4
𝐸(𝑥) = ∫ 𝑥 ∗ 10−5 𝑥(100 − 𝑥) 𝑑𝑥 = 10−5 (100 − )
0 5 5 3 4 0

3 −5 1004 1004
𝐸(𝑥) = 10 −
5 3 4
3 −1 1 1 1
𝐸(𝑥) = 10 ( − ) =
5 3 4 200
1 1 𝑆𝑢𝑠
𝜇𝑥 = → 𝜇𝑥 = [𝐶1 + 𝐶2 ]
200 200 𝐿𝑏
Capítulo 5

MODELOS MÁS UTILIZADOS DE VARIABLE


ALEATORIA DISCRETA
Experimento de Bernoulli

Está asociado a todas las aplicaciones en las cuales la única opción son fracasos
o éxitos

Defectuoso

Producción

No defectuoso

Malo

Control de calidad

Bueno

Para ello se designa como:

𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜

𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜

𝑝+𝑞 =1

𝑞 =1−𝑝

La variable aleatoria x representa al éxito o al fracaso del evento

𝑥 = 1 → 𝑓𝑟𝑎𝑐𝑎𝑠𝑜

𝑥 = 0 → 𝑒𝑥𝑖𝑡𝑜
La función de cuantía es:

𝑝(𝑥) = 𝑝 𝑥 𝑞1−𝑥 ∀𝑥 = 0,1

X 0 1
𝑥=0 𝑝(𝑥=0)=𝑞
Si: 𝑥=1 𝑝(𝑥=1)=𝑝 p (x) q p
P(x) q 1

El valor promedio esperado

𝜇 = 𝐸(𝑥) = ∑ 𝑥𝑃(𝑥) = 0 ∗ 𝑞 + 1 ∗ 𝑝 = 𝑝 𝜇≅𝑝

La varianza

𝑉𝑎𝑟(𝑥) = 𝐸(𝑥 2 ) − 𝜇 2

𝐸(𝑥 2 ) = ∑ 𝑥 2 𝑃(𝑥) = 02 ∗ 𝑞 + 12 ∗ 𝑝 = 𝑝

Entonces:

𝑉𝑎𝑟(𝑥) = 𝑝 − 𝑝2 = 𝑝(1 − 𝑝) = 𝑝𝑞

𝜎 2 = 𝑉𝑎𝑟(𝑥) = 𝑝𝑞

Distribución binomial

Sucede cuando el experimento de Bernoulli se repite “n” veces y en esas “n” veces
variable aleatoria x representa la cantidad de éxitos en las “n” oportunidades.
Función de cuantía:
𝑛 𝑥 𝑛−𝑥
𝑝(𝑥) = 𝑝 𝑞 ∀𝑥 = 0,1,2,3,4, … . , 𝑛
𝑥
El valor promedio esperado:

𝜇 = 𝑛𝑝

La varianza:

𝜎 2 = 𝑛𝑝𝑞

Función de distribución:
⟦𝑥⟧
𝑛
𝑝(𝑥) = ∑ ( ) 𝑝𝑘 𝑞 𝑛−𝑘
𝑘
𝑘=0

Distribución geométrica

La cantidad de veces que se repite el experimento de Bernoulli no es fijo(no es “n”


veces) , entonces x representa la cantidad de veces que se repite el experimento
hasta obtener el primer éxito .

La función de cuantía viene dada por:

𝑝 (𝑥) = 𝑝 ∗ 𝑞 𝑥−1

La de distribución:

⟦𝑥⟧

𝑝 (𝑥) = ∑ 𝑝 ∗ 𝑞 𝑘−1
𝑘=1

El valor promedio esperado es:

1
𝜇=
𝑝

La varianza:

𝑞
𝜎2 =
𝑝2
Distribución multinomial

Cuando “N” elementos existen en 𝑥1 , 𝑥2 , 𝑥3 , … … . , 𝑥𝑘 variables aleatorias de


Bernoulli son probabilidades de éxito 𝑝1 , 𝑝2 , 𝑝3 , … … . , 𝑝𝑘 , respectivamente, entonces
se tiene el siguiente modelo

𝑛!
𝑝(𝑥 = 𝑥1 , 𝑥2 , 𝑥3 , … . . . , 𝑥𝑘 ) = ∗ 𝑝1 𝑥1 ∗ 𝑝2 𝑥2 ∗ 𝑝3 𝑥3 ∗ … … .∗ 𝑝𝑘 𝑥𝑘
𝑥1 !, 𝑥2 !, 𝑥3 !, … … . , 𝑥𝑘 !

El valor promedio esperado:

𝜇 = 𝑛𝑝𝑖 ∀𝑖 = 1,2,3, … . , 𝑘

La varianza:

𝜎 2 = 𝑛𝑝𝑖 (1 − 𝑝𝑖 ) ∀𝑖 = 1,2,3, … . , 𝑘

En el evento multinomial se cumple: 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑘 = 𝑛

DISTRIBUCIÓN HIPERGEOMETRICA

Se da en eventos en los cuales se tienen “N” elementos divididos en dos partes


con cantidades “M” y “N-M” respectivamente, si se extrae una muestra de tamaño
“n” la variable aleatoria x representa la cantidad de elementos del primer tipo:

N= n=

N-M
La función cuantía:

𝑀 𝑁−𝑀
( )( )
𝑝(𝑥) = 𝑥 𝑛 − 𝑥
𝑁
( )
𝑛

∀𝑥 = 0, 1, 2, , , , ,,

La función de distribución:

⟦𝑥⟧𝑀 𝑁−𝑀
( )( )
𝑝(𝑥) = ∑ 𝑥 𝑛 − 𝑥
𝑁
𝑘=0 ( )
𝑛

Valor promedio esperado:

𝑀
𝑢=𝑛
𝑁

La varianza:

𝑀 𝑀 𝑁−𝑛
𝑟2 = 𝑛 (1 − ) ( )
𝑁 𝑁 𝑁−1

 Aproximación a la binomial:

Si ¨n¨ es muchísimo menor a ¨N¨ por lo menos en relación:

𝑛
< 𝑂, 1
𝑁

Se puede aproximar a una binomial


𝑀
𝑝=
𝑁

𝑀
𝑞 = 1−
𝑁

𝑛 𝑀 𝑋 𝑀
𝑝(𝑥) ≅ ( ) ( ) (1 − )𝑛−𝑥
𝑥 𝑁 𝑁

EJEMPLO:

Un cuerpo se encuentra en reposo en el origen. Se lanza un dado y por cada


numero primo que aparece el cuerpo se desplaza una unidad de longitud a la
derecha, en caso contrario se desplaza una unidad a la izquierda. Calcular la
probabilidad de que después de 10 lanzamientos el cuerpo se encuentre:

a) A 8 unidades de longitud a la derecha del origen


b) A 3 unidades de longitud a la derecha del origen
c) A 2 unidades de longitud a la izquierda del origen
d) A mas de una unidad a la derecha del origen

Solución:

-2 -1 0 1 2

Dado:{1,2,3,4,5,6}

Números primos:{1,2,3,5}

Números no primos:{4,6}

p: Probabilidad de que salga numero primo

q: Probabilidad de que no salga numero primo


p=2/3

q=1/3

x: numero de veces de que sale numero primo en n=10


lanzamientos

y: posición del cuerpo a la derecha o izquierda del origen

Rx= {0,1,2,3,4,5,6,7,8,9,10}

Ry= {-10,-8,-6,-4,-2,0,2,4,6,8,10}

y= 2x-10

entonces:

10
a) p(y=8)= p(x=9) = ( )(2/3)9 (1/3)10−9= 0.0867
9

b) p(y=3) =0

10
c) p(y=-2)=p(x=4) = ( )(2/3)4 (1/3)6=0.0569
4

10
d) p(y>1)= p(x=6) + p(x=7) + p(x=8) + p(x=9) + p(x=10) =∑10
𝑥=6( ) (2/
𝑥
3)𝑥 (1/3)10−𝑥

EJEMPLO:

Un examen consta de 10 preg. Con 5 respuestas c/u de las cuales solo una es
correcta. Un estudiante que desconoce del curso contesta la prueba al azar, para
aprobar el examen debe contestar correctamente al menos 6 preg.

a) Cuál es la probabilidad de que el estudiante apruebe el examen


b) Si al examen se presentan 200 estudiantes que desconocen el curso.
Cuantos alumnos se esperan que aprueben el examen.
Solución:
Selección multiple: 5 opciones c/pregunta

1 es correcta p=1/5

4 son incorectas q=4/5

X: cantidad de preguntas respondidas correctamente

10
𝑝(𝑥) = ( )(1/5)𝑥 (4/5)10−𝑥
𝑥

a) p(x≥6)= 𝑝(𝑥 = 6) + 𝑝(𝑥 = 7) + 𝑝(𝑥 = 8) + 𝑝(𝑥 = 9) + 𝑝(𝑥 = 10)

10
p(x ≥ 6) = ∑10
𝑥=6( ) (1/5)𝑥 (4/5)10−𝑥 = 6.27x10-3
𝑥

b) 200 estudiantes
u≈p → u≈n*p(x≥6)
u≈ 200*(6.27x10-3)
u≈1.27
u=1 alumno

EJEMPLO:

Dos jugadores A y B juegan a lanzar una dado, gana el primero que obtenga un
numero primo si el juego es empezado por A. calcule la probabilidad de ganar de
cada jugador.

Solución.-

Dado:{1,2,3,4,5,6}

Números primos:{1,2,3,5}

Números no primos:{4,6}

p:Probabilidad de que salga numero primo p=2/3

q:Probabilidad de que no salga numero primo q=1/3


𝑝 (𝑥) = 𝑝 ∗ 𝑞 𝑥−1

𝑝 (𝑥) = (2/3) ∗ (1/3)𝑥−1

Gana A

X: cantidad de lanzamientos

X=1,3,5,7,9,….

Pgane A= (2/3)+ (2/3) ∗ (1/3)2+ (2/3) ∗ (1/3)4+ (2/3) ∗ (1/3)6+…

= (2/3)*(1+ (1/3)2+ (1/3)4+ (1/3)6+ (1/3)8+…)

Progresión infinita
r= (1/3)2

𝑎1 1
s= = 1 = 9/8
1−𝑟 1−( )2
3

Pgane A= (2/3)*(9/8) = 3/4

Pgane B= Ac= 1/4

EJEMPLO:

Cierta enfermedad de la tiroides se tratan con una terapéutica de yoga se halla


que el 50% de los pacientes tiene una mejora rápida, el 40% no sufre ningún
efecto, y el 10% empeora. Se trata a 9 pacientes con esta terapéutica. Cuál es la
probabilidad de:

a) Los 9 mejoran rapidamente


b) 5 mejoren: 3 permanezcan en el mismo estado y 1 empeore.
c) 3 mejoren; 3 en el mismo estado y 3 empeoren.
Solución.-

Mejoren P1 = 0,5

Permanezcan P2 = 0,9

Empeoren P3 = 0,1

a) Los 9 mejoran;
9! 1
𝑝(𝑥1 = 9; 𝑥2 = 0; 𝑥3 = 0) = (0,5)9 = = 0,00195
9! ∗ 0! 0! 512

b) 5 mejoren: 3 permanezcan en el mismo estado y 1 empeore.

9!
𝑝(𝑥1 = 5; 𝑥2 = 3; 𝑥3 = 1) = (0,5)5 (0,4)3 (0,1)1 = 0,1008
5! ∗ 3! 1!

c) 3 mejoren; 3 estén iguales y 3 empeoren.

9!
𝑝(𝑥1 = 3; 𝑥2 = 3; 𝑥3 = 3) = (0,5)3 (0,4)3 (0,1)3 = 0,01344
3! 3! 3!

EJEMPLO:

Una compañía recibe productos en cajas de 100 unidades. El control de calidad de


los productos se efectúa de la forma siguiente: se toma una muestra de tres
productos de una caja sin reposición. Si se encuentra a lo más un producto
defectuoso se acepta la carga; si se encuentra dos o tres defectuosos se elige una
muestra de tres productos adicionales. Si en total de los seis productos elegidos
hay cuatro o más defectuosos se rechaza la caja, caso contrario se acepta.

Calcular la probabilidad de:

a) Aceptar una caja con cinco productos defectuosos


b) Rechazar una caja con cuatro defectuosos

Solución:

a defectuosos

Total caja = 100 unidades

100-a no defectuosos
Primera parte.-

n=3 → 1 como maximo x=0.1


Aceptamos
x= cantidad de productos defectuosos

Segunda parte.-

Si x= 2 ó 3 → nt = 6

x= 4,5,6 se rechaza

x= 0,1,2,3 se acepta

a) N= 100
n= 3
M= 5

𝑀 𝑁−𝑀 5 95
( )( ) ( )( )
𝑝(𝑥) = 𝑥 𝑛 − 𝑥 = 𝑥 3 − 𝑥
𝑁 100
( ) ( )
𝑛 3

5 95
( )( )
0 3−0
𝑝(𝑥 = 0) = 100 = 0,856
( )
3
Se Acepta
5 95
( )( ) 1ra Parte
𝑝(𝑥 = 1) = 1 3 − 1 = 0,138
100
( )
3
5 95
( )( )
𝑝(𝑥 = 2) = 2 3 − 2 = 5,87𝑥10−3
100
( )
3
Se rechaza

1ra Parte

5 95
( )( )
𝑝(𝑥 = 3) = 3 3 − 3 = 6,18𝑥10−5
100
( )
3

Segunda parte.-

N= 97

n= 3

M= 3

3 94 3 94
( )( ) ( )( )
𝑝2 (𝑥2 ) = 𝑥1 3 − 𝑥1 = 1 2 = 0,089
97 97
( ) ( )
3 3

𝑝(𝑎𝑐𝑒𝑝𝑡𝑎𝑟) = 0,856 + 0,138 + 5,87𝑥10−3 ∗ (0,089)

𝑝(𝑎𝑐𝑒𝑝𝑡𝑎𝑟) = 0,994

b) 𝑝(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟) = 1 − 𝑝(𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝑀 = 4)
4 96
( )( )
𝑝(𝑥 = 0) = 0 3 = 0,884
100
( )
3
4 96
( )( )
𝑝(𝑥 = 1) = 1 2 = 0,113
100
( )
3

4 96
( )( )
𝑝(𝑥 = 2) = 2 1 = 3,56𝑥10−3
100
( )
3

2 95
( )( )
𝑝1 (𝑥1 = 1) = 1 2 = 0,06
97
( )
3

𝑝(𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝑀 = 4) = 0,884 + 0,113 + 3,56𝑥10−3 ∗ (0.06)


= 0,997

𝑝(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟) = 1 − 0,997

𝑝(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟) = 2,79𝑥10−3

 DISTRIBUCION DE POISSON.-
Si un evento o suceso de un espacio muestreal tiene un promedio de
eventos por unidad de medida lo que se conoce como “‫”ג‬

𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠
‫=ג‬
𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎

Por ejemplo:

 En un parqueo entran 10 vehiculos/hora en promedio


 En el cajero de un banco se atiende a 15 personas/hora en
promedio

La variable aleatoria “x” representa la cantidad de eventos en “t” unidades


de medida. Se distribuye según una Poisson cuando la función de cuantia
es:

𝑒 −‫𝑥)𝑡ג(∗ 𝑡ג‬
𝑝(𝑥) = 𝑥 = 0,1,2,3, …
𝑥!

Usualmente:

𝛽 = ‫ 𝑒𝑑 𝑠𝑜𝑡𝑛𝑒𝑣𝑒 = 𝑡 ∗ ג‬t 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎

𝑒 −𝛽 ∗ 𝛽 𝑥
𝑝(𝑥) = 𝑠𝑖 𝑥 = 0,1,2,3, …
𝑥!

 La función de distribución:
⟦𝑥⟧
𝑒 −𝛽 ∗ 𝛽 𝑥
𝑃(𝑥) = ∑
𝑘!
𝑘=0

 El valor promedio esperado:

𝑢 =𝛽 =‫𝑡∗ג‬

 La varianza

𝜎2 = 𝛽 = ‫𝑡 ∗ ג‬
 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCION DE POISSON.-

Si existen x1, x2, x3,…, xn variables aleatorias de Poisson con


promedio ‫ג‬ de evento por unidad de medida respectivamente
entonces: 2‫ג‬n,...1‫ג‬,

𝑦 = ∑ 𝑥𝑖
𝑖=1

Es también una variable de Poisson con promedio de eventos por unidad de


medida

‫𝑡 𝑖ג ∑ = 𝑦ג‬
𝑖=1

EJEMPLO:

Suponga que 1800 células de cierto tipo se disminuyen aleatoriamente en un


microscopio, el cual mediante rejillas se ha dividido en 900 áreas iguales

a) ¿Cuál es el número de áreas que no contiene células?


b) ¿Cuál es el número de áreas que contiene exactamente 1 célula?
Solución

X: cantidad de células en “t” areas

# 𝑐𝑒𝑙𝑢𝑙𝑎𝑠 1800 𝑐𝑒𝑙𝑢𝑙𝑎𝑠 𝑐𝑒𝑙𝑢𝑙𝑎𝑠


𝛾= = =2
# 𝑟𝑒𝑛𝑗𝑖𝑙𝑙𝑎𝑠 900 𝑎𝑟𝑒𝑎𝑠 𝑎𝑟𝑒𝑎𝑠

La distribución de Poisson si asumimos un área

𝑒 −‫𝑥)𝑡ג( ∗ 𝑡ג‬ 𝑒 −‫𝑥)ג( ∗ ג‬


𝑝(𝑥) = =
𝑥! 𝑥!
a) Si x=0
𝑝(𝑥 = 0) = 𝑒 −2
#𝑎𝑟𝑒𝑎𝑠 𝑠𝑖𝑛 𝑢𝑛𝑎 𝑐𝑒𝑙𝑢𝑙𝑎 = 900 ∗ 𝑒 −2

#𝑎𝑟𝑒𝑎𝑠 𝑠𝑖𝑛 𝑢𝑛𝑎 𝑐𝑒𝑙𝑢𝑙𝑎 = 121,8 ≅ 121

b) Si x=1
𝑒 −2 ∗ 2
𝑝(𝑥 = 1) = = 2 ∗ e−2
1!
# 𝑎𝑟𝑒𝑎𝑠 𝑐𝑜𝑛 𝑢𝑛𝑎 𝑐𝑒𝑙𝑢𝑙𝑎 = 900 ∗ 2 ∗ 𝑒 −2
#𝑎𝑟𝑒𝑎𝑠 𝑐𝑜𝑛 𝑢𝑛𝑎 𝑐𝑒𝑙𝑢𝑙𝑎 = 243,60 ≅ 243

EJEMPLO:

Con base en experiencia pasada 2% de las facturas de una empresa, están


incorrectas.

Se selecciona al azar na muestra de 20 facturas.

a) Cuál es la verdadera distribución de probabilidad del número de


facturas incorrectas, cuáles son sus parámetros
b) Cuál es el numero esperado de facturas incorrectas en la muestra
c) Cuál es la probabilidad que cuando menos una factura esta
incorrecta.
Compare con la aproximación de Poisson.

Solución.-

p= 2%= 0.02 “probabilidad de factura incorrecta”

q= 0.98
n= 20 facturas

20 (0.02)𝑥
a) 𝑝(𝑥) = ( )∗ ∗ (0.98)20−𝑥
𝑥

b) E(x)
𝜇 = 𝑛𝑝 = 20 ∗ (0.02)
𝜇 = 0.4 → 𝜇 = 0

c) 𝑝(𝑥 ≥ 1) = 1 − 𝑝(𝑥 < 1)


𝑝(𝑥 ≥ 1) = 1 − 𝑝(𝑥 = 0)

20
𝑝(𝑥 ≥ 1) = 1 − ( ) ∗ (0.02)0 ∗ (0.98)20−0
0

𝑝(𝑥 ≥ 1) = 0.332

Con la aproximación:

‫ =𝑝𝑛 = ג‬20*0.02

‫ = ג‬0.4

Con la Distribución de Poisson:

𝑒 −‫𝑥)ג( ∗ ג‬ 𝑒 −0.4 ∗ (0.4)𝑥


𝑝(𝑥) = =
𝑥! 𝑥!

𝑝(𝑥 = 0) = 𝑒 −0.4
𝑝(𝑥 ≥ 1) = 1 − 𝑒 −0.4

𝑝(𝑥 ≥ 1) = 0.33
Capítulo 6

DISTRIBUCIONES CONTINUAS MÁS IMPORTANTES


En variable aleatoria continua existen varias distribuciones de probabilidad
utilizadas.

Distribución uniforme Tiene como función de densidad:

1
; 𝑠𝑖 𝑎 ≤ 𝑥 ≪ 𝑏
p(x) 𝑏−𝑎

0 ; en otro caso

p(x)

𝟏
𝒃−𝒂

0
a b x

La función de distribución:

0 ; si x≤ a

𝒙−𝒂
P(x)= ; 𝒔𝒊 𝒂 ≤ 𝒙 ≤ 𝒃
𝒃−𝒂

𝟏; 𝒔𝒊 𝒙 > 𝒃
El valor promedio esperado:

𝜇 = 𝐸(𝑥) = ∫ 𝒙 ∗ 𝒑(𝒙)𝒅𝒙
𝑹𝒙

𝒂 𝒃 +∞
1
𝜇 = ∫ 𝒙(𝟎)𝒅𝒙 + ∫ 𝒙 ∗ 𝒅𝒙 + ∫ 𝒙(𝟎)𝒅𝒙
−∞ 𝒂 𝑏−𝑎 𝒃

1 𝒙𝟐
𝜇= ∗
𝑏−𝑎 𝟐

1 𝒃𝟐 − 𝒂𝟐
𝜇= ∗
𝑏−𝑎 𝟐

𝒃+𝒂
𝝁=
𝟐

La varianza:

Var(x) = E(x 2 ) − 𝜇 2
𝒂 𝒃 +∞
𝟐 (𝟎)𝒅𝒙 𝟐
1
Var(x) = ∫ 𝒙 +∫ 𝒙 ∗ 𝒅𝒙 + ∫ 𝒙𝟐 (𝟎)𝒅𝒙 − 𝜇 2
−∞ 𝒂 𝑏 − 𝑎 𝒃

1 𝒙𝟑 𝒂+𝒃 𝟐
Var(x) = ∗ −( )
𝑏−𝑎 𝟑 𝟐

1 𝒃𝟑 − 𝒂𝟑 𝒂+𝒃 𝟐
Var(x) = ∗ −( )
𝑏−𝑎 𝟑 𝟐
(𝑏 − 𝑎) ∗ (𝑏 2 + 𝑎𝑏 + 𝑎2 ) 𝑎2 + 2𝑎𝑏 + 𝑏 2
Var(x) = −( )
(𝑏 − 𝑎) ∗ 3 𝟐

𝑎2 − 2𝑎𝑏 + 𝑏 2
Var(x) =
𝟏𝟐

(𝒂−𝒃)𝟐
𝐕𝐚𝐫(𝐱) =
𝟏𝟐
Ejemplo El tiempo medio en minutos que cierta persona invierte en ir de su casa a
su trabajo es un fenómeno aleatorio en el intervalo de 20-25 min. ¿Cuál es la
probabilidad que llegue a su trabajo a las 7:28 a.m. si sale de su casa a las 7:05
a.m.?

1
; 𝑠𝑖 20 ≤ 𝑥 ≪ 25
p(x) 25−20

0 ; en otro caso

1
; 𝑠𝑖 20 ≤ 𝑥 ≪ 25
p(x) 5

0 ; en otro caso

p(x)

1/5

0
20 25 x

Llegue al trabajo:

Sale 7:05 a.m.


23 minutos
Llega 7:28 a.m.
0 ; si x≤ 20

𝒙−𝟐𝟎
P(x)= ; 𝒔𝒊 𝟐𝟎 ≤ 𝒙 ≤ 𝟐𝟓
𝟓

𝟏 ; 𝒔𝒊 𝒙 > 𝟐𝟓

𝟐𝟑−𝟐𝟎 𝟑
P(x=23) = =
𝟓 𝟓

Distribución Exponencial

La variable aleatoria continua “x”, se distribuye exponencialmente con parámetro


“𝜆" (promedio de eventos por unidad de medida), cuando la función de densidad es:

𝜆𝑒 −𝜆𝑥 ; 𝑠𝑖 𝑥 ≥ 0
p(x)
0 ; en otros casos

Siendo 𝜆>0

p(x)

0
x
La función de distribución

𝑥 𝜆𝑒 −𝜆𝑥
𝑃(𝑥) = ∫0 𝜆𝑒 −𝜆𝑥 𝑑𝑥 = −𝜆

𝑃(𝑥) = 1 − 𝑒 −𝜆𝑥
La esperanza matemática es:
∞ ∞ −𝜆𝑥
𝑒 −𝜆𝑥 𝑒
µ = 𝐸(𝑥) = ∫ 𝑥𝜆𝑒 −𝜆𝑥 𝑑𝑥 = 𝜆{ ∗𝑥−∫ 𝑑𝑥}
0 −𝜆 0 −𝜆

𝑥 1 𝑒 −𝜆𝑥
µ = 𝜆 ∗ {− + ∗ }
𝑥𝜆𝑒 𝜆𝑥 𝜆 −𝜆
1
µ = 𝜆 ∗ {0 − 𝜆2 ∗ (−1)}

1
µ=
𝜆

La varianza:

1
𝜎2 =
𝜆2

Aplicación de la teoría de la confiabilidad

La teoría de la confiabilidad es aquella que determina los modelos para la


confiabilidad de la duración de un elemento de un determinado tiempo “T”.

𝑷(𝑻 ≤ 𝒕) = 𝑭(𝒕)

Donde F(t) es el complemento del modelo exponencial:

𝑷(𝑻 ≤ 𝒕) = 𝟏 − 𝒆−𝝀𝒕

Si necesitamos la probabilidad de que el elemento tenga una duración:

𝑷(𝑻 ≥ 𝒕) = 𝟏 − 𝑷(𝑻 ≤ 𝒕)

𝑷(𝑻 ≥ 𝒕) = 𝒆−𝝀𝒕
Ejemplo La vida en años de cierto aparato eléctrico es una variable aleatoria
distribuida exponencialmente con parámetro 0,08.el aparato lleva una garantía de
fábrica por dos años si se adquiere uno de estos aparatos, seleccionado al azar
por el vendedor ¿cuál es la probabilidad que la garantía expire antes que su
aparato se vuelva inútil?

0.08𝑒 −0.08𝑥 ; 𝑠𝑖 𝑥 ≥ 0
p(x)
0 ; x≤0

x= tiempo de vida garantía de dos años

Si x≤2 garantía

x>2 garantía ha expirado

p(x>2)= 1-𝒆−𝝀𝒙 p(x>2)= 1-𝒆−𝟎.𝟎𝟖∗𝟐

p(x>2)= 0.148

Distribución Normal

Una variable aleatoria continua “X”, se distribuye normalmente con media “µ” y
varianza”σ2”, si su función de densidad es:

1 1 𝑥−𝜇
− ( )² Si −∞ < 𝑥 < ∞
𝑝(𝑥 ) = 𝑒 2 𝜎
𝜎√2𝜋

La función de distribución:
𝐱𝐨 𝟏 𝐱−𝛍 𝟐
𝟏 −𝟐( 𝛔 )
𝑷(𝐱 ≥ 𝐱𝐨) = ∫ 𝐞 𝐝𝐱
−∞ 𝛔√𝟐𝛑
La grafica de la función de densidad:

Como −∞ < 𝑥 < ∞, se construye una curva desplazando a la media “µ”

x−µ Variable Aleatoria


z=
σ Normal
𝐱−𝛍 𝟏 𝛍
𝛍𝐳 = 𝛍 ( )= 𝛍−
𝛔 𝛔 𝛔
𝛍𝐳 = 𝟎
𝟏 𝛍
𝐕𝐚𝐫(𝐳) = 𝐕𝐚𝐫(𝛔 𝒙 − 𝛔)

𝛔𝐳 𝟐 = 𝟏

En consecuencia:

𝟏 𝟐
𝟏
𝐩 (𝐳 ) = ∗ 𝐞−𝟐∗𝐳 𝐬𝐢 − ∞ < 𝐳 <
√𝟐𝛑

La función de distribución es:

Que se resuelve por:

-Integración compleja

-Métodos numéricos
𝒁
𝟏 𝟏 𝟐
𝒑(𝒛 ≤< 𝒛𝟎 ) = 𝑷(𝒁𝟎 ) = ∫ 𝒆−𝟐𝒁 𝒅𝒛
−∞ √𝟐𝝅

Los resultados de la anterior integral se han tabulado para distintos “z” de -4 a 4

Si Zo<-4 P(Zo)=0

Si Zo>4 P(Zo)=1

Tabla de Distribución Normal

2do
decimal

1er
decimal

𝑥−𝜇 𝑥−𝜇
1. Como 𝑧 = para xo: 𝑧0 =
𝜎 𝜎
2. Buscar Z0 en la 1ra columna y el 2do decimal en las otras columnas
Z0=0.87
P(Z0≤0.87)=0.8078=80.78%
La tabla es biunívoca:
1. Dado Z0 hallar la probabilidad de P(Z≤ Z0)
2. Dada la probabilidad permite hallar Z0

Ejemplo Si P(Z≤ Z0) = 0.3328

Z0 = -0.46
Si P(Z≤ Z0) =0.732 no está en tablas con exactitud, se busca los valores que
contienen a 0.7320

Se utiliza una interpolación lineal de Laplace:

z P(z)
z1 P(z1) 𝑝(𝑧0 ) − 𝑝(𝑧1 )
z0=? P(z0)=0.732 𝑧0 = 𝑧1 + ( ) ∗ (𝑧2 − 𝑧1 )
𝑝(𝑧2 ) − 𝑝(𝑧1 )
P(z2) P(z2)

Propiedad reproductiva de la distribución normal

Si se tienen x1, x2, x3,……., xk. Variables aleatorias continuas distribuidas


normalmente con parámetros

(𝜇1 , 𝜎1 ); (𝜇2 , 𝜎2 ); (𝜇3 , 𝜎3 ); … … … … … . . (𝜇𝑘 , 𝜎𝑘 )

Entonces sí:

𝑦 = ∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + ⋯ ⋯ + 𝑥𝑘
𝑖=1

También y se distribuye normalmente con parámetros:

𝜇𝑦 = ∑ 𝜇𝑖 = 𝜇1 + 𝜇2 + 𝜇3 + ⋯ ⋯ + 𝜇𝑘
𝑖=1

𝜎 2 𝑦 = ∑ 𝜎 2 𝑖 = 𝜎 21 + 𝜎 2 2 + 𝜎 2 3 + ⋯ ⋯ + 𝜎 2 𝑘
𝑖=1

Si 𝑦 = ∑𝑘𝑖=1 𝑎𝑖 𝑥𝑖 Donde: 𝑎𝑖 = 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒𝑠

𝜇𝑦 = ∑ 𝑎𝑖 𝜇𝑖
𝑖=1

𝑘
Teorema central del límite

Si existen 𝑥1 , 𝑥2 , 𝑥3 , … … … , 𝑥𝑛 variables aleatorias normales con parámetros

𝜇1 , 𝜇2 , 𝜇3 , … … … , 𝜇𝑛 y 𝜎 21 , 𝜎 2 2 , 𝜎 2 3 , … … … , 𝜎 2 𝑛

Entonces: 𝑦 = ∑𝑛=∞
𝑖=1 𝑥𝑖

También se distribuye normalmente:

∑∞ ∞
i=1 xn − ∑i=1 µn
𝑃(𝑧 ≤ 𝑧0 ) = lim ( ) = ϕ(z = 𝑧0 )
𝑛→∞ ∑∞ 2
i=1 𝜎𝑛

Ejemplo Si “x” es una variable aleatoria distribuida normalmente con µ=6,

σ2=25, hallar:

a) P (6 ≤ 12)

b) P (|𝑥 − 6| < 5)

c) P (𝑥 > 21)

x−µ x−6
z= =
σ 5
a) 𝑃(6 ≤ x ≤ 12) =P(x ≤ 12) – P(x ≤ 6)
12 − 6 6−6
𝑃(6 ≤ x ≤ 12) = 𝜙 (z = ) − 𝜙 (z = )
5 5

𝑃(6 ≤ x ≤ 12) = 𝜙(z = 1.2) − 𝜙(z = 0)

𝑃(6 ≤ x ≤ 12) = 0.8849 − 0.50


𝑃(6 ≤ x ≤ 12) = 0.3849

b) P (|𝑥 − 6| <5) ⇒ −5 ≤ x − 6 ≤ 5

1 ≤ x ≤ 11

𝑃(1 ≤ x ≤ 11) =P(x ≤ 11) – P(x ≤ 1)

𝑃(6 ≤ x ≤ 12) = 𝜙(z = 1) − 𝜙(z = −1)

𝑃(6 ≤ x ≤ 12) = 0.8413 − 0.1587

𝑃(6 ≤ x ≤ 12) = 0.6826

b) 𝑃(x ≥ 21) = 1 – P(x ≤ 21)


𝑃(x ≥ 21) = 1 – 𝜙 (z = 3)
𝑃(x ≥ 21) = 1 – 0.9987
𝑃(x ≥ 21) = 0.0013

Ejemplo Un camión de reparto transporta cajones argados de artículos varios. Si


el peso de cada cajón es distribuido normalmente con una media de 5 libras y una
desviación estándar de 5 libras. ¿Cuántos cajones pueden ser transportados en el
camión de tal forma que la probabilidad de que la carga toral exceda a una
tonelada sea solo del 0,10?

SOLUCION:

Cajones

n = cantidad de cajones

𝜇 = 50 𝑙𝑏 ; 𝜎 = 5 𝑙𝑏

𝑊𝑡 = 𝑝𝑒𝑠𝑜 𝑡𝑜𝑡𝑎𝑙 = 𝐶1 + 𝐶2 + ⋯ + 𝐶𝑛; 𝑑𝑜𝑛𝑑𝑒 𝐶𝑖 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑛 𝑙𝑜𝑠 𝑐𝑎𝑗𝑜𝑛𝑒𝑠

Aplicamos la propiedad reproductiva.


𝑛

µWt = ∑ µi = 50 𝑛
𝑖=1
𝑛
2
σ Wt = ∑ σ2 i = 52 𝑛 = 25 𝑛
𝑖=1

P(Wt > 1000kg) = 0,10

P(Wt > 1000kg) = 1 − P(Wt < 1000kg) = 0,10

P(Wt > 1000kg) = 1 − 0,10 = 0,90

𝑊𝑡 − µWt
ϕ (Zo = ) = 0,90
𝜎𝑊𝑡

Interpolando:

0,90 − 0,8997
z0 = 1,28 + ( ) ∗ (1,29 − 1,28) = 1,2817
0,9015 − 0,8997
𝑊𝑡 − µWt
Zo =
𝜎𝑊𝑡

1000𝑔 1𝑙𝑏
𝑊𝑡 = 1000𝐾𝑔 ∗ ∗ = 2199,73603 𝑙𝑏
1 𝐾𝑔 454,6𝑔

2199,73603 − 50 n
1,2817 =
25 𝑛
n= 26,8121 cajones  n = 26 cajas

Ejemplo En una industria se comercializa harina en paquetes cuyo peso neto


indica 500g. El proceso de llenado es automatizado de manera que la cantidad
media de harina por paquete puede ajustarse al nivel que se desee. Suponiendo
que la cantidad de harina por paquete se distribuye normalmente con una
desviación estándar de 50g.

a) A qué nivel debe ajustarse el llenado medio de la máquina de modos que


solo el 0,001 de los paqueteas tengan un peso neto de inferior a 450g.
b) Si se ajusta la cantidad media a 480 g, que porcentaje de los paquetes de
harina cumplirán con el peso neto indicado en la etiqueta.
SOLUCION:

𝜇 =? ; 𝜎 = 50 𝑔

a) 𝜇 =? 0,001 peso neto inferior a 450 g


𝑥−𝜇
Z=
𝜎
𝑃(𝑥 < 450𝑔) = 0,001
450 − 𝜇
ϕ (𝑧 = ) = 0,001
𝜎
𝑃(𝑧 = 𝑧𝑜) = 0,001
Buscando en tablas:
𝑧𝑜 = −3,1
450 − 𝜇
Zo = = 𝜇 = (−3,1)(50) − 450(−1)
50
𝜇 = 605 𝑔
b) 𝜇 = 480 𝑔 ; 𝑋 = 500 𝑔
500 − 480
𝑃(𝑧 < 𝑧𝑜) = 𝑃(𝑧 = )
50
𝑃(𝑧 < 𝑧𝑜) = 𝑃(𝑧𝑜 = 0,4) (Tablas)
𝑃(𝑧 < 𝑧𝑜) = 0,6554 ≅ 65,54%
𝑃(𝑧 < 𝑧𝑜) = 65,54%

Ejemplo Ciertas varillas se fabrican con una longitud nominal de 100 mm pero de
echo sus longitudes forman una distribución normal con media de 100,4 mm y una
desviación estándar de 0,80 mm. La fabricación de cada varilla cuesta 12 $us y su
uso es inmediato si su longitud esta entre 99 y 101 mm. Las varillas más cortas no
pueden emplearse, pero tienen un valor de desecho de 2 $us, las que sobrepasen
a 101 mm pueden cortarse a una longitud aceptable con un costo adicional de
4$us. Determine el costo promedio de una varilla útil.

SOLUCION:
𝜇 = 100,4 𝑚𝑚 ; 𝜎 = 0,80 𝑚𝑚

Util  99 <=L<=101 mm  12 $us

Desecho L<99 mm  2 $us

Reutilizar L>101 mm coste 4 $us

P(99 < L < 101) = P(l < 101) − P(L < 99)

101 − 100,4 99 − 100,4


P(99 < L < 101) = ɸ (𝑧1 = ) − ɸ (𝑧2 = )
0,80 0,80

P(99 < L < 101) = ɸ(𝑧1 = 0,75) − ɸ(𝑧2 = −1,75)

P(99 < L < 101) = 0,7734 − 0,0401 = 0,7333

P(99 < L < 101) = 0,7333 Costo 12 $us


P(L > 101) =1 − 𝑃(𝐿 < 101)

P(L > 101) = 1 − 0,7734

P(L > 101) = 0,2266 Costo 16 $us


0,7333(12)+0,2266(16)+0,0401810)
costo promedio = Cpp = = 12,8262 $us
0,7333+0,2266+0,0401

0,7333(12) + 0,2266(16)
utiles = = 12,9443 $us
0,7333 + 0,2266

Ejemplo El 40% de un vendedor resultan ventas, si el desea hacer 60 ventas en


esta semana. cuál es la probabilidad de que haga más de 165 llamadas?

SOLUCION:
40% ventas

60 llamadas en una semana

Xi = número de llamadas efectuadas hasta obtener la i-esima venta

𝑦 = 𝑥1 + 𝑥2 + 𝑥3 +, … … … , +𝑥𝑖

Entonces la variable aleatoria Xi se distribuye normalmente

p = 0,4 (Éxito) 𝜇 = 𝑛𝑝

q=0,6 (fracaso) 𝜎 = √𝑛𝑝𝑞

Si no se repite

𝜇 = 0,4

𝜎 = √0,4 ∗ 0,6 = 0,49

P(y > 165) = 1 − P(y < 165)

∑ 𝑥𝑖 − ∑ 𝜇𝑖 165 − 165(0,4)
𝑦= =
∑ 𝜎𝑖 165(0,49)

165 − 165(0,4)
P(y > 165) = 1 − ɸ (z = )
165(0,49)

P(y > 165) = 1 − ɸ(z = 1,22)

P(y > 165) = 1 − 0,8888


P(y > 165) = 0,1112

Aproximación a la distribución normal

La mayor parte de las distribuciones discretas se pueden aproximar a la


distribución normal en función a los parámetros elegidos de cada distribución,
teniendo en cuenta lo siguiente.

Cunado N= tamaño de la muestra es pequeño

1
Se debe ajustar con el factor de corrección de 2.

1
𝑥0 + 2 − 𝑛𝑝
P(x ≤ x0 ) = 𝜙 (z = )
√𝑛𝑝𝑞

1
𝑥0 + 2 − 𝑛𝑝
𝑃(x ≥ x0 ) = 1 − 𝜙 (z = )
√𝑛𝑝𝑞

1
𝑥0 − 2 − 𝑛𝑝
𝑃(x < x0 ) = 𝜙 (z = )
√𝑛𝑝𝑞

1 1
𝑃(a ≤ x ≤ b) = 𝜙 (a − 2 ≤ x ≤ b + 2)

1 1
𝑏 + 2 − 𝑛𝑝 𝑎 − 2 − 𝑛𝑝
𝑃(a ≤ x ≤ b) = 𝜙 (z = ) − 𝜙 (z = )
√𝑛𝑝𝑞 √𝑛𝑝𝑞

Aproximación de la binomial a la normal

𝜇 = 𝑛𝑝 𝜎 2 = 𝑛𝑝𝑞
𝑥0 − 𝑛𝑝
z=
√𝑛𝑝𝑞

Con la corrección:

1
1 𝑥0 + 2 − 𝑛𝑝
P (X ≤ 𝑋0 + ) = 𝜙 (z = )
2 √𝑛𝑝𝑞

Aproximación de la Poisson a la normal

𝑒 −𝜆𝑡 (𝜆𝑡) 𝑋
𝑝(𝑥) =
𝑋!

𝜇 = 𝜆𝑡 𝜎 2 = 𝜆𝑡

𝑥0 − 𝜆𝑡
z=
√𝜆𝑡

Aproximación de la hipergeometrica a la normal

𝑀 𝑀 𝑀 𝑁−𝑛
𝜇 = 𝑛 (𝑁 ) 𝜎 2 = 𝑛 ( 𝑁 ) (1 − 𝑁 ) ( 𝑁−1)

𝑀
𝑥0 ± 0,5 − 𝑛 ( 𝑁 )
𝑧=
√𝑛 (𝑀) (1 − 𝑀) (𝑁 − 𝑛)
𝑁 𝑁 𝑁−1

Ejemplo El 10% de los tubos catódicos de un dispositivos electrónico se queman


antes de que la garantía haya expirado: un comerciante ha vendido 100 tubos,
Cuál es la probabilidad de que se dé:
a) Obligado a sustituir 20 de ellos por lo menos
b) Sustituya por lo menos 5 y no más de 15 tubos

SOLUCION:

p=10% (Éxito) p=0,10 xi = número de tubos a sustituir

q=0,90

n=100

Con la aproximación

𝜇 = 𝑛𝑝 = 100(0,10) = 10 𝜎 2 = 𝑛𝑝𝑞 = 100(0,1)(0,9) = 9

a) 𝑃(𝑥 ≥ 20) = 1 − 𝑃(𝑥 ≤ 20)

1
20 + 2 − 10
𝑃(𝑥 ≥ 20) = 1 − 𝜙 (z = )
3

𝑃(𝑥 ≥ 20) = 1 − 𝜙(z = 3,5)

𝑃(𝑥 ≥ 20) = 1 − 1  𝑃(𝑥 ≥ 20) = 0

1 1
b) 𝑃(5 ≤ 𝑥 ≤ 15) = 𝑃 (5 − 2 ≤ 𝑥 ≤ 15 + 2)
1 1
15 + 2 − 10 5 − 2 − 10
𝑃(5 ≤ 𝑥 ≤ 15) = 𝜙 (z = ) − 𝜙 (z = )
3 3

𝑃(5 ≤ 𝑥 ≤ 15) = 𝜙(z = 1,83) − 𝜙(z = −1,83)


𝑃(5 ≤ 𝑥 ≤ 15) = 0,9664 − 0,0336
𝑃(5 ≤ 𝑥 ≤ 15) = 0,9328

Ejemplo Se tiene un telar que teje 1000 𝑚2 /𝑑𝑖𝑎, la probabilidad de que no exista
falla en 250 𝑚2 de tela es de 𝑒 −1 . Cuál es la probabilidad aproximada que ocurra
100 o más pero no más de 140 𝑚2 fallas en la producción de un mes de trabajo
de un telar, considere que se trabajan 30 días.
SOLUCION:

Se pide calcular la probabilidad de:


𝑃(100 ≤ 𝑥 ≤ 140)

Xi = número de fallas en un mes de producción

𝑚2
1000 ∗ 30 𝑑𝑖𝑎𝑠 = 𝑒𝑛 30 𝑑𝑖𝑎𝑠 30 000 𝑚2
1 𝑑𝑖𝑎

Variable de Poisson

𝑒 −𝜆𝑛 (𝜆𝑛)𝑋 𝑒 −𝜆(250) (𝜆∗250)0


𝑝(𝑥) =  con x=0; n=250  𝑝(𝑥) =
𝑋! 0!

1 𝑓𝑎𝑙𝑙𝑎
−𝜆(250) = −1 𝜆 = 250 𝑚2

1
𝜇 = 𝜆𝑛 = ∗ (30000) = 120; 𝜎 = 𝜆𝑡 = 10,95
250

Con la aproximación:

𝑃(100 ≤ 𝑥 ≤ 140) = 𝑃(𝑥 ≤ 140) − 𝑃(𝑥 ≤ 100)

1 1
140 + 2 − 120 100 − 2 − 120
𝑃(100 ≤ 𝑥 ≤ 140) = 𝜙 (z = ) − 𝜙 (z = )
10,95 10,95

𝑃(100 ≤ 𝑥 ≤ 140) = 𝜙(z = 1,87) − 𝜙(z = −1,87)


𝑃(100 ≤ 𝑥 ≤ 140) = 0,9386

DISTRIBUCIONES MUESTRALES
En la práctica generalmente se toma una muestra de tamaño n tamaño de la
muestra de la población, este puede ser con o sin reemplazamiento, además la
población puede ser finita o infinita.

Los estadígrafos muestrales son:

∑𝑛𝑖=1 𝑋𝑖
𝑥̅ =
𝑛

2
∑(𝑋𝑖 − 𝑥̅ )2
𝑆 (𝑥) =
𝑛−1

Toda distribución muestral se puede aproximar a la normal, tomando en cuenta el


tamaño el tamaño de la muestra y la cantidad de población.

 Muestreo sin reemplazamiento


𝜇 = 𝜇𝑥 = 𝑥̅
𝜎2 𝑁−𝑛
𝜎 2𝑥 = ( 𝑁−1 ); N tamaño de población
𝑛

 Muestreo con reemplazamiento y población infinita


𝜇 = 𝜇𝑥 = 𝑥̅
𝜎2
𝜎 2𝑥 =
𝑛
Entonces:
𝑥 − 𝑥̅
𝑧=
2
√𝜎 (𝑁 − 𝑛)
𝑛 𝑁−1
𝑥 − 𝑥̅ √𝑛(𝑥 − 𝑥̅ )
𝑧= =
2 𝜎
√𝜎
𝑛

Ejemplo Considere un sistema eléctrico en serie que contiene 30 focos


conectados de manera que ninguna prenda si uno de ellos logra estar defectuoso.
Si los focos de la instalación se seleccionan al azar de un lotede 600, 100 de los
cuales son defectuosos, determinar la probabilidad que funcionen todos los focos
del sistema eléctrico.
SOLUCION:

N=600 (población); M=500 No defectuosos; 100 defectuosos

n=30 (nuestra)

Realidad hipergeometrica

𝑀 𝑁−𝑀 500 100


( )( ) ( )( )
𝑝(𝑥) = 𝑥 𝑛−𝑥 = 𝑥 30 − 𝑥
𝑁 600
( ) ( )
𝑛 30

Con la aproximación a la normal

𝑀 500
𝜇 = 𝑛 ( ) = 30 ( ) = 25 𝑓𝑜𝑐𝑜𝑠
𝑁 600

𝑀 𝑀 𝑁−𝑛 500 600 − 30


𝜎 2 = 𝑛 ( ) (1 − ) ( ) = 25 (1 − )( ) = 3,9649
𝑁 𝑁 𝑁−1 600 600 − 1

𝜎 = 1,9912

1
30 + 2 − 25
𝑃(𝑥 = 30) = 𝜙 (z = )
1,9912

𝑃(𝑥 = 30) = 𝜙(z = 2,76) = 0,9971

1 − 0,9971 𝑃(𝑥 = 30) = 0,0029

De una población con media 25 y varianza de 10 se extrae una muestra aleatoria


de 25 observaciones.

a) Cuál es la probabilidad que la media maestral se encuentre entre 24 y 27


b) Que supone para responder el inciso a

SOLUCION:

𝜇 = 25 𝜎 2 = 10; n = 25 observaciones (muestra)


a) 𝑃(24 < 𝑥̅ < 27) = 𝑃(𝑥̅ < 27) − 𝑃(𝑥̅ < 24)
Distribución maestral sin reemplazamiento
N = infinito (población)
𝜎2 10
𝜇𝑥̅ = 25; 𝜎 2 𝑥̅ = = 25
𝑛

(27 − 25) − 10,95


𝑃(𝑥̅ < 27) = 𝜙(𝑧 = )
√10
25
𝑃(𝑥̅ < 27) = 𝜙(𝑧 = 3,16) = 0,9992
(24 − 25) − 10,95
𝑃(𝑥̅ < 24) = 𝜙(𝑧 = )
√10
25
𝑃(𝑥̅ < 24) = 𝜙(𝑧 = −1,58) = 0,0571
𝑃(24 < 𝑥̅ < 27) = 0,9992 − 0,0571
𝑃(24 < 𝑥̅ < 27) = 0,9421
b) Suposición:
Para la resolución del inciso “a”, se tomó en cuenta una distribución
maestral sin reemplazamiento, y una población infinita (𝑁 = ∞).

Capítulo 7

VARIABLE ALEATORIA BIDIMENSIONAL


Cuando en los experimentos se analizan dos características del espacio muestral

𝑥 = 1º 𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎

𝑦 = 2º 𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎

Entonces se puede encontrar las distribuciones de frecuencias bidimensionales.

Y 𝒀𝟏 − 𝒀𝟐 𝒀𝟐 − 𝒀𝟑 𝒀𝟑 − 𝒀𝟒
…………. TOTALES
X 𝒀𝟏 𝒀𝟐 𝒀𝟒
𝒙𝟏 − 𝒙𝟐 𝑥1 ´ 𝑓11 𝑓12 𝑓13 …………. 𝑓1𝑥
𝒙𝟐 − 𝒙𝟑 𝑥2 ´ 𝑓21 𝑓22 𝑓23 …………. 𝑓2𝑥
𝒙𝟑 − 𝒙𝟒 𝑥3 ´ 𝑓31 𝑓32 𝑓33 …………. 𝑓3𝑥
…………

…………

…………

…………

…………

…………

…………
TOTAL 𝑓1𝑦 𝑓2𝑦 𝑓3𝑦

Si generalizamos entonces definimos la variable aleatoria bidimensional como la


función que asocia a las dos características un par ordenado en 𝑅 2

La Variable Aleatoria Bidimensional puede tomar valores discretos o continuos


además se pueden generar las distribuciones marginales separando las variables
x y y.
VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA

Las características (x,y) titntn un valor fijo dentro de una región en 𝑅 2 . Se verifica:

En V.A.B. Discreta:

∑𝑅𝑦 ∑𝑅𝑥 𝑝(𝑥, 𝑦) = 1

𝑃(𝑥, 𝑦)

∑𝑅𝑦 ∑𝑅𝑥 𝑝(𝑥, 𝑦) = 1

𝑝(𝑥, 𝑦) : Funcion conjunta de probabilidad

Las distribuciones marginales se hallan:

𝑝(𝑥) = ∑𝑅𝑦 𝑝(𝑥, 𝑦) y 𝑝(𝑦) = ∑𝑅𝑥 𝑝(𝑥, 𝑦)

𝑢𝑥 = 𝐸(𝑥) = ∑𝑅𝑥 𝑥𝑝(𝑥) y 𝑢𝑦 = 𝐸(𝑦) = ∑𝑅𝑦 𝑦𝑝(𝑦)

𝜎𝑥 2 = ∑𝑅𝑥 𝑥 2 𝑝(𝑥) − 𝑢𝑥 2 y 𝜎𝑦 2 = ∑𝑅𝑦 𝑦 2 𝑝(𝑦) − 𝑢𝑦 2

VARIABLE ALEATORIA BIDIMENSIONAL CONTINUA

𝑃(𝑥, 𝑦)

∬𝑅 𝑝(𝑥, 𝑦)𝑑𝐴 = 1
𝑥 ℝ (𝑥, 𝑦) 𝑦

Las distribuciones marginales:

𝑝(𝑥) = ∫𝑅𝑦 𝑝(𝑥, 𝑦)𝑑𝑦 y 𝑝(𝑦) = ∫𝑅𝑥 𝑝(𝑥, 𝑦)𝜕𝑥

𝑢𝑥 = 𝐸(𝑥) = ∫𝑅 𝑥𝑝(𝑥)𝑑𝑥 y 𝑢𝑦 = 𝐸(𝑦) = ∫𝑅 𝑦𝑝(𝑦)𝑑𝑦


𝑥 𝑦

𝜎𝑥 2 = 𝐸(𝑥 2 ) − 𝑢𝑥 2 y 𝜎𝑦 2 = 𝐸(𝑦 2 ) − 𝑢𝑦 2

ESPERANZA CONJUNTA Y COVARIANZA

La esperanza matemática conjunta representa el valor promedio esperado de en


𝑅2

𝐸(𝑥, 𝑦) = ∑ ∑ 𝑥𝑦 𝑝(𝑥, 𝑦)
𝑅𝑥 𝑅𝑦

𝐸(𝑥, 𝑦) = ∬ 𝑥𝑦𝑝(𝑥, 𝑦)𝑑𝐴


𝑅

COVARIANZA

La covarianza es aquel estadígrafo que mide la varianza mutua entre las dos
variables aleatorias.

Se define:
𝐶𝑜𝑣(𝑥, 𝑦) = 𝐸(𝑥 − 𝑢𝑥)𝐸(𝑦 − 𝑢𝑦)

𝐶𝑜𝑣(𝑥, 𝑦) = ∑ ∑(𝑥 − 𝑢𝑥 ) (𝑦 − 𝑢𝑦 ) 𝑝(𝑥, 𝑦)


𝑅𝑥 𝑅𝑦

𝐶𝑜𝑣(𝑥,𝑦) = ∬ (𝑥 − 𝑢𝑥 ) (𝑦 − 𝑢𝑦 ) 𝑝(𝑥, 𝑦)𝑑𝐴


𝑅(𝑥,𝑦)

Una expresión alternativa:

𝐶𝑜𝑣(𝑥, 𝑦) = 𝐸(𝑥,𝑦) − 𝑢𝑥 𝑢𝑦

𝐶𝑜𝑣(𝑥, 𝑦) = ∑ ∑ 𝑥𝑦𝑝(𝑥, 𝑦) − 𝑢𝑥 𝑢𝑦
𝑅𝑦 𝑅𝑥

𝐶𝑜𝑣(𝑥, 𝑦) = ∬ 𝑥𝑦𝑝(𝑥, 𝑦)𝑑𝐴 − 𝑢𝑥 𝑢𝑦


𝑅

NOTA.- Si las variables x y y no están relacionadas cov(x,y)=0

COEFICIENTE DE CORRELACION

Mide el grado de relacionamiento entre x y y

 Si 𝑓(𝑥,𝑦) = 1 correlación es perfecta positiva.

 Si 𝑓(𝑥,𝑦) = −1 correlación es perfecta negativa.

𝑦
x

 Si 𝐶𝑜𝑣(𝑥,𝑦) = 0 las variables son independiente.

Esta representado por:

𝐶𝑜𝑣(𝑥,𝑦)
𝜌(𝑥,𝑦) =
𝜎𝑥 ∗ 𝜎𝑦

−1 ≤ 𝜌(𝑥, 𝑦) ≤ 1

EJEMPLO:

Un producto se clasifica de acuerdo al numero de defectos que contiene y a la


fabrica que lo produce. Sean x e y las variables aleatorias que representan el
numero de defecto por unidad y el numero de fabricas los valores de la tabla
representan la distribución de probabilidad conjunta.

Determinar:

a) Las distribuciones marginales y sus correspondientes estadígrafos:


b) Covarianza
c) La esperanza matemática de y dado que x=2

a)

0 1 2 3 TOTAL
1 1/8 1/16 3/16 1/8 8/16
2 1/16 1/16 1/8 1/4 8/16
TOTAL 3/16 2/16 5/16 6/16
X 0 1 2 3
P(x) 3/16 1/8 5/16 3/8

1 5 9
𝑢𝑥 = ∑ 𝑥𝑝(𝑥) = 0 + + +
8 8 8

15
𝑢𝑥 =
8

1 5 27 15
𝜎𝑥 2 = ∑ 𝑥 2 𝑝(𝑥) = 0 + + + − ( )2
8 4 8 8

y 1 2
p(x) 1/2 1/2

1 2∗1 3
𝑢𝑦 = + =
2 2 2

2
1 3 2 1
𝜎𝑦 = +2−( ) =
2 2 4

b)

𝐶𝑜𝑣(𝑥, 𝑦) = 𝐸(𝑥,𝑦) − 𝑢𝑥 𝑢𝑦

𝐶𝑜𝑣(𝑥, 𝑦) = ∑ ∑ 𝑥𝑦𝑝(𝑥, 𝑦) − 𝑢𝑥 𝑢𝑦
𝑅𝑦 𝑅𝑥

1 2 6 8 6 24 15 3
𝐶𝑜𝑣(𝑥, 𝑦) = 0 + 0 + + + + + + − −
16 16 16 16 16 16 8 2
1
𝐶𝑜𝑣(𝑥, 𝑦) =
8
c)

6 4
𝐸(𝑦 ∩ 𝑥 = 2) 16 + 8
𝐸(𝑦. 𝑥 = 2) = = =1
𝐸(𝑥 = 2) 6 4
+
16 8

EJEMPLO:

Suponga que x es el tiempo en minutos que una persona para con un agente
eligiendo una poliza de seguro e y el tiempo en minutos que la gente emplea en
hacer el papeleo . La función de densidad conjunta es :
𝑥 𝑦
𝑝(𝑥, 𝑦) = 𝑘𝑒 −30 𝑒 −10

a) Hallar el valor de la constante k


b) Cual es la probabilidad de que toda la transacción dure mas de media
hora
∞ ∞
𝑥 𝑦
∬ 𝑝(𝑥, 𝑦)𝑑𝐴 = ∫ ∫ 𝑘𝑒 −30 𝑒 −10 𝑑𝑥𝑑𝑦 = 1
𝑅 0 0

∞ 𝑥

𝑦 𝑒 −30 ∞
𝑘∫ 𝑒 10 ∗ { 𝑑𝑦 = 1
1 0
0 − 30


𝑦
−30𝑘(0 − 1) ∫ 𝑒 −10 𝑑𝑦 = 1
0

𝑦
𝑒 −10 ∞
−30𝑘(−1) ∗ { =1
1 0
− 10

1
𝑘=
300
1 −𝑥
𝑝(𝑥, 𝑦) = 𝑒 30 𝑥, 𝑦 ≥ 0
300
𝑥 + 𝑦 ≥ 30 → 𝑃(𝑥 + 𝑦 ≥ 30) = 1 − 𝑃(𝑥 + 𝑦 < 30)
30

30

30 30−𝑥
1 −𝑥 −𝑦
𝑝(𝑥 + 𝑦 ≤ 30) ∫ ∫ 𝑒 30 𝑒 10 𝑑𝑦𝑑𝑥
300
0 0

30 𝑦
𝑥 𝑒 −10 30 − 𝑥
𝑝(𝑥 + 𝑦 ≤ 30) = ∫ 𝑒 −30 ∗ { 𝑑𝑥
1 0
0 − 10

30 30−𝑥 30
𝑥 𝑒− 10 𝑥 1
𝑝(𝑥 + 𝑦 ≤ 30) = ∫ 𝑒 −30 ∗ 𝑑𝑥 − ∫ 𝑒 −30 ∗ 𝑑𝑥
1 1
0 − 10 0 − 30

30 30−𝑥 𝑥
𝑒− −
10 30 𝑥 1 30
𝑝(𝑥 + 𝑦 ≤ 30) = ∫ 𝑑𝑥 − (𝑒 −30 ∗ )
1 1 0
0 − 10 − 10

30 −90+2𝑥
𝑒 30 10
𝑝(𝑥 + 𝑦 ≤ 30) = ∫ 𝑑𝑥 + − 10
1 𝑒
0 − 10

1 𝑥
𝑒 15
𝑝(𝑥 + 𝑦 ≤ 30) = 𝑒 3 (30 + 10 − 10
1 0 𝑒

15
1 1
𝑒2 3 3 10
𝑝(𝑥 + 𝑦 ≤ 30) = 𝑒 − 𝑒 + − 10
1 1 𝑒
− −
15 15
1 1
𝑒 𝑒 3 10 15 15 10 5 15
𝑝(𝑥 + 𝑦 ≤ 30) = − + + − 10 = − + 3+ − 10 = − + 3
1 1 𝑒 𝑒 𝑒 𝑒 𝑒 𝑒
15 15

𝑝(𝑥 + 𝑦 ≤ 30) = 5𝑒 −1 (10𝑒 −2 − 1)

Potrebbero piacerti anche