Sei sulla pagina 1di 22

3. Distribuciones de Probabilidad.

Distribuciones de Probabilidad

Las distribuciones de probabilidad son generadas por una variable aleatoria x, (se denomina variable
porque puede tomar diferentes valores, aleatoria, porque el valor tomado es totalmente al azar) la que
puede ser de dos tipos:

Variable aleatoria discreta (x), porque solo puede tomar valores enteros y un número finito de

ellos. Ejemplos:

Variable aleatoria continua (x), porque puede tomar tanto valores enteros como fraccionarios y

un número infinito de ellos. Ejemplos:

Por lo tanto, pueden existir:

1) Distribución de probabilidad discreta.


2) Distribución de probabilidad continua.

1
1. Distribución de probabilidad discreta.

Es generada por una variable discreta (x), que toma solo valores enteros:

X= 0,1,2,3,4,5,………, etc

p(xi)≥0 Las probabilidades asociadas a cada uno de los valores que toma x deben ser mayores o iguales a
cero.

∑ p(xi) = 1 La sumatoria de las probabilidades asociadas a cada uno de los valores que toma x debe
ser igual a 1.

2. Distribución de probabilidad continua.

Es generada por una variable continua (x), por lo tanto puede tomar tanto valores enteros como
fraccionarios.

X= 1.0, 3.7, 4.0, 4.6, 7.9, 8.0, 8.3, 11.5, ....., ∞

f(x) ≥ 0 Las probabilidades asociadas a cada uno de los valores que toma x deben ser
mayores o iguales a cero. Dicho de otra forma, la función de densidad de probabilidad deberá tomar
solo valores mayores o iguales a cero.

La sumatoria de las probabilidades asociadas a cada uno de los valores que toma
x debe ser igual a 1. El área definida bajo la función de densidad de probabilidad deberá ser de 1.

2
Cálculo de la media y desviación estándar de una distribución de probabilidad Discreta

1. Media o valor esperado de x. Para determinar la media de la distribución discreta se utiliza la siguiente fórmula:

Donde:
µ= media de la distribución
E(x) = valor esperado de x
xi = valores que toma la variable
p(xi) = probabilidad asociada a cada uno de los valores de la variable x

2. Desviación estándar. La desviación estándar de una distribución discreta se obtiene con la siguiente fórmula:

Donde:
 = desviación estándar
µ = media o valor esperado de x
xi = valores que toma la variable x
p(xi) = probabilidad asociada a cada uno de los valores que toma x

Cálculo de la media y desviación estándar de una distribución de probabilidad Continua

1. Media o valor esperado de x. Para calcular la media de una distribución de probabilidad continua se
utiliza la siguiente fórmula:

Donde:
µ = E(x) = media o valor esperado de la distribución
x = variable aleatoria continua
f(x) = función de densidad de la distribución de probabilidad

2. Desviación estándar.- La fórmula para determinar la desviación estándar de una distribución continua es

luego:

3
Algunas distribuciones de probabilidad

Discretas: Continuas:
 Distribución Binomial  Distribución Normal
 Distribución Hipergeométrica  Distribución t- Student
 Distribución de Poisson  Distribución Chi Cuadrado
 Distribución Geométrica
 Distribución F de Fisher
 Distribución Binomial Negativa

Algunas de Distribuciones de Probabilidad


discretas

4
1. Distribución Binomial. (Jakob Bernoulli: Suiza, 1654-1705)

Corresponde a la principal distribución de probabilidad discreta; proviene de experimentos que tienen dos posibles
resultados: éxito o fracaso. Por lo tanto los datos son resultado de un conteo, razón por la cual se clasifica como
distribución discreta. Específicamente consiste de varias pruebas y en cada una la probabilidad de éxito es la misma,
por lo que son independientes.

Construcción de una distribución binomial

Para elaborar una distribución binomial es necesario conocer el número de pruebas que se repiten y la probabilidad
de que suceda un éxito en cada una de ellas. La fórmula que describe la distribución binomial es la siguiente:

n!
Ecuación (1)
b( x; n, p)  p x (1  p ) n  x
( n  x )! x!
donde:
n es el número de pruebas
x es el número de éxitos
p es la probabilidad de obtener un éxito
q es la probabilidad de obtener un fracaso, que se calcula q = 1- p
b(x;n,p) representa la probabilidad de obtener x éxitos en n pruebas

Distribución Binomial

Resumen Distribución Binomial

Parámetros:

n!
P ( x; n , p )  p x (1  p ) n  x
( n  x )! x!
n!
P ( x; n , p )  p xq n x
( n  x )! x!

10

5
Distribución Binomial

Ejemplo

La probabilidad de éxito de una determinada vacuna es 0,72. Calcular la probabilidad de que una vez
administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solución: Se trata de una distribución binomial de parámetros B(n=15; p=0,72)

15!
a) P ( x  15 )  ( 0,72 )15 ( 0, 28 ) 0  0,00724
(15  15 )!15!

15!
b) P ( x  0)  ( 0,72 ) 0 ( 0, 28 )15  5,097 * 10  9
(15  0 )!0!

15!
c) P ( x  13)  ( 0,72 )13 (0,28 ) 2  0,11503
(15  13)!13!
11

2. Distribución Poisson. (Siméon Denis Poisson: 1781-1840 )

La distribución de Poisson describe la probabilidad como un acontecimiento fortuito ocurrido en un tiempo o intervalo de
espacio bajo las condiciones que la probabilidad de un acontecimiento ocurre es muy pequeña, pero el número de intentos
es muy grande, entonces el evento actual ocurre algunas veces.

Características:
• El número medio (promedio) de eventos en el espacio temporal o región específica, se denota como µ (mu).
• El número de resultados que ocurren en un intervalo de tiempo o región específicos es independiente de el número que
ocurre en cualquier otro intervalo de tiempo o región.
• La probabilidad de que un resultado muy pequeño ocurra en un intervalo de tiempo muy corto o en una región pequeña
es proporcional a la longitud del intervalo de tiempo o al tamaño de la región.
• La probabilidad de que más de un resultado ocurra en un intervalo de tiempo tan corto, o en esa región tan pequeña es
inapreciable, que se puede asignar el cero.

12

6
Distribución de Poisson:
e   x
p ( x;  ) 
Ecuación x!

p (x /µ) = la probabilidad de que ocurran X éxitos cuando el número promedio de ocurrencia de ellos es µ.

µ media o promedio de éxitos por unidad de tiempo, área o producto e es la constante 2.7183, base de los
logaritmos naturales, en tanto que los valores de e- pueden obtenerse de tablas.

X señala un valor específico que la variable pueda tomar (el número de éxitos que deseamos ocurran).
Por definición, el valor esperado (media en el intervalo o región de interés) de una distribución de
probabilidad de Poisson es igual a la media de la distribución.

Media  
La varianza del número de eventos de una distribución de probabilidad de Poisson también es igual a la media
de la distribución . De este modo, la desviación estándar es la raíz cuadrada de µ.

Varianza  
13

Ejemplo:

El número de nacimientos en un hospital es de 21 por semana ¿Cuál es la probabilidad de que se produzcan?

a) Solo tres nacimientos?


b) Al menos tres nacimientos la próxima semana?

Solución. Se trata de una distribución Poisson de parámetros B(x; µ=21)

a) p ( x  3;21)  
  
e 21 213 2,718221 213
 0,000001170
3! 123

b) p ( x  3)  1  P ( x  3) 
 e 21 210  e 21 211 e 21 212
b) p ( x  3)  1     
 0!  1! 2!
b)  
p ( x  3)  1  7,58  1010  1,59  10 8  1,67 7  1,84  107
 0,0000000184

14

7
2.1. Aproximación de la distribución binomial por una de Poisson

Algunas veces resulta tedioso calcular las distribuciones binomiales, sobre todo si n
es muy grande y p o q (éxito y fracaso) es muy pequeña. En este caso se puede usar
la Poisson, bajo ciertas condiciones:

a) n ≥ 30 b) np ó nq < 5

Si se satisfacen tales condiciones, se puede sustituir la media de la distribución


binomial en lugar de la media de la distribución de Poisson de modo: µ=np

15

Ejemplo:

Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular
la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3 personas
con dicha enfermedad.

Solución: Se trata de una distribución binomial de parámetros B(n=500.000;


p=1/100.000) . Pero µ = (500.000x(1/100.000)=5. Es decir la media es µ = 5

16

8
Algunas Distribuciones de
Probabilidad Continuas

17

1. Distribución Normal o de Gauss. Carl Friedrich Gauss (1777-1855)

Las estadísticas “gaussianas” se emplean frecuentemente para determinar los “límites normales”
aplicados a las pruebas de laboratorio de análisis clínicos, que como alternativa se adopta “limites de
referencia” Aparece de manera natural en errores de medida, contenido neto, diámetros, longitud y
para distribuciones binomiales con n grande (n>30) y ‘p pequeño’ (np>5).

La distribución normal está determinada por dos parámetros, su media (µ) y su desviación estándar
(). Su función es:

18

9
19

Propiedades de la Curva Normal

1. La media, la mediana y la moda tienen valores parecidos, o iguales, esto implica que es simétrica respecto
a su media  . Existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de
observar un dato menor.
2. La curva normal es asintótica al eje de abscisas, cualquier valor entre - y + es teóricamente posible. El
área total bajo la curva es, por tanto, igual a 1.
3. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación
típica ( ). Cuanto mayor sea  , más aplanada será la curva de la densidad.
4. El área bajo la curva comprendido entre 2 desviaciones estándar de la media es igual a 0.95. En concreto,
un 95% de posibilidades de observar un valor comprendido en el intervalo ( - 1,96, +1,96).

Los porcentajes de área entre ±1, ±2 y ±3 unidades de desviación estándar se presentan en la figura 2

20

10
Figura 2. Areas bajo la curva normal.

21

5. La campana depende de los parámetros  y . La media indica posición, así para diferentes valores de
 la gráfica es desplazada a lo largo del eje horizontal. La  determina el grado de apuntamiento de la
curva. A mayor , más se dispersarán los datos en torno a la media y la curva será más plana. Un
valor pequeño de  indica, por tanto, gran probabilidad de obtener datos cercanos al valor medio de la
distribución.

Como se deduce de este último apartado, no existe una única distribución normal, sino una familia de
distribuciones con una forma común, diferenciadas por los valores de su media y su varianza. De entre
todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de
media 0 y varianza 1. Así, la expresión que define su densidad se puede obtener de la Ecuación 1,
resultando:

22

11
Es importante conocer que, a partir de cualquier variable X que siga una distribución N(,), se
puede obtener otra característica Z con una distribución normal estándar, sin más que efectuar la
transformación:

Esta propiedad es interesante en la práctica, ya que para la distribución N(0,1) existen tablas
publicadas (TABLA 1 DISTRIBUCIÓN NORMAL ESTANDAR) a partir de las que se puede obtener de
modo sencillo la probabilidad de observar un dato menor o igual a un cierto valor z, y que
permitirán resolver preguntas de probabilidad acerca del comportamiento de variables de las que se
sabe o se asume que siguen una distribución aproximadamente normal.

23

Tabla 1. Áreas bajo la curva normal estándar.

La cifra entera y el primer decimal de z se buscan en la primera columna, y el segundo decimal en


la cabecera de la tabla.

UTILIZAR TABLA
DE LA
PLATAFORMA

24

12
Limitaciones de la distribución:

• Se calcula de manera univariada .

• Distribuciones asimétricas de variables biológicas

• Los datos obtenidos son de grupos de individuos seleccionados deliberadamente porque son
sanos o “normales”

• Definir la normalidad en el 95%. Lo cual implica que podría existir una persona sana que
resulta anormal por azar.

• Todos los valores más allá de los límites establecidos son considerados anormales.

• Elección inadecuada del grupo de individuos que constituyen la población de referencia.

• Existen variables biológicas que no pueden comportarse de manera normal.

25

Ejemplo

Supongamos que se sabe que el peso de los sujetos de una determinada población sigue una
distribución aproximadamente normal, con una media de 80 Kg y una desviación estándar de 10
Kg. Lo anterior se denota por N(80,10)
a) ¿Podremos saber cuál es la probabilidad de que una persona, elegida al azar, tenga un
peso superior a 100 Kg?

Desarrollo

Podemos transformar esta característica según la Ecuación 2, y obtener la variable:

26

13
para poder utilizar dicha tabla. Así, la probabilidad que se desea calcular será:

Como el área total bajo la curva es igual a 1, se puede deducir que:

Esta última probabilidad puede ser fácilmente obtenida a partir de la Tabla 1, resultando ser P(Z ≤
2)=0,9772 . Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de
esa población tenga un peso mayor de 100 Kg , es de 1–0.9772=0.0228, es decir,
aproximadamente de un 2.3%.

27

Las tablas de distribución Normal estándar tienen media 0 y Varianza igual a 1.

Existe una medición X con media µ y desviación estándar  y se desea utilizar la curva normal.
Se debe transformar la escala de X de tal manera que la media se hace cero y la desviación
estándar 1.
Este re escalamiento está dado por la relación:

X  
Z  “desviación estándar normal”

X    Z obtención del valor X a partir de Z

28

14
Ejemplo.

Se desea saber cuál es la probabilidad de encontrar a un individuo con valores


mayores de 150 en glucosa en sangre, considerando que la media es 100 y la
desviación estándar en 25. Entendiendo que la variable glucosa tiene
comportamiento normal.

x 150  100


Z   2,00  0,9772
 25

Así:

( 1-0,9772)= 0,0228 Lo cual expresado en porcentaje es 2,28%

29

La pregunta en sentido inverso:

¿Entre que valores, por sobre y bajo la media se ubica el 80% de los valores de glucosa en
sangre de los individuos?

X    Z X  100  25 Z

Formula de referencia:
El Z para la cola de arriba + 0,68
El Z para la cola de abajo - 0,68

Están entre 83 y 117


X  100  25 (  )  83 X  100  25 ()  117

30

15
Ejemplos

Los niveles de glucosa de un grupo de pacientes diabéticos mostró un promedio de


155mg/100ml y una desviación estándar de 5 mg/ 100 ml.

• ¿Cuáles la probabilidad de encontrar a un diabético con cifras menores de


160mg/100ml?

• ¿Entre qué valores se encuentra el 68% el 95% y el 99% de la población?

• ¿Qué porcentaje mostró valores inferiores a 145mg/100ml y superiores a


160mg/100ml?

31

2. Distribución “t” de Student . (William Gosset)

• En probabilidad y estadística, la distribución t-Student es una distribución de probabilidad


que surge del problema de estimar la media de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño.

• Una variable aleatoria se distribuye según el modelo de t-Student con n grados de libertad, donde n es un
entero positivo, si su función de densidad es la siguiente:


n 1
(
2
) 1
t 2  ( n 1)   t   ( p)   x p 1e  x dx siendo p0
f (t )  (1  ) 2
n n 0
( ) n
2

• La gráfica de esta función de densidad es simétrica respecto del eje de ordenadas, con
independencia del valor de n, y de forma semejante a la distribución normal.

32

16
33

Propiedades:

• La media es 0 y su varianza (n/(2-2), para n >2.

• La gráfica de la función de densidad es en forma de campana.

• Los datos están más disperso que la curva normal estándar.

• A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).

• La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t


están por encima de la normal, y el centro se encuentra por debajo del de la normal.

• Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.

• Entre las aplicaciones:


 Estimación de intervalos de confianza para medias a partir de muestras pequeñas
 Pruebas de hipótesis basadas en muestras < 30

34

17
Distribución “t” de Student

Definiendo el estadístico t:

x -μ
t=
s/ n

Se puede probar que siendo x de una muestra tomada de una población normal con
el promedio
media µ y varianza 2, el estadístico t es el valor de una variable aleatoria con distribución "t" de
Student y parámetro  (grados de libertad) = n-1.

35

Tabla de Distribución “t”

Valores de t a la derecha de los cuales se encuentra el (100 x )% área de la curva.

Localizamos la columna del valor de  y fila del valor de (n-1). La intersección de la fila y la columna
nos dará el valor de t.

UTILIZAR TABLA
DE LA
PLATAFORMA

36

18
Distribución Ji-cuadrado

Distribución Ji-cuadrado es una función de densidad de probabilidad que representa la


distribución muestreal de la varianza.

Definimos el estadístico Ji-cuadrado (2) como:

(n -1) s2
 =2

2

37

38

19
Características Ji-cuadrado

1. Asimétrica y asintótica al eje x por la derecha;


2. Su dominio va de 0 a +
3. Area bajo la curva desde 0 a + =1
4. Tiene parámetro = n-1 (grados de libertad)
5. Al aumentar n se aproxima a la normal
6. Representa distribución muestreal de varianza.
7. Entre las aplicaciones:

1. Determinación intervalos confianza para varianzas


2. Pruebas de hipótesis para una varianza
3. Tablas de contingencia
4. El ajuste de datos a una distribución dada conocida
5. Las pruebas de independencia.

39

Tabla Distribución (ji) 2

Valores 2 para varios , Área a su derecha = . 1ª columna =  1ª fila: áreas en la cola a la derecha de 2
Cuerpo tabla son los valores de 2

UTILIZAR TABLA
DE LA
PLATAFORMA

40

20
Ejercicios

a) Calcular la probabilidad de obtener un valor mayor de 23.7 en una distribución 2 con  = 14 g.d.l.
b) Calcular el valor de 2 después del cual se encuentre el 5% del área en una distribución Ji-
cuadrado con 4 g.d.l.

41

Distribución "F” de Fisher

También llamada "F” de Fisher – Snedecor, representa la distribución muestreal de


la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones
Ji-cuadrado.

2
Definimos el estadístico F como:
F = s2 1
s2

El cual es el valor de una variable aleatoria que tiene distribución F con parámetros
1=n1-1 y 2=n2-1.

42

21
Propiedades de Distribución F

1. Asimétrica, y asintótica al eje x por el lado derecho


2. Su dominio va de 0 a +
3. Área bajo curva desde 0 a + =1
4. Tiene parámetros 1=n1-1 y2=n2-1.
5. Entre sus aplicaciones:
• Pruebas de hipótesis entre 2 varianzas
• Análisis de varianza
• Análisis de covarianza.

43

Tabla de Distribución F

Tablas independientes de valores de F


para =0.01 y =0.05 para varias
combinaciones de1 y 2.

Se escoge la tabla para la


probabilidad deseada y se escoge 1
en la fila superior y 2 en la 1ª
columna. La intersección nos da el
valor de F deseado.

44

22

Potrebbero piacerti anche