Sei sulla pagina 1di 71

Probabilidad

1
Variables
• En la Estadística Descriptiva las Variables son cualidades observables y
medibles de los individuos de una muestra.
• Analizábamos los valores de una muestra ya observada.
• Estudio a posteriori.

Variables Aleatorias
• En este tema tratamos las variables situándonos antes de la
realización del experimento aleatorio.
• Haremos uso de los conceptos de Probabilidad y algunos desarrollos
serán análogos a la Estadística Descriptiva.
2
Variables aleatorias
• En cualquier experimento aleatorio tenemos resultados cualitativos o
cuantitativos. A cada resultado le asignamos un número real.

• EJEMPLO:
• Tomar un niño de la consulta al azar y medir su estatura
• Tomar una familia al azar y apuntar el número de hijos.
• Aplicar un tratamiento y ver si cura o no (0,1)

3
Variable Aleatoria
• Al realizar un experimento aleatorio, podemos estar interesados en
una función del resultado más que en el resultado.
• Al arrojar un dado dos veces, puede que nos interese la suma de los
dos valores
• A esto lo llamamos Variable Aleatoria:
• Variable porque toma distintos valores.
• Aleatoria porque el valor observado no puede ser predicho,
aunque sabemos los posibles resultados que puede tener.

4
Variables aleatorias
Son variables numéricas asociadas a experimentos aleatorios, cuyo
resultado no podemos predecir

Ejemplos:
X = peso de una persona tomada al azar de un población
X = 1 si sale cara, 0 si sale cruz
X = 1 si la enfermedad esta presente, 0 si no

5
Variable Aleatoria
• A veces puede ocurrir que los valores de una variable aleatoria son los
mismos, pero la probabilidad de que ocurran no.

• Por ejemplo, yo puedo tener dos fármacos A y B para tratar una


enfermedad. Los resultados de la variable sólo pueden ser 0 ó 1, pero
el fármaco A puede curar al 20% y el B al 60%.

• Para tener identificada una variable aleatoria hay que tener los
valores que puede tomar y cada una de las probabilidades.

6
Variable Aleatoria
• Dado que el valor de una variable aleatoria (v.a) es determinado por el
resultado de un experimento (Suma de dos dados), podemos asignar
probabilidades a los posibles valores o conjuntos de valores de la
variable.

Una variable aleatoria X es toda función que toma diversos valores


numéricos con distintas probabilidades, dependiendo de un
fenómeno aleatorio.

7
Variable Aleatoria
• Al igual que en estadística Descriptiva, podemos clasificar las Variables
Aleatorias en discretas y continuas en función de los valores que
pueden tomar:
• Será discreta si los valores están separados entre sí.
• Será contínua cuando el conjunto de valores que puede tomar
es un intervalo.

8
Variable Aleatoria Discreta
• Ejemplo:

• Lanzar un dado, la variable aleatoria


X={nº que sale en la cara superior}
X={1,2,3,4,5,6} con probabilidades
P(X)={1/6,1/6,1/6,1/6,1/6,1/6}

9
Variable Aleatoria Discreta
• Ejemplo:

X={nº de varones en una familia con dos hijos}


X={0,1,2} con probabilidades
P(X)={1/4,1/2,1/4}

10
Variable Aleatoria Discreta

Una variable aleatoria Discreta estará identificada si


conocemos sus posibles valores X={x1,x2…,xn} y sus probabilidades
respectivas P(X=xi)=Pi

La suma de las probabilidades es 1.

La regal que permite asociar a cada valor xi su probabilidad


pi, la llamamos “función de probabilidad”
11
Variable aleatoria discreta

12
Variable aleatoria discreta
• En general diremos que una variable aleatoria discreta estará identificada si
conocemos sus valores X={x1,x2,….,xn} y sus probabilidades P(X=Xi)=pi.
• A toda regla que permite asociar a cada valor xi su probabilidad pi, la llamaremos
«función de probabilidad».
• La «función de probabilidad» puede venir dada por una tabla


X 0 1 2
P(X) 1/4 1/2 1/4
Muestra aleatoria simple de una v.a.

14
Diego Salmerón Martínez. Universidad de Murcia.
Principales características de las variable
aleatorias

15
Esperanza, varianza y D. T de una Variable
Aleatoria
• Se llama Esperanza de la variable aleatoria X, al número:

E[X]=x1p1+x2p2+…...+xnpn

x1,x2,….,xn son los valores de la variable aleatoria.


p1,p2,…pn las probabilidades
Esperanza, varianza y D. T de una Variable
Aleatoria
• La esperanza de la variable aleatoria también se representa por µ y se
llama media de la distribución.

• «Esperanza de la variable» y «media de la distribución» son


expresiones equivalentes

• µ=Σpixi=E[X]

18
Diego Salmerón Martínez. Universidad de Murcia.
Media poblacional

19
Diego Salmerón Martínez. Universidad de Murcia.
Esperanza, varianza y D. T de una Variable
Aleatoria
• EJEMPLO:
• Calcular la media del número de hijos varones de una familia con dos hijos.
• Espacio Muestral={VV,VH,HV,HH}
={VV,VH,HV,HH}
• X={0,1,2}

• P1=P(X=0)=1/4
• P2=P(X=1)=2/4=1/2 0*1/2+1*1/2+2*1/4=1
• P3=P(X=2)=1/4

• En promedio una familia con dos hijos tiene 1 hijo varón.


Esperanza, varianza y D. T de una Variable
Aleatoria
• Para medir la dispersión de los valores de una variable aleatoria X
respecto de su media µ, se define el siguiente estadístico llamado
Varianza:
V[X]=E[(x-µ)2]

Es decir
V[X]=(x1-µ)2p1+]+(x2-µ)2p2+……(xxn-µ)2pn
Esperanza, varianza y D. T de una Variable
Aleatoria
• Puesto que la Varianza no se mide en las mismas unidades que la
variable, usamos la raíz cuadrada y lo llamaremos desviación típica:
Desv [X]=√V[X]

23
Diego Salmerón Martínez. Universidad de Murcia.
Esperanza, varianza y D. T de una Variable
Aleatoria
• EJEMPLO:
• Calcular la varianza del número de hijos varones de una familia con dos hijos.
• Espacio Muestral={VV,VH,HV,HH}
={VV,VH,HV,HH}
• X={0,1,2}

• P1=P(X=0)=1/4
• P2=P(X=1)=2/4=1/2 (0-1)2*1/4+(1-1)
*1/4+(1 2*1/2+(2-1)2*1/4=1/4+1/4=1/2
• P3=P(X=2)=1/4

• Tiene una varianza de ½.


Variable aleatoria continua

25
Diego Salmerón Martínez. Universidad de Murcia.
¿Qué podemos decir de una v.a. con la
función de densidad de la figura?
¿Es simétrica?

26
Diego Salmerón Martínez. Universidad de Murcia.
Conforme aumentamos el tamaño muestral, la forma del histograma
de la muestra se acerca a la forma que tiene la función de densidad

27
Diego Salmerón Martínez. Universidad de Murcia.
Algunos modelos de variables aleatorias
Binomial
Poisson
Normal

28
Diego Salmerón Martínez. Universidad de Murcia.
La variable aleatoria binomial X es el
número de éxitos en n repeticiones con
probabilidad de éxito p, es decir,

X=Número de éxitos en las n pruebas.

Denotaremos esta variable como Bin(n,p)


(n,p)

29
La variable aleatoria binomial X es el número de éxitos en n repeticiones de una

prueba en la que sólo hay dos posibles resultados (éxito o fracaso),

con probabilidad

Debe cumplirse:

•Cada
Cada prueba individual puede ser un éxito o un fracaso.
•La
La probabilidad de éxito, p, es la misma en cada prueba.
•Las
Las pruebas son independientes. El resultado de una prueba no tiene influencia
sobre los resultados siguientes.
30

31
Variable aleatoria Binomial de parámetro
n y p.
PRUEBA

E F

E F E F

E F E F E F E F
Variable aleatoria Binomial de parámetro n y
p.
Variable aleatoria Binomial de parámetro n y
p.
Media y desviación típica de una variable
Binomial.
Media y desviación típica de una variable
Binomial.
EJEMPLO:
La probabilidad de que un estudiante obtenga el título es 0,3. Hallar la
probabilidad de que un grupo de 7 estudiantes:
a)Ninguno de los siete finalice la carrera:
E:acabar la carrera. P(E)=p=0,3
F:No acabar la carrera P(F)=q=0,7
n=7.
Las pruebas son independientes.
Media y desviación típica de una variable
Binomial.
Media y desviación típica de una variable
Binomial.
Media y desviación típica de una variable
Binomial.
EJEMPLO:
a)Al menos dos acaben la carrera:
P(X≥2)=P(X=2)+P(X=3)+..+P(X=7)=

=1-P(X≤1)=1-(P(r=0)+P(r=1))=1--0,0824-0,2471=0,6705
Media y desviación típica de una variable
Binomial.
EJEMPLO:
a)Parámetros:

E[X]=μ=n*p
σ2=n*p*(1-p)

E[X]=np=7*0,3=2,1
V[X]=npq=7*0,03*0,7=1,47
=7*0,03*0,7=1,47
En muchas circunstancias el número de individuos susceptible
de dar lugar a un éxito es muy grande (llamadas a la centralita
de un hospital, número de leucocitos en una gota de
sangre,…)

Para modelizar esas situaciones se elige una distribución de


Poisson.

41
Distribución de Poisson.
Poisson

En este caso la variable aleatoria representa el número de sucesos


independientes que ocurren a una velocidad constante, en el tiempo o el
espacio.

Ejemplos:
• Número de personas que llegan a la puerta de urgencias en una noche.
• Número de bacterias en un cultivo.
• Problemas de lista de espera.
Carácterísticas de la Distribución de Poisson.

1. Debemos tener un fenómeno dicotómico.


2. Las pruebas han de ser independientes y la probabilidad de éxito
constante.
3. Los sucesos han de ser poco comunes.
4. Para p pequeña suponemos (p<0,05) y n grande suponemos n>100.
5. Los sucesos ocurren en un intervalo de tiempo.
6. Se caracteriza por un parámetro ʎ, nº medio de ocurrencia del suceso.
7. Cuando la media y la varianza sean similares podemos pensar en un
modelo de Poisson.
Media y desviación típica de una variable de
Poisson.

Media E[X]=np=ʎ

Varianza V[X]= ʎ=E[X]


45
• Utilizaremos la distribución de Poisson como aproximación de la
distribución binomial cuando n sea grande y p pequeño, en base al
límite que hemos visto.
• Como criterio podremos aproximar cuando n>50 y p<0,1

46
•EJEMPLO:

La probabilidad de que una persona se desmaye en un concierto es p=0,005.


¿Cuál es la probabilidad de que en un concierto al que asisten 3000 personas se desmayen
18?

La variable X= Número de personas que se desmayan en el concierto sigue una


Bin(3000,0´005).

Queremos calcular P(X=18)

Por eso es preferible aproximar por una Poisson de parámetro

47
VARIABLES ALEATORIAS

En el caso de variables categóricas, para conocer su distribución basta con saber


las probabilidades asociadas a cada una de las categorías.

¿Y para variables contínuas?


VARIABLES ALEATORIAS CONTÍNUAS
•Una variable aleatoria es continua cuando puede tomar cualquier valor en un
intervalo:
•El peso de una persona.
•El
El contenido de paracetamol en un lote de pastillas.
•El
El tiempo de recuperación de una operación.

El estudio de las variables continuas es más sutil que el de las discretas.


•El

La construcción del histograma es más delicado que el de las barras ya que


•La
depende de la elección de las clases.
VARIABLES ALEATORIAS CONTÍNUAS

• Tomando más observaciones de una variable continua y haciendo más


finas las clases , el histograma tiende a estabilizarse en una curva suave
que describe la distribución de la variable.
• Esta curva se llama función de densidad de X, f(X)
• La función de densidad cumple dos propiedades básicas : es no negativa
y el área total que contiene es 1.
Conforme aumentamos el tamaño muestral,
muestral la forma del histograma
de la muestra se acerca a la forma que tiene la función de densidad
LA DISTRIBUCIÓN NORMAL
Menor desviación típica

• La distribución normal es una (curva más estrecha y


apuntada)

familia de curvas (funciones


de distribución), con las
siguientes características.
• Simétricas.
• Formas de campana.
• Es la que se presenta con
Mayor desviación típica
mayor frecuencia en las (curva más ancha y
aplastada)
variables cuantitativas.
DISTRIBUCIÓN NORMAL
• Una distribución Normal queda definida por dos parámetros: su
media (μ)) y su desviación típica que se representa por σ, se denota
por la expresión N(μ, σ).
• Estos dos parámetros definen la forma concreta de la distribución.
distribución
• La media μ define el centro de la campana.
• La desviación típica σ,, define la forma.
• A mayor desviación típica (datos más dispersos), forma más
“ensanchada y aplastada”.
• Menor σ forma más “estrecha y apuntada”
Ejemplo
PROPIEDADES DE LA DISTRIBUCIÓN NORMAL
1. Queda definida por dos parámetros μ y σ.
2. Para expresar que una variable X sigue una distribución Normal con
media μ y desviación típica σ diremos: X N(μN( , σ )
3. Los valores de una variable normal tienen su máxima frecuencia
alrededor de μ (la curva tiene el máximo en μ ) y en este valor
coinciden el valor de su media, su mediana y su moda.
4. Esta distribución es completamente simétrica respecto al eje
vertical que corte al eje de abcisas en el valor μ .
PROPIEDADES DE LA DISTRIBUCIÓN NORMAL
5. En el intervalo [μ –σ, μ +σ]] se encuentran el 68.26% de los valores
más frecuentes de la distribución y en el intervalo [μ
[ –2σ, μ +2σ] el
95.44% de los valores más frecuentes de la distribución.
6. Es asintótitca respecto al eje de abcisas,
abcisas e.d, nunca llega a cruzar ese
eje. Conforme los valores del eje x se acercan a –infinito ó infinito.
7. A la distribución N(0,1) se le conoce como distribución Normal
Estándar ( o Tipificada).
57
Diego Salmerón Martínez. Universidad de Murcia.
DISTRIBUCIÓN NORMAL ESTÁNDAR N(0,1)
Los valores más frecuentes se encuentran alrededor del 0, son por lo
tanto positivos como negativos.
En adelante Z, representará una variable que siga una distribución
N(0,1)
Queremos conocer cómo es el comportamiento de esta distribución
N(0,1)
• ¿Qué probabilidad tiene la variable Z de obtener un valor inferior
a cierto valor z?
• ¿y superior?
• ¿y entre dos valores?
59
Diego Salmerón Martínez. Universidad de Murcia.
EJEMPLO
• ¿Cuál es la probabilidad de que si elegimos un valor al azar de la
variable Z sea inferior a 1,45?
• P(Z<1,45)
• Probabilidad de que un valor de la variable Z sea inferior a 1,45
• P(Z<1,45)=0,9264
• Interpretamos el resultado como: La probabilidad de que un valor de
la variable Z sea inferior a 1,45 es 0,9264.
• Lo que es igual el 92,64% de los valores de la variable Z son menores
que el valor 1,45
• 1,45 es el percentil 92,64 de la distribución N(0,1)
0.67
N(0,1)
• En la tabla de la distribución
Normal Estándar sólo aparecen
las probabilidades asociadas a
los valores que son inferiores a
un número positivo.
• Si nos interesa la probabilidad
contraria P(Z>z), usamos la
fórmula.
• P(Z>z)=1-P(Z<z)
EJEMPLO:
• ¿Cuál es la probabilidad si elegimos un valor al azar de la variable Z
sea superior a 1,45?
• P(Z>1,45)

• Por el ejemplo de antes sabemos que P(Z<1,45)=0.9246.


• Por lo tanto P(Z>1.45)=1-P(Z<1,45)=1
P(Z<1,45)=1-0.9246=0.0736
N(0,1)
• La distribución Normal tiene tanto valores positivos como negativos,
sin embargo en la tabla sólo aparecen valores positivos. Esto es
debido a lo que hemos comentado de distribución simétrica respecto
al 0.
• Sabiendo la distribución en la parte positiva podremos decir cuál será
el comportamiento en la parte negativa.
• P(Z<-z)=P(Z>z) P(Z>-z)=P(Z<z)
• En el caso de P(z1<Z<z2)=P(Z<z2)-P(Z<z
P(Z<z1)
N(0,1)
N(0,1)
• Ejemplo:

• Considerando que la variable Z sigue una N(0,1), calcula las


probabilidades: P(Z<-2,35)
2,35) y P(Z>-2,56)
P(Z>
• P(Z<-2,35)=P(Z>2,35)=1-P(Z<2,35)=1
P(Z<2,35)=1-0.9906=0.0094

• P(Z>-2.56)=P(Z<2.56)=0.9947
2.56)=P(Z<2.56)=0.9947
EJEMPLOS:
• Considerando que Z N(0,1).
• Calcula las siguientes probabilidades:
1. P(Z<1.56)
2. P(Z>3.00)
3. P(Z<-1,5)
4. P(Z>-2.61)
• Calcula el valor de V tal que:
1. P(Z<V)=0.648
2. P(Z>V)=0.9978
N(μ,σ). TIPIFICACIÓN.

• Cualquier variable X que siga una distribución N(μ,σ) se puede


transformar en una N(0,1)

• X sigue N(μ,σ)) Z= Z sigue una N(0,1)


EJEMPLO
• La longitud del fémur de cualquier feto a las 25 semanas sigue una
distribución normal con media 44mm y desviación típica 2mm.
• Si tomamos una embarazada al azar de 25 semanas de gestación ¿qué
probabilidad tenemos de que el fémur de su bebé mida más de
46mm? ¿y de qué mida entre 47mm y 49mm?
Otras distribuciones de
probabilidad.
• Para variables contínuas existen otras distribuciones de
probabilidad teóricas que nos serán de utilidad en
estadística inferencial. Éstas son la t de Student, la
distribución χ2 (Chi-cuadrado) y la F de Snedecor.
• Éstas distribuciones adoptan una forma diferente
dependiendo de un parámetro que se denomina grados de
libertad.
Estas distribuciones son t1,t2,t5
y t10

t∞ se asemeja a la distribución
normal.
Teorema Central del Límite.
• El teorema central del límite es uno de los
resultados fundamentales de la estadística.
• Este teorema nos dice que si una muestra es lo
bastante grande
(n>30),sea cual sea la distribución de la media
muestral, seguirá aproximadamente una
distribución normal.

Potrebbero piacerti anche