Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
VARIABLE ALEATORIA
Ejemplo:
Supóngase el experimento “atender dos parturientas primerizas para un proceso de
parto”. El espacio muestral, esto es, el conjunto de resultados compuestos
posibles asociados al experimento aleatorio* “tipo de parto realizado” si “C” =
parto por cesárea y “V” = parto vía vaginal, sería:
*Si el tipo de parto se realizara de acuerdo a las condiciones naturales aleatoria que presente la
parturienta y no en función de una decisión sesgada del médico que la atienda
Como se recordará encontrar la probabilidad de obtener una cara sería fácil como
producto de aplicar una definición clásica de probabilidades, esto es P(A) = ½ =
0.5 = 50%, pero ¿Qué pasaría si ahora en vez de lanzar una moneda lanzáramos
4 de ellas, y en vez de observar una cara estuviésemos interesados en observar
2?
¿Por quienes estaría conformado el espacio muestral?. A fin de visualizar mejor los
resultados elaboremos un diagrama de árbol, y pongamos atención a las siguientes
observaciones:
A AAAA 4C4 = 1
A
B AAAB 4C3 = 4
A
A AABA
B
B AABB 4C2 = 6
A
A ABAA
A
B ABAB
B
A ABBA
B
B ABBB 4C1 = 4
0
A BAAA
A
B BAAB
A
A BABA
B
B BABB
B
A BBAA
A
B BBAB
B
A BBBA
B
B BBBB 4C0 = 1
Pues, todavía se ve fácil, pero, ¿Qué pasaría si en lugar de 4, fueran 10, 20, 100 monedas ó
más?, ¿Cómo podríamos encontrar las probabilidades si se deseara observar 4, 7 ó más
caras?
Una solución podría facilitarse si pudiésemos conocer como se distribuyen sus probabilidades…
¿porqué?, veámoslo a continuación, no sin antes clasificar las variables aleatorias y definir lo
que se ha de entender en probabilidades por función de distribución
TIPOS DE VARIABLE ALEATORIA
Las variables aleatorias pueden clasificarse según el recorrido o rango Rx, así:
Ejemplos de VAC:
FUNCIÓN DE DISTRIBUCIÓN
Cuando para c/una de las anteriores variables es posible encontrar todos los valores
que asumen las mismas, o bien es posible definir una función que permitiese
conocer o determinar dichos valores, y se ordenan estos en una tabla de
frecuencias o en una gráfica, a tal función, que muestra el comportamiento
ordenado de las probabilidades que tienen cada uno de los eventos mutuamente
excluyentes que produce la variable aleatoria, se le conoce como distribución de
probabilidad, la cual recibe a la vez diferente nombre en función de si la variable
aleatoria es discreta o continua, a saber:
a) Función de Masa o Cuantía, si se tratase de una variable aleatoria discreta;
luego, una función de masa o cuantía es aquella función que recoge todos los
valores que asume una VAD, o
b) Función de Densidad, si se tratase de una variable aleatoria continua, o sea,
una función de densidad es aquella función que recoge todos los valores que
se asocian a una VAC
De lo anterior se puede ver que una función de distribución de probabilidades no es más que
aquella función (fórmula) que permite obtener las probabilidades de todos aquellos eventos que
produce un experimento aleatorio. Y recordando que la probabilidad puede expresarse en
términos de frecuencia relativa P(E)= n/N, se puede decir entonces que una distribución de
probabilidad también es un arreglo ordenado de todas las probabilidades que asumen los
eventos (indicadores de la variable aleatoria),y que están representados ya sea por una tabla,
gráfica o una fórmula.
FÓRMULA DE LA DISTRIBUCIÓN DE PROBABILIDADES PARA UNA VA(X)
Si “X” es una variable aleatoria discreta, entonces la distribución de probabilidades
de la VAD viene dada por la sumatoria de la función de masa o cuantía, así:
No es más que una tabla que presenta el ordenamiento de las probabilidades de todos los
eventos mutuamente excluyentes que puede asumir una variable aleatoria, asociada a un
experimento aleatorio, y que permite determinar cuál es el comportamiento de la variable
(espacio muestral o población) en función de las probabilidades. Esto es importante, ya que
significa que si pudiéramos conocer el comportamiento de una población en términos de las
probabilidades, entonces podríamos calcular las probabilidades para un subconjunto de valores
(muestra) que se derivaran de ella. Para comprenderlo mejor volvamos a nuestro caso
¿Qué pasaría si quisiéramos encontrar las probabilidades para cada uno de los eventos?
haciéndolo y ordenándolas tendríamos los siguientes resultados
N° Pm P(E)
Distribución gráfica de P(E) observaciones
Caras
0 1 1/16 P(e) La función de distribución de probabilidad no es más que la sumatoria de la función de
F(y)=Σf(m) Masa o cuantía, esta última a su vez es la fórmula que permite obtener la probabilidad
1 4 4/16 6 Para cada uno de los eventos que asume la variable aleatoria discreta, esto es:
2 6 6/16 5
4
3 4 4/16 3
2
4 1 1/16 1 V(y) ó sea P(E1) + P(E2) + …… + P(En)
total 16 1.00 0 1 2 3 4 Fórmula que dependerá del comportamiento de las probabilidades de VA(x)
Caras observadas
Según sean los comportamientos de las distribuciones de probabilidad, existen ya modelos, a los cuales
se les ha determinada una función matemática específica, en el caso de VA(x) las más estudiadas son:
Significa que todos los puntos muestrales tienen igual probabilidad de ocurrir, ejem. En el lanzamiento
de un dado, o el lanzamiento de una moneda, o al contestar una pregunta de selección múltiple, o la
probabilidad de un sujeto de pertenecer a determinado grupo sanguíneo.
Importante, en el caso de la probabilidad binomial, para determinar el orden en que pueden ocurrir las
probabilidades para un punto muestral o evento específico
LA DISTRIBUCIÓN BINOMIAL
La distribución binomial es una distribución de probabilidad discreta del número de éxitos en
una secuencia de “n” experimentos independientes, cada uno de los cuales tiene probabilidad
“P” de ocurrir. La función de masa para la distribución de probabilidad binomial viene dada por:
Los intentos son idénticos, y cada uno de ellos puede resultar en dos posibles
resultados,
que se denotan por éxito (P) o fracaso (Q, ) luego (P(P)+P(Q)=1
Por lo tanto, si un problema que requiere del cálculo de probabilidades puede plantearse en
estos términos, su solución podría obtenerse por medio de la fórmula de Bernoulli, POR
EJEMPLO, para el caso del experimento de la moneda, si por alguna razón se deseara encontrar
la probabilidad de sacar 5 caras y 7 coronas en 12 lanzamientos, ¿podría hacerse por un análisis
Binomial? ¿Porqué? Pues porque revisando las características se puede observar que:
1.- se requiere hacer una secuencia de 12 ensayos.
2.- los ensayos (experimentos) serían idénticos: “lanzar una moneda a lo vez”, lo cual
sólo podría dar 2 resultados: o cae cara o NO cae cara, siendo P= ”cae cara” , el éxito
y Q = “cae corona, o NO cara” el fracaso… en este punto es importante aclarar que el
éxito o fracaso viene definido por el evento de interés, y/o por el investigador, quien
previamente ha de determinar a qué suceso le llamará éxito y a qué, fracaso
3.- los ensayos son idénticos (lanzar una moneda tras otra) pero el hecho de que el
resultado de un “n1” sea cara no implica que el resultado de un n2 también será cara,
o será afectado, esto es: tenga más o menos probabilidad de ocurrir lo que nos indica
que los ensayos son independientes, y por último
4.- la probabilidad de éxito es constante, ya que dado que sólo puede caer cara o corona,
entonces P(E)=1/2 = 0.5 ( a este respecto es importante hacer notar que no siempre la
probabilidad de éxito viene dada por la probabilidad clásica, sino que esta puede ser dada por la
probabilidad frecuencial observada del fenómeno o incluso por la probabilidad empírica o
personal; en este sentido, la probabilidad de éxito puede ser obtenida por:
a) Referencia estadística
b) Sondeo o estudio piloto
c) Planteamiento de hipótesis
d) Probabilidad clásica usando Métodos de conteo
e) Asunción o presunción de P=Q
f) Otras formas (determinación a partir de indicadores, etc.)
0.193359375
μ = 12(0.5) = 6 y σ = 12(0.5)(0.5) = 3
EJEMPLO 2.- supóngase que como producto de una investigación se observa que un 15% de las
estudiantes universitarias de “Y” universidad sale embarazada antes de terminar su tercer año
de estudios, y que él 75% de ellas deja el estudio como consecuencia de la situación, si para
efectos de evaluar el fenómeno, ud toma aleatoriamente y sin que se sepa 25 señoritas de
nuevo ingreso, y se dispone a llevar el control respectivo, ¿Qué probabilidad tiene de observar al
final de 3 años que:
¿Qué probabilidad hay que al tomar una muestra de 15 señoritas que desertaron del estudio se
observe que:
Ahora bien, ¿Qué pasaría si en vez de tomar una muestra de 15, tomásemos como observación
las 600 que ingresan en “Y” facultad, y que se sabe que sólo el 3.5% de las estudiantes deja de
estudiar como consecuencia de un embarazo? Que la binomial ya no nos es tan útil ni viable su
cálculo, por lo que la probabilidad es mejor calcularla a partir de la distribución de Poisson.
Como distribución de probabilidad, estamos siempre ante una tabla, fórmula o una gráfica que
nos proporciona probabilidades o frecuencias relativas; la diferencia reside en que ahora
no hablamos de la probabilidad de un punto o valor, sino de la probabilidad de un valor o
punto entre dos puntos o valores cualesquiera .
Se denomina DISTRIBUCIÓN DE VARIABLE CONTINUA a aquella que puede tomar cualquiera de
los infinitos valores existentes dentro de un intervalo. En el caso de variable continua la
distribución de probabilidad es la integral de la función de densidad, por lo que tenemos
entonces que:
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana. La importancia de la distribución normal se debe principalmente a que hay
muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal:
Caracteres morfológicos y antropométricos de los individuos
Indicadores de laboratorio clínico: glucosa, hemoglobina, colesterol, etc.
Caracteres fisiológicos como el efecto de un fármaco
Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos
Caracteres psicológicos como el cociente intelectual, etc.
De Moivre explicó que si pudiéramos encontrar una ecuación para la curva que se
define, entonces se solucionaría más fácilmente el cálculo de probabilidades de que
aparezca “x”, (o más “caras”) al lanzar N veces una moneda. y eso fue una de sus
metas sin imaginar que esta peculiar forma de campana también se había
detectado, en el siglo 17, por Galileo en el análisis de errores de medición de
observaciones astronómicas; errores atribuibles a la instrumentación y a los
observadores. Galileo Notó que estos errores eran simétricos y que los pequeños
errores eran más frecuentes que los errores grandes. De ahí, se plantearon varias
hipótesis sobre la distribución de los errores de medición. No obstante ambas
observaciones y trabajos, fue solo a principio del siglo 19th que se descubrió que
estos errores seguían una distribución normal.
Al hacer un análisis del histograma se puede comprobar que las sub áreas corresponden a
las frecuencias de la ocurrencia de los valores de la variable entre las fronteras en la
escala horizontal, esto es
f6
Donde:
f1 + f2 + ….. + f6 = TOTAL de frecuencias absolutas
f5
f1
0 C1 C2 C3 C4 C5 C6
frc = f1 / F , que es igual a la probabilidad de ocurrencia de la clase 1, lo cual puede expresarse también
por medio de las áreas, esto es:
AT = A1 + A2 + …. + A6, pero del gráfico se puede ver que A =f ixC, por lo que sustituyendo,
tenemos que:
y que son el tipo de gráfica que reflejan generalmente las distribuciones de variables aleatorias continuas
con tendencia normal por ejemplo, la estatura de una población
Sobre estos tipos de distribución que tienen tendencia normal, podemos sacar algunas
conclusiones importantes:
a) Son simétricas respecto de su media, por lo tanto la media, la mediana y la moda son
iguales.
b) Si se han graficado las frecuencias relativas, el área total bajo la curva y sobre el eje
horizontal, es igual a 1, por cuanto se trata de una distribución de probabilidades y
porque fr = fi/N
AT
a b
que como ya se ha dicho antes tiene como función la expresión matemática , a la cual si
damos distintos valores de “x” para unos valores de y determinados paramétricamente,
podemos generar unos intervalos de confianza o probabilísticos Z, donde Z es un valor
asociado a cierto nivel de confianza de que determinada cantidad de población se halla dentro de
determinado intervalo
Dado lo anterior se puede afirmar que la “curva normal” queda definida entonces por los
parámetros μ y σ, y de acuerdo a esta última característica tendremos una familia de
distribuciones según ellas (ver figura) , en donde μ desplaza la curva hacia la derecha cuando
crece (asimetría); y σ la hace más achatada cuando crece (curtosis), luego cuando μ=0 y σ=1,
tenemos el caso particular de distribución llamada distribución normal unitaria o estándar.
Frecuentemente, es con la CNU que se obtienen probabilidades para cualquier variable aleatoria
continua en estudio que tenga esta tendencia o comportamiento normal, y en lugar de utilizar la
fórmula matemática (función de densidad) se puede recurrir a unas tablas en que se nos
proporcionan las áreas bajo la curva normal para un valor definido de “z”. Antes de hacerlo y para
hacerlo (calcular probabilidades usando la CNU) es importante aclarar que para convertir una
variable aleatoria X en una variable aleatoria Z, es necesario estandarizar o tipificar los valores
de la Variable X, lo cual se puede hacer procediendo de la siguiente manera:
,
se dice entonces, que se ha tipificado o estandarizado la variable X, si sustituimos X en Z,
esto gráficamente es:
Ej.1.- Encontrar a partir de la distribución normal unitaria, el área bajo la curva, por encima del eje “z”
entre z=0 y Z = 2.21
0 2.21
A11z
1 A2
Paso1: hacemos un esquema para visualizar el área
Paso2: buscamos en la tabla de “áreas bajo la curva
normal tipificada de 0 a Z, el valor de A1=Az -1.25 y
A2=Az2.75 tenemos que:
Paso3: AT = A1 + A2 = 0.39435 + 0.49702
AT = 0.89137
P=89.137% aproximadamente
-1.25 0 2.75
Solución del literal c): puesto que los valores dados corresponden a una variable continua X, tendríamos
que hacerlo por integración, pero dado que ya existe un modelo estandarizado para una variable
aleatoria continua Z, en donde las probabilidades ya están determinadas para cada valor que esta
asuma, entonces mejor transformamos la variable aleatoria X a Variable aleatoria Z, proceso que
AT
-1.17 0 0.5
Problema 1.- Supóngase que la población del problema anterior son de los 287 estudiantes de
bioestadística que realizaron la PBANIPs y que por alguna razón estamos interesados en
seleccionar un estudiante al azar, entonces: ¿Qué probabilidad tendría este de:
Problema 2.- Si según las estadísticas el H: de maternidad atiende diariamente como promedio 60
partos de primerizas, (de los cuales el 35% son por cesárea), cuya edad media es de 25 años con una
varianza de 12.25 años, entonces:
a) ¿Qué probabilidad hay de que sea joven, aunque no mucho tampoco normal para ser primeriza?
b) ¿Qué probabilidad hay de que al tomar una mujer al azar ésta sea bastante mayor para ser
primeriza?
c) ¿Qué probabilidad hay de que al tomar una muestra de 17 parturientas se observe que:
c.1) ninguna tenga a su hij@ por cesárea ,
c.2) se observen al menos 3 cesáreas?, y
c.3) 14 de ellas tengan a su hij@ por vía vaginal ?
d) ¿Qué probabilidad hay de que al tomar una parturienta al azar esta tenga una edad
d.1.- mayor de 21 años,
d.2.- entre 27 y 31 años,
d.3.- sea menor de 18 o mayor que 35 años?
EJEMPLO 2.- supóngase que como producto de una investigación se observa que un 15% de las estudiantes
universitarias de “Y” universidad sale embarazada antes de terminar su tercer año de estudios, y que él 75% de
ellas deja el estudio como consecuencia de la situación, si para efectos de evaluar el fenómeno, ud toma
aleatoriamente y sin que se sepa 25 señoritas de nuevo ingreso, y se dispone a llevar el control respectivo, ¿Qué
probabilidad tiene de observar al final de 3 años que:
¿Qué probabilidad hay que al tomar una muestra de 15 señoritas que desertaron del estudio se observe que:
LA DISTRIBUCIÓN DE POISSON
En teoría de probabilidad y estadística, la distribución de Poisson es una
distribución de probabilidad discreta. Expresa la probabilidad de un número de
eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media
conocida, y son independientes del tiempo desde el último evento. En términos
concretos la probabilidad viene definida por la función de masa
Ejemplo de aplicación: solucionemos ahora nuestro anterior problema de partida para el tema,
esto es: ¿Qué probabilidad habría, en el caso de las universitarias que abandonan sus estudios
como consecuencia de embarazo, que 10 de las 600 que ingresan en “Y” facultad, se observe
que dejen de estudiar por tal motivo, dado que un nuevo estudio poblacional indique que sólo el
3.5% de la población lo hace por causa del embarazo de la estudiante?