Sei sulla pagina 1di 6

Objetivo del artículo: Mejorar el entendimiento de las Estadísticas Bayesianas

1. Un problema científico

Se toman 12 chinches y se lanzan sobre un paño con las siguientes condiciones:

 El chinche está en buenas condiciones.


 La forma en que se hacen los n lanzamientos no influyen en la forma en que caen. U: Caen por la
parte superior y D: Cae por la parte inferior.
 No se realiza trampa en el conteo, es decir, no hay sesgo, los lanzamientos son continuos.

n: 12, U: 9, D: 3.

Problema: Cual es la probabilidad de que en el treceavo lanzamiento el chinche caiga por la parte superior
(U).

Karl Pearson (1920): Fundador de la estadística moderna. En (n1) ocasiones se ha observado un evento (r1)
veces. ¿Cuál es la probabilidad de que en (n2) otras ocasiones ocurra (r2) veces? Tenemos (n1) = 12, (r1) = 9,
(n2) = (r2) = 1

El problema surge con los ensayos repetidos, cada uno de los cuales puede dar uno de dos resultados
(arriba, abajo, cabezas, colas, macho, hembra, éxito, fracaso, muerto, vivo).

Un estadista no bayesiano requiere más información intuitiva y no puede realizar procedimientos


estadísticos estándar, no podrá usar una prueba de significancia, una estimación imparcial con error estándar
o hallar un intervalo de confianza.

Prueba de Hipótesis o significancia:

Ho: El chinche no está sesgado. P(U)=P(D).

Hi: El chinche esta sesgado.

Arbuthnot (1710) rechazo la prueba de hipótesis con la que buscaba explicar de que los nacimientos
masculinos y femeninos ocurren con igual frecuencia y concluyó que esta desigualdad de Hombres y Mujeres
no es el Efecto del azar sino la Divina Providencia.

La obtención de U=9 de n=12 sugiere que la probabilidad de que caiga sobre su parte superior Excede el 50%
(1/2). Los resultados que apoyan aún más esta sugerencia son: (10,2) (11,1) y (12,0)

De modo que, en la hipótesis nula, la probabilidad del resultado observado, o más extrema, es:
12

{( ) ( ) ( ) ( )}( )
12 + 12 + 12 + 12
3 2 1 0
1
2
=7.5

El 7.5% no es significante a un nivel de 0,5%.

J. B. S. Haldane (1945): lanzamientos hasta que D=3. Con esto los valores extremos son: (10,3) (11,3) (12,3) y
la probabilidad es 3.271%, significante a un vivel de 0,5%. Con lo anterior se concluye que la significancia que
se asocia con la hipótesis de la igualdad de probabilidades depende en gran medida de que otros resultados
se podrían haber logrado, además de los U=9 y D=3 reportados.

Otra forma de describir la significancia es definir la Regla de Detención, es decir un máximo de experimentos.
Para el ejemplo se da hasta que la esposa le llama a tomar café. Se pueden definir otras reglas de detención
pueden ser hasta que D=3 o n=12.
2. Análisis Bayesiano.

El análisis Bayesiano utiliza la secuencia observada de lanzamientos buscando que el resultado obtenido en
cualquier lanzamiento será equivalente al de cualquier otro. La posición y el orden son irrelevantes para
cualquier longitud de secuencia n ya que cada una es independiente y tienen la misma probabilidad.

Finetti (1937) define las secuencias intercambiables como el orden los éxitos.

El Ensayo de Bernoulli es una secuencia familiar de ensayos independientes con probabilidades constantes θ
r s
de éxito donde no importa el orden. Tiene probabilidad p (θ )=θ ( 1−θ ) independientemente del
orden de los éxitos y fracasos.

Sean: n: # de ensayos (lanzamientos), r: # de éxitos y s: # de fracasos, entonces r+s: n.

De lo anterior se prueba que


1
r 8
p ( r , s ) =∫ θ ( 1−θ ) p ( θ ) dθ=1
0

Las características de la anterior función de probabilidad continua sobre el intervalo unitario son que no es
1
negativa e integra a 1. Para algún p (θ ) ≥ 0 con ∫ p ( θ ) dθ=1 por lo que p(n)=1.
0

La proporción de U en secuencias intercambiables tiende a un límite a medida que la secuencia se alarga


indefinidamente, y este límite tiene la distribución descrita por p (θ ) . El caso especial de los ensayos de
Bernoulli, donde la distribución se concentra en un solo valor, muestra que la ley de los grandes números es
un caso especial del teorema de Finetti.

En el sentido bayesiano θ es una proporción de r/n, así:

p ( U 13|9,3 )= p ( 10,3 ) / p ( 9,3 )

Reemplazando por la fórmula de Finetti se debe obtener el mismo resultado que con el teorema de Bayes.
1
p ( U 13|9,3 )=∫ θ {θ9 ( 1−θ )3 p (θ ) dθ/ p ( 9,3 ) }
0

Aplicando la distribución de Bayes:


1
p ( U 13|9,3 )=∫ θp ( θ|9,3 ) dθ .
0

Se concluye que, aplicando la hipótesis de intercambiabilidad, el argumento bayesiano se mantiene.

3. Interpretación de p (θ ) y su efecto en p (θ|r , s ) .


Suponiendo que p (θ ) tiene una distribución Beta con parámetros a,b>0, se evidencia que si a crece r y b
crece s, sin importar el resultado del experimento la distribución permanece de la forma Beta.

p (θ|r , s ) α θr ( 1−θ )s p ( θ ) α θ r+ a−1 ( 1−θ )s+ b−1


Con lo anterior, la probabilidad puede insertar en el resultado general como:

a+r
p ( U n+1|r , s ) =
a+ b+n
Para el experimento de la probabilidad de que el “Chinche” caiga por su parte superior U en el treceavo
lanzamiento es (9 + a) / (12 + a + b), se concluye que el experimento genera secuencias intercambiables,
mediante una distribución Beta con valores a y b. En particular, la regla de detención o el espacio muestral es
irrelevante.

Los argumentos estadísticos usan la regla de detención o espacio de muestra y el argumento bayesiano usa
la distribución p (θ ) .

Los ensayos de Bernoulli son un caso especial de ensayos intercambiables.

¿Qué significa p (θ ) ? θ es la frecuencia a largo plazo del evento, U en este caso.

Para el investigador, una distribución razonable para θ en el caso de un “Chinche” es 6 θ ( 1−θ ) : a


saber, Beta con a = b = 2.

En el experimento se considera que U y D son simétricas por lo que toman valores cercanos a 1/2. Bayes
tomó originalmente a = b = 1. Por lo tanto, la probabilidad de que el decimotercer lanzamiento sea U es,
11 10
=0,69 , para Bayes, =0,71 , una diferencia relativa de aproximadamente 3%.
16 14
Los análisis ortodoxo y bayesiano difieren en sentido práctico. El bayesiano siempre es más complicado ya
que tiene en cuenta otras variables como por ejemplo el conocimiento de la industria, según sea el caso.

4. Ejemplo:

Se plantea el ejemplo de las Freesias, para las cuales su aroma no es perceptible para cualquier persona, se
entiende que este fenómeno responde a un desorden génico, se quiere conocer la proporción θ de las
personas que pueden percibir el aroma de las Freesias.

De acuerdo a lo anterior, por análisis bayesiano el p (θ ) corresponde a la función de densidad que


representa el % de personas que pueden percibir el olor de las freesias.

Se toma una muestra de las personas y, a partir de las observaciones sobre las medias de la muestra, se
hacen inferencias sobre θ.

Se sabe que cada evento E es igual mente probable, por lo que se define que el experimento tiene
distribución uniforme que se relación a una distribución Beta con parámetros a,b=1, pero de acuerdo al
ejemplo se considera que la mayor parte de la población puede percibir el olor por lo que se definen los
parámetros a=3 y b=2. Con lo anterior se identifica que la mediana de esta distribución, que se encuentra en
las tablas de la distribución acumulativa (Pearson & Johnson, 1968) es 0,61, así se define que θ está en el
intervalo de 0,61 a 1 sin embargo se considera que es una distribución demasiado dispersa.
Posteriormente se toma una muestra de 43 personas de las cuales 36 perciben el aroma y 7 no (notese que
no se requiere la secuencia real de éxitos y fracasos ni la regla de detención). Suponemos que las personas
en este experimento son intercambiables, con respecto a la capacidad de oler freesias, con las personas cuya
propensión estamos tratando de evaluar. Esto es necesario para que los resultados de esta investigación
generalizen a la población en general.
r +a−1
Se calcula p (θ|r , s ) α θ ( 1−θ )s +b−1 con parámetros a + r y b + s. En el experimento, a y b son los
parámetros originales, cuyos valores se evaluaron en 5 y 2,5.

Sea r=36 y s=7 se obtienen nuevos valores de parámetro de 41 y 9,5.

Comparando las dos distribuciones, la primera se basa en información que no tiene en cuenta los datos del
experimento y la segunda que contempla una muestra se evidencia que la primera contiene la mayor parte
de los datos de θ entre 0,2 y 1,0 y la segunda en el intervalo 0,65 a 0,95 siendo este un intervalo más
acotado con menor desviación estandar. La media calculada en los dos escenarios como:

a+ r
( a+r ) + ( b+ s )
41
=0,81
( 41 ) + ( 9,5 )
En una versión mas cercana:

a+r −1
=0,82
( a+r−1 )+ ( b+ s−1 )
La desviación estándar:

√ ( a+r )( b+ s )
2
( a+ r +b+ s ) ( a+ r+ b+ s+1 )
=0.545

El intervalo de confianza para un nivel del 95% es

p ( 0,70≤ θ ≤ 0,91 )=0.95


Con lo que podemos definir que hay un 95% de probabilidad de que el verdadero valor de θ esté entre 0,70 y
0,91.

Si está interesado en saber si θ es mayor o menor que un valor específico θ¿ . Es fácil encontrar
θ¿ ¿
p (θ >θ¿ ) calculando el área bajo p (θ|r , s ) a la derecha de . Por ejemplo, si θ =0.5
entonces:

1
p (θ >0,5 )=∫ p (θ|r , s ) d θ=0.9999983
0.5

Se puede decir con certeza que más de la mitad de la población puede oler freesias.

Potrebbero piacerti anche