Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
HIDROLO
GIA
INTRODUCCIN
Muchos procedimientos estadsticos suponen que los datos siguen algn tipo de modelo
matemtico que se define mediante una ecuacin, en la que se desconoce alguno de sus
parmetros, siendo stos calculados o estimados a partir de la informacin obtenida en un estudio
bien diseado para tal fin. Existen diferentes procedimientos para estimar los coeficientes de un
modelo de regresin, o para estimar los parmetros de una distribucin de probabilidad. De entre
esos procedimientos probablemente el ms verstil, ya que se puede aplicar en gran cantidad de
situaciones, y por ello uno de los ms empleado se conoce con el nombre de "mtodo de mxima
verosimilitud" (en ingls "method of maximum likelihood").
Aunque para aquellos que tiene una formacin estadstica este mtodo es perfectamente conocido
y comprendido, sin embargo muchos de los usuarios de los programas estadsticos, que estn
habituados a calcular modelos de regresin logstica, o modelos de supervivencia de riesgo
proporcional o de Cox, modelos de Poisson, y muchos otros, desconocen cmo se efecta la
estimacin de los coeficientes de esos modelos, por lo que nos parece adecuado dedicar una de
stas pginas mensuales a describir su filosofa e interpretacin. Por otro lado, no es infrecuente
que empleemos tcnicas de forma habitual y mecnica, sin conocer en qu se sustentan y en
ltima instancia en qu consisten realmente: no me cabe ninguna duda que casi todo el mundo
tiene claro qu es una distribucin de probabilidad normal, pero cunta gente que utiliza la t de
Student sabe qu es realmente eso?
Podemos considerar que el mtodo de mxima verosimilitud, abreviado a menudo como MLE, tal y
como hoy lo conocemos e interpretamos fue propuesto por Fisher (1890-1962), aunque ya de una
forma mucho ms artificiosa fue inicialmente atisbado por Bernoulli (1700-1782), cuyo
planteamiento fue revisado y modificado por su coetneo y amigo el gran matemtico Euler (17071783). Sin embargo la resolucin de los problemas numricos planteados por este mtodo en la
mayor parte de los casos son de tal magnitud que no ha sido posible su amplia utilizacin hasta la
llegada de los modernos ordenadores.
HIDROLO
GIA
se denomina estadstica.
Una estadstica que se utiliza para estimar una propiedad de una pdf (media,
varianza, etc.) se llama un estimador.
APLICACIONES
HIDROLO
GIA
aplicar los MMV en el marco de los modelos de vecindad es que permite ajustar y
comparar mltiples modelos que usen distintos atributos de los vecinos y/o formas
funcionales para seleccionar aquel con mayor soporte emprico. De esta manera, cada
modelo funcionar como un experimento virtual para responder preguntas relacionadas
con la magnitud y extensin espacial de los efectos de distintas especies coexistentes, y
extraer conclusiones sobre posibles implicaciones para el funcionamiento de comunidades
y ecosistemas. Este trabajo sintetiza las tcnicas de implementacin de los MMV y los
modelos de vecindad en ecologa terrestre, resumiendo su uso hasta la fecha y destacando
nuevas lneas de aplicacin
HIDROLO
GIA
poblacin es ms probable que observemos ese valor concreto de X en una muestra aleatoria de N
sujetos.
Supongamos que el nmero X de pacientes con cifras de tensin iguales o superiores al lmite
prefijado es de 60. Podemos plantear cul es la probabilidad de obtener 60 sujetos hipertensos en
una muestra de 200 personas si la prevalencia real fuera de p=0.2. Substituyendo esos valores en
la ecuacin [1] obtenemos P(X)=0.00022. Si la prevalencia real fuera p=0.3 el valor de P(X)
calculado sera 0.06146, mayor que el anterior; y si p=0.4 entonces P(X)=0.00082, que tambin es
menor que el calculado para p=0.3. El mtodo de mxima verosimilitud nos dice que escogeremos
como valor estimado del parmetro aqul que tiene mayor probabilidad de ocurrir segn lo que
hemos observado, es decir aqul que es ms compatible con los datos observados, siempre
suponiendo que es correcto el modelo matemtico postulado.
Obviamente no se trata de ir probando diferentes valores del parmetro, en este caso de la
prevalencia p, para ver cul es que proporciona un mayor valor de verosimilitud. La ecuacin [1],
una vez fijados en nuestro estudio N y X, es nicamente funcin de p, por lo que podemos
representar en una grfica el resultado de sustituir diferentes valores de p en esa ecuacin y
obtendremos una grfica como la de la figura 1, donde se ve que esa funcin tiene su valor
mximo para 0.3. Luego con ese modelo matemtico 0.3 es el valor de la prevalencia ms
verosmil de acuerdo con los datos que hemos obtenido en nuestro estudio (N=200, X=60)
Desde luego para poder representar esa grfica, salvo que dispongamos de un programa
adecuado, tambin tenemos que calcular cada pareja de valores (Verosimilitud,p) y adems
despus dibujarlos. Sin embargo existe un procedimiento matemtico para determinar el punto
mximo o mnimo de una ecuacin, que consiste en calcular la derivada de la funcin e igualar a
HIDROLO
GIA
cero. Se trata en realidad de determinar, de forma matemtica, la pendiente en cada punto (eso es
la derivada) y en el punto mximo sabemos que la pendiente es cero (basta mirar la figura 1). Si el
lector todava recuerda como se haca eso y prueba con la ecuacin [1], puede comprobar que el
mximo de esa funcin se obtiene para el valor de p calculado como X/N, que no es mas que la
proporcin de sujetos hipertensos observada en nuestro estudio, lo que por otro lado parece obvio,
pero resulta bastante tranquilizador que las matemticas corroboren algo que nos parece obvio, a
saber que la estimacin ms verosmil de una proporcin a partir de una muestra aleatoria
corresponde al cociente entre el nmero de sucesos partido por el tamao de la muestra. Sin
embargo este razonamiento es general y hay muchos casos en el que el resultado no es tan
sencillo y s es imprescindible la matemtica para estimar
los parmetros.
[2]
donde p es la probabilidad de que ocurra el suceso de inters y xi son los posibles factores
(factores de riesgo) que se piensa que estn relacionados con la probabilidad de que el suceso se
produzca.
Ahora a partir de los datos de la muestra, para los que hemos observado si se ha producido o no el
suceso, y a partir de los valores de los factores de riesgo en cada caso de la muestra, se trata de
estimar los valores de los coeficientes bi en el modelo para cada factor de riesgo, lo que entre otras
cosas nos permite calibrar el efecto de esos factores en la probabilidad de que el suceso ocurra. Si
denominamos de forma compacta a esos coeficientes con la letra b (vector de valores), y dado que
los valores de los factores x son conocidos para cada sujeto, la probabilidad p es funcin de los
coeficientes b, y lo representamos como p=f(b).
Si p es la probabilidad de que ocurra el suceso, la de que NO ocurra ser 1-p, y entonces en los
sujetos en los que ocurri el suceso vendr dada por p(xi), mientras que para un sujeto en el que
NO ocurre el suceso, se calcula como 1-p(xi). Siendo ambas expresiones funcin de b.
HIDROLO
GIA
HIDROLO
GIA
esa cantidad se denomina desviacin (deviance en ingls; en algn lugar la he visto traducida cono
"desvianza", trmino que no creo que exista en nuestro idioma y que a mi particularmente no me
suena bien).
La desviacin nos permite comparar modelos, por ejemplo un modelo que incluye una variable
adicional:
G=D(modelo 1 sin la variable) - D(modelo 2 con la variable) =
que se distribuye segn una chi2 con grados de libertad igual a la diferencia de parmetros entre
modelos, que este caso es 1 grado de libertad. Se le denomina contraste de verosimilitud. Si el
contraste resulta ser no significativo aceptamos que la incorporacin de la nueva variable no
mejora sensiblemente la verosimilitud del modelo y por tanto no merece la pena incluirla en l.
Tambin en las salidas de los programas suele aparecer el trmino likelihood ratio o cociente de
verosimilitud para un modelo, sin que se especifique que se est contrastando con otro diferente.
En estos casos el contraste es frente al modelo que slo incluye el trmino constante y por tanto no
se consideran las variables X o los factores de riesgo, y se compara con el modelo que s incluye
las variables, por lo que ahora esa cantidad se distribuye segn una chi2 con grados de libertad
igual al nmero de variables incluidas en el modelo, que es la diferencia frente al modelo con solo
la constante. Al igual que antes, si el contraste resulta no significativo pensamos que incluir el
conocimiento de las variables X no mejora significativamente la verosimilitud del modelo y por lo
tanto se trata de un modelo sin utilidad.
Aadiendo ms trminos, ms variables, a un modelo la funcin de verosimilitud mejorar y si la
muestra es grande ser difcil distinguir mediante el contraste del cociente de verosimilitud entre
una mejora "real" y una aportacin trivial. El modelo perfecto no existe, puesto que todos
constituyen simplificaciones de la realidad y siempre son preferibles modelos con menos variables,
puesto que adems de ser ms sencillos, son ms estables y menos sometidos a sesgo. Por ello
se han propuesto otras medidas de contraste entre modelos que penalizan en alguna medida que
stos tengan muchos parmetros.
Las ms conocidas y que suelen figurar en las salidas de ordenador son el criterio de informacin
de Akaike, AIC, y criterio de informacin bayesiano, BIC.
HIDROLO
GIA
Supongamos que tenemos una m.a.s. (X1, ..., Xn) de una v.a. discreta con distribucion
P(x|) conocida salvo por los parametros
Una vez realizada la muestra tenemos (x1, ..., xn) y estamos interesados en encontrar un
estimador del parametro que maximice la probabilidad de la muestra.
p(x1 = x1, ..., xn = xn) = qn i=1 p(xi = xi) = qn i=1 p(xi |) = l(|(x1, ..., xn)) l()
y la denominaremos funcion de verosimilitud.
Caso continuo
Supongamos ahora que tenemos una m.a.s (X1, ..., Xn) de una v.a. continua con funcion
de densidad f(x| conocida salvo por los parametros
Una vez realizada la muestra tenemos (x1, ..., xn) y estamos interesados en encontrar un
estimador del parametro que maximice la funcion de densidad conjunta de la muestra.
HIDROLO
GIA
f(x1, ..., xn) = Qn i=1 fXi (xi) = Qn i=1 f(xi |) = l(|(x1, ..., xn)) l()
y la denominaremos funcion de verosimilitud.
Propiedades
asintoticamente
centrados,
el
de
maxima
necesario determinar los valores para los cuales la derivada de la verosimilitud se anula, pero por
definicin la verosimilitud es un producto de probabilidades o de densidades, lo cual puede ser
bastante complicado de derivar. Es preferible derivar una suma, y es por esto que comenzamos por
substituir la verosimilitud por su logaritmo. Al ser el logaritmo una funcin creciente, es equivalente
HIDROLO
GIA
maximizar
de
para el cual la derivada se anula, hay que asegurarse con la ayuda de la segunda derivada
que el punto en cuestin es realmente un mximo. Trataremos a continuacin los casos de algunas
familias clsicas.
. Si
. El parmetro desconocido
Su logaritmo es:
es:
HIDROLO
GIA
es efectivamente un mximo. Si
es
, el parmetro desconocido
Si
Su logaritmo es:
es:
es
es:
HIDROLO
GIA
es efectivamente un mximo. Si
es
es:
parmetro
es el inverso de la esperanza.
reales positivos
ella vale:
Su logaritmo es:
-tupla de nmeros
HIDROLO
GIA
es:
es efectivamente un mximo. Si
es:
parmetro
es
Leyes normales: Para un parmetro multidimensional el principio es el mismo, pero los clculos de
optimizacin son ms complicados. Para las leyes normales hay dos parmetros desconocidos.
Para evitar confusiones en las notaciones de las derivadas, denotaremos por
. Para una
verosimilitud vale:
al parmetro de la
la
Su logaritmo es:
son:
y
Las segundas derivadas parciales son:
HIDROLO
GIA
HIDROLO
GIA
Por tanto la matriz hessiana (matriz de las segundas derivadas parciales) en el punto
Sus
Si
valores
propios
son
negativos,
el
punto
es
efectivamente
de mxima verosimilitud de
es:
un
mximo.
, los estimadores
HIDROLO
GIA
CONCLUSIONES:
funciona, puesto que, la funcin de densidad Normal est definida en el intervalo (-, +).
HIDROLO
GIA
Jacknife.
Si tratamos de estimar la mediana poblacional es mejor utilizar la estimacin convencional,
ya que para tamaos muestrales impares el metodo Jacknife no funciona y para tamaos
muestrales pares funciona pero proporciona los mismos resultados que el mtodo de
HIDROLO
GIA
BILIOGRAFIA
http://www5.uva.es/estadmed/inferen/estima_punt/t9metod_mve.
htm
http://digital.csic.es/bitstream/10261/12314/1/Ceratitis%20y
%20Dacus%20m%C3%A1xima%20verosimilitud.pdf
https://es.wikipedia.org/wiki/M%C3%A1xima_verosimilitud
http://www.seh-lelha.org/maxverosim.htm
http://es.slideshare.net/pedroanzurez/maxma-verosimilitud
HIDROLO
GIA