Modelos Lineales Generalizados

SOLUCIÓN AL SEGUNDO TALLER DE MODELOS LINEALES GENERALIZADOS
R. Verdadero. Ya que el modelo ahora contempla distribuciones de respuesta de Y del componente

aleatorio, que pueden ser como la normal, la Bernoulli, la Binomial, la Poisson, la Gamma entre
otras. Además la componente sistemática en el predictor lineal, puede ser continua o discreta,
binaria, proporciones o conteos.
R. Verdadero. La medida de tendencia central de la variable aleatoria es , y en este caso el

parámetro de dispersión es el cual se debe multiplicar por la varianza del valor esperado ,
para obtener la varianza de Y.
R. Verdadero. La función de densidad o la función de probabilidad de una variable aleatoria Y que

pertenece a la FED es: . Para el caso de una variable aleatoria Y
binomial la función de probabilidad es de la forma: , que implica que .
Para el caso de una variable aleatoria Y de Poisson la función de probabilidad es de la forma:
, que implica que .
Para la distribución normal la función de densidad es , para la poisson la

función de probabilidad es , la función de densidad gamma es
, la función de densidad normal inversa es
, para las cuales implica que qk = 1.
R. Verdadero. Para el modelo normal se tiene , que implica = *V(k), es decir V(k)
debe ser 1. Para el modelo binomial se tiene , que implica (k(1-k)/mk)=(1/mk)* V(k),
es decir V(k) debe ser (k(1-k). Para el modelo poisson se tiene , que implica V(Yk)=
V(k), es decir V(k) debe ser k. Para el modelo Gamma , que implica (1/alfa)*
(k)^2=(1/alfa)* V(k), es decir V(k) debe ser k^2. Para el modelo normal inverso , que
implica (1/lamba)* (k)^3=(1/lamda)* V(k), es decir V(k) debe ser k^3.
1
R. Verdadero. Ya que la variable Y tiene distribución: , es decir, varianza constante y
la media puede cambiar dependiendo del predictor lineal que corresponde a cada individuo.
R. Verdadero. Ya que la variable Y tiene distribución , es decir, es constante y

corresponde al coeficiente de variación, y la media puede cambiar acorde a la función inversa de la
función de enlace del predictor lineal que corresponde a cada individuo.
R. Verdadero. Ya que todas estas funciones de enlace cumplen con = , siendo

una función de la media, que se puede incluir en la función de densidad o función de probabilidad
de la familia exponencial de dispersión (FED):
R. Verdadero. Ya que las varianzas dependen del valor estimado de la media. Para el caso binomial
( ), para Poisson ( ), para la Gama ( ) y para la normal inversa (
).
R. Verdadero. La función de escore se puede escribir como ( ), si la función de

enlace es canónica se simplifica a ( ). La matriz de información esperada de Fisher se
puede escribir como ( con ), si la función de enlace es canónica, W se reduce
a( ).
R. Falso. Para que haya solución cerrada al estimador de máxima verosimilitud de beta, se requiere
que y que la función de enlace sea la canónica, es decir en este caso la identidad.
R. Verdadero. La matriz de información observada de Fisher se puede escribir como

, si la función de enlace es la canónica se puede escribir como , con ; la matriz
de información esperada de Fisher se defina como , que se puede escribir como
con , si la función de enlace es la canónica se simplifica a ,
es decir, las matrices de información observada y esperada de Fisher coinciden.
2
R. Verdadero. Beta estimado es la única solución al sistema de p ecuaciones no lineales de
si ella existe, y para ello se requieren al menos n=p que den la información suficiente para resolver
el sistema.
R. Falso. no dependen de beta, por lo tanto el beta estimado de la expresión del
logaritmo de la función de verosimilitud de beta , se
puede reducir a , es decir, beta estimado no depende de .
R. Falso. Están intercambiadas las expresiones de beta (t+1). En el algoritmo de Newton Raphson
, en el de Scoring de Fisher , donde la
matriz de información observada de Fisher es y la matriz de información esperada
de Fisher es .
R. Verdadero. Coinciden ya que la matriz de información observada de Fisher y la matriz de

información esperada( ) coinciden.
R. Verdadero. Por la ley débil de los grandes números se puede concluir que:
para todo , es decir, y se parecen más y más en la medida en que el
tamaño de muestra aumenta, de modo que las soluciones a los sistemas
también se parecen más y más al aumentar n. Esto implica o
lo que es lo mismo, que beta estimado es un estimador consistente del valor verdadero de beta
(para todo , ). Por otro lado para tamaño de muestra grande
lo cual implica (distribución asintótica normal de beta), es

decir beta estimado tiene distribución normal con media beta y varianza , cuya raíz cuadrada
de los elementos de la diagonal principal dará los errores estándar.
R. Verdadero. Ya que el test de Wald para grandes tamaños de

muestra: y ,donde =0.
3
R. Verdadero. Para modelos con respuesta normal, gama y normal inversa, un estimador del
parámetro de dispersión se puede escribir como (a partir de la consistencia de beta y la ley de los
grandes números): , en la cual a reemplazar la varianza da las

expresiones citadas, ya que la varianza para la normal es independiente de la media, en la gama
depende de la media al cuadrado y en la normal inversa depende de la media al cubo.
R. Falso. Cuanto mayor es el desvío es mayor la evidencia de que el modelo bajo estudio no se ajusta
bien a los datos, ya que .
R. Verdadero. La expresión de Akaike y del BIC , disminuyen

en la medida que haya mejor ajuste, lo cual se mide con el primer término, y ambas penalizan la
complejidad del modelo con el segundo término aumentando hacia positivo con el número de
parámetros. Es decir ambos miden la calidad de ajuste global penalizando la excesiva complejidad.
2. Se ajusta un modelo con respuesta binomial o poisson usando la función glm() de R y el resultado
se guarda en el objeto fit. A partir de esta información relacione las dos columnas que se presentan
a continuación:
(A) X __I__AIC(fit)
(B) ˆβ=(ˆβ1,…,ˆβp)⊤ ___J___BIC(fit)
(C) [K(ˆβ)]−1 __C__vcov(fit)
(D) ˆμ=(ˆμ1,…,ˆμn)⊤ ___A___model.matrix(fit)
(E) D*(y,ˆμ) __B__coef(fit)
(F) D*(y,ˆμº) __F__fit$null.deviance
(G) P*(y,ˆμ) __H__logLik(fit)
(H) ℓ(ˆβ) __D__fitted(fit)
(I) −2ℓ(ˆβ)+2p __E__deviance(fit)
(J) −2ℓ(ˆβ)+log(n)p __G__sum(resid(fit,type="pearson")2)
¿Qué cambios se tendrían si el modelo considerado no tuviera respuesta binomial o poisson sino
respuesta normal, Gama, o normal inversa?
R/: El parámetro de dispersión ˆμ de la binomial, en la Gamma es reemplazado por ˆλ, en la normal

por ˆσ y en la normal inversa por ˆφ.
4
Si el modelo considerado tuviera respuesta normal D(y, ˆμ) y P(y, ˆμ) coinciden, reduciéndose ambos
a ser la suma de cuadrados de los residuos. En una respuesta gamma, D*(yk,ˆμk) se reduce a 2[(yk
− ˆμk)/ˆμk + log(ˆμk/yk)], y en una Normal inversa, D*(yk,ˆμk) se reduce a (yk − ˆμk)2/ˆμ2kyk.
En la respuesta normal y normal inversa, los criterios de calidad de ajuste tienen las siguientes
funciones de máx. verosimilitud: AIC = −2ℓ(ˆβ) + 2(p + 1) y BIC = −2ℓ(ˆβ) + log(n)(p + 1), mientras que
en la Poisson son: AIC = −2ℓ(ˆβ) + 2p BIC = −2ℓ(ˆβ) + log(n) p, y en la Gamma: AIC = −2ℓ(ˆβ) + 2(p
+ 1) BIC = −2ℓ(ˆβ) + log(n)(p + 1).
3. (Dobson y Barnett (2008, página 140)) Una muestra de personas de edad avanzada fue sometida
a un examen psiquiátrico para determinar si estaban presentes los síntomas de senilidad. Al mismo
tiempo, a cada persona se le aplicó la escala de inteligencia de Wechsler. A seguir se describe los
puntajes obtenidos en la escala de Wechsler junto con la presencia (1) o ausencia (0) de síntomas
de senilidad.
A) Ajuste modelos de respuesta binaria con funciones de enlace logit, probit y complemento log-
log. Use el desvió y los criterios AIC y BIC para seleccionar el “mejor” modelo.
El modelo por ser de respuesta binaria generalizado

Yk ∼ Bernoulli (μk),
g(μk) = β1 + β2xk2,
Y1, . . . , Yn independiente.
Explicaríamos los siguientes enlaces.
Logit link: g(μk) = log(μk/(1 − μk)
Probit link: g(μk) = (μk)
Complementary log-log link: g(μk) = log(−log(1 − μk)).
Los puntos se distribuyen:
5
La única variable que afecta la detección de a senilidad es el valor del resultado del examen escala
Wechsler.
Final model:
senilidad ~ 1 + Escala_W
El mejor modelo es Final model: senilidad ~ 1 + Escala_W con un enlace Link: probit. Al comparar
los criterios AIC y BIC con valores de 54.9836 y 58.9615.
B) Use las estadísticas de Wald y razón de verosimilitudes para evaluar, al nivel de significancia
aproximado de 5%, si la probabilidad de presentar síntomas de senilidad depende del puntaje
en la escala de inteligencia de Wechsler.
El test de Wald en p-value con el nivel de significancia del 5%:
6
No hay evidencia estadística de que el B2 sea 0 es decir la probabilidad de presentar sintomas de
senilidad depende del puntaje en la escala de inteligencia de Wechsler.
Con el Test de verosimilitudes usando la función ANOVA con test “LRT”:
Se rechaza la hipótesis nula, donde la diferencia del modelo final con el modelo nulo es igual a 0 por
lo anterior se procede con el modelo final ya que es diferente al modelo nulo.
C) Realice el análisis de diagnóstico al modelo seleccionado (análisis residual y análisis de

sensibilidad). Comente.
El análisis residual y la curva envelope nos muestra el siguiente resultado:
7
El cambio entre los puntos contra el modelo de resultado binario es adecuado, ya que los puntos
aunque variantes por la función de enlace normalmente se encuentran dentro del rango de
aceptación de las diferencias con la observación.
El punto 51 se muestra como dato que puede ser influenciador en el modelo, comparamos el
modelo con y sin el punto y por el p-valor menor a 0.05 podemos concluir que el modelo se adecua
a todos los puntos y que el cambio que ocurre al no contemplar la observación 51 no es
estadísticamente significativo.
D) Interprete las estimaciones de los parámetros excepto el intercepto.
8
Los parámetros del modelo son Beta2=-0.18801 y valorando nuestro resultado el cual si tiene
senilidad (1) y no tiene senilidad (0), por lo anterior nos indica que a mayor valor en la escala de
Wechsler hay menor probabilidad de tener senilidad. Como ejemplo para una persona que tiene
un resultado en la escala de Wechsler de 10, y= 1.38616-0.18801*(10)= -0.49394, es decir, es menor
que cero por lo anterior la posibilidad de senilidad es baja. Con un resultado de 5 el resultado 0.446
es decir aumenta la posibilidad de tener senilidad pero aun es más probable que no tenga senilidad.
E) Estime la probabilidad que una persona con 15 puntos en la escala de Wechsler tenga síntomas
de senilidad. Haga esta estimación “manualmente” y usando la función predict().
La estimación para el modelo nos indica.

Probit link: g(μk) = (μk)
Donde
Para la estimación manual lo realizamos con el siguiente código.

pnorm(betas%*%c(1,15)) donde betas son betas<-coef(fit2) y c(1,15) son 1 que acompaña a al
intercepto y 15 valor de con el cual vamos a estimar.
Pnorm nos da la densidad de probabilidad acumulada, la estimación es
9
Punto 4
plot(Dosis,100*Porcentaje,pch=20,xlab="Dosis de plaguicida",ylab="Tasa de mortalidad

(%)",col="blue")
10
Se observa que a medida que incrementa la dosis de plaguicida, la proporción o tasa de mortalidad
aumenta. Se observa relación directamente proporcional entre la dosis y las muertes en los
individuos.
fit1 <- glm(Porcentaje ~ Dosis, weights=Expuestos, family=binomial(link="logit"))

fit2 <- glm(Porcentaje ~ Dosis, weights=Expuestos, family=binomial(link="probit"))
fit3 <- glm(Porcentaje ~ Dosis, weights=Expuestos, family=binomial(link="cloglog"))
Al parecer, y tomando los datos de la gráfica, se evidencia que las curvas logit y probit son las que
más se asemejan al comportamiento de los datos. La función de enlace cloglog está más alejada del
1er y 4to punto, por lo que no logra representar tan bien los datos como las otras dos funciones de
enlace.
Family: binomial
Link: logit
Df Value
Residual deviance 3 1.3481
Pearson's statistic 3 1.3387
Adjusted R-squared based on the residual deviance 0.9814
Adjusted R-squared based on the Pearson's statistic 0.9795
-2*log-Likelihood 20.5685
AIC 24.5685
BIC 23.7873
Family: binomial
Link: probit
11
Df Value
AIC 24.8590
BIC 24.0779
Family: binomial
Link: cloglog
Df Value
AIC 27.2559
BIC 26.4747
Según lo observado, el mejor modelo para el análisis de datos es usado con la función de enlace
Logit, ya que su criterio AIC y BIC es menor en comparación con las otras dos funciones de enlace.
Además, el R2 ajustado para este modelo es mayor en comparación con los otros. (Ver tabla
resumen).
Call:
glm(formula = Porcentaje ~ Dosis, family = binomial(link = "logit"),
weights = Expuestos)
Deviance Residuals:
1 2 3 4 5
-0.1195 0.1500 -0.3136 0.8664 -0.6800
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.8387 0.6377 -7.588 3.24e-14 ***
Dosis 7.0681 0.8826 8.009 1.16e-15 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 96.6881 on 4 degrees of freedom

Residual deviance: 1.3481 on 3 degrees of freedom
AIC: 24.568
12
Number of Fisher Scoring iterations: 4
Usando el Test de Ward a un nivel de significancia del 5%, se evidencia que la concentración del
plaguicida afecta la proporción de que los insectos mueran. Es decir, a mayor cantidad de plaguicida,
mayor es el chance de que los insectos mueran, rechazando así la hipótesis nula.
Analysis of Deviance Table
Model 1: Porcentaje ~ 1
Model 2: Porcentaje ~ Dosis
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 4 96.688
2 3 1.348 1 95.34 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Usando el test de razón de verosimilitud (1-pchisq(95.34,1)=0), evidenciamos que la dosis es

significativa a un 5 %. Con esto, se determina que la dosis es totalmente influyente en el chance de
mortalidad de un insecto.
ANÁLISIS DE RESIDUOS
Se evidencia que la mayoría de los puntos. Gráficamente no hay evidencia que un dato esté sub o
sobre estimado.
13
ANÁLISIS DE SENSIBILIDAD
Detección de observaciones a ser influyentes. El dato 4 es el más influyente en los datos.
Hace la diferencia entre todos los individuos y el que deseamos excluir: Para este caso, no existe
diferencia, ya que los valores cambian levemente y el valor p sigue indicando que cada variable es
significativa (para la dosis, el valor p tiende a cero, lo cual lo hace significativo).
Se evidencia que los residuos tienen un comportamiento según la distribución asignada, ya que
ninguno de los valores sale de los límites a un 99% de confianza.
Estimación con PREDICT():
14
 predict(fit1,data.frame(Dosis=0.75),type="response")= 0.6135
Estimación Manual:
 mu=exp(-4.8387+7.0681*0.75)/(1+exp(-4.8387+7.0681*0.75))= 0.6135
Punto 5
Se exporta la información de la siguiente manera:
library(ssym)
library(readxl)
source("macros_v2.txt")
Cancer_higado <- read_excel("Cancer_higado.xlsx")

Cancer_vejiga <- read_excel("Cancer_vejiga.xlsx")
attach(Cancer_higado)
attach(Cancer_vejiga)
He iniciamos con la descripción del Cáncer de Vejiga

Un gráfico de los datos para ilustrar su comportamiento:
plot(Dosis_V,100*Enfermos_V/Expuestos_V,pch=20,xlab="Dosis de carcinógeno",ylab="Tasa de
Rata con Cancer Vejiga(%)",col="red")
15
Los datos tienen un comportamiento ascendente
a medida que la dosis aumenta. No es simétrico,
no sugiere modelo lineal.
Definiendo el modelo sugerido, tenemos lo siguiente:
fit1 <- glm(Enfermos_V/Expuestos_V ~ Dosis_V, weights=Expuestos_V,

family=binomial(link="logit"))
Procedemos con descripción de Cáncer de Hígado, la descripción grafica de los datos
plot(Dosis_H,100*Enfermos_H/Expuestos_H,pch=20,xlab="Dosis de carcinógeno",ylab="Tasa de
Rata con Cancer Hígado(%)",col="blue")
Los datos tienen un comportamiento ascendente a

medida que la dosis aumenta, sin embargo, la
velocidad es mayor respecto al cáncer de vejiga.
Definiendo el modelo sugerido, tenemos lo

siguiente:
fit2 <- glm(Enfermos_H~ Dosis_H + offset(log(Expuestos_H)), family=poisson(link=log))
16
Cáncer de Vejiga
La hipótesis nula
(B2=0) a un nivel
de significancia
del 5%, se rechaza
dado que el
pr(>|t|)= <2e-16
*** para la
variable Dosis_V.
Es decir, a mayor
dosis, mayor es el
chance de que las
ratas tengan
cáncer de vejiga.
En cuanto a la razón de verosimilitud:
fit11<glm(Enfermos_V/Expuestos_V~1,weights=Expuestos_V,family=binomial("probit"))
Nos sugiere que la dosis es

significativa a un 5%. La
dosis es influyente en el
chance de que la rata
contraiga cáncer de vejiga.
Cáncer de Hígado
La hipótesis nula (B2=0) a un

nivel de significancia del 5%, se
rechaza dado que el pr(>|t|)=
<2e-16 *** para la variable
Dosis_H. Es decir, a mayor dosis,
mayor es el chance de que las
ratas tengan cáncer de Hígado
En cuanto a la razón de
verosimilitud:
17
fit22<-glm(Enfermos_H~1,family=poisson(link=log))
Nos sugiere que la dosis es significativa a un 5%. La dosis es influyente en el chance de que la rata
contraiga cáncer de Hígado.
Cáncer de Vejiga
Análisis de Residuos: De acuerdo con el resultado, no se evidencia un score sobre estimado o
subestimado para algún dato.
residuals_glm(fit1)
Análisis de sensibilidad: Se identifican dos puntos sospechosos (2, 7)

Cookdis_glm(fit1,identify = 2)
18
Al mantenerse las mismas conclusiones sin estos puntos, se llega a la conclusión de que el modelo
no es sensible a su ausencia.
Cáncer de Hígado
Análisis de Residuos: De acuerdo con el resultado, no se evidencia un score sobre estimado o
subestimado para algún dato.
residuals_glm(fit2)
Análisis de sensibilidad: Se identifican un punto sospechoso (8)

Cookdis_glm(fit2,identify = 1)
19
Al mantenerse las mismas conclusiones sin estos puntos, se llega a la conclusión de que el modelo
no es sensible a su ausencia.
Cáncer de Vejiga
Beta 2 de Vejiga: Si aumenta la dosis, mayor es la probabilidad de tener cáncer.
Cáncer de Hígado
Beta 2 de Hígado: El resultado de la dosis es positivo y significativo, a mayor dosis, mayor el número
de ratas con cáncer de hígado.
20
R. Bajo los tres criterios el mejor modelo es el de la función de enlace log, ya que el desvío, el AIC y
el BIC toman los menores valores.
21
R. Mediante el test de Wald se ve que el tiempo de funcionamiento en el modo 2 no tiene un efecto
significativo en el número de fallas (p valor mayor al 0.05) y ya que en el test de razón de
verosimilitudes también se acepta la hipótesis nula, entonces se puede deducir que la interacción
con el tiempo de funcionamiento en el modo 1 no influye en la rata de fallas.
R. Mediante el test de Wald se ve que el tiempo de funcionamiento en el modo 1 no tiene un efecto

significativo en el número de fallas (p valor mayor al 0.05) y ya que en el test de razón de
verosimilitudes también se acepta la hipótesis nula, entonces se puede deducir que la interacción
con el tiempo de funcionamiento en el modo 2 no influye en la rata de fallas.
22
R. Análisis de residuales. En el gráfico de residuales estandarizados se identifica que el dato 8 es el
de mayor nivel de residuo, y de la curva de envolvente se infiere que los residuales tiene una
distribución que se ajusta al supuesto de distribución del modelo.
Análisis de sensibilidad. En el gráfico de distancias de Cook se identifica que el dato 8 tiene valor
elevado respecto al resto. Por ello se comparó el modelo antes y después de retirar este individuo,
donde se nota bajo un nivel de significancia del 5% que se rechaza la hipótesis nula sobre el beta del
tiempo de operación en el modo 1, es decir el número de fallas solo depende de TM1. Por lo tanto
el registro Numero 8 es influyente.
Por lo anterior se corre de nuevo el modelo solo dependiendo el número de fallas del tiempo de
operación en el modo 1, obteniéndose lo siguiente:
23
R. el valor de beta para tiempo de operación en modo 1 es: 0.007705, cuyo valor es 1.007. Es decir
el número esperado de fallas es 0,7 % mayor por cada unidad de aumento en el tiempo de
funcionamiento en el modo 1,
24
7. (Hand et al. (1994, página 241)) Estos datos muestran la incidencia de cáncer de piel por rangos
de edad en las mujeres de las ciudades de St Paul (Minneapolis-Minnesota) y Fort Worth (Dallas-
Texas). Se espera que la incidencia de este tipo de cáncer sea mayor en Texas que en Minnesota ya
que la exposición al sol es mayor en Texas.
A) Ajuste un modelo de respuesta Poisson con función de enlace logaritmo natural y las
covariables cualitativas ciudad y edad. Comente.
Se plantea el modelo completo donde se incluyen las interacciones de las covariables, utilizando
AIC, BIC y p.value podemos el elegir el modelo
El modelo adecuado es sin interacción.

Casos ~ 1 + Edad + Ciudad.
25
B) Use las estadísticas de Wald y razón de verosimilitudes para evaluar, al nivel de significancia
aproximado de 5%, si el efecto de la edad sobre la tasa de incidencia de cáncer de piel depende
de la ciudad.
El test de Wald en p-value si con el nivel de significancia del 5%,
No hay evidencia estadística de que el B3, B4, B5, B6, B7 Y B8 sean 0 es decir la edad si tiene efecto
sobre la tasa de incidencia de cáncer de piel y con B2 la ciudad también incide en la tasa de incidencia
de cáncer de piel.
Con el Test de verosimilitudes al comparar la distancia,
26
Por lo anterior se rechaza la hipótesis nula donde la diferencia del modelo final con los modelos con
únicas variables el primero excluyendo la ciudad y el segundo excluyendo la edad indica que no hay
suficiente evidencia estadística para un cambio de modelo.
C) Realice el análisis de diagnóstico (análisis residual y análisis de sensibilidad). Comente.
Podemos observar los residuos dentro de los rangos y la distancia indicándonos que la observación
10 puede influir en el modelo.
Al excluir la observación y observamos que la observación no afecta la selección del modelo.
Confirmamos que el modelo es adecuado y con un nivel de confianza del 99% en las bandas todos
los residuos del modelo se encuentran dentro es decir el modelo lo representa adecuadamente.
27
D) La incidencia de cáncer de piel es mayor en Fort Worth que en St Paul? Justifique.
La incidencia esperada de cáncer de piel en individuos de la ciudad St Paul, es aproximadamente,

0.426265 veces la incidencia esperada en individuos de la ciudad Fort Worth es decir los residentes
de la ciudad Fort Worth tienen 2.345958 veces la incidencia esperada en los individuos de St Paul,
por cada individuo de St Paul que se espera tenga cáncer de piel 2.345958 se espera tengan cáncer
de piel en Fort Worth.
E) Estime el número esperado de casos de cáncer de piel en personas de más de 75 años de edad
en la ciudad de St Paul si la población en este rango de edad es de 10000 personas. Haga esta
estimación “manualmente” y usando la función predict().
Se realiza la estimación con esas condiciones de forma manual se espera que para los residentes
de la ciudad St Paul mayores de 75 años y la población de este rango en la ciudad es de 10000 es
de 40.20308.
Estimacion=exp(betas%*%c(1,1,0,0,0,0,0,1))*10000 y
predict(fit2,data.frame(Ciudad=="St_Paul",Edad=="Edad75+",Poblacion=10000),type =
"response")
PUNTO 8
28
gof_glm(fit11) #AIC 429.7666; BIC: 435.6295
El modelo fit12 es el elegido por sus valores de AIC y BIC, además de usar el criterio del p-value para
las marginales y descartar así el parámetro de temperatura, según el STEP_GLM realizado en fit1.
RESUMEN FIT1
Call:
glm(formula = Tiempo ~ Tension + Temperatura, family = Gamma(link = "log"),
data = tabla1)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.82186 -0.23393 -0.09166 0.26635 0.58341
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.273367 0.326438 25.344 < 2e-16 ***
29
Tension -0.006938 0.001141 -6.082 1.27e-06 ***
Temperatura180 C -0.211890 0.127550 -1.661 0.107
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.130152)

AIC: 429.55
RESUMEN FIT12
Call:
glm(formula = Tiempo ~ Tension, family = Gamma(link = "log"),
data = tabla1)
Deviance Residuals:
-0.9035 -0.2808 -0.0475 0.2163 0.7041
Coefficients:
(Intercept) 8.166272 0.328786 24.838 < 2e-16 ***
Tension -0.006914 0.001172 -5.901 1.84e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 430.35
Call:
data = tabla1)
Deviance Residuals:
-0.9035 -0.2808 -0.0475 0.2163 0.7041
30
Coefficients:
(Intercept) 8.166272 0.328786 24.838 < 2e-16 ***
Tension -0.006914 0.001172 -5.901 1.84e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 430.35
Usando el Test de Ward a un nivel de significancia del 5%, se evidencia que el tiempo de vida está
relacionado con el voltaje aplicado a las celdas. Es decir, a mayor voltaje, menor será el tiempo de
vida esperado.
fit12 <- glm(Tiempo ~ Tension, family=Gamma(link="log"), data=tabla1)

fit121 <- glm(Tiempo ~ 1, family=Gamma(link="log"), data=tabla1)
anova(fit121,fit12,test="LRT")
Analysis of Deviance Table
Model 1: Tiempo ~ 1
Model 2: Tiempo ~ Tension
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 31 9.4487
2 30 4.3600 1 5.0887 1.139e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Usando el test de razón de verosimilitud, el parámetro voltaje es significativo a un nivel de

significancia del 5 %., por lo que este parámetro debe estar sí o sí en el modelo de análisis.
ANÁLISIS DE RESIDUOS
31
En términos generales, los individuos están bien estimados según el modelo. EL dato más lejano (21)
está sobreestimado
ANÁLISIS DE SENSIBILIDAD
Detección de observaciones a ser influyentes. El dato 4 es el más influyente en los datos.
Hace la diferencia entre todos los individuos y el que deseamos excluir: Para este caso, no existe
diferencia, ya que los valores cambian levemente y el valor p sigue indicando que cada variable es
significativa (para la dosis, el valor p tiende a cero, lo cual lo hace significativo).
Se evidencia que los residuos tienen un comportamiento según la distribución asignada, ya que
ninguno de los valores sale de los límites a un 95% de confianza.
32
Call:
data = tabla1)
Deviance Residuals:
-0.9035 -0.2808 -0.0475 0.2163 0.7041
Coefficients:
(Intercept) 8.166272 0.328786 24.838 < 2e-16 ***
Tension -0.006914 0.001172 -5.901 1.84e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 430.35
Se observa que la relación es negativa, por lo cual se identifica que el tiempo de fallo disminuye a
medida que se aumenta el voltaje.
1-exp(-0.006937*50)= 0.2930886
A cada 50 V de aumento, el descenso del tiempo de vida es del 29.3 % sin importar la temperatura.
dispersion<-sum(resid(fit12,type="pearson")^2)/fit12$df.residual;dispersion; sqrt(0.1375378)
El coeficiente de variación constante para este modelo es 0,3708.
Estimación con PREDICT():

 predict(fit12,data.frame(Tension=250),type="response")= 625.0418
Estimación Manual:
 mu2=exp(coef(fit12)[1]+coef(fit12)[2]*250)= 625.0418
33
Punto 9
Código utilizado:
library(ssym)
data("Biaxial")
attach(Biaxial)
x11
plot(Work,Life,xlab="Cantidad de trabajo",ylab="Numero de Ciclos",pch=1)
Salida:
De la gráfica y la descripción del
problema, tenemos que la
variable respuesta es una
variable continua y
estrictamente positiva y sesgada
a la derecha. Con estas
características, podemos inferir
que es una Gamma (teniendo en
cuenta que la varianza de la gama
es proporcional a la media), falta
averiguar cuál podría ser la
función de enlace que mejor se
ajusta a estos datos.
34
Se realizará una revisión de resultados para cada distribución (Normal Inversa, Gama y Normal) con
el fin de definir cuál es la función de enlace adecuada, luego se compararán los AIC y BIC para
seleccionar el mejor modelo.
Normal Inversa
Dado lo siguiente:
Los parámetros van acompañados de log en la implementación del modelo.
Código utilizado para seleccionar función enlace:
fit11<-glm(log(Life) ~ log(Work), data=Biaxial, family=inverse.gaussian("inverse"))

fit12<-glm(log(Life) ~ log(Work), data=Biaxial, family=inverse.gaussian("log"))
fit13<-glm(log(Life) ~ log(Work), data=Biaxial, family=inverse.gaussian("identity"))
Salida:
35
De acuerdo con lo anterior, la función enlace que tiene mejor calidad de ajuste es la log.
Gamma
Dado lo siguiente:
De nuevo, los parámetros van acompañados de log en la implementación del modelo.

Código utilizado para seleccionar función enlace:
fit1 <- glm(log(Life) ~ log(Work), data=Biaxial, family=Gamma("inverse"))
36
fit2 <- glm(log(Life) ~ log(Work), data=Biaxial, family=Gamma("log"))
fit3 <- glm(log(Life) ~ log(Work), data=Biaxial, family=Gamma("identity"))
Salida:
De acuerdo con lo anterior, la función enlace que tiene mejor calidad de ajuste es la log.
37
Normal
Dado lo siguiente:
De nuevo, los parámetros van acompañados de log en la implementación del modelo.

Código utilizado, donde la función enlace utilizada es la identidad:
fit21 <- lm(log(Life) ~ log(Work), data=Biaxial).
En resumen, se han elegido los siguientes modelos:
 Normal Inversa con función enlace Log (fit12)
 Gamma con función enlace Log (fit2)
 Normal con función enlace Identidad (fit21)
Ahora, de estas tres, elegiremos la que mejor se ajusta al modelo:
38
Se elige el modelo Gamma Función enlace Log.
El resumen del modelo seleccionado es el siguiente
39
La hipótesis nula (B2=0) se rechaza dado que el pr(>|t|)= <2e-16 *** para la variable Log(work). Es
decir, la vida esperada de la pieza si depende del trabajo por ciclo.
En cuanto a las razones de verosimilitudes:
fit2ANOVA <- glm(log(Life) ~ 1, data=Biaxial, family=Gamma("log"))
Nos sugiere que la dosis es

significativa a un 5%. El trabajo por
ciclos influyente en la esperanza de
vida de la pieza de metal
Análisis de Residual
residuals_glm(fit2,identify=3)
Comentario: La mayoría de los

puntos oscilan sobre 0, es decir, lo
que se observó vs lo que se estimó
es casi igual. En cuanto al punto 46,
el modelo le da un score bajo frente
al que realmente tiene. En cuanto al
punto 32, sucede lo contrario, el
modelo le da un score muy alto
frente al que realmente tiene.
Análisis de sensibilidad
Cookdis_glm(fit2,identify=3)
40
Se identifican 3 puntos que pueden ser
influyentes. Evaluamos cada uno de ellos
y los tres al tiempo
Comentario: Se evidencia que estos puntos NO son influyentes dado que las conclusiones sobre el
modelo NO cambian en ausencia de los mismos
Residuos con bandas de confianza
envelope_glm(fit2,rep=1000,conf=0.99)
41
Comentario: Los residuos del modelo
seleccionado se encuentran sobre las bandas, por
lo que podemos inferir los datos se ajustan al
modelo.
Parámetro de dispersión constante
Comentario: Se acepta la
hipótesis nula (parámetro de
dispersión es constante) dado
que el p-valor es mayor a 0.05.
Por cada unidad que aumenta la cantidad de trabajo, el número de ciclos de la pieza disminuye,
aproximadamente 23%.
## Manual
exp(coef(fit2)[1]+coef(fit2)[2]*log(50))
5.719159
## Predict
predict(fit2,data.frame(Work=50),type="response")
5.719159
Comentario: el número de ciclos esperados hasta q la pieza se rompa es de 5.7 ciclos
42

Modelos Lineales Generalizados

Caricato da

Informazioni sul documento

Descrizione originale:

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Modelos Lineales Generalizados

Caricato da

Copyright:

Formati disponibili

SOLUCIÓN AL SEGUNDO TALLER DE MODELOS LINEALES GENERALIZADOS

R. Verdadero. Ya que el modelo ahora contempla distribuciones de respuesta de Y del componente

R. Verdadero. La medida de tendencia central de la variable aleatoria es , y en este caso el

R. Verdadero. La función de densidad o la función de probabilidad de una variable aleatoria Y que

Para la distribución normal la función de densidad es , para la poisson la

R. Verdadero. Ya que la variable Y tiene distribución , es decir, es constante y

R. Verdadero. Ya que todas estas funciones de enlace cumplen con = , siendo

R. Verdadero. La función de escore se puede escribir como ( ), si la función de

R. Verdadero. La matriz de información observada de Fisher se puede escribir como

R. Falso. no dependen de beta, por lo tanto el beta estimado de la expresión del

logaritmo de la función de verosimilitud de beta , se

puede reducir a , es decir, beta estimado no depende de .

R. Verdadero. Coinciden ya que la matriz de información observada de Fisher y la matriz de

lo cual implica (distribución asintótica normal de beta), es

R. Verdadero. Ya que el test de Wald para grandes tamaños de

grandes números): , en la cual a reemplazar la varianza da las

R. Verdadero. La expresión de Akaike y del BIC , disminuyen

R/: El parámetro de dispersión ˆμ de la binomial, en la Gamma es reemplazado por ˆλ, en la normal

El modelo por ser de respuesta binaria generalizado

El test de Wald en p-value con el nivel de significancia del 5%:

Con el Test de verosimilitudes usando la función ANOVA con test “LRT”:

C) Realice el análisis de diagnóstico al modelo seleccionado (análisis residual y análisis de

El análisis residual y la curva envelope nos muestra el siguiente resultado:

D) Interprete las estimaciones de los parámetros excepto el intercepto.

La estimación para el modelo nos indica.

Para la estimación manual lo realizamos con el siguiente código.

Pnorm nos da la densidad de probabilidad acumulada, la estimación es

plot(Dosis,100*Porcentaje,pch=20,xlab="Dosis de plaguicida",ylab="Tasa de mortalidad

fit1 <- glm(Porcentaje ~ Dosis, weights=Expuestos, family=binomial(link="logit"))

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 96.6881 on 4 degrees of freedom

Analysis of Deviance Table

Usando el test de razón de verosimilitud (1-pchisq(95.34,1)=0), evidenciamos que la dosis es

Detección de observaciones a ser influyentes. El dato 4 es el más influyente en los datos.

Estimación con PREDICT():

Se exporta la información de la siguiente manera:

Cancer_higado <- read_excel("Cancer_higado.xlsx")

He iniciamos con la descripción del Cáncer de Vejiga

Definiendo el modelo sugerido, tenemos lo siguiente:

fit1 <- glm(Enfermos_V/Expuestos_V ~ Dosis_V, weights=Expuestos_V,

Procedemos con descripción de Cáncer de Hígado, la descripción grafica de los datos

Los datos tienen un comportamiento ascendente a

Definiendo el modelo sugerido, tenemos lo

fit2 <- glm(Enfermos_H~ Dosis_H + offset(log(Expuestos_H)), family=poisson(link=log))

En cuanto a la razón de verosimilitud:

Nos sugiere que la dosis es

La hipótesis nula (B2=0) a un

Análisis de sensibilidad: Se identifican dos puntos sospechosos (2, 7)

Análisis de sensibilidad: Se identifican un punto sospechoso (8)

R. Mediante el test de Wald se ve que el tiempo de funcionamiento en el modo 1 no tiene un efecto

El modelo adecuado es sin interacción.

El test de Wald en p-value si con el nivel de significancia del 5%,

Con el Test de verosimilitudes al comparar la distancia,

C) Realice el análisis de diagnóstico (análisis residual y análisis de sensibilidad). Comente.

Al excluir la observación y observamos que la observación no afecta la selección del modelo.

La incidencia esperada de cáncer de piel en individuos de la ciudad St Paul, es aproximadamente,

(Dispersion parameter for Gamma family taken to be 0.130152)

Null deviance: 9.4487 on 31 degrees of freedom

Number of Fisher Scoring iterations: 5

(Dispersion parameter for Gamma family taken to be 0.1372705)

Null deviance: 9.4487 on 31 degrees of freedom

Number of Fisher Scoring iterations: 4