[R-es] Interpretación de salida de un GLM

Francisco Rodriguez Sanchez |@rodr|guez@@@nc @end|ng |rom gm@||@com
Mar Sep 15 11:13:38 CEST 2020


Hola Juan,

Primero de todo, no estoy seguro de si tu variable respuesta 'prop' 
representa la proporción de semillas germinadas? No es lo mismo que esa 
proporción sea 1 de 2 que 50 de 100, aunque el porcentaje de germinación 
sea el mismo (50%). Ver 
https://stats.stackexchange.com/questions/241983/using-proportions-directly-instead-of-cbind-in-glm-binomial-regression-is-th. 


Mi opción preferida para tener en cuenta el tamaño de muestra es 
proporcionar el número de semillas germinadas y el de no germinadas como 
variable respuesta, esto es

glm(cbind(germin, nogermin) ~ condicion etc, family = binomial)

En cuanto a la interpretación de los parámetros, en tu modelo el 
intercept representaría la probabilidad de germinación (en escala logit) 
cuando la condición es a y HFe es 0. Para interpretar un modelo así con 
interacciones creo que lo mejor es visualizarlo, por ejemplo usando el 
paquete effects o visreg. Aquí tengo algunos ejemplos 
(https://github.com/Pakillo/LM-GLM-GLMM-intro/blob/trees/glm_binomial.pdf), 
pero hay mucha más información en internet.

Para obtener los valores estimados de germinación en distintas 
condiciones de humedad y estratificación, creo que lo más fácil es usar 
la función predict. Le pasas un data frame con los valores de humedad y 
estratificación y obtienes la probabilidad de germinación, con su 
incertidumbre. Si usaste HFe como predictor, debes mantener la misma 
escala. Si te interesa que el modelo se aplique en el futuro a otros 
datos, mejor usar HF tal cual o usar puntos de referencia fijos (p. ej. 
HF = 1000 horas) como propone Carlos.

Espero que sirva. Suerte

Paco


On 14/9/20 21:44, Juan Seco Lopez wrote:
> Estimada comunidad, tengo unas dudas que son muy básicas creo, pero es mi
> primera incursión en GLM.
> Estoy ajustando un modelo binomial a unos datos de germinación. El modelo
> es muy sencillo, tengo un factor "Condicion" con dos niveles: "a" y "b"
> (nivel de humedad en suelo). Por otro lado, tengo una variable explicativa
> "HF" (horas frío=estratificación) que va de 0 a 2160 (en el modelo esta
> variable es HFe por estandarizada y centrada).
> Acá van mis preguntas:
>                   - ¿cómo interpreto la salida? Si, por ejemplo, me
> encuentro bajo la "condicion a", ¿no incluyo los
> términos +1.97820*Condicionb y +1.22376*Condicionb*HFe?
>                   - cuando tengo que reemplazar los valores HFe en la
> fórmula, ¿tengo que utilizar los valores centrados y estandarizados o
> puedo usar los valores "crudos" HF?  Pregunto esto porque perdería
> reproducibilidad del modelo si utilizo los datos centrados
>
> Les dejo el summary de mi modelo y agradezco de antemano su colaboración.
> Saludos
>
>
> Call:
> glm(formula = prop ~ Condicion + HFe + Condicion * HFe, family = binomial,
>      data = datos)
>
> Deviance Residuals:
>      Min       1Q   Median       3Q      Max
> -4.0365  -1.2027   0.0994   0.9577   3.4023
>
> Coefficients:
>                            Estimate     Std. Error        z value
>   Pr(>|z|)
> (Intercept)          -1.17749    0.04484          -26.262           < 2e-16
> ***
> Condicionb         1.97820     0.06434          30.745            < 2e-16
> ***
> HFe                    -0.20626    0.04503          -4.581
>   4.64e-06 ***
> Condicionb:HFe 1.22376     0.06667          18.355            < 2e-16 ***
> ---
> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
> (Dispersion parameter for binomial family taken to be 1)
>
>      Null deviance: 1923.94  on 139  degrees of freedom
> Residual deviance:  348.59  on 136  degrees of freedom
> AIC: 875.09
>
> Number of Fisher Scoring iterations: 4
>
> 	[[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

-- 
Dr Francisco Rodríguez-Sánchez
https://frodriguezsanchez.net


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es