[R-es] Interpretación de salida de un GLM

Carlos J. Gil Bellosta cgb @end|ng |rom d@t@n@|yt|c@@com
Mar Sep 15 01:03:38 CEST 2020


Hola, ¿qué tal?

Es largo contestar a todo lo que planteas, pero déjame darte una
recomendación acerca de una de las cuestiones que planteas: la
estandarización de la variable HF. No usaría ni los datos crudos ni
estandarización vía media-sd. En lugar de eso, colocaría el 0 en un nivel
"normal" o "de referencia" (¿existe tal cosa?) para esa variable y tal vez
la escalaría para que incrementos de una unidad (escalada) se
correspondiesen con incrementos razonables de la variable subyacente (¿cien
unidades de la otra?).

Así podrías interpretar la salida del modelo en términos del incremento de
la probabilidad de la variable objetivo (sea o no a través de los infames
*odds*) frente a variaciones de tamaño "normal" frente a niveles "normales"
de las variables más relevantes. Además, el término independiente también
tendría una interpretación razonable.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El lun., 14 sept. 2020 a las 21:45, Juan Seco Lopez (<
juansecolopez using gmail.com>) escribió:

> Estimada comunidad, tengo unas dudas que son muy básicas creo, pero es mi
> primera incursión en GLM.
> Estoy ajustando un modelo binomial a unos datos de germinación. El modelo
> es muy sencillo, tengo un factor "Condicion" con dos niveles: "a" y "b"
> (nivel de humedad en suelo). Por otro lado, tengo una variable explicativa
> "HF" (horas frío=estratificación) que va de 0 a 2160 (en el modelo esta
> variable es HFe por estandarizada y centrada).
> Acá van mis preguntas:
>                  - ¿cómo interpreto la salida? Si, por ejemplo, me
> encuentro bajo la "condicion a", ¿no incluyo los
> términos +1.97820*Condicionb y +1.22376*Condicionb*HFe?
>                  - cuando tengo que reemplazar los valores HFe en la
> fórmula, ¿tengo que utilizar los valores centrados y estandarizados o
> puedo usar los valores "crudos" HF?  Pregunto esto porque perdería
> reproducibilidad del modelo si utilizo los datos centrados
>
> Les dejo el summary de mi modelo y agradezco de antemano su colaboración.
> Saludos
>
>
> Call:
> glm(formula = prop ~ Condicion + HFe + Condicion * HFe, family = binomial,
>     data = datos)
>
> Deviance Residuals:
>     Min       1Q   Median       3Q      Max
> -4.0365  -1.2027   0.0994   0.9577   3.4023
>
> Coefficients:
>                           Estimate     Std. Error        z value
>  Pr(>|z|)
> (Intercept)          -1.17749    0.04484          -26.262           < 2e-16
> ***
> Condicionb         1.97820     0.06434          30.745            < 2e-16
> ***
> HFe                    -0.20626    0.04503          -4.581
>  4.64e-06 ***
> Condicionb:HFe 1.22376     0.06667          18.355            < 2e-16 ***
> ---
> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
> (Dispersion parameter for binomial family taken to be 1)
>
>     Null deviance: 1923.94  on 139  degrees of freedom
> Residual deviance:  348.59  on 136  degrees of freedom
> AIC: 875.09
>
> Number of Fisher Scoring iterations: 4
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es