[R-es] Simulación de modelo logit con interacción

Olivier Nuñez onunez en unex.es
Vie Ene 23 12:23:25 CET 2015


Efectivamente, la normalidad tarda en llegar (un problema que merece ser investigado)
En cualquier caso, parece que ambos diseños dan varianzas asintóticas similares de los estimadores:

> n=1000
> 
> dat <- data.frame(x1=sample(0:1, n,replace=TRUE),x2=sample(0:1, n,replace=TRUE))
> dat$intercept=1
> odds <- exp(-1 - 4 * dat$x1 + 7*dat$x2  - 1 *dat$x1* dat$x2 )
> pr <- odds/(1+odds)
> D=diag(pr*(1-pr))
> X=as.matrix(dat)
> I=t(X)%*%D%*%X
> solve(I)
                  x1           x2    intercept
x1         0.4716741 -0.451997095 -0.014952896
x2        -0.4519971  0.470731667 -0.005214237
intercept -0.0149529 -0.005214237  0.020017370
> 
> dat$x1= rep(c(0,1), each = n/2)
> dat$x2 = rep(c(0,1), times = n/2)
> odds <- exp(-1 - 4 * dat$x1 + 7*dat$x2 - 1 * dat$x1 * dat$x2 )
> pr <- odds/(1+odds)
>   
> D=diag(pr*(1-pr))
> X=as.matrix(dat)
> I=t(X)%*%D%*%X
> solve(I)
                   x1           x2    intercept
x1         0.45113285 -0.430788206 -0.014755274
x2        -0.43078821  0.451132851 -0.005589371
intercept -0.01475527 -0.005589371  0.020161833
> 


----- Mensaje original -----
De: "Carlos J. Gil Bellosta" <cgb en datanalytics.com>
Para: "Olivier Nuñez" <onunez en unex.es>
CC: "Emilio Torres Manzanera" <torres en uniovi.es>, "r-help-es" <r-help-es en r-project.org>
Enviados: Viernes, 23 de Enero 2015 11:14:44
Asunto: Re: [R-es] Simulación de modelo logit con interacción

Hola, ¿qué tal?

Cierto, cierto, había un error en el código que publiqué. Pero el
diagnóstico es parecido. Cuando los datos se generan con el
coeficiente de x2 igual a 7, los coeficientes estimados tienen una
distribución extraña, bimodal (aparentemente), en lugar de
_normalmente_ distribuida alrededor del 7 como se espera. Supongo que
depende del número de casos en que x2 = 1 e y = 0.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 23 de enero de 2015, 9:54, Olivier Nuñez <onunez en unex.es> escribió:
> Emilio,
>
> espero no haberte generado mucha confusión con mi anterior respuesta.
> El problema no es de separación sino más bien de tamaño muestral.
> Al coger el código de Carlos, obtenía que "y" y "x1" eran sistemáticamente independiente (la tabla table(dat$y,dat$x1) tiene columnas proporcionales).
> En el diseño de Carlos, el código correcto para simular los datos ha de ser dat$y= rbinom(2*n,1,pr).
> Con tu diseño, si elijo un tamaño muestral suficientemente grande, obtengo estimaciones razonables de los parámetros de tu modelo:
>
>> res <- logisticsimulation(10000)
>> apply(res,2,median)
> (Intercept)          x1          x2       x1:x2
>  -0.9955877  -3.9938632   6.9967218  -0.9913839
>
> Un saludo. Olivier
>
>
> ----- Mensaje original -----
> De: "Emilio Torres Manzanera" <torres en uniovi.es>
> Para: r-help-es en r-project.org
> Enviados: Jueves, 22 de Enero 2015 12:28:14
> Asunto: [R-es] Simulación de modelo logit con interacción
>
> Hola,
> Deseo simular un modelo logit con interacción, estimar sus coeficientes y comprobar si son o no parecidos al modelo teórico. Con este ejemplo obtengo que los coeficientes estimados no se asemejan mucho a los originales. ¿Se le ocurre a alguien cuál es el motivo de esta discrepancia? ¿y cómo solucionarlo?
> Muchas gracias
> Emilio
>
> logisticsimulation <- function(n){
>   dat <- data.frame(x1=sample(0:1, n,replace=TRUE),
>                     x2=sample(0:1, n,replace=TRUE))
>   odds <- exp(-1 - 4 * dat$x1 + 7*dat$x2 - 1 *dat$x1* dat$x2 )
>   pr <- odds/(1+odds)
>   res <- replicate(100, {
>     dat$y <- rbinom(n,1,pr)
>     coef(glm(y ~ x1*x2, data = dat, family = binomial()))
>   })
>   t(res)
> }
>
> res <- logisticsimulation(100)
> apply(res,2,median)
> ## (Intercept)          x1          x2       x1:x2
> ## -1.0986123 -18.4674562  20.4823593  -0.0512933
>
> Deberían salir -1, -4, 7, 1
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es