[R-es] Cómo aplicar weights a las observaciones en un GLM binomial

Isa García Barón xanamb en gmail.com
Vie Nov 14 10:46:53 CET 2014


Hola, espero ser clara en el mensaje ya que es la primera vez que recurro a
este tipo de ayudas, explico mi duda:

Tengo un dataset con 4505 observaciones en el que la variable dependiente
son presencias (n=97 y clasificadas como 1) y ausencias (n=4408 y
clasificadas como 0). Mi primer paso fue realizar un GLM con una muestra
compensada de ausencias y presencias para la variable dependiente, es decir
97 presencias y 97 ausencias. Sin embargo, como todo lo que tengo son
ausencias y no pseudoausencias me recomendaron utilizar las 97 presencias
frente a todas las ausencias, aquí viene el problema. Si realizo un GLM con
ausencia/presencia como variable dependiente no siendo ésta proporcional
entre 1 y 0 debo ponderar las observaciones, lo cuál creo que se realiza
añadiendo el vector "weights" a la función, quedando asi:

modelo <- glm(v_dependiente ~ v1 + v2 + v3, data = datset, weights="x",
family = binomial (link=logit)

Mi duda es cómo calcular el factor de ponderación de las presencias y las
ausencias para crear el vector que pueda introducir en la función weights.

Muchas gracias! Un saludo

*-------------*
*Isabel García Barón*

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es