[R-es] Cómo aplicar weights a las observaciones en un GLM binomial
Isa García Barón
xanamb en gmail.com
Vie Nov 14 10:46:53 CET 2014
Hola, espero ser clara en el mensaje ya que es la primera vez que recurro a
este tipo de ayudas, explico mi duda:
Tengo un dataset con 4505 observaciones en el que la variable dependiente
son presencias (n=97 y clasificadas como 1) y ausencias (n=4408 y
clasificadas como 0). Mi primer paso fue realizar un GLM con una muestra
compensada de ausencias y presencias para la variable dependiente, es decir
97 presencias y 97 ausencias. Sin embargo, como todo lo que tengo son
ausencias y no pseudoausencias me recomendaron utilizar las 97 presencias
frente a todas las ausencias, aquí viene el problema. Si realizo un GLM con
ausencia/presencia como variable dependiente no siendo ésta proporcional
entre 1 y 0 debo ponderar las observaciones, lo cuál creo que se realiza
añadiendo el vector "weights" a la función, quedando asi:
modelo <- glm(v_dependiente ~ v1 + v2 + v3, data = datset, weights="x",
family = binomial (link=logit)
Mi duda es cómo calcular el factor de ponderación de las presencias y las
ausencias para crear el vector que pueda introducir en la función weights.
Muchas gracias! Un saludo
*-------------*
*Isabel García Barón*
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es