[R-es] PDP con XgBoost

Eric Concha er|cconch@munoz @end|ng |rom gm@||@com
Jue Abr 15 03:58:20 CEST 2021


Quizá te sirve así:
Se calcula el pdp con la función partial() del paquete pdp,
luego graficas con ggplot():

# CALCULAR EL PDP
 bdst_edadagnospdp <- pdp::partial(dat.rfr, pred.var="edadagnos")

# CAMBIAR EL NOMBRE A LA COLUMNA DE DATOS CALCULADOS, PARA EL GRAFICO
 names(bdst_edadagnospdp)[2] <- "bdst_pb" 

# GRAFICAR LA CURVA CALCULADA POR PDP SOBRE EL SET DE DATOS PARA TESTING
 ggplot(dat.test, aes(edadagnos,bdst_pb)) +
    geom_density_2d_filled(show.legend = FALSE) + geom_point(size=0.1,
    col="white") + ylim(-1,6) + xlim(8,13) +
    geom_line(data=bdst_edadagnospdp, col="red", size=1.5)

la curva calculada con pdp se agrega sobre los datos para testing al
final del ggplot, en la parte de geom_line(data=bdst_edadagnospdp,
col="red", size=1.5)

puedes mirar los detalles de la funcion pdp con ?pdp.

Ojalá te sirva,

Saludos !!

Eric.




On Wed, 14 Apr 2021 21:03:39 +0200
Manuel Mendoza <mmendoza using fulbrightmail.org> wrote:

> Buenas, ¿alguien ha calculado alguna vez partial dependence plots con
> XgBoost? Yo lo he conseguido con el paquete PDP y clasificación
> binaria, pero llevo horas intentándolo con regresión y no hay forma.
> Apenas hay ejemplos en la red, y utilizan caret o h2o, que de momento
> no me sirven. Gracias,
> Manuel
> 
> 	[[alternative HTML version deleted]]
> 
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es