[R-es] Dos cuestiones relacionadas con rpart y printcp

Manuel Mendoza mmendoz@ @end|ng |rom |u|br|ghtm@||@org
Mie Feb 24 18:59:35 CET 2021


Muy buenas, tengo dos cuestiones relacionadas con  rpart para regresión y
printcp.
Entreno el algoritmo con  fitrp <- rpart(nspp ~ ., data=data, cp=0)
y obtengo el error relativo, xerror, del mejor árbol con
min(fitrp$cptable[,"xerror"]).
Hasta ahí muy fácil.

1. Para calcular mse, multiplico ese valor de xerror por el error del nodo
raíz.
¿es correcto?

2. Necesito el % de varianza (R2) de la variable objetivo explicada por el
mejor árbol, pero no está en ninguno de los objetos incluídos fitrp.
En la documentación encontré que rsq.rpart(fitrp) te representa
directamente la evolución de R2 tal y como se van añadiendo nuevas
divisiones (también te representa la evolución de xerror, pero esa ya la
tenía con plotcp(fitrp)).
Mi pregunta es:
¿cómo puedo obtener esa secuencia de valores de R2, cuyo máximo sería el R2
que busco?
Gracias, una vez más,
Manuel

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es