[R-es] weighted random forest

Manuel Mendoza mmendoz@ @end|ng |rom |u|br|ghtm@||@org
Vie Ene 22 11:43:00 CET 2021


Buenos días, tengo una base de datos desequilibrados (unbalanced) en la que
las ausencias son 9 veces más abundantes que las presencias (*ratio *= 9).
Para árboles de clasificación utilizo una matriz de pérdidas
parms=list(loss=matrix(c(0,
FP,  *ratio  *,0)))o un vector de ponderación que le da 9 veces más peso a
las presencias. Como cabría esperar, la sensibilidad y sensitividad se
hacen parecidas. Pasan de ser
89/39 a 79/76 y kappa sube de 0.24 a 0.30.

El problema surge cuando intento hacer lo mismo con random forest, y
supongo que no lo estoy haciendo bien. Uso  RFfit <- randomForest(Dep ~. ,
classwt = c(1, *ratio * ), data=data). La sensibilidad y sensitividad se
quedan casi igual 90/40 y kappa también 0.25.

Sé que se puede hacer con ranger, pero, por razones que no vienen al caso,
no me viene bien cambiar.

Gracias, como siempre,
Manuel

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es