[R-es] weighted random forest

Jesús Para Fernández j@p@r@@|ern@ndez @end|ng |rom hotm@||@com
Vie Ene 22 16:10:27 CET 2021


Has probado en usar en vez de algoritmos sensibles al coste, usar t�cnicas de remuestreo? Hay un paquete de la UGR llamado imbalance que funciona muy bien.


________________________________
De: R-help-es <r-help-es-bounces using r-project.org> en nombre de Manuel Mendoza <mmendoza using fulbrightmail.org>
Enviado: viernes, 22 de enero de 2021 11:43
Para: Lista R <r-help-es using r-project.org>
Asunto: [R-es] weighted random forest

Buenos d�as, tengo una base de datos desequilibrados (unbalanced) en la que
las ausencias son 9 veces m�s abundantes que las presencias (*ratio *= 9).
Para �rboles de clasificaci�n utilizo una matriz de p�rdidas
parms=list(loss=matrix(c(0,
FP,  *ratio  *,0)))o un vector de ponderaci�n que le da 9 veces m�s peso a
las presencias. Como cabr�a esperar, la sensibilidad y sensitividad se
hacen parecidas. Pasan de ser
89/39 a 79/76 y kappa sube de 0.24 a 0.30.

El problema surge cuando intento hacer lo mismo con random forest, y
supongo que no lo estoy haciendo bien. Uso  RFfit <- randomForest(Dep ~. ,
classwt = c(1, *ratio * ), data=data). La sensibilidad y sensitividad se
quedan casi igual 90/40 y kappa tambi�n 0.25.

S� que se puede hacer con ranger, pero, por razones que no vienen al caso,
no me viene bien cambiar.

Gracias, como siempre,
Manuel

        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es using r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es