[R-es] weighted random forest

Manuel Mendoza mmendoz@ @end|ng |rom |u|br|ghtm@||@org
Vie Ene 22 17:52:08 CET 2021


Gracias Carlos, la verdad es que no me lo solucionó, seguramente por falta
mía de conocimientos. Haré remuestreo como dice Jesús.

El vie, 22 ene 2021 a las 12:46, Carlos Ortega (<cof using qualityexcellence.es>)
escribió:

> Hola Manuel,
>
> No dan una respuesta concluyente, pero sí algunas pistas...
>
>
> https://stackoverflow.com/questions/57076570/how-to-calculate-class-weights-for-random-forests
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El vie, 22 ene 2021 a las 11:43, Manuel Mendoza (<
> mmendoza using fulbrightmail.org>) escribió:
>
>> Buenos días, tengo una base de datos desequilibrados (unbalanced) en la
>> que
>> las ausencias son 9 veces más abundantes que las presencias (*ratio *= 9).
>> Para árboles de clasificación utilizo una matriz de pérdidas
>> parms=list(loss=matrix(c(0,
>> FP,  *ratio  *,0)))o un vector de ponderación que le da 9 veces más peso a
>> las presencias. Como cabría esperar, la sensibilidad y sensitividad se
>> hacen parecidas. Pasan de ser
>> 89/39 a 79/76 y kappa sube de 0.24 a 0.30.
>>
>> El problema surge cuando intento hacer lo mismo con random forest, y
>> supongo que no lo estoy haciendo bien. Uso  RFfit <- randomForest(Dep ~. ,
>> classwt = c(1, *ratio * ), data=data). La sensibilidad y sensitividad se
>> quedan casi igual 90/40 y kappa también 0.25.
>>
>> Sé que se puede hacer con ranger, pero, por razones que no vienen al caso,
>> no me viene bien cambiar.
>>
>> Gracias, como siempre,
>> Manuel
>>
>>         [[alternative HTML version deleted]]
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es using r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es