[R-es] gbm.step para clasificación no binaria

Manuel Mendoza mmendoza en mncn.csic.es
Lun Feb 19 18:57:39 CET 2018


Bueno, primero te comento que si no le indico la family me hace  
Bernuilli y da error por no ser binaria.

La razón de aplicar gbm.step del paquete dismo es que da una  
información fundamental, como la interacción entre las variables o los  
partial plots. La interacción te la representa en 3D y es super  
explicativo.

El paquete randomforest también me da los partialplots y sale muy  
bien, pero me gustaría probar también con boosted. Lo haré con gbm,  
aunque no obtenga las interacciones.

Gracias una vez más,
Manuel


Quoting Carlos Ortega <cof en qualityexcellence.es>:

> Hola,
>
> Sí, tienes razón...
> ¿No puedes usar la propia función "gbm" del paquete "gbm"?...
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 19 de febrero de 2018, 18:01, Manuel Mendoza <mmendoza en mncn.csic.es>
> escribió:
>
>>
>> Gracias Carlos. Hasta donde yo entiendo si las hay:
>>
>> El argumento family puede ser:
>>
>> "gaussian" (for minimizing squared error); por lo que tiene que ser
>> numérica
>> "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
>> "poisson" (count outcomes; requires the response to be a positive
>> integer); numérica también, pues.
>>
>> La única podría ser "laplace" (for minimizing absolute loss), pero me da
>> este error: Error in while (delta.deviance > tolerance.test & n.fitted <
>> max.trees) { :
>>   missing value where TRUE/FALSE needed
>>
>> Supongo que loss se refiere a la función de pérdida, y como habla de
>> deviance (la función de pérdida por defecto en gbm) pienso que también es
>> para variable respuesta numérica, aunque no lo encontré por ningún lado.
>> Por eso pregunté.
>>
>> Probaré sin indicar la family, a ver si funciona.
>> Gracias,
>> Manuel
>>
>>
>>
>> Quoting Carlos Ortega <cof en qualityexcellence.es>:
>>
>> Hola,
>>>
>>> No hay ninguna limitación en la ayuda de la función en este sentido.
>>> Tan solo se indica que han de existir dos niveles en la variable
>>> predictora, vaya que al menos sea binaria...
>>> En la función en el parámetro "gbm.y" es donde indicas qué columna es la
>>> predictora. No hay otro parámetro donde por otro lado le indiques si es un
>>> modelo binario o multinominal...
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>>
>>> 2018-02-19 14:03 GMT+01:00 Manuel Mendoza <mmendoza en mncn.csic.es>:
>>>
>>> Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no
>>>> binaria?
>>>> Gracias
>>>> --
>>>> Dr Manuel Mendoza
>>>> Department of Biogeography and Global Change
>>>> National Museum of Natural History (MNCN)
>>>> Spanish Scientific Council (CSIC)
>>>> C/ Serrano 115bis, 28006 MADRID
>>>> Spain
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>> --
>> Dr Manuel Mendoza
>> Department of Biogeography and Global Change
>> National Museum of Natural History (MNCN)
>> Spanish Scientific Council (CSIC)
>> C/ Serrano 115bis, 28006 MADRID
>> Spain
>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es


-- 
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain



Más información sobre la lista de distribución R-help-es