[R-es] Paquete pdp

Carlos Ortega cof en qualityexcellence.es
Sab Ene 20 14:15:17 CET 2018


Hola,

Sí, y en la ayuda sobre el objeto que utiliza "partial()" también viene que
es posible...

object

A fitted model object of appropriate class (e.g., "gbm", "lm",
"randomForest", "train", etc.).

El 20 de enero de 2018, 13:55, Manuel Mendoza <mmendoza en mncn.csic.es>
escribió:

>
> Acabo de encontrar que si sirve para gbm, por lo que no es esa la razón.
>
> Aquí: https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-20
> 17-016.pdf
>
>
>
>
>
>
>
>
> Quoting Manuel Mendoza <mmendoza en mncn.csic.es>:
>
> Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico a
>> mis datos me da:
>>
>> Error in eval(stats::getCall(object)$data) : object 'x.data' not found.
>>
>> Os copio abajo un ejemplo de aplicación a un RF. El mio es de un boosted
>> regression trees (paquete gbm). No sé si esa puede ser la razón del error.
>> En el paquete pdp no especifica que sea solo para RF, aunque en los
>> ejemplos que encontré nunca eran de boosted ... Solo de RF y SVM.
>>
>> Gracias,
>> Manuel
>>
>>
>> library(pdp)
>> data (boston)  # load the boston housing data
>> set.seed(101)  # for reproducibility
>> boston.rf <- randomForest(cmedv ~ ., data = boston)
>>
>> # Partial dependence of cmedv on lstat and rm
>>
>> pd <- partial(boston.rf, pred.var = c("lstat", "rm"), chull = TRUE)
>>
>> head(pd)  # print first 6 rows
>> #>     lstat      rm     yhat
>> #> 1  7.5284 3.66538 24.13683
>> #> 2  8.2532 3.66538 23.24916
>> #> 3  8.9780 3.66538 23.13119
>> #> 4  9.7028 3.66538 22.13531
>> #> 5 10.4276 3.66538 20.62331
>> #> 6 11.1524 3.66538 20.51258
>>
>>
>>
>>
>>
>>
>>
>> Quoting Carlos Ortega <cof en qualityexcellence.es>:
>>
>> Hola,
>>>
>>> A "treesize()" le tienes que pasar como parámetro el objeto randomForest
>>> de
>>> tu modelo.
>>> Y obtiene el número de nodos de cada uno de los árboles que hayas
>>> indicado
>>> en el valor del parámetros "ntrees" de "randomForest". Por defecto
>>> "ntrees"
>>> tiene un valor de 500.
>>> Mira qué valor tiene "ntrees" en tu modelo "randomForest", que
>>> seguramente
>>> le hayas indicado un valor de 1000...
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El 17 de enero de 2018, 14:29, Manuel Mendoza <mmendoza en mncn.csic.es>
>>> escribió:
>>>
>>> Buenas tardes a todos. El paquete randomForest tiene la función treesize,
>>>> que es el nº de nodos. Me dan valores realmente elevados (en torno a
>>>> 1000),
>>>> y eso me parece extraño. ¿sabéis si es así?
>>>> Gracias,
>>>> Manuel
>>>> --
>>>> Dr Manuel Mendoza
>>>> Department of Biogeography and Global Change
>>>> National Museum of Natural History (MNCN)
>>>> Spanish Scientific Council (CSIC)
>>>> C/ Serrano 115bis, 28006 MADRID
>>>> Spain
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>> --
>> Dr Manuel Mendoza
>> Department of Biogeography and Global Change
>> National Museum of Natural History (MNCN)
>> Spanish Scientific Council (CSIC)
>> C/ Serrano 115bis, 28006 MADRID
>> Spain
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es