[R-es] Random Forests
Carlos Ortega
cof en qualityexcellence.es
Sab Ene 20 14:51:42 CET 2018
Hola,
No. Mira el ejemplo:
> data(iris)
> iris.rf <- randomForest(Species ~ ., iris)
> hist(treesize(iris.rf))
> treesize(iris.rf)
[1] 7 10 13 7 10 6 9 8 7 9 8 8 6 8 7 9 7 10 6 16 4 13 11
10 8 11 10 8 7 9 9 6 11 7 5 10 12 10 7 12 12 8 11 10
[45] 10 10 9 11 8 6 7 12 9 9 7 6 10 9 10 7 8 8 8 7 8 12 7
11 12 8 7 7 6 9 9 6 6 11 3 9 12 11 13 9 9 7 7 12
[89] 11 6 6 8 6 11 9 10 10 6 7 14 7 10 8 7 9 11 7 14 7 7 8
9 7 6 9 8 9 8 13 9 10 10 9 11 6 7 9 10 8 9 9 6
[133] 9 8 10 9 11 8 6 7 13 6 6 9 5 14 8 10 13 10 12 13 11 12 10
9 12 9 13 10 9 11 7 10 10 9 9 8 6 5 9 9 11 10 8 10
[177] 4 10 12 10 10 8 10 11 9 5 7 8 8 15 8 7 7 9 12 9 10 9 12
8 10 8 11 9 6 7 9 12 7 8 10 12 6 14 11 4 6 6 7 9
[221] 10 11 13 5 8 10 7 10 10 12 10 11 11 8 9 11 9 9 9 10 6 10 7
10 10 14 9 10 6 10 6 8 6 9 9 10 10 10 10 9 10 10 8 14
[265] 8 11 6 11 9 9 9 8 11 7 8 11 8 4 9 11 6 8 10 8 9 10 8
9 8 11 11 9 12 14 7 9 8 9 10 10 11 8 12 12 12 4 10 11
[309] 8 8 11 9 9 8 10 9 4 10 10 6 13 10 12 9 10 9 5 9 7 4 7
15 7 8 7 11 7 11 12 5 12 7 9 8 13 14 9 9 9 9 6 13
[353] 13 7 10 6 5 6 10 6 8 8 9 11 9 11 7 7 11 8 6 10 13 7 12
11 14 7 10 11 9 8 6 8 10 8 9 6 10 10 6 7 7 7 11 13
[397] 8 5 7 14 10 14 8 9 6 11 9 11 10 9 8 7 11 10 10 11 8 10 12
9 8 8 9 9 9 9 9 5 9 7 13 10 11 8 10 9 10 12 8 12
[441] 9 10 4 7 11 7 10 4 6 13 8 7 10 9 7 6 8 9 7 11 8 8 9
10 5 8 11 12 6 5 10 10 6 10 10 5 10 13 9 13 10 10 6 12
[485] 8 7 9 12 10 9 7 7 14 6 9 6 6 8 10 6
> vtmp <- treesize(iris.rf)
> sum(vtmp)
Por defecto al no especificar nada, el "ntrees" de randomForest() es 500.
Efectivamente generas 500 árboles como ves en el número de elementos que
devuelve "treesize(iris.rf)".
Y cada árbol, tiene el número de nodos que ves en el valor de cada uno de
los elementos que igualmente devuelve "treesize(iris.rf)": 7, 10, 13...
Gracias,
Carlos
El 20 de enero de 2018, 10:36, Manuel Mendoza <mmendoza en mncn.csic.es>
escribió:
>
> Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus
> respectivos tamaños (nº de nodos)
>
> ntree: Number of trees to grow. This should not be set to too small ......
>
> treesize: Size of trees (number of nodes) in and ensemble.
>
>
> Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº
> de nodos:
>
> treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno por
> cada árbol), todos ellos mayores que 4000 ????
>
> ¿tienen los 1000 árboles más de 4000 nodos cada uno? Parece extraño ¿no?
>
> Esa es mi pregunta
>
> Gracias nuevamente,
> Manuel
>
>
>
>
>
>
> Quoting Carlos Ortega <cof en qualityexcellence.es>:
>
> Hola,
>>
>> A "treesize()" le tienes que pasar como parámetro el objeto randomForest
>> de
>> tu modelo.
>> Y obtiene el número de nodos de cada uno de los árboles que hayas indicado
>> en el valor del parámetros "ntrees" de "randomForest". Por defecto
>> "ntrees"
>> tiene un valor de 500.
>> Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente
>> le hayas indicado un valor de 1000...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 17 de enero de 2018, 14:29, Manuel Mendoza <mmendoza en mncn.csic.es>
>> escribió:
>>
>> Buenas tardes a todos. El paquete randomForest tiene la función treesize,
>>> que es el nº de nodos. Me dan valores realmente elevados (en torno a
>>> 1000),
>>> y eso me parece extraño. ¿sabéis si es así?
>>> Gracias,
>>> Manuel
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>
--
Saludos,
Carlos Ortega
www.qualityexcellence.es
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es