[R-es] Random Forests

Carlos Ortega cof en qualityexcellence.es
Sab Ene 20 14:51:42 CET 2018


Hola,

No. Mira el ejemplo:

> data(iris)
> iris.rf <- randomForest(Species ~ ., iris)
> hist(treesize(iris.rf))
> treesize(iris.rf)
  [1]  7 10 13  7 10  6  9  8  7  9  8  8  6  8  7  9  7 10  6 16  4 13 11
10  8 11 10  8  7  9  9  6 11  7  5 10 12 10  7 12 12  8 11 10
 [45] 10 10  9 11  8  6  7 12  9  9  7  6 10  9 10  7  8  8  8  7  8 12  7
11 12  8  7  7  6  9  9  6  6 11  3  9 12 11 13  9  9  7  7 12
 [89] 11  6  6  8  6 11  9 10 10  6  7 14  7 10  8  7  9 11  7 14  7  7  8
9  7  6  9  8  9  8 13  9 10 10  9 11  6  7  9 10  8  9  9  6
[133]  9  8 10  9 11  8  6  7 13  6  6  9  5 14  8 10 13 10 12 13 11 12 10
9 12  9 13 10  9 11  7 10 10  9  9  8  6  5  9  9 11 10  8 10
[177]  4 10 12 10 10  8 10 11  9  5  7  8  8 15  8  7  7  9 12  9 10  9 12
8 10  8 11  9  6  7  9 12  7  8 10 12  6 14 11  4  6  6  7  9
[221] 10 11 13  5  8 10  7 10 10 12 10 11 11  8  9 11  9  9  9 10  6 10  7
10 10 14  9 10  6 10  6  8  6  9  9 10 10 10 10  9 10 10  8 14
[265]  8 11  6 11  9  9  9  8 11  7  8 11  8  4  9 11  6  8 10  8  9 10  8
9  8 11 11  9 12 14  7  9  8  9 10 10 11  8 12 12 12  4 10 11
[309]  8  8 11  9  9  8 10  9  4 10 10  6 13 10 12  9 10  9  5  9  7  4  7
15  7  8  7 11  7 11 12  5 12  7  9  8 13 14  9  9  9  9  6 13
[353] 13  7 10  6  5  6 10  6  8  8  9 11  9 11  7  7 11  8  6 10 13  7 12
11 14  7 10 11  9  8  6  8 10  8  9  6 10 10  6  7  7  7 11 13
[397]  8  5  7 14 10 14  8  9  6 11  9 11 10  9  8  7 11 10 10 11  8 10 12
9  8  8  9  9  9  9  9  5  9  7 13 10 11  8 10  9 10 12  8 12
[441]  9 10  4  7 11  7 10  4  6 13  8  7 10  9  7  6  8  9  7 11  8  8  9
10  5  8 11 12  6  5 10 10  6 10 10  5 10 13  9 13 10 10  6 12
[485]  8  7  9 12 10  9  7  7 14  6  9  6  6  8 10  6
> vtmp <- treesize(iris.rf)
> sum(vtmp)

Por defecto al no especificar nada, el "ntrees" de randomForest() es 500.
Efectivamente generas 500 árboles como ves en el número de elementos que
devuelve "treesize(iris.rf)".

Y cada árbol, tiene el número de nodos que ves en el valor de cada uno de
los elementos que igualmente devuelve "treesize(iris.rf)": 7, 10, 13...

Gracias,
Carlos

El 20 de enero de 2018, 10:36, Manuel Mendoza <mmendoza en mncn.csic.es>
escribió:

>
> Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus
> respectivos tamaños (nº de nodos)
>
> ntree: Number of trees to grow. This should not be set to too small ......
>
> treesize: Size of trees (number of nodes) in and ensemble.
>
>
> Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº
> de nodos:
>
> treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno por
> cada árbol), todos ellos mayores que 4000 ????
>
> ¿tienen los 1000 árboles más de 4000 nodos cada uno? Parece extraño ¿no?
>
> Esa es mi pregunta
>
> Gracias nuevamente,
> Manuel
>
>
>
>
>
>
> Quoting Carlos Ortega <cof en qualityexcellence.es>:
>
> Hola,
>>
>> A "treesize()" le tienes que pasar como parámetro el objeto randomForest
>> de
>> tu modelo.
>> Y obtiene el número de nodos de cada uno de los árboles que hayas indicado
>> en el valor del parámetros "ntrees" de "randomForest". Por defecto
>> "ntrees"
>> tiene un valor de 500.
>> Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente
>> le hayas indicado un valor de 1000...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 17 de enero de 2018, 14:29, Manuel Mendoza <mmendoza en mncn.csic.es>
>> escribió:
>>
>> Buenas tardes a todos. El paquete randomForest tiene la función treesize,
>>> que es el nº de nodos. Me dan valores realmente elevados (en torno a
>>> 1000),
>>> y eso me parece extraño. ¿sabéis si es así?
>>> Gracias,
>>> Manuel
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es