[R-es] partialPlot en un Randomforest

Manuel Mendoza mmendoza en mncn.csic.es
Dom Ene 7 10:58:26 CET 2018


Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día  
de reyes a la 1.20h y me contestas a las 2.45h)

Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En  
un RF para clasificación me da valores parecidos a los de tu ejemplo,  
y en otro para regresión, valores de y entre 45 y 55.

Para regresión, el último parámetro no puede ser una categoría, como  
"versicolor". Yo puse la variable entrecomillada, pensando que era el  
nombre del eje x, pero he probado a poner otra cosa, y lo ignora; lo  
he quitado y no afecta. Pensé que podría ser el valor de la variable  
respuesta más esperado, en función del valor del predictor, pero no se  
mueve en el mismo rango.

Voy a ver el paquete pdp del que me hablas.

Gracias nuevamente,

Manuel


Quoting Carlos Ortega <cof en qualityexcellence.es>:

> Hola,
>
> Ya es que la explicación de la función es un tanto oscura...
>
> Mira el ejemplo (clasificación):
>
>> data(iris)
>> set.seed(543)
>> iris.rf <- randomForest(Species~., iris)
>> partialPlot(iris.rf, iris, Petal.Width, "versicolor")
>
> Y el gráfico que se produce:
>
> [image: Imágenes integradas 1]
> El gráfico mide la variación de la probabilidad sobre una de las clases de
> la variable target (en este caso la variable target es "Species" y la clase
> es "versicolor") de acuerdo a cómo varía la variable de estudio, en este
> caso "Petal.Width". El gráfico te indica que valores de Petal.Width
> cercanos a 1.0 se obtiene el máximo de probabilidad de que Species sea
> "versicolor".
>
> Y algo parecido para cuando tienes un modelo de "regresión".
>
> No sé ese "VR" que comentas en tu duda de dónde sale...
>
> Si estás interesado en este tema, mira también el paquete  "pdp".
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El 7 de enero de 2018, 1:21, Manuel Mendoza <mmendoza en mncn.csic.es>
> escribió:
>
>>
>> Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
>> plot que resulta de aplicar partialPlot en un Randomforest.
>>
>> Encuentro que:
>>
>> Partial dependence plot gives a graphical depiction of the marginal effect
>> of a variable on the class probability (classification) or response
>> (regression)
>>
>> que nos indica como varía la VR en función de la variable considerada,
>> manteniendo el resto de variables fijas.
>>
>> No encuentro lo que es esa VR por ningún sitio (varianza?), ni la
>> explicación de qué son los dos ejes.
>>
>> Gracias,
>> Manuel
>>
>>
>> --
>> Dr Manuel Mendoza
>> Department of Biogeography and Global Change
>> National Museum of Natural History (MNCN)
>> Spanish Scientific Council (CSIC)
>> C/ Serrano 115bis, 28006 MADRID
>> Spain
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es


-- 
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain



Más información sobre la lista de distribución R-help-es