[R-es] Encontrar las variables más importantes en componentes principales
Argel Gastélum Arellánez
argel.gastelum en gmail.com
Mar Ago 27 23:14:52 CEST 2013
Hola compañeros de la lista. Qué tal.
Tengo un análisis de componentes principales, en el que se evalúan
aproximadamente 1000 variables. Usando la función dudi.pca e
inertia.dudi obtengo una cantidad de información sobre la influencia de
las variables sobre los dos componentes principales. Me gustaría saber
si existe alguna función que sobre esta información me arrojara la lista
de cuáles son las variables que más influyen sobre el resultado.
Revisando la información que arroja inertia.dudi, creo que con las
contribuciones a los ejes podría conseguirlo. Los comandos que utilizo
son los siguientes:
acp <- dudi.pca(df = DATOS[,(2:1013)], scannf = FALSE, nf = 2)
acpI <- inertia.dudi(acp, row.inertia = T, col.inertia = T)
#CONTRIBUCIONES DE LAS COLUMNAS A LOS EJES
acpI$col.abs/100
Con esto obtengo una lista similar a:
Comp1 Comp2
X0 0.02 0.03
X1 0.04 0.00
X2 0.25 0.08
X3 0.12 0.07
X4 0.08 0.10
X5 0.09 0.03
.
.
.
De estos valores parece ser que, por ejemplo, las variables X2 y X3
contribuyen en mayor grado al componente principal 1, y que la variable
X4 contribuye en mayor grado al componente principal 2... ¿Cómo podría,
usando un criterio objetivo, obtener aquéllas variables X que estén
afectando en mayor medida al resultado del análisis de componentes
principales?
De antemano muchas gracias por la ayuda.
Saludos.
--
Argel.
Más información sobre la lista de distribución R-help-es