[R-es] Encontrar las variables más importantes en componentes principales

Argel Gastélum Arellánez argel.gastelum en gmail.com
Mar Ago 27 23:14:52 CEST 2013


     Hola compañeros de la lista. Qué tal.

     Tengo un análisis de componentes principales, en el que se evalúan 
aproximadamente 1000 variables. Usando la función dudi.pca e 
inertia.dudi obtengo una cantidad de información sobre la influencia de 
las variables sobre los dos componentes principales. Me gustaría saber 
si existe alguna función que sobre esta información me arrojara la lista 
de cuáles son las variables que más influyen sobre el resultado.

     Revisando la información que arroja inertia.dudi, creo que con las 
contribuciones a los ejes podría conseguirlo. Los comandos que utilizo 
son los siguientes:

acp <- dudi.pca(df = DATOS[,(2:1013)], scannf = FALSE, nf = 2)

acpI <- inertia.dudi(acp, row.inertia = T, col.inertia = T)

#CONTRIBUCIONES DE LAS COLUMNAS A LOS EJES
acpI$col.abs/100

     Con esto obtengo una lista similar a:

      Comp1 Comp2
X0    0.02  0.03
X1    0.04  0.00
X2    0.25  0.08
X3    0.12  0.07
X4    0.08  0.10
X5    0.09  0.03
.
.
.

     De estos valores parece ser que, por ejemplo, las variables X2 y X3 
contribuyen en mayor grado al componente principal 1, y que la variable 
X4 contribuye en mayor grado al componente principal 2... ¿Cómo podría, 
usando un criterio objetivo, obtener aquéllas variables X que estén 
afectando en mayor medida al resultado del análisis de componentes 
principales?

     De antemano muchas gracias por la ayuda.

     Saludos.

-- 

     Argel.



Más información sobre la lista de distribución R-help-es