[R-es] Crear Cluster

ricardo alva k@|o_@|v@ @end|ng |rom hotm@||@com
Mie Ene 27 19:33:04 CET 2021


Hola amigos.
Soy algo nuevo en este tema de R, pero estoy aprendiendo a empujones porque el tiempo apremia. Necesito segmentar 165000 personas con los siguientes datos, los cuales los tengo en excel en un archivo llamado Data, el cual tiene la siguiente forma.

Nombre
G�nero  Edad    R_Edad  Domilicio       Actividad econ�mica     Ingresos mensuales      R_Ingresos      Categoria Persona
Pepito  1       24      2       1104    23      1200    2       3
Juanita 0       56      4       1021    140     3450    4       16
Pedro   1       35      3       1104    45      300     1       4


Especificaciones:

  *   G�nero: 1 =Masculino y 0=Femenino
  *   R_Edad: La edad recodificada en 9 categor�as.
  *   Domilicio: C�digos que representan distintas regiones del pa�s. Son 167 categor�as en total.
  *   Actividad econ�mica: Clasificado en 164 categor�as.
  *   R_Ingresos: Ingresos mensuales recodificados en 15 categor�as.
  *   Categor�a Persona: Clasificado en 19 categor�as.

Estuve intentando usar la distancia de gower(al ser variables mixtas), con las variables G�nero, R_Edad, Domicilio, Actividad Econ�mica, R_Ingresos y Categor�a Persona, para luego poder usar la funci�n kmeans y PAM, para poder comparar los resultados, pero me arroja que mis variables son character y no continua con el proceso. Habia le�do tambi�n que la funci�n clustMixType tambi�n es muy �til cuando tienes datos nominales con bastantes categor�as, pero no entiendo como armar la sintaxis; en realidad se me hace  dif�cil entender la sintaxis de todo jajajaja.

Si alguien con tiempo, podr�a indicarme como ser�a la sintaxis para realizar el an�lisis con los m�todos antes indicados y as� poder evaluar el mejor n�mero de cluster y la consistencia de �stos se los agradecer�a mucho.


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es