[R-es] Re: Correlación entre X (ordinal) y Y (nomial)

Pablo Emilio Verde PabloEmilio.Verde en uni-duesseldorf.de
Mar Sep 29 11:19:07 CEST 2009


Hola Jorge,

En el Wikipedia acabo de leer: "la correlación indica la fuerza y la
dirección de una
relación lineal entre dos variables aleatorias". En el caso de variables
aleatores que
no son continuas, parece que el concepto de correlacion es mas misterioso.

En la version en ingles de este articulo de Wiki aprace:

"The polychoric correlation is another correlation applied to ordinal data
..."

Cuando vi la palabra "polychoric" pense que se referia a alguna substancia
quimica ...

Bueno, te doy una sugerencia sobre tu problema, que en definitiva queres
medir
asociacion entre Y y X. Aparte de usar un test Chi^2 de asociacion entre X e
Y,
una posibiliadad es utilizar regresion.

Para la asociacion Pr(X|Y) podes aplicar: "Proportional-odds" con la funcion
"polr( X ~ Y )"
que esta en el paquete "MASS". Para la asociacion Pr(Y|X) regresion
multinomial
con la funcion "multinom(Y ~X)" del paquete "nnet".

Los coeficientes de estos modelos representan "logOdds" asi que estan
centrados en 0.
Esta estrategia tiene el efecto colateral de que podes analizar si los
modelos ajustan tus
datos o no (e.g. residuos etc.).

Uno esperaria que los resulatados en una direccion y la otra sean similares,
y dependera
de la forma que quieras presentar los resultados elegir uno u otro.

En una situacion mas complicada en la que te den distintos resultados
Pr(Y|X) y Pr(X|Y)
creo que deberias investigar como han sido generados estos datos.

Espero que te sirva.

Saludos.

Pablo




----- Original Message -----
From: "Jorge Ivan Velez" <jorgeivanvelez en gmail.com>
To: "R-help-es" <r-help-es en r-project.org>
Sent: Tuesday, September 29, 2009 12:19 AM
Subject: [R-es] Correlación entre X (ordinal) y Y (nomial)


Buenas tardes para todos,

Estoy trabajando con una tabla de datos que contiene una variable ordinal
(X) y otra nominal (Y). La primera tiene categorias n1,n2, n3 y n4 siendo n4
la de mayor gravedad, y la segunda tiene categorias A, B, C, D (el orden no
importa).

Me gustaría determinar la correlación entre X y Y utilizando R (por
supuesto!) y sin perder la información ordinal que contiene X. En CRAN
encontré que una opción podría ser la librería polycor pero
desafortunadamente las funciones que se encuentran allí no aplican para
cuando X es ordinal y Y es nominal. En [1] sugieren utilizar el coeficiente
de correlación "Rank-Biserial" pero mis datos tienen más de dos categorías
en ambas variables.

Podría alguien sugerirme alguna otra librería / función en R que pueda
utilizar?

Muchas gracias por su tiempo,

                                   Jorge Ivan Velez
[1] http://www.andrews.edu/~calkins/math/edrm611/edrm13.htm

[[alternative HTML version deleted]]




----------------------------------------------------------------------------
----


_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es