[R-es] Determinación del punto de corte óptimo

Fernando Sanchez fernandsanche en yahoo.es
Mar Ene 26 21:59:20 CET 2016


 Jorge y Carlos: muchas gracias por vuestras respuestas. Quiero pedir disculpas a todos los miembros de la lista por el problema con el mensaje anterior. Lo he mandado como siempre y no sé qué ha pasado. Lo envío de nuevo, espero que ahora no de problemas.
saludos,
Fernando
Hola a todos, en estos momentos me encuentro inmerso en la resolución del siguiente problema. Resulta que dispongo de una variable categórica denominada Severity y que consta de tres categorías (low, medium, high). Además, tengo otra variable que se denomina ZX y que puede tomar cualquier valor comprendido entre 0 y 10. Quiero determinar los dos puntos de corte óptimos de manera que me dividan a la variable ZX en tres categorías (llamadas también low, medium y high) y que exista el máximo nivel de acuerdo entre las variables ZX y Severity. Por acuerdo me refiero a que el porcentaje de casos (filas) que en ambas variables caiga en la misma categoría sea el máximo posible.
Dado que no se me ocurría cómo resolverlo de forma sistemática, he hecho un pequeño código en R que fija dos puntos de corte aleatorios y calculo la tasa de acuerdo. A base de repetirlo 500.000 veces, me he hecho una idea de hasta qué nivel de concordancia puedo llegar pero buscaba una forma más sistemática. En el caso de un único punto de corte, sé que existen métodos y librerías en R como OptimalCutPoints que permiten hacerlo.
Debajo os pongo un ejemplo de los datos que estoy manejando para que os hagáis mejor una idea de su aspecto.
ZX                      Severity    
2.818181818     high
2.084242424     high
5.326666667     medium
4.758484848     low
4.795454545     high
3.367878788     high
5.734848485     high
3.417575758     medium
3.16000         medium
4.307272727     low
Cualquier sugerencia es bienvenida. Si mi código le puede ayudar a alguien, estaré encantado en pasárselo.
	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es