[R-es] Determinación del punto de corte óptimo

Fernando Sanchez fernandsanche en yahoo.es
Mar Ene 26 20:04:39 CET 2016


 Hola a todos, en estos momentos me encuentro inmerso en laresolución del siguiente problema. Resulta que dispongo de una variable categóricadenominada Severity y que consta de tres categorías (low, medium, high). Además,tengo otra variable que se denomina ZX y que puede tomar cualquier valorcomprendido entre 0 y 10. Quiero determinar los dos puntos de corte óptimos demanera que me dividan a la variable ZX en tres categorías (llamadas tambiénlow, medium y high) y que exista el máximo nivel de acuerdo entre las variablesZX y Severity. Por acuerdo me refiero a que el porcentaje de casos (filas) queen ambas variables caiga en la misma categoría sea el máximo posible.Dado que no se me ocurría cómo resolverlo de formasistemática, he hecho un pequeño código en R que fija dos puntos de cortealeatorios y calculo la tasa de acuerdo. A base de repetirlo 500.000 veces, mehe hecho una idea de hasta qué nivel de concordancia puedo llegar pero buscabauna forma más sistemática. En el caso de un único punto de corte, sé queexisten métodos y librerías en R como OptimalCutPoints que permitenhacerlo.Debajo os pongo un ejemplo de los datos que estoy manejandopara que os hagáis mejor una idea de su aspecto.ZX                      Severity    2.818181818    high2.084242424    high5.326666667    medium4.758484848    low4.795454545    high3.367878788    high5.734848485    high3.417575758    medium3.16000         medium4.307272727    lowCualquier sugerencia es bienvenida. Si mi código le puedeayudar a alguien, estaré encantado en pasárselo.
	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es