Hola,

Empiezo por la parte que puede ser más fácil y es sobre algún libro que
trate este tema pero aplicado a R. De lo más asequible, actualizado que
conozco te recomendaría especialmente este libro:

http://www.amazon.com/Handbook-Statistical-Analyses-Using-Second/dp/1420079336/ref=sr_1_1?s=books&ie=UTF8&qid=1317934799&sr=1-1

Y sobre el detalle de la organización de los datos, efectivamente como has
visto en los ejemplos, se organizan de manera que los detalles de un
individuo aparecen en una fila. En este tipo de modelos lo que monitoriza es
el tiempo de supervivencia (lo que comentas como "entre fechas") y el resto
de columnas suelen ser variables categóricas (tratamiento, sexo, etc) que
sirven para contrastar si los tiempos de supervivencia están o no
relacionados con estas variables.

Pero como en tu caso, quieres mantener las fechas de diferentes hitos
(nacimiento, tratamiento, etc), las puedes mantener en las primeras columnas
de la tabla:

Individuo Nacimiento Inicio_Protocolo Resultado
Javier     17/11/00    27/12/01          30/04/04
Otro       20/10/00    16/09/01          25/03/03
....

Como no sé muy bien el significado de los eventos "Tratamiento" no los he
puesto, pero vaya si los quieres mantener serían columnas adicionales.

Sobre esta tabla, el ampliarla para conseguir el "Tiempo_Supervivencia" es
inmediato (resta de fechas de las columnas "Resultado" y "Nacimiento").  Además
del "Tiempo_Supervivencia" puedes llegar a analizar si el
"Tiempo_hasta_inicio_tratamiento" o el "Tiempo_en_tratamiento" tiene o no
efecto en los tiempos de supervivencia. Estas otras variables derivadas
vuelven a ser de cálculo inmediato (resta de columnas con fechas).

Hacer esto mismo sobre la estructura que tienes :

javier    17/11/00    nacimiento
javier    27/12/01    inicio protocolo
javier    08/03/02    tratamiento
javier    20/09/03    tratamiento
javier    30/04/04    resultado

es algo bastante más complicado (pero factible).

Si ya tienes pasadas 5000 líneas en tu tabla, de esa otra forma, la forma de
construir la nueva estructura puede hacerse en R con un blucle o con un par
de manipulaciones en Excel...

Saludos,
Carlos Ortega
www.qualityexcellence.es


2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com>

> Hola a todos:
>
> Estoy comenzando a utilizar la librería survival, mi experiencia al
> respecto es nula.
>
> El material que leo y los ejemplos son entendibles, pero tengo una duda
> respecto a como preparar mis datos antes de utilizar la librería.
>
> Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de
> datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo
> del tiempo de ciertas cosas que van pasando.
> Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o
> cinco tratamientos, y el resultado (si o no). Cabe aclarar que el resultado
> puede ser al primer tratamiento, segundo tratamiento, al producirse el
> resultado no se realiza el siguiente tratamiento (no enveneno a nadie, pero
> es comparable, si está muerto no doy más veneno). También conozco la fecha
> de nacimiento, podía tener la edad a cada tiempo.
>
> Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy
> próximo a lo necesario para el procesamiento del modelo en R. No se a
> ustedes, pero para a mi muchas veces es más el tiempo que me lleva acomodar
> los datos (dentro o fuera de R) que el que me lleva pensar y hacer el modelo
> estadístico.
>
> Lo que yo pensé es almacenar los registros de una forma muy sencilla, las
> columnas serían las siguientes:
>
> Individuo, fecha, lo que paso.
>
> Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio de
> protocolo”, “tratamiento”, “resultado”.
>
> Quedaría algo como (las fechas son cualquiera)
>
> javier    17/11/00    nacimiento
> javier    27/12/01    inicio protocolo
> javier    08/03/02    tratamiento
> javier    20/09/03    tratamiento
> javier    30/04/04    resultado
>
> Mirando ejemplos, las columnas preparadas son serían algo como:
> individuo    fecha tratamiento    resultado
>
> O
> Individuo     entre fechas        resultados
>
> La libreria survival tiene el siguiente ejemplo:
> fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata)
>
> subject    time1    time2    status    age    creatinine . . .
> 1             0             15         0         25         1.3
> 1             15           46         0         25         1.5
> 1             46           73         0         25         1.4
>
> Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal y
> tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por
> ejemplo)
> Serían algo como:
>
> subject    time     status ( status es si o no para la fecha o día time).
>
> Necesitaría algo de información como para leer un poco más o comentarios de
> experiencia de algunos de ustedes sobre survival y R. Principalmente a como
> ir preparando los registros para ser eficiente y no perder tiempo, llevo más
> de 5000 renglones pasados y no me gustaría tener que rehacer mi trabajo por
> almacenar de forma incorrecta la información. Tengo dudas sobre como
> preparar los registros para importar y/o procesar en R antes de escribir el
> modelo para la librería Survival.
>
>
>
>        [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

	[[alternative HTML version deleted]]

