[R-es] limpieza datos
Carlos J. Gil Bellosta
gilbellosta en gmail.com
Mar Mar 30 15:34:44 CEST 2010
Hola, ¿qué tal?
¿Eliminarlos? ¿Quedándote únicamente con la primera fecha? ¿Con qué criterio?
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
El día 30 de marzo de 2010 15:25, Javier Marcuzzi
<javier.ruben.marcuzzi en gmail.com> escribió:
> Hola
>
>
>
> Me encuentro con un problema al manejar unos datos, estos son tomados de una
> base de datos que tiene algunos errores, importaciones de programas viejos,
> etc.
>
>
>
> Básicamente son dos tablas, la primer tabla identifica al individuo, esta
> tabla tiene valores mal ingresados.
>
> La segunda tabla tiene mediciones.
>
> Al buscar desde la tabla de mediciones a los individuos solo obtengo solo
> los individuos con mediciones, eliminando de esta forma los individuos que
> no aportan datos encontrándose entre estos muchos errores.
>
>
>
> El resultado es aproximadamente
>
>
>
> Individuo 1 fecha medición 1 medición
>
> Individuo 1 fecha medición 2 medición
>
> Individuo 1 fecha medición 3 medición
>
> Individuo 2 fecha medición 1 medición
>
> Individuo 2 fecha medición 2 medición
>
> Individuo 3 fecha medición 1 medición
>
> Individuo 3 fecha medición 2 medición
>
>
>
> Yo necesito la tabla como la expresada como otra con esta forma
>
>
>
> Individuo 1
>
> Individuo 2
>
> Individuo 3
>
>
>
> ¿Cómo puedo hacer para crear un data.frame que elimine los renglones
> 2,3,5,7, es decir los que tienen un valor igual al valor del renglón
> anterior no se tienen en cuenta, y si el valor es distinto debe guardarse en
> un data.frame? Lógicamente son más datos, unos 240.000 registros, no me es
> fácil depurarlos a mano.
>
>
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
Más información sobre la lista de distribución R-help-es