[R-es] limpieza datos

Bengoechea Bartolomé Enrique (SIES 73) enrique.bengoechea en credit-suisse.com
Mie Mar 31 08:52:23 CEST 2010


Hola,

Si "x" es el data frame, puedes usar

	x[!duplicated(x[[1L]]),]

que elimina todas las filas que tienen duplicado el valor de la primera columna.

Un saludo
 
------------------------------
Date: Tue, 30 Mar 2010 10:25:51 -0300
From: "Javier Marcuzzi" <javier.ruben.marcuzzi en gmail.com>
To: <r-help-es en r-project.org>
Subject: [R-es] limpieza datos
Message-ID: <4bb1fbcd.2a7ae70a.0b03.fffff5aa en mx.google.com>
Content-Type: text/plain

Hola



Me encuentro con un problema al manejar unos datos, estos son tomados de una base de datos que tiene algunos errores, importaciones de programas viejos, etc.



Básicamente son dos tablas, la primer tabla identifica al individuo, esta tabla tiene valores mal ingresados.

La segunda tabla tiene mediciones.

Al buscar desde la tabla de mediciones a los individuos solo obtengo solo los individuos con mediciones, eliminando de esta forma los individuos que no aportan datos encontrándose entre estos muchos errores.



El resultado es aproximadamente



Individuo 1         fecha medición 1             medición

Individuo 1         fecha medición 2             medición

Individuo 1         fecha medición 3             medición

Individuo 2         fecha medición 1             medición

Individuo 2         fecha medición 2             medición

Individuo 3         fecha medición 1             medición

Individuo 3         fecha medición 2             medición



Yo necesito la tabla como la expresada como otra con esta forma



Individuo 1

Individuo 2

Individuo 3



¿Cómo puedo hacer para crear un data.frame que elimine los renglones 2,3,5,7, es decir los que tienen un valor igual al valor del renglón anterior no se tienen en cuenta, y si el valor es distinto debe guardarse en un data.frame? Lógicamente son más datos, unos 240.000 registros, no me es fácil depurarlos a mano.






	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es