[R-es] Cantidad de datos

Carlos J. Gil Bellosta cgb en datanalytics.com
Sab Ago 8 02:36:05 CEST 2009


Hola, ¿qué tal?

No sabemos nada ni de tu sistema y poco de tu conjunto de datos (sólo
que tiene 30M de filas).

La solución a este tipo de problemas suele pasar por:

1) Cargar tus datos en una base de datos. Te recomiendo postgres.
Herramientas del tipo Talend o Kettle te pueden resultar muy útiles para
este propósito.

2) Analizar la tabla dentro de la base de datos con las siguientes tres
preguntas en mente:

	2.1) ¿Necesito todas las columnas?
	2.2) ¿Necesito todas las filas?
	2.3) ¿Necesito el máximo nivel de detalle o puedo agregar filas desde
la base de datos?

3) Filtrar, descartar columnas y agregar dentro de la base de datos.

4) Importar la tabla resultante a R (la conexión JDBC entre R y postgres
funciona de maravilla).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com




On Fri, 2009-08-07 at 12:10 -0500, Manuel Bonilla wrote:
> Buenas, tengo 30 000 000 de datos, y el R no me deja trabajar, como 
> podria corregir eso problema para trabajar con los 30 000 000, mintras 
> es estoy trabajando cada 1 000 000 pero no es igual.
> Espero puedan ayudarme
> 
> saludos
>



Más información sobre la lista de distribución R-help-es