[R-es] Cantidad de datos
Carlos J. Gil Bellosta
cgb en datanalytics.com
Sab Ago 8 02:36:05 CEST 2009
Hola, ¿qué tal?
No sabemos nada ni de tu sistema y poco de tu conjunto de datos (sólo
que tiene 30M de filas).
La solución a este tipo de problemas suele pasar por:
1) Cargar tus datos en una base de datos. Te recomiendo postgres.
Herramientas del tipo Talend o Kettle te pueden resultar muy útiles para
este propósito.
2) Analizar la tabla dentro de la base de datos con las siguientes tres
preguntas en mente:
2.1) ¿Necesito todas las columnas?
2.2) ¿Necesito todas las filas?
2.3) ¿Necesito el máximo nivel de detalle o puedo agregar filas desde
la base de datos?
3) Filtrar, descartar columnas y agregar dentro de la base de datos.
4) Importar la tabla resultante a R (la conexión JDBC entre R y postgres
funciona de maravilla).
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
On Fri, 2009-08-07 at 12:10 -0500, Manuel Bonilla wrote:
> Buenas, tengo 30 000 000 de datos, y el R no me deja trabajar, como
> podria corregir eso problema para trabajar con los 30 000 000, mintras
> es estoy trabajando cada 1 000 000 pero no es igual.
> Espero puedan ayudarme
>
> saludos
>
Más información sobre la lista de distribución R-help-es