[R-es] como importar una base de datos grande a R

Reverté Calvet, Gerard greverte en ajmataro.cat
Vie Abr 19 15:12:33 CEST 2013


Gracias por las respuestas.

Miguel me miraré el paquete ff. Muchas gracias.

Javier, ya intenté la opción de conectar el fichero de txt a Access 2010, pero son demasiados campos (Acces 2010 me admite como máximo 255 campos). Me dice que elimine campos, pero sólo me enseña los 255 primeros, que son justamente los que más me interesan. No se, supongo que con MySQL no tendría este problema, pero no he trabajado nunca con MySQL.

Carlos, no dispongo de 6GB de RAM. Temiendome esto, planteé la segunda pregunta, ¿puedo conectarme con R al fichero de texto, y seleccionar los datos que me interesan a través de consultas con el paquete sqldf o con la función subset? Otra pregunta, con read.table puedo seleccionar el número de filas a importar (nrows) y el numero de filas que tiene que saltarse antes de empezar a importar datos (skip), pero con columnas como lo puedo hacer?

Gracias.
 


Gerard


-----Missatge original-----
De: gilbellosta en gmail.com [mailto:gilbellosta en gmail.com] En nom de Carlos J. Gil Bellosta 
Enviat: dijous, 18 / abril / 2013 18:58
Per a: Reverté Calvet, Gerard
a/c: r-help-es en r-project.org
Tema: Re: [R-es] como importar una base de datos grande a R

Hola, ¿qué tal?

Según

410 * 2e6 * 8 / 1024^3
[1] 6.109476

necesitarías un mínimo de 6GB de RAM (como mínimo) para almacenar el objeto que quieres cargar. ¿Los tienes?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El día 18 de abril de 2013 11:59, Reverté Calvet, Gerard <greverte en ajmataro.cat> escribió:
> Buenos dias,
>
> En primer lugar decir que soy un novato con R.
>
> Dispongo de una base de datos txt con 2 millones de registros y 410 
> variables. De las 410 variables, 409 son numéricas y 1 es de texto. 
> Las preguntas son las siguientes:
>
> 1) ¿Como puedo importar a R toda la base de datos? Con "read.table" 
> puedo importar todas las variables pero solo unos 300.000 registros.
>
> 2) Si quiero seleccionar sólo algunos datos de la base de datos, ¿qué 
> tengo que hacer? ¿conectarme a la base de datos con la función file() 
> y luego hacer consultas a través del paquete sqldf?
>
> Gracias.
>
> Gerard
>
>
>
> Avís legal/Aviso legal
>
> La present informació s'envia únicament a la persona a la que va 
> dirigida i pot contenir informació privilegiada o de caràcter 
> confidencial. Qualsevol modificació, retransmissió, difusió o altre ús 
> d'aquesta informació per persones o entitats diferents a la persona a 
> la que va dirigida està prohibida. Si vostè l'ha rebut per error, si 
> us plau contacti amb el remitent i esborri el missatge de qualsevol 
> ordinador. En el cas que aquest missatge vagi a ser contestat per la 
> mateixa via, ha de saber-se que la seva resposta podria ser coneguda 
> per tercers a l'entrar a la xarxa. Per això, si el missatge inclou 
> contrasenyes, números de targetes de crèdit o qualsevol altra 
> informació que vostè consideri confidencial, seria més segur contestar 
> per una altra via i cancel·lar la seva transmissió. L'Ajuntament de 
> Mataró i els seus organismes dependents no poden assumir la 
> responsabilitat derivada del fet de què terceres persones puguin arribar a conèixer el contingut d'aquest missatge durant la seva transmissió.
> ________________________________
> La presente información se envía únicamente a la persona a la que va 
> dirigida y puede contener información privilegiada o de carácter 
> confidencial. Cualquier modificación, retransmisión, difusión u otro 
> uso de esta información por persones o entidades diferentes a la 
> persona a la que va dirigida está prohibida. Si usted la ha recibido 
> por error, por favor contacte con el remitente y borre el mensaje. En 
> el caso de que este mensaje vaya a ser contestado por la misma vía, ha 
> de saberse que su respuesta podría ser conocida por terceros al entrar 
> en la red. Por este motivo, si el mensaje incluye contraseñas, números 
> de tarjetas de crédito o cualquier otra información que considere 
> confidencial, sería más seguro contestar por otra vía y cancelar su 
> transmisión. El Ayuntamiento de Mataró y sus organismos dependientes 
> no pueden asumir la responsabilidad derivada del hecho de que terceras 
> personas puedan llegar a conocer el contenido de este mensaje durante su transmisión.
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130419/a3abb924/attachment.html>


Más información sobre la lista de distribución R-help-es