[R-es] Seleccionar de columnas de un conjunto de datos

Carlos J. Gil Bellosta cgb en datanalytics.com
Jue Oct 11 15:36:46 CEST 2012


Una manera "cutre" sería leer sólo 2000, p.e., caracteres de cada fila
y luego leer las posiciones que te interesan, que casi seguro, por ser
de las primeras, están dentro de esos 2000 caracteres. Eso se puede
hacer desde R (con readLines, por ejemplo).

Un fichero de texto con separadores no es eficiente en el sentido de
que ni R ni nadie sabe en qué posición están los EOL. Hay que leerlo
todo.

Tengo un paquete en CRAN, colbycol, que funcionaría bien en tu
contexto: muchísimas columnas y pocas filas. Pero aunque te permite
leer sólo "ciertas" columnas, es cierto que tiene un preproceso en el
que lee el fichero completo, como no podría ser de otra manera.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



El día 11 de octubre de 2012 15:28, Jorge I Velez
<jorgeivanvelez en gmail.com> escribió:
> Apreciados miembros de R-help-es,
>
> Estoy trabajando con un archivo de texto que contiene ~10K filas y ~120K
> columnas.  Especificamente, me gustaria utilizar R (u otro programa GNU, si
> es el caso) para seleccionar solo las columnas 1, 2 y 6 de ese archivo y
> exportarlas como un nuevo archivo.  Cualquier sugerencia es bienvenida.
>
> Trabajo en Mac OS X (10.6.8, Snow Leopard) y mi sessionInfo() es
>
>> sessionInfo()
> R version 2.15.0 Patched (2012-04-18 r59094)
> Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)
>
> locale:
> [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
>
> attached base packages:
> [1] stats     graphics  grDevices utils     datasets  methods   base
>
> Muchas gracias,
> Jorge.-
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es