[R-es] Seleccionar de columnas de un conjunto de datos
Marcuzzi, Javier Rubén
javier.ruben.marcuzzi en gmail.com
Jue Oct 11 16:40:38 CEST 2012
Hola a todos:
AWK - recuerdo haber usado eso, es sencillo pero casi no se utiliza.
Hice una consulta casi al azar y comparto este correo de otra lista, es casi
idéntico a la solución escrita aquí.
http://www.mail-archive.com/r-help@r-project.org/msg149812.html
Javier Marcuzzi
-----Mensaje original-----
From: Jorge I Velez
Sent: Thursday, October 11, 2012 11:15 AM
To: Carlos Ortega
Cc: R-help-es
Subject: Re: [R-es] Seleccionar de columnas de un conjunto de datos
Perfecto! Muchas gracias, Carlos.
Este es el comando que utilice (Mac OS X):
setwd("~/Desktop")
system("awk ' { print $1, $2, $6 } ' mdd.ped > mdd.phen")
Y este el resultado de system.time():
user system elapsed
11.277 0.330 12.276
Definitivamente mucho mas rapido, eficiente, y versatil (sin mencionar lo
amigable con la RAM) que mi aproximacion via read.table(); solo para leer
los datos esta tardaba ~30X lo que ahora tarda awk haciendo el proces
completo.
Un saludo,
Jorge.-
2012/10/12 Carlos Ortega <>
> Hola,
>
> Sería algo así como:
>
> gawk ' { print $1, $2, $6 } ' fichero_entrada > fichero_salida
>
> Para gawk el separador natural es el espacio. Si no es así tienes que
> indicarle cuál es el separador.
> Y cada campo se obtiene con el símbolo "$".
>
> Otra opción, que recuerdo vagamente, es utilizar el comando "cut" pero no
> recuerdo el detalle de su sintaxis.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 11 de octubre de 2012 15:44, Jorge I Velez <> escribió:
>
> Hola Carlos. Gracias por tu respuesta. Alguna vez alguien me menciono
>> awk/gawk para hacer algo similar pero honestamente no me puse en la tarea
>> de aprender. Disculpa mi atrevimiento, pero tenes algun ejemplo donde se
>> haga algo similar a la situacion que acabo de plantear? Muchas gracias!
>> --JIV
>>
>>
>> 2012/10/12 Carlos Ortega <>
>>
>> Hola,
>>>
>>> Con awk/gawk esta selección es inmediata de programar, vaya sobre la
>>> misma línea de comandos de la consola lo puedes ejecutar...(una
>>> línea)...
>>>
>>> Saludos,
>>> Carlos Otega
>>> www.qualityexcellence.es
>>>
>>> El 11 de octubre de 2012 15:28, Jorge I Velez
>>> <jorgeivanvelez en gmail.com>escribió:
>>>
>>>> Apreciados miembros de R-help-es,
>>>>
>>>> Estoy trabajando con un archivo de texto que contiene ~10K filas y
>>>> ~120K
>>>> columnas. Especificamente, me gustaria utilizar R (u otro programa
>>>> GNU, si
>>>> es el caso) para seleccionar solo las columnas 1, 2 y 6 de ese archivo
>>>> y
>>>> exportarlas como un nuevo archivo. Cualquier sugerencia es bienvenida.
>>>>
>>>> Trabajo en Mac OS X (10.6.8, Snow Leopard) y mi sessionInfo() es
>>>>
>>>> > sessionInfo()
>>>> R version 2.15.0 Patched (2012-04-18 r59094)
>>>> Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)
>>>>
>>>> locale:
>>>> [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
>>>>
>>>> attached base packages:
>>>> [1] stats graphics grDevices utils datasets methods base
>>>>
>>>> Muchas gracias,
>>>> Jorge.-
>>>>
>>>> [[alternative HTML version deleted]]
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
Más información sobre la lista de distribución R-help-es