[R-es] convertir archivo texto en data frame

Carlos J. Gil Bellosta cgb en datanalytics.com
Lun Jun 21 14:58:08 CEST 2010


Hola...

¿Y cómo esperas que R entienda que "Javier Dominguez Pelaez" es
"Javier" + "Domínguez Peláez" y que "José María Pérez" es "José María"
+ "Pérez"?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 21 de junio de 2010 13:58, Sebastian Kruk
<residuo.solow en gmail.com> escribió:
> El fichero table tiene el siguiente formato:
>
> "2000-01-03 12:10:20 Juan Perez"
> "2000-02-30 16:10:20 Javier Pelaez"
> "2000-03-01 02:10:20 Darío Iglesias"
> "2000-03-04 12:34:00 Daniel Bianco"
> "2000-04-10 16:10:20 Javier Pelaez"
> "2000-03-30 02:10:20 Darío Varela"
> "2000-04-03 12:10:20 Juan Perez"
> "2000-05-30 16:10:20 Javier Pelaez"
> "2000-06-01 02:10:20 Darío Iglesias"
> "2000-07-04 12:34:00 Daniel Bianco"
> "2000-08-10 16:10:20 Javier Pelaez"
> "2000-09-30 02:10:20 Darío Varela"
> "2000-01-03 12:10:20 Juan Perez"
> "2000-02-30 16:10:20 Javier Pelaez"
> "2000-03-01 02:10:20 Darío Iglesias"
> "2000-03-04 12:34:00 Daniel Bianco"
> "2000-04-10 16:10:20 Javier Pelaez"
> "2000-03-30 02:10:20 Darío Varela"
> "2000-04-03 12:10:20 Juan Perez"
> "2000-05-30 16:10:20 Javier Pelaez"
> "2000-06-01 02:10:20 Darío Iglesias"
> "2000-07-04 12:34:00 Daniel Bianco"
> "2000-08-10 16:10:20 Javier Pelaez"
> "2000-09-30 02:10:20 José María Pérez"
> "2000-01-03 12:10:20 Juan Perez"
> "2000-02-30 16:10:20 Javier Pelaez"
> "2000-03-01 02:10:20 Darío Iglesias"
> "2000-03-04 12:34:00 Daniel Bianco"
> "2000-04-10 16:10:20 Javier Pelaez"
> "2000-03-30 02:10:20 Darío Varela"
> "2000-04-03 12:10:20 María José Juarez Perez"
> "2000-05-30 16:10:20 Javier Dominguez Pelaez"
> "2000-09-30 02:10:20 José María Pérez"
> "2000-01-03 12:10:20 Juan Perez"
> "2000-02-30 16:10:20 Javier Pelaez"
> "2000-03-01 02:10:20 Darío Iglesias"
> "2000-03-04 12:34:00 Daniel Bianco"
> "2000-04-10 16:10:20 Javier Pelaez"
> "2000-03-30 02:10:20 Darío Varela"
> "2000-04-03 12:10:20 María José Juarez Perez"
> "2000-05-30 16:10:20 Javier Dominguez Pelaez"
>
> Tengo instalado el R 2.11.1 en Windows Vista. El archivo lo tengo que
> abrir y guardarlo con codificación Ansi sino cuando lo "capturo" queda
> cualquier cosa.
>
> Me gustaría poder de una sola vez crear un data frame en que me quede
> en la primera columna la fecha y hora juntas, en la segunda los
> nombres y en la tercera los apellidos. Como máximo puede haber dos
> apellidos y/o dos nombres.
>
> Saludos,
>
> Sebastián.
>
> El día 18 de junio de 2010 13:09, Olivier Nuñez <onunez en iberstat.es> escribió:
>> El fichero tabla tiene el formato:
>>
>> Fecha;Nombre;Apellido
>> 1999-01-30 12:12:20;Marx;Carl
>> 1991-02-23 11:12:19;Paolo;Conte
>>
>> (dejar un fila vacía al final del fichero).
>> Luego el comando
>>
>>> read.table("tabla",header=TRUE,sep=";",colClasses =
>>> c("POSIXct","character","character"))
>>
>> da el resultado:
>>
>>                Fecha Nombre Apellido
>> 1 1999-01-30 12:12:20   Marx     Carl
>> 2 1991-02-23 11:12:19  Paolo    Conte
>>
>> -- ____________________________________
>>
>> Olivier G. Nuñez
>> Email: onunez en iberstat.es
>> Tel : +34 663 03 69 09
>> Web: http://www.iberstat.es
>>
>> ____________________________________
>>
>>
>>
>>
>> El 18/06/2010, a las 17:43, Sebastian Kruk escribió:
>>
>>> Tengo un archivo de texto donde cada línea es de la siguiente forma:
>>>
>>> "aa-mm-dd hh:mm:ss Nombre Apellido"
>>>
>>> ¿Hay alguna forma de usar read.table o algo similar para obtener
>>> directamente un data frame que tenga dos columnas donde una tenga la
>>> fecha y quede de tipo PosiX y la otra character con el nombre
>>> completo?
>>>
>>> Gracias,
>>>
>>> Sebastián.
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es