[R-es] Leer csv separado por comas y por espacios

Jesús Para Fernández j.para.fernandez en hotmail.com
Lun Ene 9 14:06:31 CET 2017


Pensé que sería mucho más sencillo.


Al final optaré por lo que he hecho, el strstrip


Gracias de todos modos

Jesús


________________________________
De: Carlos Ortega <cof en qualityexcellence.es>
Enviado: lunes, 9 de enero de 2017 12:49
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Leer csv separado por comas y por espacios

Hola,

El parámetro "sep" de "read.csv()" ha de ser único. No puedes utilizar varias opciones, aunque es cierto que en la documentación no lo advierte. Por lo que tienes que utilizar otra estrategia para leer el fichero.

Te sugeriría varias cosas:

  *   Probar con la función "fread()" del paquete "data.table" que es algo más inteligente que read.csv. Aunque no tengo claro que realmente te vaya a funcionar... pero por probar...
  *   Una segunda opción es un poco más trabajosa que es el leer el fichero con "readLines", de esta forma te generará un data.frame con una fila por línea del fichero. Luego tendrás que construir una lógica para que si la línea tiene "," como separador separes las variables y si el separador es un "tab" que haga lo propio.
  *   Otra opción más limpia y sencilla es pre-procesar el fichero en el SO con funciones del tipo "sed", "awk" y dejarlo con el formato, separadores que más te interese.
  *   Y si el fichero tiene bloques con "," y otros bloques con "tab" como separador, puedes utilizar "read.table" y decir que vaya saltando el número de filas, que no tienen el separador que has definido...

Saludos,
Carlos Ortega
www.qualityexcellence.es<http://www.qualityexcellence.es>
[http://qualityexcellence.es/images/1_blanco.jpg]<http://www.qualityexcellence.es/>

QualityExcellence<http://www.qualityexcellence.es/>
www.qualityexcellence.es
QUALITY EXCELLENCE, consultores en calidad, procesos y mejora continua


El 9 de enero de 2017, 9:42, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió:
Buenas compañeros!


Tengo una duda y no se muy bine como resolverlo. Tengo un csv en el que hay variables separadas por comas y otras esparadas por espacios (tabulaciones). Algo así


V1    V2   V3,V4

M1   123   2512,2522

M2   117   2852,3521

...................................



Para leerlo he probado poniendo:


datos<-read.csv("c:/datos/listado.txt",sep=c(",","","\t"),header=F)


Pero no me funciona, es decir, la separada por el espacio en blanco no la distingue y la mete en lo mismo.


Lo he solucionado hacinedo un strsplit pero es un poco coñazo andar parcheando algo que tendria que leer bien directametne.


¿Alguna idea de porque no está cogiendo bien el fichero?


Gracias

Jesús

        [[alternative HTML version deleted]]


_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Saludos,
Carlos Ortega
www.qualityexcellence.es<http://www.qualityexcellence.es>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es