[R-es] buscar y reemplazar tabs dentro de un archivo

eric ericconchamunoz en gmail.com
Mie Mayo 18 10:02:59 CEST 2016


Muchas gracias Javier ... cuando hay un doble \teb\teb desaparece la 
fila completa al importar el archivo a un data.frame, por eso queria 
modificarlo antes de importar el archivo, o pensaba que quiza habia una 
funcion robusta para importar, que no fuera afectada por el doble tab

muchas gracias por su sugerencia,

Saludos, Eric.





On 05/17/2016 11:19 PM, Javier Marcuzzi wrote:
> Estimado Eric
>
> Las filas que faltan, ¿son filas enteras, donde todo es valor NA o “” en un data.frame?
>
> Porque si es así podrías importar todo y luego buscar (filtrar) los que no son NA.
>
> Copio y pego un código que utilizo en un trabajo, posiblemente le sea útil.
>
> Tratamientos$Tratamiento[Tratamientos$Tratamiento == ""] <- NA  # asignar NA a las celdas vacías
> Tratamientos<- Tratamientos[ !is.na(Tratamientos$Tratamiento),]    #Solo dejo filas en las que las tratamiento son diferentes de cero
>
> Javier Rubén Marcuzzi
>
> De: ja palazon
> Enviado: martes, 17 de mayo de 2016 18:06
> Para: r-help-es en r-project.org
> Asunto: Re: [R-es] buscar y reemplazar tabs dentro de un archivo
>
> Usa la función system para desde R usar las herramientas del sistema.
>
> On 17/05/16 16:13, eric wrote:
>> Hola Jose, muchas gracias por la sugerencia, no conocia la existencia
>> de "sed" ... yo preguntaba por la posibilidad de hacerlo con R mismo
>> para no tener que escribir algo en otro lenguaje, porque te refieres a
>> "sed" en linux, no ? y tambien por lo mucho mejor que es un script que
>> hacerlo a mano, considerando que son varios cientos de archivos ...
>> voy a probar con un script de bash a ver si me funciona.
>>
>> Muchas gracias a todos,
>>
>> Saludos, Eric.
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> On 05/15/2016 11:57 AM, JA Palazón wrote:
>>> Hola
>>>
>>> Lo más sencillo es utilizar sed, desde la línea de comandos:
>>>
>>> sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat
>>>
>>> Alternativa: usa la hoja de cálculo de libre office te da
>>> la opción de eliminar repeticiones de separador de campos.
>>>
>>> Espero que te sirva
>>>
>>> El 14/05/16 a las 18:58, eric escribió:
>>>> Estimados, tengo el siguiente problema:
>>>>
>>>> tengo muchos archivos (algunos cientos) con columnas de datos
>>>> separados por \tab y al importar en R me di cuenta que me faltaban
>>>> algunas filas ... despues de 3 dias dandole vueltas al problema
>>>> encontre que las filas que faltaban tenian un doble \tab en alguna
>>>> columna
>>>>
>>>> Luego la pregunta es:
>>>>
>>>> existe alguna forma de importar los archivos de modo que el doble \tab
>>>> no produzca errores o
>>>>
>>>> existe alguna forma de "abrir" los archivos sin importarlos en R (pero
>>>> con R), buscar y reemplazar ese doble \tab para luego importar
>>>>
>>>> Saludos y muchas gracias,
>>>>
>>>> Eric,
>>>>
>>>>
>>>>
>>>>
>>>
>>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> 	[[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

-- 
Forest Engineer
Master in Environmental and Natural Resource Economics
Ph.D. student in Sciences of Natural Resources at La Frontera University
Member in AguaDeTemu2030, citizen movement for Temuco with green city 
standards for living

Nota: Las tildes se han omitido para asegurar compatibilidad con algunos 
lectores de correo.



Más información sobre la lista de distribución R-help-es