[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

Carlos J. Gil Bellosta gilbellosta en gmail.com
Vie Abr 23 11:05:11 CEST 2010


Hola, ¿qué tal?

Saber qué codificación usa un fichero de texto no es un problema
trivial ni que tenga una solución única. Entre otras cosas, porque el
"encoding" no está declarado en el fichero. Y ficheros que contengan
caracteres "normales" pueden haber estado originalmente guardados en
cualquier codificación exótica.

Una manera relativamente sencilla de averiguar la codificación es
abrir el fichero con el navegador de internet. En fireffox puedes ir a

Ver > Codificación de caracteres

y después probar con los que aparecenen en la lista hasta que el
fichero se vea "correctamente".

Dependiendo de lo que averigues, igual tienes que recodificar el
fichero. Existeun programa, iconv, que no sé si está portado a
Windows. Creo que gVim, el editor de texto, permite realizar cambios
de codificación al guardar un fichero:

http://stackoverflow.com/questions/778069/how-can-i-change-a-files-encoding-with-vim

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 23 de abril de 2010 04:05, Sebastian Kruk
<residuo.solow en gmail.com> escribió:
> Estimados:
>
> Yo tengo un archivo de texto Unicode y no funciona read.table con
> encoding Latin-1 o UTF-8 estando en un entorno Windows.
>
> Si no es con ninguno de los anteriores, ¿como lo importo?
>
> ¿Cómo puedo saber que codificación tiene?
>
> Gracias,
>
> Sebastián.



Más información sobre la lista de distribución R-help-es