[R-es] Importación de texto con caracteres especiales

Carlos J. Gil Bellosta cgb en datanalytics.com
Dom Mar 13 23:54:20 CET 2016


Hola, ¿qué tal?

En el mundo Windows, latin1 impera. En Linux/Mac, es UTF-8. Por eso,
_generalmente_,

1) Si código y datos proceden del mismo ámbito, no es necesario indicar el
fileEncoding.
2) Si estás en Windows y quieres leer datos procedentes del mundo
Linux/Mac, usualmente el fileEncoding "UTF-8" vale.
3) Si estás en Linux/Mac y quieres leer datos procedentes del mundo Widows,
usualmente el fileEncoding "latin1" vale.

Hay excepciones a las reglas anteriores, pero son las menos.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 13 de marzo de 2016, 22:43, "Raúl Vaquerizo" <
rvaquerizo en analisisydecision.es> escribió:

> Muchas gracias Carlos, no se me había ocurrido que no se pudiera con
> UTF-8. A veces hay que empezar por las soluciones más simples.
>
> El Dom, 13 de Marzo de 2016, 8:16 pm, Carlos Ortega escribió:
> > Hola Raúl,
> >
> >
> > Utiliza como encoding "latin1"...
> >
> >
> > #-----------------
> >
> >> ubicacion="
> >
> http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congr
> > eso.txt "
> >
> >> texto <- read.table
> > (ubicacion,sep="\r",encoding="latin1",stringsAsFactors = FALSE)
> >
> >> head(texto)
> >
> >
> >
> >
> > V1
> > 1
> >
> >
> >
> > ORDEN DEL
> > DÍA:
> > 2 - Toma en consideración de la proposición de reforma del artículo 135
> de
> >  la Constitución española, presentada por los grupos parlamentarios
> > Socialista y Popular en el Congreso. BOCG. Congreso de los Diputados,
> > serie B, número 329-1, de 26 de agosto de 2011. (Número de expediente
> > 100/000001.) ... (Página2)
> > 3                                                                -
> Acuerdo
> >  de tramitación directa y en lectura única de la citada proposición de
> > reforma constitucional, en virtud de lo dispuesto en el artículo 150 del
> > Reglamento del Congreso de los Diputados. (Número de expediente
> > 100/000001.) ... (Página2)
> > 4
> > #--------------------
> >
> >
> >
> > Gracias,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
> > El 13 de marzo de 2016, 19:58, "Raúl Vaquerizo" <
> > rvaquerizo en analisisydecision.es> escribió:
> >
> >> Compañeros,
> >>
> >>
> >> Me plantearon una duda el otro día en el blog sobre la problemática de
> >> leer un archivo de texto con caracteres españoles tales como tildes y
> >> eñes
> >> (http://analisisydecision.es/analisis-de-textos-con-r/#comment-93993)
> >> En
> >> un principio pensé que sería un problema de diccionarios en R-Studio y
> >> que lo resolvería en 10 minutos y aquí llevo una hora y no soy capaz de
> >> que este código tan simple lea tildes:
> >>
> >> ubicacion="
> >> http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_con
> >> greso.txt "
> >> texto = read.table (ubicacion,sep="\r",encoding="UTF-8",stringsAsFactors
> >> =
> >> FALSE)
> >>
> >>
> >>> sessionInfo()
> >> R version 3.2.2 (2015-08-14)
> >> Platform: x86_64-apple-darwin13.4.0 (64-bit)
> >> Running under: OS X 10.10.5 (Yosemite)
> >>
> >>
> >> locale:
> >> [1] C/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8
> >>
> >>
> >> attached base packages: [1] stats     graphics  grDevices utils
> >> datasets  methods   base
> >>
> >> other attached packages: [1] shapefiles_0.7 foreign_0.8-66 sp_1.2-1
> >> shiny_0.13.0
> >>
> >> loaded via a namespace (and not attached): [1] R6_2.1.1
> >> htmltools_0.3   tools_3.2.2     Rcpp_0.12.1 grid_3.2.2      digest_0.6.8
> >> xtable_1.8-0 [8] httpuv_1.3.3    mime_0.4        lattice_0.20-33
> >>
> >>
> >> En mi viejo win-32 fincionaba, ahora en Linux tampoco me funciona y en
> >> mi nuevo Win-64 no sabría deciros porque mi mujer lo tiene lleno de
> >> virus. Si no es un problema de diccionario, ¿qué está pasando? Saludos.
> >>
> >>
> >> Ra�l Vaquerizo Romero
> >> www.analisisydecision.es
> >>
> >> _______________________________________________
> >> R-help-es mailing list
> >> R-help-es en r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> >
> >
> >
> >
> > --
> > Saludos,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
>
>
> Ra�l Vaquerizo Romero
> www.analisisydecision.es
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es