[R-es] Problema con un xml demasiado Grande

Carlos Ortega cof en qualityexcellence.es
Vie Ene 20 13:18:43 CET 2017


Hola,

Siempre puedes tirar de la solución del pre-procesado sobre su SO
capturando solo la parte del XML que te interese vía las muchas y buenas
utilidades que hay en Linux del tipo sed, awk, grep, etc...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 20 de enero de 2017, 10:59, Milagros Camacho Bellido <
mila.camachobellido en gmail.com> escribió:

> Hola, muy buenas,
>
> Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en
> R el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml
> solo me interesa un campo, el referente al texto del artículo. ¿Alguiém
> conoce alguna forma de cargar solo ese campo del xml en R sin cargar el xml
> completo? La salida seria un archivo .txt, donde cada fila fuera un
> artículo ó muchos archivos texto donde cada archivo fuera un artículo.
>
>
> Un saludo,
>
> Milagros Camacho
>
>
> ---
> El software de antivirus Avast ha analizado este correo electrónico en
> busca de virus.
> https://www.avast.com/antivirus
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es