[R-es] Problema con un xml demasiado Grande

Carlos J. Gil Bellosta cgb en datanalytics.com
Vie Ene 20 13:04:15 CET 2017


Trocea o desiste.

Nunca vas a poder procesar 10GB de XML con una máquina de las
habituales. Si tienes 64GB de RAM o más, es otra historia.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 20 de enero de 2017, 10:59, Milagros Camacho Bellido
<mila.camachobellido en gmail.com> escribió:
> Hola, muy buenas,
>
> Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en R
> el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml solo
> me interesa un campo, el referente al texto del artículo. ¿Alguiém conoce
> alguna forma de cargar solo ese campo del xml en R sin cargar el xml
> completo? La salida seria un archivo .txt, donde cada fila fuera un artículo
> ó muchos archivos texto donde cada archivo fuera un artículo.
>
>
> Un saludo,
>
> Milagros Camacho
>
>
> ---
> El software de antivirus Avast ha analizado este correo electrónico en busca
> de virus.
> https://www.avast.com/antivirus
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es



Más información sobre la lista de distribución R-help-es