[R-es] Problema con un xml demasiado Grande

Marcelino de la Cruz Rot marcelino.delacruz en urjc.es
Vie Ene 20 14:20:26 CET 2017


Es posible que con la función xmlEventParse() del paquete XML lo puedas 
conseguir.
A ver si tienes suerte.

Un saludo,

Marcelino


El 20/01/2017 a las 13:04, Carlos J. Gil Bellosta escribió:
> Trocea o desiste.
>
> Nunca vas a poder procesar 10GB de XML con una máquina de las
> habituales. Si tienes 64GB de RAM o más, es otra historia.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
> El día 20 de enero de 2017, 10:59, Milagros Camacho Bellido
> <mila.camachobellido en gmail.com> escribió:
>> Hola, muy buenas,
>>
>> Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en R
>> el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml solo
>> me interesa un campo, el referente al texto del artículo. ¿Alguiém conoce
>> alguna forma de cargar solo ese campo del xml en R sin cargar el xml
>> completo? La salida seria un archivo .txt, donde cada fila fuera un artículo
>> ó muchos archivos texto donde cada archivo fuera un artículo.
>>
>>
>> Un saludo,
>>
>> Milagros Camacho
>>
>>
>> ---
>> El software de antivirus Avast ha analizado este correo electrónico en busca
>> de virus.
>> https://www.avast.com/antivirus
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es