[R-es] Problema con un xml demasiado Grande
Marcelino de la Cruz Rot
marcelino.delacruz en urjc.es
Vie Ene 20 14:20:26 CET 2017
Es posible que con la función xmlEventParse() del paquete XML lo puedas
conseguir.
A ver si tienes suerte.
Un saludo,
Marcelino
El 20/01/2017 a las 13:04, Carlos J. Gil Bellosta escribió:
> Trocea o desiste.
>
> Nunca vas a poder procesar 10GB de XML con una máquina de las
> habituales. Si tienes 64GB de RAM o más, es otra historia.
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
> El día 20 de enero de 2017, 10:59, Milagros Camacho Bellido
> <mila.camachobellido en gmail.com> escribió:
>> Hola, muy buenas,
>>
>> Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en R
>> el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml solo
>> me interesa un campo, el referente al texto del artículo. ¿Alguiém conoce
>> alguna forma de cargar solo ese campo del xml en R sin cargar el xml
>> completo? La salida seria un archivo .txt, donde cada fila fuera un artículo
>> ó muchos archivos texto donde cada archivo fuera un artículo.
>>
>>
>> Un saludo,
>>
>> Milagros Camacho
>>
>>
>> ---
>> El software de antivirus Avast ha analizado este correo electrónico en busca
>> de virus.
>> https://www.avast.com/antivirus
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
--
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es