[R-es] Elecciones Generales

Karel L. krelopq en yahoo.es
Lun Dic 28 18:02:01 CET 2015


Hola Ivan,

En mi opinión recurrir a "escrapear" el html no tiene demasiado sentido 
cuando tienes los json.

Esto está en sucio, tienes que hacer un bucle que vaya recorriendo la 
jerarquía de directorios. Fija "data" como directorio de trabajo y borra 
todas las carpetas que no sean "ES".

library(RJSONIO)
directorios<-list.dirs()
directorios<-directorios[nchar(directorios)>=17]
directorios<-gsub("\\./", replacement = "", directorios)

# Esto tiene que escribirse como bucle
ruta<-paste0(directorios[1], "/info.json")
nombre_lista<-strsplit(directorios[1], "/")[[1]][4]
assign(nombre_lista, data.frame(Reduce(rbind, fromJSON(ruta)[[2]][[1]]),
                                 row.names = NULL))

El problema es que tendrías al final un montón de listas, nada que no 
pasara si utilizaras un scrapper. Para evitar eso habría que pensar en 
como importar los archivos de forma ordenada.

¿Se puede saber lo que quieres hacer? Por que así se podría dimensionar 
la solución.



El 28/12/15 a las 16:37, Ivan Aguilar escribió:
> De aqui:
>
> http://resultadosgenerales2015.interior.es/congreso/#/ES201512-CON-ES/ES
>
> o en json:
>
> http://resultadosgenerales2015.interior.es/#/herramienta-analisis?siteLanguage=es_ES
>
> dentro del linux estan los archivos
>
> El 28 de diciembre de 2015, 16:30, Javier Marcuzzi <
> javier.ruben.marcuzzi en gmail.com> escribió:
>
>> Estimado Ivan Aguilar
>>
>> Desconozco desde donde toma los datos, en R hay herramientas para trabajar
>> con json y HTML, el problema es como trabajar teniendo menos trabajo (con
>> algo de redundancia), y esto tiene algo de gustos personales, conocimientos
>> de una tecnología sobre otra, incluso podría juntar los datos en una base
>> de datos y luego leerlos desde R. No hay una receta optima, no comprendo
>> bien disgregado y un tanto coñazo, porque esos términos pueden tener una
>> frase idiomática que no uso, supongo que pueden ser cientos de archivos
>> json, los cuáles posiblemente tienen un patrón que comparten, si ese es el
>> caso podía realizar un bucle de lectura e importación de datos json.
>>
>>
>>
>>
>> *De: *Ivan Aguilar <iaguilar en gmail.com>
>> *Enviado: *lunes, 28 de diciembre de 2015 12:08
>> *Para: *Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>
>> *CC: *R-help-es <r-help-es en r-project.org>
>> *Asunto: *Re: [R-es] Elecciones Generales
>>
>>
>>
>> Tiene todo, pero esta muy disgregado en varios archivos, parece un tanto
>> coñazo
>>
>>
>>
>> El 28 de diciembre de 2015, 13:10, Javier Marcuzzi <
>> javier.ruben.marcuzzi en gmail.com> escribió:
>>
>> Estimado Ivan Aghilar
>>
>>
>>
>> Primero hay que responder una pregunta, ¿json tiene todo lo que necesito o
>> en la versión web hay algo más?, según esta respuesta puedes decidir, la
>> diferencia es simple, json ya tiene realizado el proceso de limpiar los
>> datos del DOM del HTML.
>>
>>
>>
>> Javier Rubén Marcuzzi
>>
>>
>>
>>
>> *De: *Ivan Aguilar <iaguilar en gmail.com>
>> *Enviado: *lunes, 28 de diciembre de 2015 7:58
>> *Para: *R-help-es <r-help-es en r-project.org>
>> *Asunto: *[R-es] Elecciones Generales
>>
>>
>>
>> Ideas para escrapear los resultados de las generales por municipios?
>>
>>
>>
>> Dos vias:
>>
>>
>>
>> 1) via web
>>
>> 2) via json
>>
>>
>>
>> la 2) tardará mucho creo.
>>
>>
>>
>> Va, si me ayudais escribimos post conjunto
>>
>>
>>
>> --
>>
>> Ivan
>>
>>
>>
>>                  [[alternative HTML version deleted]]
>>
>>
>>
>> _______________________________________________
>>
>> R-help-es mailing list
>>
>> R-help-es en r-project.org
>>
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>>
>>
>>
>>
>>
>> --
>>
>> Ivan
>>
>>
>>
>
>



Más información sobre la lista de distribución R-help-es