[R-es] Extraccion de datos de una Web

Javier Marcuzzi javier.ruben.marcuzzi en gmail.com
Lun Ene 18 17:44:45 CET 2016


Estimado Sergio Castro

Su punto se encuentra muy próximo, table[@class='points']/tr, usted obtiene los tr de la tabla, pero en realidad no desea estos, sino algo como /tr/td, o class “semana” … Tendría que poder recorrer el DOM para estar seguro pero con unos pequeños cambios estaría la solución.

Javier Rubén Marcuzzi


De: Sergio Castro
Enviado: lunes, 18 de enero de 2016 13:29
Para: r-help-es
Asunto: [R-es] Extraccion de datos de una Web

 Buenas tardes,

 Quiero extraer datos de una web en la que ser relaciona la semana con
la puntuación obtenida por un jugador. Ahora mismo llego a obtener
elnodo en el que se relacionan la semana con la puntuación obtenida,
pero no soy capaz de extraer esa informacion en una tabla de dos
columna (semana, puntuacion) teniendo en cuenta que puede que haya
semanas que no haya puntuado (en el ejemplo, la segunda semana). De
momento lo estoy obteniendo de la siguiente forma:

 url_jugador<-"http://localhost:8080/jugadores/Luis"
 txt_jugador <- getURL(url_jugador)
 doc<-htmlTreeParse(txt_jugador, useInternalNodes = TRUE)
 puntos_nodo<- xpathApply(doc, "//")
 puntos_nodo
[[1]]
<tr>
  <td class="semana">1</td>
  <td class="neg"/>
  <td>
    <div class="bar">6</div>
  </td>

</tr>
[[2]]
<tr>
  <td class="semana">2</td>
  <td class="neg"/>
  <td/>
</tr>
[[3]]
<tr>
  <td class="semana">3</td>
  <td class="neg"/>
  <td>
    <div class="bar">9</div>
  </td>
</tr>
attr(,"class")
[1] "XMLNodeSet"

¿Veis alguna forma de sacar la información que necesito?

Muchas gracias.
Un saludo.

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es