[R-es] Extraccion de datos de una Web

Sergio Castro castro.rodriguez.sergio en gmail.com
Lun Ene 18 17:29:11 CET 2016


 Buenas tardes,

 Quiero extraer datos de una web en la que ser relaciona la semana con
la puntuación obtenida por un jugador. Ahora mismo llego a obtener
elnodo en el que se relacionan la semana con la puntuación obtenida,
pero no soy capaz de extraer esa informacion en una tabla de dos
columna (semana, puntuacion) teniendo en cuenta que puede que haya
semanas que no haya puntuado (en el ejemplo, la segunda semana). De
momento lo estoy obteniendo de la siguiente forma:

 url_jugador<-"http://localhost:8080/jugadores/Luis"
 txt_jugador <- getURL(url_jugador)
 doc<-htmlTreeParse(txt_jugador, useInternalNodes = TRUE)
 puntos_nodo<- xpathApply(doc, "//table[@class='points']/tr")
 puntos_nodo
[[1]]
<tr>
  <td class="semana">1</td>
  <td class="neg"/>
  <td>
    <div class="bar">6</div>
  </td>

</tr>
[[2]]
<tr>
  <td class="semana">2</td>
  <td class="neg"/>
  <td/>
</tr>
[[3]]
<tr>
  <td class="semana">3</td>
  <td class="neg"/>
  <td>
    <div class="bar">9</div>
  </td>
</tr>
attr(,"class")
[1] "XMLNodeSet"

¿Veis alguna forma de sacar la información que necesito?

Muchas gracias.
Un saludo.



Más información sobre la lista de distribución R-help-es