[R-es] Distinto número de elemento en dataframe usando rvest

Ruben Tobalina Ramirez |@gr|m@e@cr|t@ @end|ng |rom gm@||@com
Mie Nov 27 15:42:35 CET 2019


Hola de nuevo,

sigo con mis pruebas webscrapeando.

Estoy cogiendo la programación de varias cadenas de la web de Movistar
usando el paquete *rvest *y los voy guardando en un data frame. El problema
surge cuando el numero de elementos cada cadena varia. Por ejemplo en el
caso de IB3 hay menos elementos de Genero que de programas, por que supongo
que un programa no tiene genero o lo que sea.
¿Hay alguna forma de poner un espacio en blanco cuando rvest no encuentre
un valor y seguir teniendo el mismo numero de elemento?

os pongo un ejemplo del código que estoy usando:

 url <- " http://www.movistarplus.es/guiamovil/IB3/2019-12-01"
 webpage <- read_html(url)
 # Nombre Cadena
  nombreCadena <- webpage %>% html_nodes('.info-canal .titulo') %>%
html_text(trim = TRUE)
  # Titulo programa
  titulo <- webpage %>% html_nodes('#canales .container_box .program
.title') %>%
    html_text(trim = TRUE)
  #genero
  genero <- webpage %>% html_nodes('#canales .container_box .program
.genre')%>% html_text(trim = TRUE)

Un abrazo!

-- 
Rubén.

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es