From co| @end|ng |rom qu@||tyexce||ence@e@ Tue Jul 1 22:07:42 2025 From: co| @end|ng |rom qu@||tyexce||ence@e@ (Carlos Ortega) Date: Tue, 1 Jul 2025 22:07:42 +0200 Subject: [R-es] =?utf-8?q?97_-_Reuni=C3=B3n_Grupo_de_R_-_Madrid=3A_Jueves?= =?utf-8?q?_26_de_junio_de_2025?= In-Reply-To: References: Message-ID: Gracias a todos los que pudieron asistir (presencial y online) a la última sesión del "Grupo de Usuarios de R de Madrid". Y gracias en especial a Pedro Concejero y al "DS Lab" (Universidad Rey Juan Carlos ) por todas las facilidades. El video y material de la presentación está disponible aquí: - https://madrid.r-es.org/97-jueves-26-de-junio-2025/ (Nos vemos a la vuelta del verano). Gracias, Carlos Ortega www.qualityexcellence.es El dom, 22 jun 2025 a las 10:55, Carlos Ortega () escribió: > Hola, > > ¿Qué tal? > > El próximo *jueves* (26 de junio), volvemos con una nueva reunión del " > Grupo de R de Madrid". > > Esta vez contamos con Pedro Concejero (habitual en esta lista) que nos > contará: > > "Kinsey, Tukey y el CIS: estadística en la cama" > "Estadística y diversidad sexual: de Kinsey a microdatos del CIS" > El detalle de la agenda lo podéis encontrar aquí: > > - > https://www.meetup.com/es-ES/grupo-de-usuarios-de-r-de-madrid/events/308570748/ > > Este evento será tanto presencial como online (Zoom). > > Os esperamos!. > > Gracias, > Carlos Ortega > www.qualityexcellence.es > > > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 13:39:27 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 13:39:27 +0200 Subject: [R-es] =?iso-8859-1?q?=28sin_asunto=29?= Message-ID: Hola, buenas tardes, Estoy usando *rvest* para hacer webscraping y me surge una duda con el siguiente codigo: *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die Autobahnpolizei)\n

'* *x %>% read_html() %>% html_nodes(xpath = "//h2")* Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. En este ejemplo seria solo *Alerta Cobra. *He probado usando los típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. -- Rubén. [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 16:56:20 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 16:56:20 +0200 Subject: [R-es] rvest webscraping In-Reply-To: References: Message-ID: Hola, buenas tardes, Estoy usando *rvest* para hacer webscraping y me surge una duda con el siguiente código: *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die Autobahnpolizei)\n

'* *x %>% read_html() %>% html_nodes(xpath = "//h2")* Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. En este ejemplo seria solo *Alerta Cobra. *He probado usando los típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. PD: perdón que en els anterior mensaje se me olvidó poner un asunto. -- Rubén. [[alternative HTML version deleted]] From ju@n@@b@@o|o @end|ng |rom ehu@eu@ Wed Jul 9 19:07:59 2025 From: ju@n@@b@@o|o @end|ng |rom ehu@eu@ (Juan Abasolo) Date: Wed, 9 Jul 2025 19:07:59 +0200 Subject: [R-es] rvest webscraping In-Reply-To: References: Message-ID: Hola, Rubén; Disculpá si es algo obvio. Pero por si no lo fuera, te comento que el plugin SelectorGadget para los derivados de Chromium (Brave, Chrome, Opera....) te sirve para identificar cuál es la etiqueta específica para seleccionar los diferentes elementos de una página. Por lo menos yo, todo lo que pude resolver con Rvest, lo conseguí resolver por esa vía (te tocaría ver algún tutorial). Suerte Juan Hau idatzi du Ruben Tobalina Ramirez (lagrimaescrita en gmail.com) erabiltzaileak (2025 uzt. 9(a), az. (16:56)): > Hola, buenas tardes, > > Estoy usando *rvest* para hacer webscraping y me surge una duda con el > siguiente código: > > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > Autobahnpolizei)\n

'* > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > > Una orientación de como hacerlo me vendría bien, muchas gracias de > antemano. > > PD: perdón que en els anterior mensaje se me olvidó poner un asunto. > -- > Rubén. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Juan Abasolo, PhD Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea Bilboko Hezkuntza Fakultatea Euskal Herriko Unibertsitatea EHU Sarriena auzoa z/g 48940 - Leioa (Bizkaia) T : (+34) 94 601 7567 Telegram: @JuanAbasolo Skype : abasolo72 Bloga : juanabasolo.netlify.app [[alternative HTML version deleted]] From j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com Wed Jul 9 22:55:32 2025 From: j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com (Javier Marcuzzi) Date: Wed, 9 Jul 2025 17:55:32 -0300 Subject: [R-es] (sin asunto) In-Reply-To: References: Message-ID: Buenas tardes Rubén Lo que usted desea no se puede, pero hay una solución. Primero, si selecciona el h2 lo que está dentro de esta etiqueta se selecciona. Segundo, lo que está mal es la selección, sin embargo, puede solucionar esta buscando y borrando el código El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez escribió: > > Hola, buenas tardes, > > Estoy usando *rvest* para hacer webscraping y me surge una duda con el > siguiente codigo: > > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > Autobahnpolizei)\n

'* > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > > Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. > > -- > Rubén. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 23:01:12 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 23:01:12 +0200 Subject: [R-es] (sin asunto) In-Reply-To: References: Message-ID: Buenas noches Javier, Gracias por la respuesta, yo también lo había pensado. Creo que no me vale porque el span dentro del h2 no se repite en todos los casos. Rubén. El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi < javier.ruben.marcuzzi en gmail.com> va escriure: > Buenas tardes Rubén > > Lo que usted desea no se puede, pero hay una solución. Primero, si > selecciona el h2 lo que está dentro de esta etiqueta se selecciona. > Segundo, lo que está mal es la selección, sin embargo, puede solucionar > esta buscando y borrando el código podría repetir en todos los datos, por lo cuál el localizarlo y eliminarlo > sería una solución. > > Por lo cuál al restallado de rvest tendría que procesarlo con otro script > en R que limpie el código repetido en todos los registros. > > ¿Esa solución le es útil? > > Javier Marcuzzi > > > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez < > lagrimaescrita en gmail.com> escribió: > > > > Hola, buenas tardes, > > > > Estoy usando *rvest* para hacer webscraping y me surge una duda con el > > siguiente codigo: > > > > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > > Autobahnpolizei)\n

'* > > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > > > > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando > *span*. > > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > > > > Una orientación de como hacerlo me vendría bien, muchas gracias de > antemano. > > > > -- > > Rubén. > > > > [[alternative HTML version deleted]] > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Wed Jul 9 23:03:54 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Wed, 9 Jul 2025 23:03:54 +0200 Subject: [R-es] rvest webscraping In-Reply-To: References: Message-ID: Buenas noches Juan, Gracias por la respuesta. Mañana miro a ver si me sirve esa herramienta. Un saludo Rubén. El dc., 9 de jul. 2025, 19:08, Juan Abasolo va escriure: > Hola, Rubén; > Disculpá si es algo obvio. Pero por si no lo fuera, te comento que el > plugin SelectorGadget para los derivados de Chromium (Brave, Chrome, > Opera....) te sirve para identificar cuál es la etiqueta específica para > seleccionar los diferentes elementos de una página. > Por lo menos yo, todo lo que pude resolver con Rvest, lo conseguí resolver > por esa vía (te tocaría ver algún tutorial). > > Suerte > Juan > > Hau idatzi du Ruben Tobalina Ramirez (lagrimaescrita en gmail.com) > erabiltzaileak (2025 uzt. 9(a), az. (16:56)): > >> Hola, buenas tardes, >> >> Estoy usando *rvest* para hacer webscraping y me surge una duda con el >> siguiente código: >> >> *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die >> Autobahnpolizei)\n

'* >> *x %>% read_html() %>% html_nodes(xpath = "//h2")* >> >> Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando >> *span*. >> En este ejemplo seria solo *Alerta Cobra. *He probado usando los >> típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. >> >> Una orientación de como hacerlo me vendría bien, muchas gracias de >> antemano. >> >> PD: perdón que en els anterior mensaje se me olvidó poner un asunto. >> -- >> Rubén. >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > -- > Juan Abasolo, PhD > > Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea > Bilboko Hezkuntza Fakultatea > Euskal Herriko Unibertsitatea EHU > > Sarriena auzoa z/g 48940 - Leioa (Bizkaia) > > T : (+34) 94 601 7567 > Telegram: @JuanAbasolo > Skype : abasolo72 > Bloga : juanabasolo.netlify.app > [[alternative HTML version deleted]] From j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com Thu Jul 10 10:54:15 2025 From: j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com (Javier Marcuzzi) Date: Thu, 10 Jul 2025 05:54:15 -0300 Subject: [R-es] (sin asunto) In-Reply-To: References: Message-ID: <1F45D3E4-882F-45E9-90DF-25B4F0D93931@gmail.com> Estimado Rubén No importa, el código es algo más largo pero no tanto, sería algo como : Si existe lo siguiente Borrar esto So no existe No borrar nada Para mi gusto no iría por expresiones regulares, por si las dudas en algún caso borro de más, hay que saber dominarlas, pero también son una alternativa. Aunque si yo quiero, para el webscraping, puedo crear código para enloquecer a cualquier análisis, por lo cuál, es posible que lo que usted analiza tenga algo para ?complicarle la vida?. Javier Marcuzzi > El 9 jul 2025, a las 6:01?p. m., Ruben Tobalina Ramirez escribió: > > Buenas noches Javier, > > Gracias por la respuesta, yo también lo había pensado. Creo que no me vale porque el span dentro del h2 no se repite en todos los casos. > > Rubén. > > El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi > va escriure: >> Buenas tardes Rubén >> >> Lo que usted desea no se puede, pero hay una solución. Primero, si selecciona el h2 lo que está dentro de esta etiqueta se selecciona. Segundo, lo que está mal es la selección, sin embargo, puede solucionar esta buscando y borrando el código > >> Por lo cuál al restallado de rvest tendría que procesarlo con otro script en R que limpie el código repetido en todos los registros. >> >> ¿Esa solución le es útil? >> >> Javier Marcuzzi >> >> > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez > escribió: >> > >> > Hola, buenas tardes, >> > >> > Estoy usando *rvest* para hacer webscraping y me surge una duda con el >> > siguiente codigo: >> > >> > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die >> > Autobahnpolizei)\n

'* >> > *x %>% read_html() %>% html_nodes(xpath = "//h2")* >> > >> > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*. >> > En este ejemplo seria solo *Alerta Cobra. *He probado usando los >> > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. >> > >> > Una orientación de como hacerlo me vendría bien, muchas gracias de antemano. >> > >> > -- >> > Rubén. >> > >> > [[alternative HTML version deleted]] >> > >> > _______________________________________________ >> > R-help-es mailing list >> > R-help-es en r-project.org >> > https://stat.ethz.ch/mailman/listinfo/r-help-es >> [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Thu Jul 10 11:14:04 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Thu, 10 Jul 2025 11:14:04 +0200 Subject: [R-es] (sin asunto) In-Reply-To: <1F45D3E4-882F-45E9-90DF-25B4F0D93931@gmail.com> References: <1F45D3E4-882F-45E9-90DF-25B4F0D93931@gmail.com> Message-ID: Buenos días. Muchas gracias de nuevo por el interés Javier. Está mañana tuve la idea feliz y lo hice tal como dices, pero luego tuve una nueva idea feliz y me di cuenta que el texto que está dentro del *span* está siempre dentro de unos paréntesis Así que hice un sencillo gsub() borrando todo lo que hay dentro de los susodichos paréntesis y listo. A veces es más sencillo de lo que parece. :D muchas gracias por todo. un saludo El jue, 10 jul 2025 a las 10:54, Javier Marcuzzi (< javier.ruben.marcuzzi en gmail.com>) escribió: > Estimado Rubén > > No importa, el código es algo más largo pero no tanto, sería algo como : > > Si existe lo siguiente > Borrar esto > So no existe > No borrar nada > > Para mi gusto no iría por expresiones regulares, por si las dudas en algún > caso borro de más, hay que saber dominarlas, pero también son una > alternativa. > > Aunque si yo quiero, para el webscraping, puedo crear código para > enloquecer a cualquier análisis, por lo cuál, es posible que lo que usted > analiza tenga algo para ?complicarle la vida?. > > Javier Marcuzzi > > El 9 jul 2025, a las 6:01?p. m., Ruben Tobalina Ramirez < > lagrimaescrita en gmail.com> escribió: > > Buenas noches Javier, > > Gracias por la respuesta, yo también lo había pensado. Creo que no me vale > porque el span dentro del h2 no se repite en todos los casos. > > Rubén. > > El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi < > javier.ruben.marcuzzi en gmail.com> va escriure: > >> Buenas tardes Rubén >> >> Lo que usted desea no se puede, pero hay una solución. Primero, si >> selecciona el h2 lo que está dentro de esta etiqueta se selecciona. >> Segundo, lo que está mal es la selección, sin embargo, puede solucionar >> esta buscando y borrando el código > podría repetir en todos los datos, por lo cuál el localizarlo y eliminarlo >> sería una solución. >> >> Por lo cuál al restallado de rvest tendría que procesarlo con otro script >> en R que limpie el código repetido en todos los registros. >> >> ¿Esa solución le es útil? >> >> Javier Marcuzzi >> >> > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez < >> lagrimaescrita en gmail.com> escribió: >> > >> > Hola, buenas tardes, >> > >> > Estoy usando *rvest* para hacer webscraping y me surge una duda con el >> > siguiente codigo: >> > >> > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die >> > Autobahnpolizei)\n

'* >> > *x %>% read_html() %>% html_nodes(xpath = "//h2")* >> > >> > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando >> *span*. >> > En este ejemplo seria solo *Alerta Cobra. *He probado usando los >> > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. >> > >> > Una orientación de como hacerlo me vendría bien, muchas gracias de >> antemano. >> > >> > -- >> > Rubén. >> > >> > [[alternative HTML version deleted]] >> > >> > _______________________________________________ >> > R-help-es mailing list >> > R-help-es en r-project.org >> > https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> > -- Rubén. [[alternative HTML version deleted]] From co| @end|ng |rom qu@||tyexce||ence@e@ Thu Jul 10 11:24:40 2025 From: co| @end|ng |rom qu@||tyexce||ence@e@ (Carlos Ortega) Date: Thu, 10 Jul 2025 11:24:40 +0200 Subject: [R-es] (sin asunto) In-Reply-To: References: <1F45D3E4-882F-45E9-90DF-25B4F0D93931@gmail.com> Message-ID: Hola, ¿Qué tal? No sé si ya está resuelto el problema... Una alternativa puede ser esta. #----------------- > # Cargar la librería rvest > library(rvest) > > # Definir el HTML de ejemplo > x <- '

Alerta Cobra (Alarm für Cobra 11 - Die Autobahnpolizei)

' > > # Parsear el HTML > html_content <- read_html(x) > > # Extraer solo el nodo de texto dentro de

que no esté en > result <- html_content %>% + html_node(xpath = "//h2/text()") %>% + html_text(trim = TRUE) > > # Mostrar el resultado > print(result) [1] "Alerta Cobra" #----------------- Gracias, Carlos Ortega www.qualityexcellence.es El jue, 10 jul 2025 a las 11:14, Ruben Tobalina Ramirez (< lagrimaescrita en gmail.com>) escribió: > Buenos días. > > Muchas gracias de nuevo por el interés Javier. Está mañana tuve la idea > feliz y lo hice tal como dices, pero luego tuve una nueva idea feliz y me > di cuenta que el texto que está dentro del *span* está siempre dentro de > unos paréntesis Así que hice un sencillo gsub() borrando todo lo que hay > dentro de los susodichos paréntesis y listo. > > A veces es más sencillo de lo que parece. :D > > muchas gracias por todo. un saludo > > El jue, 10 jul 2025 a las 10:54, Javier Marcuzzi (< > javier.ruben.marcuzzi en gmail.com>) escribió: > > > Estimado Rubén > > > > No importa, el código es algo más largo pero no tanto, sería algo como : > > > > Si existe lo siguiente > > Borrar esto > > So no existe > > No borrar nada > > > > Para mi gusto no iría por expresiones regulares, por si las dudas en > algún > > caso borro de más, hay que saber dominarlas, pero también son una > > alternativa. > > > > Aunque si yo quiero, para el webscraping, puedo crear código para > > enloquecer a cualquier análisis, por lo cuál, es posible que lo que usted > > analiza tenga algo para ?complicarle la vida?. > > > > Javier Marcuzzi > > > > El 9 jul 2025, a las 6:01?p. m., Ruben Tobalina Ramirez < > > lagrimaescrita en gmail.com> escribió: > > > > Buenas noches Javier, > > > > Gracias por la respuesta, yo también lo había pensado. Creo que no me > vale > > porque el span dentro del h2 no se repite en todos los casos. > > > > Rubén. > > > > El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi < > > javier.ruben.marcuzzi en gmail.com> va escriure: > > > >> Buenas tardes Rubén > >> > >> Lo que usted desea no se puede, pero hay una solución. Primero, si > >> selecciona el h2 lo que está dentro de esta etiqueta se selecciona. > >> Segundo, lo que está mal es la selección, sin embargo, puede solucionar > >> esta buscando y borrando el código >> podría repetir en todos los datos, por lo cuál el localizarlo y > eliminarlo > >> sería una solución. > >> > >> Por lo cuál al restallado de rvest tendría que procesarlo con otro > script > >> en R que limpie el código repetido en todos los registros. > >> > >> ¿Esa solución le es útil? > >> > >> Javier Marcuzzi > >> > >> > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez < > >> lagrimaescrita en gmail.com> escribió: > >> > > >> > Hola, buenas tardes, > >> > > >> > Estoy usando *rvest* para hacer webscraping y me surge una duda con > el > >> > siguiente codigo: > >> > > >> > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > >> > Autobahnpolizei)\n

'* > >> > *x %>% read_html() %>% html_nodes(xpath = "//h2")* > >> > > >> > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando > >> *span*. > >> > En este ejemplo seria solo *Alerta Cobra. *He probado usando los > >> > típicos operadores como *!* o *:not(span)*, pero no ha resultado bien. > >> > > >> > Una orientación de como hacerlo me vendría bien, muchas gracias de > >> antemano. > >> > > >> > -- > >> > Rubén. > >> > > >> > [[alternative HTML version deleted]] > >> > > >> > _______________________________________________ > >> > R-help-es mailing list > >> > R-help-es en r-project.org > >> > https://stat.ethz.ch/mailman/listinfo/r-help-es > >> > >> > > > > -- > Rubén. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] From |@gr|m@e@cr|t@ @end|ng |rom gm@||@com Thu Jul 10 11:43:20 2025 From: |@gr|m@e@cr|t@ @end|ng |rom gm@||@com (Ruben Tobalina Ramirez) Date: Thu, 10 Jul 2025 11:43:20 +0200 Subject: [R-es] (sin asunto) In-Reply-To: References: <1F45D3E4-882F-45E9-90DF-25B4F0D93931@gmail.com> Message-ID: uau, esto si es magia. Ese uso del text() no lo conocía, pensaba que cogia también el texto del span. Muchas gracias, un saludo El jue, 10 jul 2025 a las 11:24, Carlos Ortega () escribió: > Hola, > > ¿Qué tal? > No sé si ya está resuelto el problema... > > Una alternativa puede ser esta. > > #----------------- > > # Cargar la librería rvest > > library(rvest) > > > > # Definir el HTML de ejemplo > > x <- '

Alerta Cobra (Alarm für Cobra 11 - Die > Autobahnpolizei)

' > > > > # Parsear el HTML > > html_content <- read_html(x) > > > > # Extraer solo el nodo de texto dentro de

que no esté en > > result <- html_content %>% > + html_node(xpath = "//h2/text()") %>% > + html_text(trim = TRUE) > > > > # Mostrar el resultado > > print(result) > [1] "Alerta Cobra" > #----------------- > > Gracias, > Carlos Ortega > www.qualityexcellence.es > > El jue, 10 jul 2025 a las 11:14, Ruben Tobalina Ramirez (< > lagrimaescrita en gmail.com>) escribió: > >> Buenos días. >> >> Muchas gracias de nuevo por el interés Javier. Está mañana tuve la idea >> feliz y lo hice tal como dices, pero luego tuve una nueva idea feliz y me >> di cuenta que el texto que está dentro del *span* está siempre dentro de >> unos paréntesis Así que hice un sencillo gsub() borrando todo lo que hay >> dentro de los susodichos paréntesis y listo. >> >> A veces es más sencillo de lo que parece. :D >> >> muchas gracias por todo. un saludo >> >> El jue, 10 jul 2025 a las 10:54, Javier Marcuzzi (< >> javier.ruben.marcuzzi en gmail.com>) escribió: >> >> > Estimado Rubén >> > >> > No importa, el código es algo más largo pero no tanto, sería algo como : >> > >> > Si existe lo siguiente >> > Borrar esto >> > So no existe >> > No borrar nada >> > >> > Para mi gusto no iría por expresiones regulares, por si las dudas en >> algún >> > caso borro de más, hay que saber dominarlas, pero también son una >> > alternativa. >> > >> > Aunque si yo quiero, para el webscraping, puedo crear código para >> > enloquecer a cualquier análisis, por lo cuál, es posible que lo que >> usted >> > analiza tenga algo para ?complicarle la vida?. >> > >> > Javier Marcuzzi >> > >> > El 9 jul 2025, a las 6:01?p. m., Ruben Tobalina Ramirez < >> > lagrimaescrita en gmail.com> escribió: >> > >> > Buenas noches Javier, >> > >> > Gracias por la respuesta, yo también lo había pensado. Creo que no me >> vale >> > porque el span dentro del h2 no se repite en todos los casos. >> > >> > Rubén. >> > >> > El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi < >> > javier.ruben.marcuzzi en gmail.com> va escriure: >> > >> >> Buenas tardes Rubén >> >> >> >> Lo que usted desea no se puede, pero hay una solución. Primero, si >> >> selecciona el h2 lo que está dentro de esta etiqueta se selecciona. >> >> Segundo, lo que está mal es la selección, sin embargo, puede solucionar >> >> esta buscando y borrando el código > >> podría repetir en todos los datos, por lo cuál el localizarlo y >> eliminarlo >> >> sería una solución. >> >> >> >> Por lo cuál al restallado de rvest tendría que procesarlo con otro >> script >> >> en R que limpie el código repetido en todos los registros. >> >> >> >> ¿Esa solución le es útil? >> >> >> >> Javier Marcuzzi >> >> >> >> > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez < >> >> lagrimaescrita en gmail.com> escribió: >> >> > >> >> > Hola, buenas tardes, >> >> > >> >> > Estoy usando *rvest* para hacer webscraping y me surge una duda con >> el >> >> > siguiente codigo: >> >> > >> >> > *x <- '

Alerta Cobra (Alarm für Cobra 11 - Die >> >> > Autobahnpolizei)\n

'* >> >> > *x %>% read_html() %>% html_nodes(xpath = "//h2")* >> >> > >> >> > Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando >> >> *span*. >> >> > En este ejemplo seria solo *Alerta Cobra. *He probado usando los >> >> > típicos operadores como *!* o *:not(span)*, pero no ha resultado >> bien. >> >> > >> >> > Una orientación de como hacerlo me vendría bien, muchas gracias de >> >> antemano. >> >> > >> >> > -- >> >> > Rubén. >> >> > >> >> > [[alternative HTML version deleted]] >> >> > >> >> > _______________________________________________ >> >> > R-help-es mailing list >> >> > R-help-es en r-project.org >> >> > https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> >> >> >> > >> >> -- >> Rubén. >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es > -- Rubén. [[alternative HTML version deleted]] From bet@n@ter @end|ng |rom gm@||@com Fri Jul 18 15:32:53 2025 From: bet@n@ter @end|ng |rom gm@||@com (Jose Betancourt Bethencourt) Date: Fri, 18 Jul 2025 09:32:53 -0400 Subject: [R-es] salida xls Message-ID: Estimados Hay varias bases de datos en metafor que quisiera salvarlas en excel no me funciona lo que he hecho ?puede ayudarme? saludos -- Dr. Jose A. Betancourt Bethencourt Universidad de Ciencias Medicas Carlos j. Finlay [[alternative HTML version deleted]] From jorge|v@nve|ez @end|ng |rom gm@||@com Sat Jul 19 14:30:14 2025 From: jorge|v@nve|ez @end|ng |rom gm@||@com (Jorge I Velez) Date: Sat, 19 Jul 2025 07:30:14 -0500 Subject: [R-es] salida xls In-Reply-To: References: Message-ID: Hola Jose, Ayúdanos a ayudarte. Qué has hecho? Saludos, Jorge.- On Fri, Jul 18, 2025 at 8:33?AM Jose Betancourt Bethencourt < betanster en gmail.com> wrote: > Estimados > > Hay varias bases de datos en metafor que quisiera salvarlas en excel > no me funciona lo que he hecho > ?puede ayudarme? > saludos > -- > Dr. Jose A. Betancourt Bethencourt > Universidad de Ciencias Medicas Carlos j. Finlay > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] From bet@n@ter @end|ng |rom gm@||@com Sat Jul 19 14:32:10 2025 From: bet@n@ter @end|ng |rom gm@||@com (Jose Betancourt Bethencourt) Date: Sat, 19 Jul 2025 08:32:10 -0400 Subject: [R-es] xls Message-ID: Estimados library(metafor) dat.bcg necesito la manera de salvar en excel dat.bcg a un archivo saludos -- Dr. Jose A. Betancourt Bethencourt Universidad de Ciencias Medicas Carlos j. Finlay [[alternative HTML version deleted]] From bet@n@ter @end|ng |rom gm@||@com Sat Jul 19 14:39:18 2025 From: bet@n@ter @end|ng |rom gm@||@com (Jose Betancourt Bethencourt) Date: Sat, 19 Jul 2025 08:39:18 -0400 Subject: [R-es] salida xls In-Reply-To: References: Message-ID: # Cargar los paquetes necesarios library(metafor) library(openxlsx) # o puedes usar writexl como alternativa # Cargar los datos data(dat.bcg) # Guardar en archivo Excel write.xlsx(dat.bcg, file = "dat_bcg.xlsx") write.xlsx(dat.bcg, file = "C:/Users/betan/Desktop/dat_bcg.xlsx") ya lo hice fgacias El vie, 18 jul 2025 a las 9:32, Jose Betancourt Bethencourt (< betanster en gmail.com>) escribió: > > Estimados > > Hay varias bases de datos en metafor que quisiera salvarlas en excel > no me funciona lo que he hecho > ?puede ayudarme? > saludos > -- > Dr. Jose A. Betancourt Bethencourt > Universidad de Ciencias Medicas Carlos j. Finlay > -- Dr. Jose A. Betancourt Bethencourt Universidad de Ciencias Medicas Carlos j. Finlay [[alternative HTML version deleted]] From j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com Sun Jul 20 01:56:23 2025 From: j@v|er@ruben@m@rcuzz| @end|ng |rom gm@||@com (Javier Marcuzzi) Date: Sat, 19 Jul 2025 20:56:23 -0300 Subject: [R-es] salida xls In-Reply-To: References: Message-ID: <19D67922-A544-407A-8583-4020D2A24EE3@gmail.com> Estimado José Es posible, la respuesta es si, posiblemente lo que le aportaron solucionaría el problema. Tenga en cuenta que por ahí también puede exportar a sqlite, que es una base de datos simple, gratis y no entra en posibles errores de corrección automática de errores y que se modifiquen mayusculas por minúsculas, datos tipo fecha, etc. Aunque excel es simple para un montón de cosas, en cambio leer una base de datos deja de ser un simple click y mirar la pantalla. Javier Marcuzzi > El 19 jul 2025, a las 9:39?a. m., Jose Betancourt Bethencourt escribió: > > # Cargar los paquetes necesarios > library(metafor) > library(openxlsx) # o puedes usar writexl como alternativa > > # Cargar los datos > data(dat.bcg) > > # Guardar en archivo Excel > write.xlsx(dat.bcg, file = "dat_bcg.xlsx") > > > > write.xlsx(dat.bcg, file = "C:/Users/betan/Desktop/dat_bcg.xlsx") > > ya lo hice fgacias > > El vie, 18 jul 2025 a las 9:32, Jose Betancourt Bethencourt (< > betanster en gmail.com >) escribió: > >> >> Estimados >> >> Hay varias bases de datos en metafor que quisiera salvarlas en excel >> no me funciona lo que he hecho >> ?puede ayudarme? >> saludos >> -- >> Dr. Jose A. Betancourt Bethencourt >> Universidad de Ciencias Medicas Carlos j. Finlay >> > > > -- > Dr. Jose A. Betancourt Bethencourt > Universidad de Ciencias Medicas Carlos j. Finlay > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]