[R-es] Búsqueda de palabras en una variable de R

Carlos J. Gil Bellosta cgb en datanalytics.com
Mie Nov 29 11:52:57 CET 2017


readLines()

El mié., 29 nov. 2017 5:51, <miriam.alzate en unavarra.es> escribió:

> Muchas gracias,
>
> Estoy intentado ejecutar el paquete y necesito importar el archivo txt,
> pero necesito importarlo de modo que cada línea sea una observación y no
> un texto único (tengo unas 63,000 lineas). No encuentro la solución en los
> enlaces. ¿Sabrías como hacerlo?
>
> Gracias!
> El Mar, 28 de Noviembre de 2017, 3:50, Freddy Omar López Quintero escribió:
> > El mar, 28-11-2017 a las 03:42 +0100, miriam.alzate en unavarra.es
> > escribió:
> >> Tengo un vector de 40 palabras (marca) y necesito saber si en una de
> >> las
> >> variables del data.frame (datos) se incluye alguna de esas 40
> >> palabras. Si
> >> se incluye alguna de ellas, me gustaría crear una variable dummy
> >> siendo 1
> >> que incluye alguna palabra y 0 que no incluye.
> >>
> >> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?
> >
> > Lo que describes luce como minería de texto y lo que parece que quieres
> > es una porción de la matriz que llaman Term-Document Matrix. El paquete
> > por excelencia para estos menesteres es tm:
> >
> > https://cran.r-project.org/web/packages/tm/
> >
> > que tiene su buena viñeta
> >
> > https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf
> >
> > Ojalá sirva.
> >
> > Saludos.
> >
> >
> > --
> > «...homines autem hominum causa esse generatos...»
> >
> > Cicero
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es