[R-es] Búsqueda de palabras en una variable de R

miriam.alzate en unavarra.es miriam.alzate en unavarra.es
Mie Nov 29 05:51:33 CET 2017


Muchas gracias,

Estoy intentado ejecutar el paquete y necesito importar el archivo txt,
pero necesito importarlo de modo que cada línea sea una observación y no
un texto único (tengo unas 63,000 lineas). No encuentro la solución en los
enlaces. ¿Sabrías como hacerlo?

Gracias!
El Mar, 28 de Noviembre de 2017, 3:50, Freddy Omar López Quintero escribió:
> El mar, 28-11-2017 a las 03:42 +0100, miriam.alzate en unavarra.es
> escribió:
>> Tengo un vector de 40 palabras (marca) y necesito saber si en una de
>> las
>> variables del data.frame (datos) se incluye alguna de esas 40
>> palabras. Si
>> se incluye alguna de ellas, me gustaría crear una variable dummy
>> siendo 1
>> que incluye alguna palabra y 0 que no incluye.
>>
>> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?
>
> Lo que describes luce como minería de texto y lo que parece que quieres
> es una porción de la matriz que llaman Term-Document Matrix. El paquete
> por excelencia para estos menesteres es tm:
>
> https://cran.r-project.org/web/packages/tm/
>
> que tiene su buena viñeta
>
> https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf
>
> Ojalá sirva.
>
> Saludos.
>
>
> --
> «...homines autem hominum causa esse generatos...»
>
> Cicero



Más información sobre la lista de distribución R-help-es