[R-es] Tamaño de la matriz de términos y memoria. Paquete TM

Carlos J. Gil Bellosta cgb en datanalytics.com
Jue Dic 13 22:04:39 CET 2012


Hola, ¿qué tal?

Tienes un error en tu código. Donde dices

> # remueve términos con baja frecuencia
>                 inspect(removeSparseTerms(dtm, 0.4))

debieras haber escrito

> # elimina términos con baja frecuencia
>                 dtm <- removeSparseTerms(dtm, 0.4)

No estabas eliminando los términos poco frecuentes sino únicamente
mostrándolos.

Mira luego si puedes continuar con

> # nube de palabras
>                 m <- as.matrix(dtm)
>                 v <- sort(rowSums(m),decreasing=TRUE)
>                 df <- data.frame(word = names(v),freq=v)
> wordcloud(df$word,df$freq,min.freq=30)

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



Más información sobre la lista de distribución R-help-es