[R-es] Tamaño de la matriz de términos y memoria. Paquete TM
Carlos J. Gil Bellosta
cgb en datanalytics.com
Jue Dic 13 22:04:39 CET 2012
Hola, ¿qué tal?
Tienes un error en tu código. Donde dices
> # remueve términos con baja frecuencia
> inspect(removeSparseTerms(dtm, 0.4))
debieras haber escrito
> # elimina términos con baja frecuencia
> dtm <- removeSparseTerms(dtm, 0.4)
No estabas eliminando los términos poco frecuentes sino únicamente
mostrándolos.
Mira luego si puedes continuar con
> # nube de palabras
> m <- as.matrix(dtm)
> v <- sort(rowSums(m),decreasing=TRUE)
> df <- data.frame(word = names(v),freq=v)
> wordcloud(df$word,df$freq,min.freq=30)
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
Más información sobre la lista de distribución R-help-es