[R-es] problemas con el paquete tm

Ruben Tobalina Ramirez lagrimaescrita en gmail.com
Mar Jun 17 19:27:26 CEST 2014


Hola,

hace un tiempo que voy detrás de aprender este magnifico programa pero un
poco por miedo y otro poco por falta de tiempo nunca me animaba. He
realizado un par de cursos de introducción y, a parte de esta lista, sigo
algunos blogs sobre R. Al lio, esta introducción era mas que nada para
pedir paciencia conmigo:D

Estoy intentando introducirme en el paquete tm para hacer análisis de
textos de canciones. Mi problema es que al intentar hacer la matriz del
corpus linguistico me da el siguiente error:





*Error en UseMethod("meta", x) :   no applicable method for 'meta' applied
to an object of class "character"Además: Mensajes de aviso perdidosIn
mclapply(unname(content(x)), termFreq, control) :  all scheduled cores
encountered errors in user code*

Os copio el script y os adjunto los datos por si acaso:































*TEXTFILE = "/home/rubent/Documentos/Sociologia/Soc Musica/Black
metal/Analisis texto/Inmortal" inmortal = readLines(TEXTFILE)inmortal =
readLines(TEXTFILE)length(inmortal)head(inmortal)tail(inmortal)library(tm)vec
<- VectorSource(inmortal)corpus <- Corpus(vec)summary(corpus)
inspect(corpus[1:7])corpus <- tm_map(corpus, tolower)corpus <-
tm_map(corpus, removePunctuation)corpus <- tm_map(corpus,
removeNumbers)corpus <- tm_map(corpus, removeWords, stopwords("english"))
inspect(doc.corpus[1:2])library(SnowballC)corpus <- tm_map(corpus,
stemDocument)corpus <- tm_map(corpus,
stripWhitespace)inspect(doc.corpus[1:8])TDM <- TermDocumentMatrix(corpus)
TDM*

Mi problema viene cuando ejecuto la matriz en la última linea, bueno la
penultima. Entiendo que hay algún error al captar los datos, y no tienen
que ser de la clase "character" pero no encuentro el por qué. He revisado
articulos, leido el pdf del paquete tm y no entiendo en que fallo. ¿alguien
me puede explicar en que me equivoco?

por adelantado, muchas gracias!!!

ruben!

pd: me di cuenta que todos los mensajes tienen la etiqueta [R-es] en el
asunto, asi que vuelvo a enviar el mensaje x si acaso no lo hice. Disculpad
si lo recibis 2 veces:P
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140617/500a5398/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: Inmortal
Type: application/octet-stream
Size: 50147 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140617/500a5398/attachment-0001.obj>


Más información sobre la lista de distribución R-help-es