[R-es] Loop sobre muchos data frames

Oscar Benitez oscar.benitez1962 en gmail.com
Vie Abr 10 06:14:48 CEST 2015


Hola a todos!
Estoy en un proyecto de text mining y por razones de los recursos con que
cuento tuve que separar los archivos de texto de input del proyecto en
muchos archivos pequeños.
Luego de transformar cada uno de estos archivos en un corpus separado,
puedo aplicar limpieza sobre cada corpus, buscar n-gramas, construir cada
termDocumentMatrix y finalmente reunir todo en una sola TDM.

Pero estoy atorado en el paso de transformar cada uno de los archivos en
corpus mediante un loop. Es decir que en lugar de hacer esto infinitas
veces:

#Librerias necesarias
library(tm)

corpus_001<-Corpus(VectorSource(qBlog001))
corpus_002<-Corpus(VectorSource(qBlog002))
corpus_003<-Corpus(VectorSource(qBlog003))
.........
corpus_150<-Corpus(VectorSource(qBlog150))
........

quisiera poder armar un loop que haga el trabajo, como por ejemplo



#lista con los nombres que quiero para cada corpus
c_names <- paste("corpus_",formatC(seq(length(bNames)),
                                                width=3, flag="0"), sep="")

donde bNames es la lista de los df que tengo cargados "qBlog001"
"qBlog002"..."qBlog150"...

algo así es lo que tengo en mente:

for (i in bNames) {
  for (j in c_names) {
    j<- Corpus(VectorSource(i))
  }
}

Pero no funciona, he probado con lapply, con sapply, con llply de la
librería (plyr) y no encuentro la manera de hacerlo..
Cualquier sugerencia sera bienvenida!
Muchas gracias por adelantado!


-- 
Oscar Benitez

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es