[R-es] Resumen de R-help-es, Vol 48, Envío 31

Carlos J. Gil Bellosta cgb en datanalytics.com
Lun Mar 4 18:24:27 CET 2013


Hola, ¿qué tal?

Casi seguro, no quieres realmente lo que pides. Es seguramente más
probable que quieras crear 12 nuevas columnas en tu df que sean T/F
según se mencione el mes o no.

df$enero <- grepl("enero", df$cadena.texto.libre)
etc.

Ese formato es mucho más sencillo de procesar, tabular, etc.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 4 de marzo de 2013 18:09, Sebastian Kruk
<residuo.solow en gmail.com> escribió:
> Estimado Carlos:
>
> Si quiero vectorizar el procedimiento anterior y lo hago de la siguiente
> manera:
>
>>cad.ena1 <- c("Durante los meses de enero y febrero principalmente","")
>>cad.ena2 <- c("Durante los meses de enero y febrero principalmente a veces
> diciembre","")
>>cad.ena3 <- c("febrero / enero","")
>>cad.ena <- rbind(cad.ena1, cad.ena2, cad.ena3)
>>val.uno <- str_extract_all(cad.ena,
> "enero|febrero|marzo|abril|mayo|junio|julio|agosto|septiembre|octubre|noviembre|diciembre")
>>val.cad <- str_c(unlist(val.uno), collapse=" ")
>>val.cad
> [1] "enero febrero enero febrero diciembre febrero enero"
>
> De la forma siguiente no me sirve pues precisaria un vector que quede:
> [1] "enero febrero"
> [2] "enero febrero diciembre"
> [3] "enero febrero"
>
> Saludos,
>
> Sebastián
>
>
> El 1 de marzo de 2013 10:40, Carlos Ortega <cof en qualityexcellence.es>escribió:
>>
>> Hola Sebastián,
>>>
>>> Esta otra alternativa es mucho más fácil...
>>>
>>> #------------------------------------------------
>>> library(stringr)
>>>
>>> cad.ena <- "Durante los meses de enero y febrero principalmente"
>>> cad.ena2 <- "Durante los meses de enero y febrero principalmente a veces
>>> diciembre"
>>>
>>> val.uno <- str_extract_all(cad.ena,
>>> "enero|febrero|marzo|abril|mayo|junio|julio|agosto|septiembre|octubre|noviembre|diciembre")
>>> val.cad <- str_c(unlist(val.uno), collapse=" ")
>>> val.cad
>>>
>>> val.dos <- str_extract_all(cad.ena2,
>>> "enero|febrero|marzo|abril|mayo|junio|julio|agosto|septiembre|octubre|noviembre|diciembre")
>>> val.cad2 <- str_c(unlist(val.dos), collapse=" ")
>>> val.cad2
>>>
>>> #------------------------------------------------
>>>
>>> que produce estos resultados:
>>>
>>> > library(stringr)
>>> >
>>> > cad.ena <- "Durante los meses de enero y febrero principalmente"
>>> > cad.ena2 <- "Durante los meses de enero y febrero principalmente a
>>> veces diciembre"
>>> >
>>> > val.uno <- str_extract_all(cad.ena,
>>> "enero|febrero|marzo|abril|mayo|junio|julio|agosto|septiembre|octubre|noviembre|diciembre")
>>> > val.cad <- str_c(unlist(val.uno), collapse=" ")
>>> > val.cad
>>> *[1] "enero febrero"*
>>> >
>>> > val.dos <- str_extract_all(cad.ena2,
>>> "enero|febrero|marzo|abril|mayo|junio|julio|agosto|septiembre|octubre|noviembre|diciembre")
>>> > val.cad2 <- str_c(unlist(val.dos), collapse=" ")
>>> > val.cad2
>>> *[1] "enero febrero diciembre"*
>>>
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>
>         [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es