[R-es] búsqueda y sustitución masiva
Carlos Ortega
cof en qualityexcellence.es
Jue Abr 30 14:56:56 CEST 2015
Hola,
Salvo que lo esté entendiendo mal, con un "merge()" podrías solucionar el
problema.
urlGood <- merge(url.origen, url.des, by.x="V1", by.y="url1")
"urlGood" sería un data.frame de 15K filas y como columnas todas las que
tuviera "url.origen" y "url.des" pero pareadas la columna que las vincula:
V1 y url1.
Luego ya de "urlGood" extraes las filas/columnas que desees...
Saludos,
Carlos Ortega
www.qualityexcellence.es
El 30 de abril de 2015, 13:00, Carlos Guadián Orta <carlosguadian en gmail.com>
escribió:
> Hola a tod en s, explico lo que estoy intentando hacer...
>
> Tengo un listado de url comprimidas de twitter, entre las cuales hay muchas
> repetidas, por lo que el número de registros llega a más de 15K.
>
> Por otro lado tengo otra lista de esas url únicas con su equivalente ya
> descomprimido llegando a un registro de 900.
>
> El problema que tengo es que estoy intentando hacer un loop para hacer la
> sustitución de la url comprimida por su equivalente descomprimido, pero no
> hay manera.
>
> Los datos que tengo son:
> url.origin$V1 es la lista de url originales (más de 15K)
> url.des$url1 es la lista de url originales únicas
> url.des$url2 es la lista de url descomprimidas equivalentes a url.des$url1
>
>
> El último código con el que he probado es el siguiente pero sin buenos
> resultados:
>
> recoderFunc <- function(data, oldvalue, newvalue) {
>
> # convertir los factores en caracteres
>
> if (is.factor(data)) data <- as.character(data)
> if (is.factor(oldvalue)) oldvalue <- as.character(oldvalue)
> if (is.factor(newvalue)) newvalue <- as.character(newvalue)
>
> # crear el vector de retorno
>
> newvec <- data
>
> # poner los valores registrados en la posición correcta del vector de
> retorno
>
> for (i in unique(oldvalue)) newvec[data == i] <- newvalue[oldvalue == i]
>
> newvec
>
> }
>
> recoderFunc(url.origin$V1, url.des$url1, url.des$url2)
>
> Cualquier idea sobre como poder resolverlo u orientación por dónde podría
> ir será bienvenida.
>
> Muchas gracias de antemano.
>
>
> *Carlos Guadián Orta*
> Mi Twitter es @carlosguadian <http://twitter.com/carlosguadian>
> Mi blog es K-Government <http://www.k-government.com>
> Mi perfil profesional en LinkedIn <http://es.linkedin.com/in/carlosguadian
> >
> Trabajo en Autoritas Consulting <http://www.autoritas.es>
> Coordino #oGov <http://www.ogov.eu>
> Escribo en Sesión de Control
> <http://sesiondecontrol.com/author/carlosguadian/>
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
--
Saludos,
Carlos Ortega
www.qualityexcellence.es
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es