[R-es] búsqueda y sustitución masiva

Carlos Guadián Orta carlosguadian en gmail.com
Jue Abr 30 17:15:24 CEST 2015


Carlos genial!!! Muchas gracias


*Carlos Guadián Orta*
Mi Twitter es @carlosguadian <http://twitter.com/carlosguadian>
Mi blog es K-Government <http://www.k-government.com>
Mi perfil profesional en LinkedIn <http://es.linkedin.com/in/carlosguadian>
Trabajo en Autoritas Consulting <http://www.autoritas.es>
Coordino #oGov <http://www.ogov.eu>
Escribo en Sesión de Control
<http://sesiondecontrol.com/author/carlosguadian/>

El 30 de abril de 2015, 14:56, Carlos Ortega <cof en qualityexcellence.es>
escribió:

> Hola,
>
> Salvo que lo esté entendiendo mal, con un "merge()" podrías solucionar el
> problema.
>
> urlGood <- merge(url.origen, url.des, by.x="V1", by.y="url1")
>
>  "urlGood" sería un data.frame de 15K filas y como columnas todas las que
> tuviera "url.origen" y "url.des" pero pareadas la columna que las vincula:
> V1 y url1.
>
> ​Luego ya de "urlGood" extraes las filas/columnas que desees...​
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El 30 de abril de 2015, 13:00, Carlos Guadián Orta <
> carlosguadian en gmail.com> escribió:
>
>> Hola a tod en s, explico lo que estoy intentando hacer...
>>
>> Tengo un listado de url comprimidas de twitter, entre las cuales hay
>> muchas
>> repetidas, por lo que el número de registros llega a más de 15K.
>>
>> Por otro lado tengo otra lista de esas url únicas con su equivalente ya
>> descomprimido llegando a un registro de 900.
>>
>> El problema que tengo es que estoy intentando hacer un loop para hacer la
>> sustitución de la url comprimida por su equivalente descomprimido, pero no
>> hay manera.
>>
>> Los datos que tengo son:
>> url.origin$V1 es la lista de url originales (más de 15K)
>> url.des$url1 es la lista de url originales únicas
>> url.des$url2 es la lista de url descomprimidas equivalentes a url.des$url1
>>
>>
>> El último código con el que he probado es el siguiente pero sin buenos
>> resultados:
>>
>> recoderFunc <- function(data, oldvalue, newvalue) {
>>
>>   # convertir los factores en caracteres
>>
>>   if (is.factor(data))     data     <- as.character(data)
>>   if (is.factor(oldvalue)) oldvalue <- as.character(oldvalue)
>>   if (is.factor(newvalue)) newvalue <- as.character(newvalue)
>>
>>   # crear el vector de retorno
>>
>>   newvec <- data
>>
>>   # poner los valores registrados en la posición correcta del vector de
>> retorno
>>
>>   for (i in unique(oldvalue)) newvec[data == i] <- newvalue[oldvalue == i]
>>
>>   newvec
>>
>> }
>>
>> recoderFunc(url.origin$V1, url.des$url1, url.des$url2)
>>
>> Cualquier idea sobre como poder resolverlo u orientación por dónde podría
>> ir será bienvenida.
>>
>> Muchas gracias de antemano.
>>
>>
>> *Carlos Guadián Orta*
>> Mi Twitter es @carlosguadian <http://twitter.com/carlosguadian>
>> Mi blog es K-Government <http://www.k-government.com>
>> Mi perfil profesional en LinkedIn <
>> http://es.linkedin.com/in/carlosguadian>
>> Trabajo en Autoritas Consulting <http://www.autoritas.es>
>> Coordino #oGov <http://www.ogov.eu>
>> Escribo en Sesión de Control
>> <http://sesiondecontrol.com/author/carlosguadian/>
>>
>>         [[alternative HTML version deleted]]
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es