[R-es] búsqueda y sustitución masiva

Carlos Guadián Orta carlosguadian en gmail.com
Jue Abr 30 13:00:32 CEST 2015


Hola a tod en s, explico lo que estoy intentando hacer...

Tengo un listado de url comprimidas de twitter, entre las cuales hay muchas
repetidas, por lo que el número de registros llega a más de 15K.

Por otro lado tengo otra lista de esas url únicas con su equivalente ya
descomprimido llegando a un registro de 900.

El problema que tengo es que estoy intentando hacer un loop para hacer la
sustitución de la url comprimida por su equivalente descomprimido, pero no
hay manera.

Los datos que tengo son:
url.origin$V1 es la lista de url originales (más de 15K)
url.des$url1 es la lista de url originales únicas
url.des$url2 es la lista de url descomprimidas equivalentes a url.des$url1


El último código con el que he probado es el siguiente pero sin buenos
resultados:

recoderFunc <- function(data, oldvalue, newvalue) {

  # convertir los factores en caracteres

  if (is.factor(data))     data     <- as.character(data)
  if (is.factor(oldvalue)) oldvalue <- as.character(oldvalue)
  if (is.factor(newvalue)) newvalue <- as.character(newvalue)

  # crear el vector de retorno

  newvec <- data

  # poner los valores registrados en la posición correcta del vector de
retorno

  for (i in unique(oldvalue)) newvec[data == i] <- newvalue[oldvalue == i]

  newvec

}

recoderFunc(url.origin$V1, url.des$url1, url.des$url2)

Cualquier idea sobre como poder resolverlo u orientación por dónde podría
ir será bienvenida.

Muchas gracias de antemano.


*Carlos Guadián Orta*
Mi Twitter es @carlosguadian <http://twitter.com/carlosguadian>
Mi blog es K-Government <http://www.k-government.com>
Mi perfil profesional en LinkedIn <http://es.linkedin.com/in/carlosguadian>
Trabajo en Autoritas Consulting <http://www.autoritas.es>
Coordino #oGov <http://www.ogov.eu>
Escribo en Sesión de Control
<http://sesiondecontrol.com/author/carlosguadian/>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es