[R-es] Identificar muestras iguales a una en concreto

Manuel Mendoza mmendoz@ @end|ng |rom |u|br|ghtm@||@org
Dom Ago 15 06:29:31 CEST 2021


Buenos días, tengo una df, resultado de un remuestreo de data (data.rem),
que lógicamente tiene muestras repetidas muchas veces. Para hacer un
leave-one-out, cada vez que quito una muestra tengo que quitar también las
que son iguales. Se me ocurrió hacer lo de abajo, pero no funciona porque
"duplicated" no hace lo que yo creía y no sé cómo identificar las muestras
que son iguales a la seleccionada (data.rem[i, ]).
Lo de después del rpart tampoco está bien, porque la muestra sobre la que
predigo no es la misma que había quitado.

preds <- c(0)  # creamos un vector vacío
for (i in 1:nrow(data)) {
  index <- which(duplicated(data.rem[i, ]))
  training <-  data.rem[-index, ]
  training <-  training  [-i, ]
  fitrp <- rpart(loc ~ .,data=training)
  Pred <- predict(fitrp,data[i,], type="class")
  preds[i] <- as.character(Pred)
}
data$preds<- preds

Muchas gracias, como siempre.
Manuel

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es