[R-es] Data frame: eliminar caracteres raros y convertir 2 columnas a formato numerico
Sebastian Kruk
re@iduo@@olow @ending from gm@il@com
Vie Nov 9 20:46:41 CET 2018
Estimados usuarios de R:
Muy buenas tardes.
Hace días que estoy dando vueltas con un data frame de 28 observaciones con
3 variables llamado data que lo obtuve de transformar unas tablas html.
La primer y segunda variable tienen 28 niveles y la tercera 25 niveles.
¿Hay alguna forma de dejarlo sin factores?
Tiene tres columnas, en la primera están los productos, en la segunda la
cantidad vendida y en la tercera la plata.
Por medio de la siguiente sentencia elimino los Â:
data <- apply(data, 2, function(y) gsub("Â*", "", y))
Tiene como problema que hace que se me convierta en una lista el data frame.
En la variable ventas y plata tengo algunas celdas vacías y el separador de
miles es la coma y a su vez no tengo decimales.
Para resolver lo anterior aplico:
data[,2:3] <- apply(data[,2:3], 2, function(y) gsub(",", "", y))
Finalmente quiero pasar a formato numérico las últimas dos columnas usando:
data[,2:3] <- apply(data[,2:3], 2, as.numeric)
Pero no tiene efecto.
¿Me pueden dar alguna ayuda u orientar?
Gracias,
Sebastián.
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es