[R-es] Data frame: eliminar caracteres raros y convertir 2 columnas a formato numerico

Sebastian Kruk re@iduo@@olow @ending from gm@il@com
Vie Nov 9 20:46:41 CET 2018


Estimados usuarios de R:

Muy buenas tardes.

Hace días que estoy dando vueltas con un data frame de 28 observaciones con
3 variables llamado data que lo obtuve de transformar unas tablas html.

La primer y segunda variable tienen 28 niveles y la tercera 25 niveles.

¿Hay alguna forma de dejarlo sin factores?

Tiene tres columnas, en la primera están los productos, en la segunda la
cantidad vendida y en la tercera la plata.

Por medio de la siguiente sentencia elimino los Â:

data <- apply(data, 2, function(y) gsub("Â*", "", y))

Tiene como problema que hace que se me convierta en una lista el data frame.

En la variable ventas y plata tengo algunas celdas vacías y el separador de
miles es la coma y a su vez no tengo decimales.

Para resolver lo anterior aplico:

data[,2:3] <- apply(data[,2:3], 2, function(y) gsub(",", "", y))

Finalmente quiero pasar a formato numérico las últimas dos columnas usando:

data[,2:3] <- apply(data[,2:3], 2, as.numeric)

Pero no tiene efecto.

¿Me pueden dar alguna ayuda u orientar?

Gracias,

Sebastián.

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es