[R-es] Limpiar variables

Javier Gómez Gonzalez zaragatan en gmail.com
Vie Feb 3 17:39:20 CET 2017


Muchas gracias Isidro, problema solucionado con la función grep().

Este documento me ha sido de mucha utilidad:* Introduction to String
Matching and Modification in R Using **Regular Expressions*

http://biostat.mc.vanderbilt.edu/wiki/pub/Main/SvetlanaEdenRFiles/regExprTalk.pdf

El 3 de febrero de 2017, 9:05, Isidro Hidalgo Arellano <ihidalgo en jccm.es>
escribió:

> Hola:
> Asegúrate de que la información que tienes es correcta, porque da la
> impresión de que existe un problema de "calidad" en esas variables.
> Mira la ayuda de la función "grep()".
> Puedes cargar la variable como "character", excluir con grep() todo lo que
> no sea número y después convertir a número con "as.numeric()".
> Un saludo
>
> Isidro Hidalgo Arellano
> Observatorio del Mercado de Trabajo
> Consejería de Economía, Empresas y Empleo
> http://www.castillalamancha.es/
>
>
> -----Mensaje original-----
> De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de
> javier.ruben.marcuzzi en gmail.com
> Enviado el: viernes, 03 de febrero de 2017 3:45
> Para: Javier Gómez Gonzalez <zaragatan en gmail.com>; r-help-es en r-project.org
> Asunto: Re: [R-es] Limpiar variables
>
> Estimado Javier Gómez Gonzalez
>
> Hay una diferencia entre lo que tiene y lo que piensa que tiene, si usted
> escribe lo siguiente:
>
> str(el data frame con los datos)
>
> R le informa lo que tiene, en su ejemplo A% seguro que no es informado como
> numérico.
>
> Ahora hay otro problema, si por ejemplo la variable es altura de las
> personas, ¿Quién mide A%?
>
> Los datos tienen errores, una alternativa es usar expresiones regulares,
> con
> estas se aceptan números, lógicamente lo que no le es se descarta o borra
> de
> los datos. Pero usted dice que carga los archivos desde un csv ¿Qué
> posibilidades hay de preparar los datos de una forma más limpia para que R
> importe solo números en las variables numéricas?
>
> Javier Rubén Marcuzzi
>
> De: Javier Gómez Gonzalez
> Enviado: jueves, 2 de febrero de 2017 22:40
> Para: r-help-es en r-project.org
> Asunto: [R-es] Limpiar variables
>
> Hola:
>
> Tengo una serie de variables numéricas en las que aparecen caracteres
> extraños. Las variables tienen unos 50000 datos aproximadamente.
> ejemplo:
>
> {1,25,47,A%.....,25N,....C,.....)
>
> No es un problema a la hora de cargar el archivo csv a R. Estos caracteres
> ya vienen en el csv.
> ¿Cómo podría limpiarlos en R?
>
> Muchas gracias
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es