[R-es] Ayuda para campo con numerico y texto con Problemas

Francisco Rodríguez |jro@r @end|ng |rom hotm@||@com
Dom Mar 17 20:33:08 CET 2019


Efectivamente siga el consejo de Javier, tiene datos no normalizados y por tanto le toca limpiar y preparar la informaci�n como sea necesaria. Pero tenga en cuenta que la falta de normalizaci�n har� que en todo caso solucione el problema para un caso en concreto, cuando trate de unir esos datos �limpios� con otros, otra vez vuelta a empezar.



Por normalizar entiendo en su contexto tener identificados al menos los municipios por un c�digo que puede ser el c�digo municipal.



Por otro lado si tiene otro programa que le corrige los errores, �selo o bien pase ese programa a R, si va a usar R es porque alguna ganancia debe reportarle



Un saludo



Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para Windows 10



________________________________
De: R-help-es <r-help-es-bounces using r-project.org> en nombre de Javier Marcuzzi <javier.ruben.marcuzzi using gmail.com>
Enviado: Sunday, March 17, 2019 8:19:36 PM
Para: Maria Ruiz
Cc: r-help-es
Asunto: Re: [R-es] Ayuda para campo con numerico y texto con Problemas

Estimada Mar�a Ruiz.
Lo m�s simple, si son pocos datos, arregle los datos con excel, una base de
datos, etc. Limpieza de datos fuera de R. Luego, las palabras y su trabajo,
mire tm, texto mining.
Saludos
Javier Rub�n Marcuzzi

El dom., 17 de mar. de 2019 3:17 PM, Maria Ruiz <brew5157 using gmail.com>
escribi�:

> Hola a todos,
> Soy nueva usando R y tengo unos problema en procesado de datos que quiero
> hacer en R.
>
> Tengo un fichero de datos  en formato texto separado con ; (punto y coma).
> Este fichero contiene las columnas:
> Poblacion;Sexo;Nota; EdadP, EdadM
> Tengo 2 problemas que no se como  tratar.
> 1.- Problema
> La  columna *Poblacion* debo tenerla  siempre con la primera letra en
> may�sculas y  tengo poblaciones  que tiene art�culos o prepsosicones entre
> medias como por ejemplo: ( de, del,, las...)
> Albaida *de*l Aljarafe o  Santa Cruz de  Tenerife, tambien tengo algunas
> con Valencia, valencia, y (blanco)Valencia o Valencia(blanco)
>
>
> NO s� c�mo tratar este dato para que solo aparezca en La primera letra  de
> cada palabra y no los enlace o art�culos, es decir no debe aparecer: del o
> de .
>
> 2,. Problema
> La columna *Nota* por  hay errores y los datos no todso son de tipo 7.8 o
> 8.9
> Parece que han errores y tengo algunos  6,5 o 6,9
> ES decir han introducido la coma como separador decimal en vez de punto.
>
> Nota podria corregir los errores con otro programa pero quiero hacerlo
> todo con R.
>
> Gracias y espero un pronta respuesta
> Adjunto un troz del fichero
>
>
> Un trozo de ejemplo del fichero :
>
> Poblacion;Sexo;Nota;EdadP;EdadM
>
>   Valencia ;m;7.23;45;34
>
> Albaida del Aljarafe;M;5.93;36;37
>
> valencia;M;NA;34;35
>
> Barcelona;M;6.33;37;29
>
> Albalate de las Nogueras;  M;8.93;35;26
>
>   Valencia ;M;7.23;29;44
>
> Santa Cruz de Tenerife;  M   ;NA;26;23
>
> Valencia;M;9.23;44;46
>
> Valencia;  M   ;7.63;23;35
>
> Valencia ;M;5.73;46;31
>
>  Valencia;M;5.03;35;35
>
> Valencia;M;NA;31;-24
>
> Valencia;M   ;6.13;35;28
>
> Albalate de las Nogueras;  M;7.63;24;37
>
>  Valencia;M   ;7.53;28;26
>
>  Valencia;  M;6.33;37;20
>
> Santa Cruz de Tenerife;M;5.33;26;25
>
> Santa cruz de Tenerife;  m;7.33;20;35
>
>  Santa Cruz de tenerife;M;8.23;-25;39
>
> Santa cruz de tenerife;M   ;6.93;35;36
>
> valencia;  M;5.33;39;44
>
>  Valencia;  M;7.73;36;46
>
>   Valencia;M   ;6.23;44;35
>
>  Valencia;M;6.43;40;31
>
> Santa cruz de Tenerife;  m;6.83;36;35
>
> valencia;M;5,73;39;24
>
>   valencia;M;6.23;58;28
>
>  valencia ;  m;7.03;50;37
>
> Albalate de las Nogueras;  m;7.33;20;35
>
> Albaida del Aljarafe;M;8.23;25;39
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es using r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es