[R-es] Ayuda para campo con numerico y texto con Problemas
Isidro Hidalgo Arellano
|h|d@|go @end|ng |rom jccm@e@
Lun Mar 18 08:27:59 CET 2019
Si lo necesitas, yo puedo pasarte el nombre de las localidades de Castilla-La Mancha de cuatro formas diferentes.
Un saludo
Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo
Consejería de Economía, Empresas y Empleo
<http://www.castillalamancha.es/> http://www.castillalamancha.es/
De: R-help-es <r-help-es-bounces using r-project.org> En nombre de Maria Ruiz
Enviado el: domingo, 17 de marzo de 2019 19:17
Para: r-help-es using r-project.org
Asunto: [R-es] Ayuda para campo con numerico y texto con Problemas
Hola a todos,
Soy nueva usando R y tengo unos problema en procesado de datos que quiero hacer en R.
Tengo un fichero de datos en formato texto separado con ; (punto y coma).
Este fichero contiene las columnas:
Poblacion;Sexo;Nota; EdadP, EdadM
Tengo 2 problemas que no se como tratar.
1.- Problema
La columna Poblacion debo tenerla siempre con la primera letra en mayúsculas y tengo poblaciones que tiene artículos o prepsosicones entre medias como por ejemplo: ( de, del,, las...)
Albaida del Aljarafe o Santa Cruz de Tenerife, tambien tengo algunas con Valencia, valencia, y (blanco)Valencia o Valencia(blanco)
NO sé cémo tratar este dato para que solo aparezca en La primera letra de cada palabra y no los enlace o artículos, es decir no debe aparecer: del o de .
2,. Problema
La columna Nota por hay errores y los datos no todso son de tipo 7.8 o 8.9
Parece que han errores y tengo algunos 6,5 o 6,9
ES decir han introducido la coma como separador decimal en vez de punto.
Nota podria corregir los errores con otro programa pero quiero hacerlo todo con R.
Gracias y espero un pronta respuesta
Adjunto un troz del fichero
Un trozo de ejemplo del fichero :
Poblacion;Sexo;Nota;EdadP;EdadM
Valencia ;m;7.23;45;34
Albaida del Aljarafe;M;5.93;36;37
valencia;M;NA;34;35
Barcelona;M;6.33;37;29
Albalate de las Nogueras; M;8.93;35;26
Valencia ;M;7.23;29;44
Santa Cruz de Tenerife; M ;NA;26;23
Valencia;M;9.23;44;46
Valencia; M ;7.63;23;35
Valencia ;M;5.73;46;31
Valencia;M;5.03;35;35
Valencia;M;NA;31;-24
Valencia;M ;6.13;35;28
Albalate de las Nogueras; M;7.63;24;37
Valencia;M ;7.53;28;26
Valencia; M;6.33;37;20
Santa Cruz de Tenerife;M;5.33;26;25
Santa cruz de Tenerife; m;7.33;20;35
Santa Cruz de tenerife;M;8.23;-25;39
Santa cruz de tenerife;M ;6.93;35;36
valencia; M;5.33;39;44
Valencia; M;7.73;36;46
Valencia;M ;6.23;44;35
Valencia;M;6.43;40;31
Santa cruz de Tenerife; m;6.83;36;35
valencia;M;5,73;39;24
valencia;M;6.23;58;28
valencia ; m;7.03;50;37
Albalate de las Nogueras; m;7.33;20;35
Albaida del Aljarafe;M;8.23;25;39
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es