[R-es] Ayuda para campo con numerico y texto con Problemas

Isidro Hidalgo Arellano |h|d@|go @end|ng |rom jccm@e@
Lun Mar 18 08:27:59 CET 2019


Si lo necesitas, yo puedo pasarte el nombre de las localidades de Castilla-La Mancha de cuatro formas diferentes.

Un saludo

 

Isidro Hidalgo Arellano

Observatorio del Mercado de Trabajo

Consejería de Economía, Empresas y Empleo

 <http://www.castillalamancha.es/> http://www.castillalamancha.es/

 

 

 

De: R-help-es <r-help-es-bounces using r-project.org> En nombre de Maria Ruiz
Enviado el: domingo, 17 de marzo de 2019 19:17
Para: r-help-es using r-project.org
Asunto: [R-es] Ayuda para campo con numerico y texto con Problemas

 

Hola a todos, 

Soy nueva usando R y tengo unos problema en procesado de datos que quiero hacer en R.

 

Tengo un fichero de datos  en formato texto separado con ; (punto y coma).

Este fichero contiene las columnas:

Poblacion;Sexo;Nota; EdadP, EdadM

Tengo 2 problemas que no se como  tratar.

1.- Problema

La  columna Poblacion debo tenerla  siempre con la primera letra en mayúsculas y  tengo poblaciones  que tiene artículos o prepsosicones entre medias como por ejemplo: ( de, del,, las...)

Albaida del Aljarafe o  Santa Cruz de  Tenerife, tambien tengo algunas con Valencia, valencia, y (blanco)Valencia o Valencia(blanco) 

 

 

NO sé cémo tratar este dato para que solo aparezca en La primera letra  de cada palabra y no los enlace o artículos, es decir no debe aparecer: del o de .

 

2,. Problema

La columna Nota por  hay errores y los datos no todso son de tipo 7.8 o 8.9 

Parece que han errores y tengo algunos  6,5 o 6,9

ES decir han introducido la coma como separador decimal en vez de punto. 

 

Nota podria corregir los errores con otro programa pero quiero hacerlo todo con R.

 

Gracias y espero un pronta respuesta  

Adjunto un troz del fichero

 

 

Un trozo de ejemplo del fichero :

Poblacion;Sexo;Nota;EdadP;EdadM

  Valencia ;m;7.23;45;34

Albaida del Aljarafe;M;5.93;36;37

valencia;M;NA;34;35

Barcelona;M;6.33;37;29

Albalate de las Nogueras;  M;8.93;35;26

  Valencia ;M;7.23;29;44

Santa Cruz de Tenerife;  M   ;NA;26;23

Valencia;M;9.23;44;46

Valencia;  M   ;7.63;23;35

Valencia ;M;5.73;46;31

 Valencia;M;5.03;35;35

Valencia;M;NA;31;-24

Valencia;M   ;6.13;35;28

Albalate de las Nogueras;  M;7.63;24;37

 Valencia;M   ;7.53;28;26

 Valencia;  M;6.33;37;20

Santa Cruz de Tenerife;M;5.33;26;25

Santa cruz de Tenerife;  m;7.33;20;35

 Santa Cruz de tenerife;M;8.23;-25;39

Santa cruz de tenerife;M   ;6.93;35;36

valencia;  M;5.33;39;44

 Valencia;  M;7.73;36;46

  Valencia;M   ;6.23;44;35

 Valencia;M;6.43;40;31

Santa cruz de Tenerife;  m;6.83;36;35

valencia;M;5,73;39;24

  valencia;M;6.23;58;28

 valencia ;  m;7.03;50;37

Albalate de las Nogueras;  m;7.33;20;35

Albaida del Aljarafe;M;8.23;25;39


	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es