[R-es] Como leer una BD con una estructura inadecuada
eric
ericconchamunoz en gmail.com
Dom Abr 19 01:03:01 CEST 2015
Estimados, tengo el siguiente problema:
Tengo una BD de 19 columnas y aprox 500 mil filas, la que tiene muchas
celdas vacias y esta separada con espacios para hacer coincidir los
datos bajo los encabezados.
Mi problema es que al tratar de importar a R la BD no se como tratar con
los espacios vacios cuando se trata de una columna de numeros (para el
texto puse na.strings = "NA") y tampoco se como hacer para que al leer
cada dato este asociado al encabezado correcto, pues el numero de
espacios que esta puesto entre cada dato varia de acuerdo a la extension
en caracteres del dato (hay numeros, nombres, etc). Incluso hay
encabezados de dos palabras y parece que R los considera dos encabezados
distintos. Me explico ?
Como puedo hacer para leer la BD correctamente ? Alguna idea ??
Adjunto un archivo de muestra.
Muchas gracias.
Eric.
--
Forest Engineer
Master in Environmental and Natural Resource Economics
Ph.D. student in Sciences of Natural Resources at La Frontera University
Member in AguaDeTemu2030, citizen movement for Temuco with green city
standards for living
Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
lectores de correo.
------------ próxima parte ------------
ID Number Name Fed Sex Tit WTit OTit SRtng SGm SK RRtng RGm Rk BRtng BGm BK B-day Flag
14319110 Van Der Walt, Dina RSA F 0000 w
10218181 (mastar Marine), Asaduzzaman BAN M 1969
13802860 .Sultanov Zhamalidin KGZ M 2008
5700230 A B, Muhammad Yusop MAS M 0000
35077023 A Chakravarthy IND M 1151 0 40 1986
10207538 A E M, Doshtagir BAN M 1840 0 40 1836 0 20 1860 0 20 1974
5716365 A Hamid, Harman MAS M 1593 0 20 0000
10207546 A K M Aminul, Islam BAN M 0000
10217916 A K M Arif, Hossain BAN M 1970
10215727 A K M Jane, Alam BAN M 1969
10207716 A K M Manjurul, Alam BAN M 1964
10206612 A K M, Sourab BAN M 1714 0 40 0000 i
5045886 A K, Kalshyan IND M 1919 0 20 1964
46622110 A Krishna Pranav Reddy IND M 2003
8605360 A La, Teng Hua CHN F 1915 0 40 1993 wi
5716373 A Rajah, Abdul Shukor MAS M 1773 0 40 1996 0 20 0000
5031605 A, Akshaya IND F 2014 0 20 1994 wi
124136061 A, Sergey FID M 1988
5080444 A, Sohita IND F 1447 0 40 1995 wi
Más información sobre la lista de distribución R-help-es