[R-es] Como leer una BD con una estructura inadecuada

eric ericconchamunoz en gmail.com
Dom Abr 19 01:03:01 CEST 2015


Estimados, tengo el siguiente problema:

Tengo una BD de 19 columnas y aprox 500 mil filas, la que tiene muchas 
celdas vacias y esta separada con espacios para hacer coincidir los 
datos bajo los encabezados.

Mi problema es que al tratar de importar a R la BD no se como tratar con 
los espacios vacios cuando se trata de una columna de numeros (para el 
texto puse na.strings = "NA") y tampoco se como hacer para que al leer 
cada dato este asociado al encabezado correcto, pues el numero de 
espacios que esta puesto entre cada dato varia de acuerdo a la extension 
en caracteres del dato (hay numeros, nombres, etc). Incluso hay 
encabezados de dos palabras y parece que R los considera dos encabezados 
distintos. Me explico ?

Como puedo hacer para leer la BD correctamente ? Alguna idea ??

Adjunto un archivo de muestra.

Muchas gracias.

Eric.




-- 
Forest Engineer
Master in Environmental and Natural Resource Economics
Ph.D. student in Sciences of Natural Resources at La Frontera University
Member in AguaDeTemu2030, citizen movement for Temuco with green city 
standards for living

Nota: Las tildes se han omitido para asegurar compatibilidad con algunos 
lectores de correo.
------------ próxima parte ------------
ID Number      Name                                                         Fed Sex Tit  WTit OTit           SRtng SGm SK RRtng RGm Rk BRtng BGm BK B-day Flag
14319110        Van Der Walt, Dina                                          RSA F                                                                   0000  w   
10218181       (mastar Marine), Asaduzzaman                                 BAN M                                                                   1969      
13802860       .Sultanov Zhamalidin                                         KGZ M                                                                   2008      
5700230        A B, Muhammad Yusop                                          MAS M                                                                   0000      
35077023       A Chakravarthy                                               IND M                            1151  0   40                           1986      
10207538       A E M, Doshtagir                                             BAN M                            1840  0   40 1836  0   20 1860  0   20 1974      
5716365        A Hamid, Harman                                              MAS M                                         1593  0   20              0000      
10207546       A K M Aminul, Islam                                          BAN M                                                                   0000      
10217916       A K M Arif, Hossain                                          BAN M                                                                   1970      
10215727       A K M Jane, Alam                                             BAN M                                                                   1969      
10207716       A K M Manjurul, Alam                                         BAN M                                                                   1964      
10206612       A K M, Sourab                                                BAN M                            1714  0   40                           0000  i   
5045886        A K, Kalshyan                                                IND M                            1919  0   20                           1964      
46622110       A Krishna Pranav Reddy                                       IND M                                                                   2003      
8605360        A La, Teng Hua                                               CHN F                            1915  0   40                           1993  wi  
5716373        A Rajah, Abdul Shukor                                        MAS M                            1773  0   40 1996  0   20              0000      
5031605        A, Akshaya                                                   IND F                            2014  0   20                           1994  wi  
124136061      A, Sergey                                                    FID M                                                                   1988      
5080444        A, Sohita                                                    IND F                            1447  0   40                           1995  wi  


Más información sobre la lista de distribución R-help-es