[R-es] Como leer una BD con una estructura inadecuada
Carlos Ortega
cof en qualityexcellence.es
Dom Abr 19 11:34:19 CEST 2015
Hola Eric,
He probado el nuevo paquete de Hadley Wickham para leer ficheros, como
alternativa al read.table() y parece que funciona:
> library(readr)
> datIn <- read_table("cdb.txt")
> head(datIn)
ID Number Name Fed Sex Tit WTit OTit SRtng SGm SK
RRtng RGm Rk BRtng BGm BK B-day Flag
1 14319110 Van Der Walt, Dina RSA F NA NA NA NA NA
NA NA NA NA NA NA NA 0 w
2 10218181 (mastar Marine), Asaduzzaman BAN M NA NA NA NA NA
NA NA NA NA NA NA NA 1969
3 13802860 .Sultanov Zhamalidin KGZ M NA NA NA NA NA
NA NA NA NA NA NA NA 2008
4 5700230 A B, Muhammad Yusop MAS M NA NA NA NA NA
NA NA NA NA NA NA NA 0
5 35077023 A Chakravarthy IND M NA NA NA 1151 0
40 NA NA NA NA NA NA 1986
6 10207538 A E M, Doshtagir BAN M NA NA NA 1840 0
40 1836 0 20 1860 0 20 1974
Saludos,
Carlos Ortega
www.qualityexcellence.es
El 19 de abril de 2015, 1:03, eric <ericconchamunoz en gmail.com> escribió:
> Estimados, tengo el siguiente problema:
>
> Tengo una BD de 19 columnas y aprox 500 mil filas, la que tiene muchas
> celdas vacias y esta separada con espacios para hacer coincidir los datos
> bajo los encabezados.
>
> Mi problema es que al tratar de importar a R la BD no se como tratar con
> los espacios vacios cuando se trata de una columna de numeros (para el
> texto puse na.strings = "NA") y tampoco se como hacer para que al leer cada
> dato este asociado al encabezado correcto, pues el numero de espacios que
> esta puesto entre cada dato varia de acuerdo a la extension en caracteres
> del dato (hay numeros, nombres, etc). Incluso hay encabezados de dos
> palabras y parece que R los considera dos encabezados distintos. Me explico
> ?
>
> Como puedo hacer para leer la BD correctamente ? Alguna idea ??
>
> Adjunto un archivo de muestra.
>
> Muchas gracias.
>
> Eric.
>
>
>
>
> --
> Forest Engineer
> Master in Environmental and Natural Resource Economics
> Ph.D. student in Sciences of Natural Resources at La Frontera University
> Member in AguaDeTemu2030, citizen movement for Temuco with green city
> standards for living
>
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
> lectores de correo.
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
--
Saludos,
Carlos Ortega
www.qualityexcellence.es
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20150419/13465e01/attachment.html>
Más información sobre la lista de distribución R-help-es