[R-es] Como leer una BD con una estructura inadecuada

Jose Luis Brita jlbrita en gmail.com
Dom Abr 19 10:59:03 CEST 2015


Estimado Eric,

Con la función read.fwf() y definiendo la anchura de cada variable como
diferencia de las columnas de inicio y final creo que lo lee correctamente.

Un saludo


Jose Luis

ff <- c('C:\\cdb.txt')
datos <-
read.fwf(ff,widths=c(3-1,15-3,76-16,81-76,85-81,90-85,95-90,110-95,115-110,120-115,123-120,129-123,133-129,136-133,142-136,146-142,149-146,154-149,4),
                  header=FALSE, skip=1,
                  col.names=c('ID',
'Number','Name','Fed','Sex','Tit','WTit','OTit','SRtng','SGm','SK','RRtng','RGm','Rk','BRtng','BGm','BK','B-day','Flag'))


El 19 de abril de 2015, 1:03, eric <ericconchamunoz en gmail.com> escribió:

> Estimados, tengo el siguiente problema:
>
> Tengo una BD de 19 columnas y aprox 500 mil filas, la que tiene muchas
> celdas vacias y esta separada con espacios para hacer coincidir los datos
> bajo los encabezados.
>
> Mi problema es que al tratar de importar a R la BD no se como tratar con
> los espacios vacios cuando se trata de una columna de numeros (para el
> texto puse na.strings = "NA") y tampoco se como hacer para que al leer cada
> dato este asociado al encabezado correcto, pues el numero de espacios que
> esta puesto entre cada dato varia de acuerdo a la extension en caracteres
> del dato (hay numeros, nombres, etc). Incluso hay encabezados de dos
> palabras y parece que R los considera dos encabezados distintos. Me explico
> ?
>
> Como puedo hacer para leer la BD correctamente ? Alguna idea ??
>
> Adjunto un archivo de muestra.
>
> Muchas gracias.
>
> Eric.
>
>
>
>
> --
> Forest Engineer
> Master in Environmental and Natural Resource Economics
> Ph.D. student in Sciences of Natural Resources at La Frontera University
> Member in AguaDeTemu2030, citizen movement for Temuco with green city
> standards for living
>
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
> lectores de correo.
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Jose Luis
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20150419/30938147/attachment.html>


Más información sobre la lista de distribución R-help-es