[R-es] error com un archivo
Marta valdes lopez
martavaldes85 en gmail.com
Mie Jul 9 13:56:48 CEST 2014
Hola a todos,
Me gustaria pedir vuestra ayuda a encontrar el error que no consigo
encontrar en este archivo. He revisado todo mil veces y probado y no doy
con ello.Adjunto el archivo con Google drive porque es muy grande.
monicap_50.csv
<https://docs.google.com/file/d/0B8o2KrPEgG7ATlBMc19lTVk1d3M/edit?usp=drive_web>
Este es el script, y lo que no entiendo que pasa es que tengo 592044 datos
despues de limpiar los NA quedan 586561 datos , y cuando utilizo el script
la suma de z2+z4+z5+z6 , que son los estados deberia de darme lo mismo que
Z1 que es el valor total de datos pero no se que error existe que me dan
mas datos que los que hay.He comparado con el archivo en excel y los datos
de na estan correctos.
library(chron)
library(xlsx)
filename<-"monicap_50.csv"
DBxy<-read.csv(filename, sep=";",header=TRUE,dec=",")
DBx<-na.omit(DBxy)
names(DBx)<-c("Boat","DateTime","TimeDiff", "Latitude", "Longitude",
"Course", "Speed", "distNm", "calcSpeed", "calcCourse", "distHb",
"Harbour", "idTrip","vmsAngle", "calcAngle", "vmsLeg", "calcLeg",
"Trip_vmsLeg", "Trip_calcLeg", "lengthTrip", "lengthTrip_vmsLeg",
"lengthTrip_calcLeg","Time", "Date")
#Formatting date and time variables
DBx$Date<-strptime(DBx$Date, "%d-%m-%Y")
DBx$Year<-as.POSIXlt(DBx$Date)$year+1900
if(filename!="monicap_50.csv") {DBx$Time<-paste(DBx$Time, ":00",
sep="")} #NOT necessary for Monicap and Univerest_50
DBx$Time<-times(DBx$Time) #Works for Monicap AND UNIVEREST_50 ONLY
DBx$Boat<-gsub("^\\s+|\\s+$", "", DBx$Boat)
#Read file with boat codes and gears
codeBoats<- read.csv("CODES_2002-2010New.csv",
sep=",",header=TRUE) #Laptop
codeBoats$CODIGO<-gsub("^\\s+|\\s+$", "", codeBoats$CODIGO)
#Assigning a Fishing license based on Boat and Year
DBx$gear<-codeBoats$Lic[match(paste(DBx$Boat,DBx$Year),
paste(codeBoats$CODIGO,codeBoats$Year))]
z0<-length(DBx$gear)
z1<-length(DBx$gear)
z1
#defining speed and distance limits
speedFishing<-2.0
speedHarb<-1.0
distHbRule<-3.0
speedSteam<-2.0
minTime<-times(c("05:59:59")) #usual beginning of fishing
operations
maxTime<- times(c("20:59:59")) #usual finishing of fishing
operations
#Selecting Harbour
DBharbour<- na.omit(DBx[DBx$distHb<=distHbRule &
DBx$calcSpeed<=speedHarb,])
DBharbour$State<-"Harbour" #MONICAP= 10618; UNIVER1= ; UNIVER2= ;
UNIVEREST= 1028
z2<-length(DBharbour$State)
#Selecting Steaming
DBsteaming<- na.omit(DBx[(DBx$calcSpeed>speedFishing) |
(DBx$distHb<=distHbRule & DBx$calcSpeed>speedHarb),])
DBsteaming$State<- "Steaming" #MONICAP= 88398; UNIVER1= ; UNIVER2=
; UNIVEREST= 53748
DBsteaming$Harbour<-""
z4<-length(DBsteaming$State)
#Selecting Fishing
DBfishing<- na.omit(DBx[(DBx$calcSpeed<=speedFishing &
DBx$distHb>distHbRule & DBx$Time>minTime & DBx$Time<=maxTime),])
DBfishing$State<-"Fishing"
DBfishing$Harbour<-""
z5<-length(DBfishing$State)
#Selecting nigth
DBnight<- na.omit(DBx[(DBx$calcSpeed<=speedFishing &
DBx$distHb>distHbRule &(DBx$Time<=minTime | DBx$Time>maxTime)),])
DBnight$State<-"Night" #MONICAP=10434; UNIVER1= 16677; UNIVER2=
25789
DBnight$Harbour<-""
z6<-length(DBnight$State)
Si alguien ve el error y puede echarme una mano agradeceria, si no pues
seguire peleandome con el archivo!
Muchas gracias, un saludo
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140709/12392d7c/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: CODES_2002-2010New.csv
Type: text/csv
Size: 113916 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140709/12392d7c/attachment-0001.bin>
Más información sobre la lista de distribución R-help-es