<div dir="ltr"><div>Hola a todos,</div><div><br></div><div>Me gustaria pedir vuestra ayuda a encontrar el error que no consigo encontrar en este archivo. He revisado todo mil veces y probado y no doy con ello.Adjunto el archivo con Google drive porque es muy grande.</div>
<div><br></div><div>​<br><div class="gmail_chip gmail_drive_chip" style="padding:5px;border:1px solid rgb(221,221,221);width:396px;height:18px;color:rgb(34,34,34);line-height:1;font-family:arial;font-size:13px;font-style:normal;font-weight:bold;max-height:18px;background-color:rgb(245,245,245)">
<a style="padding:1px 0px;border:currentColor;width:100%;overflow:hidden;text-decoration:none;display:inline-block;white-space:nowrap" href="https://docs.google.com/file/d/0B8o2KrPEgG7ATlBMc19lTVk1d3M/edit?usp=drive_web" target="_blank"><img style="border: currentColor; border-image: none; vertical-align: bottom;" src="https://ssl.gstatic.com/docs/doclist/images/icon_10_generic_list.png"> <span style="color:rgb(17,85,204);text-decoration:none;vertical-align:bottom" dir="ltr">monicap_50.csv</span></a></div>
​<br></div><div>Este es el script, y lo que no entiendo que pasa es que tengo 592044 datos despues de limpiar los NA quedan 586561 datos , y cuando utilizo el script la suma de z2+z4+z5+z6 , que son los estados deberia de darme lo mismo que Z1 que es el valor total de datos pero no se que error existe que me dan mas datos que los que hay.He comparado con el archivo en excel y los datos de na estan correctos.</div>
<div><br></div><div>library(chron)<br>  library(xlsx)<br> filename<-"monicap_50.csv"<br>  DBxy<-read.csv(filename, sep=";",header=TRUE,dec=",")<br> DBx<-na.omit(DBxy)<br> names(DBx)<-c("Boat","DateTime","TimeDiff", "Latitude", "Longitude", "Course", "Speed", "distNm", "calcSpeed", "calcCourse", "distHb",  "Harbour", "idTrip","vmsAngle", "calcAngle", "vmsLeg", "calcLeg", "Trip_vmsLeg", "Trip_calcLeg", "lengthTrip", "lengthTrip_vmsLeg", "lengthTrip_calcLeg","Time", "Date")<br>
  #Formatting date and time variables<br>  DBx$Date<-strptime(DBx$Date, "%d-%m-%Y")           <br>  DBx$Year<-as.POSIXlt(DBx$Date)$year+1900<br>  if(filename!="monicap_50.csv") {DBx$Time<-paste(DBx$Time, ":00", sep="")}   #NOT necessary for Monicap and Univerest_50<br>
  DBx$Time<-times(DBx$Time)       #Works for Monicap AND UNIVEREST_50  ONLY<br>  DBx$Boat<-gsub("^\\s+|\\s+$", "", DBx$Boat)                             <br>   #Read file with boat codes and gears<br>
  codeBoats<- read.csv("CODES_2002-2010New.csv", sep=",",header=TRUE)            #Laptop<br>  codeBoats$CODIGO<-gsub("^\\s+|\\s+$", "", codeBoats$CODIGO)<br> #Assigning a Fishing license based on Boat and Year<br>
  DBx$gear<-codeBoats$Lic[match(paste(DBx$Boat,DBx$Year), paste(codeBoats$CODIGO,codeBoats$Year))]  <br> z0<-length(DBx$gear)<br> z1<-length(DBx$gear) <br>  z1<br> #defining speed and distance limits<br>      speedFishing<-2.0 <br>
      speedHarb<-1.0  <br>      distHbRule<-3.0  <br>speedSteam<-2.0    <br>      minTime<-times(c("05:59:59"))        #usual beginning of fishing operations<br>      maxTime<- times(c("20:59:59"))        #usual finishing of fishing operations</div>
<div>       #Selecting Harbour         <br>        DBharbour<- na.omit(DBx[DBx$distHb<=distHbRule & DBx$calcSpeed<=speedHarb,])<br>        DBharbour$State<-"Harbour"   #MONICAP= 10618; UNIVER1= ; UNIVER2= ; UNIVEREST= 1028<br>
        z2<-length(DBharbour$State)     <br> #Selecting Steaming      <br>        DBsteaming<- na.omit(DBx[(DBx$calcSpeed>speedFishing) |  (DBx$distHb<=distHbRule & DBx$calcSpeed>speedHarb),]) <br>        DBsteaming$State<- "Steaming" #MONICAP= 88398; UNIVER1= ; UNIVER2= ; UNIVEREST= 53748<br>
        DBsteaming$Harbour<-""<br>        z4<-length(DBsteaming$State)<br>         #Selecting Fishing        <br>        DBfishing<- na.omit(DBx[(DBx$calcSpeed<=speedFishing & DBx$distHb>distHbRule & DBx$Time>minTime & DBx$Time<=maxTime),])<br>
        DBfishing$State<-"Fishing" </div><div>  DBfishing$Harbour<-""<br>        z5<-length(DBfishing$State)</div><div>       #Selecting nigth        <br>        DBnight<- na.omit(DBx[(DBx$calcSpeed<=speedFishing & DBx$distHb>distHbRule &(DBx$Time<=minTime | DBx$Time>maxTime)),])<br>
        DBnight$State<-"Night"  #MONICAP=10434; UNIVER1= 16677; UNIVER2= 25789<br>        DBnight$Harbour<-""<br>        z6<-length(DBnight$State)</div><div><br></div><div>Si alguien ve el error y puede echarme una mano agradeceria, si no pues seguire peleandome con el archivo!</div>
<div><br></div><div>Muchas gracias, un saludo<br>      <br></div></div>