[R-es] NA's

Marcuzzi, Javier Rubén javier.ruben.marcuzzi en gmail.com
Mie Jul 25 01:03:46 CEST 2012


Estimado Luciano Selzer

Los datos son leídos con 
C_L_0<- read.csv("~/Tambos/Control_RP.txt")

El archivo txt es generado como resultado a una consulta en base de datos.

A partir de este realizo varias líneas de código, donde una línea en particular toma dos fechas y calcula la diferencia entre estas. Como resultado hay 18 registros de 80516 que dan NA, porque falta una fecha.

La búsqueda de los NA son dentro de un data.frame, donde hay algo de información en otra columna, puesto que anteriormente todos los controles que tienen leche cero o NA los hago valer uno, pero no los uso, tomo solamente los mayores a 5, colocar un summary sería enviar muchos datos sin sentido, pero hay variables donde todo tiene información, nada de NA.

Hay fechas donde “no” hay información, el animal podía estar en el listado predefinido pero al ir al campo estaba muerto, por eso que elimino los NA antes. Pero es ilógico un control, que se realizó a campo, se pago por él, en algunos casos intervino un análisis de laboratorio, y no anotaron el día. Estadísticamente 18 contra 80516 tiene poca o nada que ver, pero para mí es un dato muy importante, ¿que paso?, ¿descuido, error de escritura, problema en el software?, esos NA son algo de 5000 euros (en leche) sin fecha. Posiblemente esa parte puntual de calidad de datos no es muy importante en términos estadísticos, como sí son otros problemas que puede documentar, pero sin dudas es lo más fácil de mostrar.

Javier

From: Luciano Selzer 
Sent: Tuesday, July 24, 2012 7:27 PM
To: Marcuzzi, Javier Rubén 
Cc: r-help-es en r-project.org 
Subject: Re: [R-es] NA's

Capaz que esos son los NA. Pienso que pueden ser filas vacias. Que usaste para leer los datos? read.table?
Luciano



El 24 de julio de 2012 18:24, Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com> escribió:

  Estimado Julio Di Rienzo

  Muchas gracias por su sugerencia, pero creo que en mi contexto no sería aplicable, cambiaría los NA por TRUE o FALSE, no se si se ve mi captura de pantalla, esos registros tienen su origen en controles lecheros, y como ambos somos de Argentina usted debe conocer que no siempre al laboratorio le solicitan análisis de proteína, es decir hay muchos NA, mi intención es informar los animales que tienen NA en los días de lactancia, es decir, le realizaron un control lechero con o sin análisis fisicoquímico, pero no registraron el día del control, son muy pero muy pocos datos en relación a la cantidad que tengo, pero bueno, es lo que hay.

  Es bueno utilizar R o su software, InfoStat, que en una oportunidad me cedió por un problema que tuve en mi facultad, sin embargo, la calidad de los datos es indispensable independientemente del análisis posterior. Deseo informar algunos problemas de datos previo a mi análisis, por eso que busque los NA.

  Javier

  From: Julio Alejandro Di Rienzo 
  Sent: Tuesday, July 24, 2012 4:57 PM
  To: Marcuzzi, Javier Rubén 
  Cc: r-help-es en r-project.org 
  Subject: Re: [R-es] NA's

  Javier proba con

  complete.cases(cosas)
  te devuelve un vector booleano 

  Prof. Julio Di Rienzo
  Estadística y Biometría
  FCA- U.N. Córdoba
  IBS-RARG President
  http://sites.google.com/site/juliodirienzo
  "Biometry, the active pursuit of biological
  knowledge by quantitative methods." 
  (R.A. Fisher, 1948)




  2012/7/24 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com>

    Buenas tardes

    Les consulto los siguiente, dentro de unos datos hay registros faltantes, estos son NA.

    Me gustaría poder avisar cuáles son los registros no tomados en cuenta porque son NA.

    Como no puedo reproducir el error, copio y pego un script R que es la forma que yo razone, la cuál me funciona, y un trozo de la captura de pantalla donde aparece mi error, es decir todo NA.

    #   NA's
    persona <- c('javier', 'ruben', 'marcuzzi')
    bici <- c(1,1,3)
    auto <- c(NA,1,1)
    cosas <- data.frame(persona, bici, auto)
    cosas
    no_NA_auto <- cosas[!is.na(cosas$auto),]
    no_NA_auto
    si_NA_auto <- cosas[is.na(cosas$auto),]
    si_NA_auto


    ¿Que significa eso? Algo no anda, ¿que puede ser?

    Javier Marcuzzi


    _______________________________________________
    R-help-es mailing list
    R-help-es en r-project.org
    https://stat.ethz.ch/mailman/listinfo/r-help-es




  _______________________________________________
  R-help-es mailing list
  R-help-es en r-project.org
  https://stat.ethz.ch/mailman/listinfo/r-help-es


------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20120724/0f22b301/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/png
Size: 206830 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20120724/0f22b301/attachment-0001.png>


Más información sobre la lista de distribución R-help-es