[R-es] Importando mal los datos

Carlos Ortega cof en qualityexcellence.es
Vie Oct 6 19:15:00 CEST 2017


​Sí, esa es la forma que iba a comentar...

Hay hasta una heurística eficiente para encontrar ese caso, como el de
adivinar un número con un mínimo de preguntas... Divide tu fila en dos
partes iguales, mira si está en la primera parte o en la segunda. Y en la
parte que está vuelves a aplicar la división...

Si tu columna lo permite... podrías plantearte hasta hacerlo con "table()"

Saludos,
Carlos Ortega
www.qualityexcellence.es



El 6 de octubre de 2017, 17:43, eric <ericconchamunoz en gmail.com> escribió:

> Pero no necesitas hacer ese paso ... como dice Carlos, fuerza a que la
> columna sea de tipo numerico al leerla, con los parametros de fread ...
> otra cosa es que tengas metida una letra en la columna, a veces me ha
> pasado, por ejemplo una I en lugar de un uno (cuando vienen de escaneo y
> OCR por ejemplo), y si las columnas tienen varios miles de filas y no es
> practico encontrarlas a ojo lo que yo he hecho artesanalmente es hacer un
> ciclo de cualquier operacion numerica sencilla sobre la columna usando un
> ciclo FOR, como hay una letra entre medio al llegar ahi el ciclo de traba,
> entonces miras el contador del ciclo y ya sabes en que fila se detuvo ...
> es artesanal, pero sirve XD ... no se si habra alguna forma mas eficiente,
> ya que me ha pasado poco no he profundizado en el asunto ...
>
> Saludos, Eric.
>
>
>
> On 10/06/2017 10:55 AM, Jesús Para Fernández wrote:
>
> Es ese segundo paso el que no se como hacer. Es decir, como detecto una anomalia en caracter factor de una columna?
>
> Gracias Carlos
> ________________________________
> De: Carlos Ortega <cof en qualityexcellence.es> <cof en qualityexcellence.es>
> Enviado: viernes, 6 de octubre de 2017 15:27
> Para: Jes�s Para Fern�ndez
> Cc: r-help-es en r-project.org
> Asunto: Re: [R-es] Importando mal los datos
>
> Puedes forzar que esa columna sea de un tipo determinado... con el par�metro "colClasses" de "fread()"...
>
> O dejar que te importe todo "data.table", detectar la anomal�a, corregirla y forzar el tipo de la columna a tipo num�rico...
>
> Saludos,
> Carlos Ortegawww.qualityexcellence.es<http://www.qualityexcellence.es> <http://www.qualityexcellence.es>
> P.S: Acu�rdate que en este foro est�n prohibidas las palabrotas... :-))...
>
>
> El 6 de octubre de 2017, 15:07, Jes�s Para Fern�ndez <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com> <j.para.fernandez en hotmail.com>> escribi�:
> Entendido... El otro dia lei un art�culo sobre el efecto 2031 que versaba justo sobre eso....
>
> Una duda mas. En la columna ID hay alguna fila que esta mal metida y tiene un caracter o algo que esta hacinedo que toda esa columna me la importe como un factor y no como un numero. �Como detecto esas filas que me est�n jo...?
>
> Gracias Carlos!!!
> ________________________________
> De: Carlos Ortega <cof en qualityexcellence.es<mailto:cof en qualityexcellence.es> <cof en qualityexcellence.es>>
> Enviado: viernes, 6 de octubre de 2017 15:01
>
> Para: Jes�s Para Fern�ndez
> Cc: r-help-es en r-project.org<mailto:r-help-es en r-project.org> <r-help-es en r-project.org>
> Asunto: Re: [R-es] Importando mal los datos
>
> Porque tienes n�meros menores que 10^-31...
>
> El 6 de octubre de 2017, 14:54, Jes�s Para Fern�ndez <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com> <j.para.fernandez en hotmail.com>> escribi�:
> Gracias Carlos,
>
> Me lo ha solucionado, pero..
> �Por que es necesario instlara ese paquete?
>
> Un saludo
> Jes�s
>
> ________________________________
> De: Carlos Ortega <cof en qualityexcellence.es<mailto:cof en qualityexcellence.es> <cof en qualityexcellence.es>>
> Enviado: viernes, 6 de octubre de 2017 14:51
> Para: Jes�s Para Fern�ndez
> Cc: r-help-es en r-project.org<mailto:r-help-es en r-project.org> <r-help-es en r-project.org>
> Asunto: Re: [R-es] Importando mal los datos
>
> Instala el paquete "bit64"....
>
> Saludos,
> Carlos Ortegawww.qualityexcellence.es<http://www.qualityexcellence.es> <http://www.qualityexcellence.es>
>
> El 6 de octubre de 2017, 14:43, Jes�s Para Fern�ndez <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com> <j.para.fernandez en hotmail.com>> escribi�:
> Buenas chicos,
>
> Estoy intentando importar el csv que adjunto y que tiene la siguietne forma:
>
> "a";"b"
> 11092740;0
> 8978056137;0
>
>
> Usando la funcion fread. Necesito usar la funci�n fread por velocidad (lo que envio es un ejemplo simplificado pero que replica el error). El problema es que al importar los datos, usando:
>
> datos<-fread(datos.csv,sep=";")
>
> el campo a no lo importa correctamente, importandome lo siguiente:
>
>                a b
> 1: 5.480542e-317 0
> 2: 4.435749e-314 0
>
> �Como puedo hacer para que me lo importe bien?
>
> Gracias
> Jes�s
>
>
>
> _______________________________________________
> R-help-es mailing listR-help-es en r-project.org<mailto:R-help-es en r-project.org> <R-help-es en r-project.org>https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
> --
> Saludos,
> Carlos Ortegawww.qualityexcellence.es<http://www.qualityexcellence.es> <http://www.qualityexcellence.es>
>
>
>
> --
> Saludos,
> Carlos Ortegawww.qualityexcellence.es<http://www.qualityexcellence.es> <http://www.qualityexcellence.es>
>
>
>
> --
> Saludos,
> Carlos Ortegawww.qualityexcellence.es<http://www.qualityexcellence.es> <http://www.qualityexcellence.es>
>
> 	[[alternative HTML version deleted]]
>
>
>
>
> _______________________________________________
> R-help-es mailing listR-help-es en r-project.orghttps://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> --
> Forest Engineer
> Master in Environmental and Natural Resource Economics
> Ph.D. student in Sciences of Natural Resources at La Frontera University
> Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living
>
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo.
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es