[R-es] Boxplot.stats

Mie Jun 13 01:01:23 CEST 2018

Hola,

Mira el ejemplo de la ayuda:

#------------------------------
> rb <- boxplot(decrease ~ treatment, data = OrchardSprays, col = "bisque")
> title("Comparing boxplot()s and non-robust mean +/- SD")
> rb
$stats
     [,1] [,2] [,3] [,4] [,5]  [,6] [,7]  [,8]
[1,]  2.0  4.0  9.0 20.0   39  20.0 60.0  69.0
[2,]  2.5  5.0 14.0 24.5   45  50.5 65.5  74.0
[3,]  4.0  7.5 16.5 32.0   53  70.0 72.0  81.0
[4,]  5.0  9.0 24.0 45.0   78  88.5 78.5 106.5
[5,]  5.0 14.0 29.0 57.0  114 114.0 92.0 130.0

$n
[1] 8 8 8 8 8 8 8 8

$conf
         [,1]     [,2]     [,3]     [,4]     [,5]     [,6]     [,7]     [,8]
[1,] 2.603464 5.265543 10.91386 20.54841 34.56573 48.77265 64.73801 62.84503
[2,] 5.396536 9.734457 22.08614 43.45159 71.43427 91.22735 79.26199 99.15497

*$out[1] 12 84 24$group[1] 1 3 7*

$names
[1] "A" "B" "C" "D" "E" "F" "G" "H"

#------------------------------

Y luego en la ayuda lo que dice:

out

the values of any data points which lie beyond the extremes of the whiskers.
group

a vector of the same length as out whose elements indicate to which group
the outlier belongs.

Entonces la forma de encontrar usando esta alternativa que propones es
primero generar los diferentes grupos (que los marca la variable
"treatment" ) y en el primer grupo el valor 12 es un outlier, en el grupo 3
el 84 es otro outlier y en el grupo "7" el valor 24 es otro outlier.

De todas formas, tienes formas más fáciles de encontrar estos outliers
utilizando la función "IQR()" y aplicándola a cada uno de los grupos, esto
es lo que hace la función boxplot.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 12 de junio de 2018, 18:19, Dayana Muñoz <dayanaa.mg using hotmail.com>
escribió:

> Junto con saludar,
>
> Quería saber si los que han usado boxplot.stats, saben como ubicar los
> resultados que arroja como "out" (outliers) directamente en la base de
> datos, ya que, muestra los resultados en valor de cada dato atípico.
>
> Por ejemplo, estoy usando una base de datos con 300 datos y 10 columnas,
> en este caso estoy buscando los datos atípicos de la columna del precio de
> x producto, me arroja los out, pero no el número de fila, sino que el valor:
>
> $out
>  [1] 2039333000 8990717000 1965476000 2014958000 3609685000 4679092000
>  [7] 3276474000 1561967000 3898798000 4290957000 2140644000 1784590000
> [13] 2266295000 2540774000 1656117000 3762612000
>
> Quiero ver una forma que me identifique estos valores en la base de datos.
>
> Agradeceré sus orientaciones, saludos!
>
>         [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

	[[alternative HTML version deleted]]