[R-es] t-test y distribución de variables

JM Arbones marbones en unizar.es
Mar Sep 20 10:44:44 CEST 2016


Gracias Olivier por tu sugerencia
JM

On 09/14/2016 10:03 AM, Olivier Nuñez wrote:
> Entiendo que quieres regularizar tus datos agregandolos.
> El test de Shapiro rechaza la normalidad de una uniforme
>
>> set.seed(1234)
>> d=runif(100, min = 2, max = 4)
>> shapiro.test(d)
>          Shapiro-Wilk normality test
>
> data:  d
> W = 0.94504, p-value = 0.0003966
>
> Pero acepta la normalidad de medias de 5 uniformes:
>> i=replicate(100,mean(sample(d,5)))
>> shapiro.test(i)
>          Shapiro-Wilk normality test
>
> data:  i
> W = 0.98641, p-value = 0.3991
>
> Ahora bien, en todo caso, deberias contrastar la normalidad de tus "medias" en el seno de cada grupo y actualizar los grados de libertad de tu t-test basado en medias de medias. Pero mi consejo es optar por una solución más ortodoxa, tipo trimm-mean o test no parametrico.
> Un saludo. Olivier
>
>
> ----- Mensaje original -----
> De: "JM Arbones" <marbones en unizar.es>
> Para: r-help-es en r-project.org
> Enviados: Martes, 13 de Septiembre 2016 16:13:08
> Asunto: [R-es] t-test y distribución de variables
>
> Hola,
> Estoy analizando unos datos para una tesis doctoral.
> Durante la investigación se han recogido distintas variables clínicas de
> dos grupos (n=30 y n=40). Me encuentro que las comparaciones de medias
> se han realizado mediante t-tests sin preocuparse de estudiar la
> distribución de las variables.  Al revisar si las variables se ajustan a
> la distribución normal, aunque los QQplots no tienen "mala pinta" las
> distribuciones de las variables se alejan de la normalidad
> (Shapiro-Wilks<0.01).
> Aunque se podrían utilizar otros métodos (no parametricos,
> permutaciones, etc) para realizar las comparaciones, el doctorando se
> empeña en utilizar las pruebas t (imagino que por no rehacer todos los
> resultados).
>
>
> Entiendo que el t-test es una prueba bastante robusta y puede tolerar
> desviaciones de la normalidad, también entiendo que el criterio para
> poder aplicar esta prueba es que la distribución de las medias (no de
> las variables) sea normal. Se me ha ocurrido que si  remuestreo (siendo
> d la variable de estudio)
>
>    for (n in 1:500){
>     i[n]=mean(sample(d,20))}
>
> y justifico que la distribución de las medias sigue una distribución normal
>
> shapiro.test(i)
>
> podría decir que las pruebas t (utilizando la correccion de Welch por si
> acaso) se hacen "con todas las de la ley".
>
> Me gustaria que los que sabeis de esto me dierais vuestra opinion con
> respecto a este apaño.
>
> Un saludo y muchas gracias
>
> Jose Miguel
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es