[R-es] t-test y distribución de variables

Mar Sep 13 16:13:08 CEST 2016

Hola,
Estoy analizando unos datos para una tesis doctoral.
Durante la investigación se han recogido distintas variables clínicas de 
dos grupos (n=30 y n=40). Me encuentro que las comparaciones de medias 
se han realizado mediante t-tests sin preocuparse de estudiar la 
distribución de las variables.  Al revisar si las variables se ajustan a 
la distribución normal, aunque los QQplots no tienen "mala pinta" las 
distribuciones de las variables se alejan de la normalidad 
(Shapiro-Wilks<0.01).
Aunque se podrían utilizar otros métodos (no parametricos, 
permutaciones, etc) para realizar las comparaciones, el doctorando se 
empeña en utilizar las pruebas t (imagino que por no rehacer todos los 
resultados).

Entiendo que el t-test es una prueba bastante robusta y puede tolerar 
desviaciones de la normalidad, también entiendo que el criterio para 
poder aplicar esta prueba es que la distribución de las medias (no de 
las variables) sea normal. Se me ha ocurrido que si  remuestreo (siendo 
d la variable de estudio)

  for (n in 1:500){
   i[n]=mean(sample(d,20))}

y justifico que la distribución de las medias sigue una distribución normal

shapiro.test(i)

podría decir que las pruebas t (utilizando la correccion de Welch por si 
acaso) se hacen "con todas las de la ley".

Me gustaria que los que sabeis de esto me dierais vuestra opinion con 
respecto a este apaño.

Un saludo y muchas gracias

Jose Miguel