[R-es] Duda sobre modas en un distribución

Francisco Mauro Gutiérrez francisco.mauro en upm.es
Dom Nov 11 21:39:00 CET 2012


Hola Justo,

Por el resultado que nos envías yo entiendo que la hipótesis nula del test
(Aquello que se supone) es que los datos son unimodales, pues la hipótesis
alternativa es que son NO son unimodales. Es decir, en un principio se
supone que los datos vienen de una distribución unimodal. Así, el test
proporciona la probabilidad (p-value) de haber obtenido una muestra como la
de los datos sometidos al test, suponiendo que es cierto que los datos son
unimodales (Hipótesis nula).

Por otro lado, aunque no estoy familiarizado con el test que indicas te
aconsejaría que buscases información sobre dicho test. Los test estadísticos
pueden ser un poco "suyos" y hay que tener muy en cuenta cuáles son sus
puntos de partida. Por otro lado, en el ejemplo que comentas, es cierto que
la grafica del Kernel es bimodal, y sin embargo el resultado del test te
dice que no lo sea, simplemente te dice que hay evidencias de que la
distribución NO sea unimodal. Es decir el test te deja como al principio, no
sabes ni una cosa ni la otra. En el segundo ejemplo la gráfica y el
resultado del test coinciden con lo que esperaríamos todos. Mi explicación a
esto es la siguiente:

	El número de observaciones en el ejemplo uno es 78 (aproximadamente
3 veces menor que el numero de datos del ejemplo 2). Tanto las funciones
Kernel como los test estadísticos dependen del tamaño de tu muestra. En
cuanto a las distribuciones Kernel, el resultado con muestras reducidas
simplemente tiene una mayor varianza. Es decir que la función de densidad
real subyacente a los datos podría puede diferir de la estimación kernel en
una cantidad que será menor cuanto mayor sea el número de datos. Es decir
que el pequeño bache que se observa en 1 podría ser un efecto aleatorio. Con
el test pasa algo parecido. Cuanto, menor es el número de datos, menor es la
potencia de un test. Esto es; la capacidad para rechazar la hipótesis nula
cuando esta no se verifica, es menor cuantos menos datos tenemos. Con los
datos que tienes el test te dice que no puedes descartar que 1 sea unimodal
y esto podría deberse a dos cosas: una falta de potencia del test o
simplemente a que la distribución de 1 es unimodal.

Un saludo


Paco

Hola a tod en s, estoy intentando averiguar el número de modas en una
distribución. Para ello utilizo diptest. Mi duda es que no acabo de
entender cuando la información suministrada por los test suponen la
existencia o no de unimodalidad/multimodalidad. Una parte de la salidad de
diptest es la que pego a continuación (el resto esta en el fichero adjunto
con las distribuciones kernels y las soluciones gráficas).

*Distribución #1(suponía que hay más de una moda)*



Hartigans' dip test for unimodality



data:  Datos8$V2

D = 0.0432, p-value = 0.3501

alternative hypothesis: non-unimodal, i.e., at least bimodal



*Distribución #2*



dip.test(Datos9$V2)



Hartigans' dip test for unimodality



data:  Datos9$V2

D = 0.0667, p-value = 1.535e-06

alternative hypothesis: non-unimodal, i.e., at least bimodal


Podría alguien por favor darme alguna pista.

Gracias



Más información sobre la lista de distribución R-help-es