[R-es] Una pregunta de estadística (marginalmente relacionada con R)

Jue Abr 30 15:41:33 CEST 2009

Hola, ¿qué tal?

Agradezco las dos respuestas anteriores. Pero creo que voy a tener que
redefinir mi pregunta por medio de un "experimento mental". Es el
siguiente:

Alguien nos da dos cosas:

1) Un vector de 100 números, X.

2) Un "menú" de distribuciones de probabilidad (exponencial,
lognormal, gamma, weibull, etc.)

Y nos hace una pregunta: ¿con cuál de las anteriores distribuciones (y
con qué parámetros) he generado aleatoriamente X?

Uno dice: para cada una de las distribuciones de mi "menú", ajusto vía
máxima verosimilitud los parámetros, aplico un test de bondad de
ajuste y ordeno los p-valores de menor a mayor.

Una cuestión que surge es: imaginemos que X procede de una
exponencial. Sabemos que la distribución exponencial es un caso
particular de la weibull, sólo que más "parsimoniosa". Por eso, uno
espera que siempre se ajuste mejor a los datos (lo que pasaría al
comparar dos modelos anidados, vamos).

De alguna manera me gustaría penalizar la complejidad adicional de la
weibul para, al menos, poder en algunas ocasiones preferir la
exponencial a ella. Pero no he visto referencias en este ámbito...
¿algún cable?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 30 de abril de 2009 12:22, Olivier Nuñez <onunez en iberstat.es> escribió:
> Una posible solución a tu problema consiste en construir el cierre convexo
> de estas familias de distribuciones.
> Supongamos que tengas sólo dos familias: N(m,s) y T(z) .
> Entonces, el cierre convexo de ambas familias sería la familia parametrica:
> C(p,m,s,z) = p*N(m,s) + (1-p)*T(z)
> donde p es un parametro que toma valores entre 0 y 1.
> En este caso, podrías aplicar el test de maxima verosimilitud para tomar una
> decisión sobre p.
> El package adecuado para este tipo de modelo debería ser flexmix.
> Un saludo. Olivier
> --
> --
> ____________________________________
> Olivier G. Nuñez
> Email: onunez en iberstat.es
> Tel : +34 663 03 69 09
> Web: http://www.iberstat.es
> ____________________________________
>
>
>
> El 29/04/2009, a las 23:26, Carlos J. Gil Bellosta escribió:
>
> Hola, ¿qué tal?
> Tengo una pregunta de estadística (marginalmente relacionada con R).
> Me llegan unos datos y quiero ajustarlos vía máxima verosimilitud. Sin
> embargo, no tengo una sóla familia de distribuciones (por ejemplo, N(mu,
> sigma) sino varias, media docena de ellas. Y se me pide que encuentre
> "la que mejor se ajusta a los datos".
> Ordenar por el p-valor de un test de bondad de ajuste (que es lo que he
> heredado) me parece problemático: unas distribuciones son más
> "parsimoniosas" que otras y no he oído de algún equivalente al AIC para
> este problema.
> Se me ocurre alguna idea peregrina (como un "bootstrap" en los datos
> originales para estimar la variabilidad de la bondad del ajuste sobre
> las submuestras. Pero me gustaría saber si alguien conoce alguna
> referencia acerca de este problema.
> Un saludo,
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>