[R-es] Una pregunta de estadística (marginalmente relacionada con R)

Carlos J. Gil Bellosta cgb en datanalytics.com
Jue Abr 30 21:39:06 CEST 2009


Hola, ¿qué tal?

Tengo que emitir una excusa parcial por haberle temido al AIC y por
hablerme temblado la mano al teclear "anidado". Ahora cuento por qué.

Estoy leyendo (y haciendo cosas relacionadas con) el siguiente artículo:

http://mpra.ub.uni-muenchen.de/10423/1/MPRA_paper_10423.pdf

En él se buscan distribuciones que mejor ajustan un vector de datos
(pérdidas económicas por catástrofes). Entre las distribuciones
candidatas están la Weibull y la exponencial. En este ámbito, más que
"anidadas", prefiero decir que la una es una caso particular de la
otra.

¿Cómo se ajustan las distribuciones? Por máxima verosimilitud. ¿Cómo
se elige la "mejor"? Aplicando (versiones de) los tests de bondad de
ajuste habituales (Kolmogorov-Smirnov, Anderson-Darling, etc.). Y yo
me planteé lo siguiente: si la exponencial es un caso particular de la
Weibull, aplicando este procedimiento, "siempre" se va a preferir la
segunda. Alguien que había hecho las cuentas me lo corroboró (¡incluso
cuando los datos proceden de una exponencial!).

Fue por eso que escribí a la lista: ¿existe algún modo de penalizar
por complejidad? Mi primera referencia al AIC vino por analogía (dado
que la mayor parte de nosotros lo habrá utilizado al elegir modelos
más que para comparar el ajuste de dos distribuciones, dejando de lado
las discusiones sobre si, en el fondo, es o no lo mismo).

Por ejemplo, ahora podríamos discutir, si a la luz de los comentarios
de Kjetil, el AIC es en sí una medida de bondad de ajuste (por su
relación con la distancia de KL, etc.). No he visto que nadie lo use
como tal en este campo que me ocupa. Pero igual es válido: el que
nadie haga algo no significa que no sea factible.

Y, bueno, agradezco a todos los que han participado en este hilo el
interés por mi cuestión.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com



Más información sobre la lista de distribución R-help-es