[R-es] Efectos fijos y aleatorios en un modelo lineal

Javier Martinez javi.martinez.lopez en gmail.com
Mar Mar 20 18:29:29 CET 2012


Gracias por la aportación! ¿Es cierto que es mejor aplicar técnicas
bayesianas, como puede ser el caso de la librería MCMCglmm, para
modelos con pocos datos como el mío? Me interesa sobre todo saber la
validez del valor de p del modelo.

Saludos,

Javier

2012/3/20 Julio Alejandro Di Rienzo <dirienzo.julio en gmail.com>:
> Me incorporo a esta discusión un poco tarde pero creo que algunas
> observaciones pueden ayudar
> a poner en contexto el problema de la modelación con efectos aleatorios.
>
> 1. Los objetivos de incluir efectos aleatorios en un modelo lineal pueden
> ser distintos:
>    Caso a. Modelar convenientemente la falta de independencia entre
> observaciones (grouped data)
>    Caso b. Estimar componentes de varianza (varianza genética,
> fenotípica,  etc)
>    Caso c. Lidear con problemas de desbalance (típico en ensayos agrícolas
> multiambientales donde los mismos materiales no son o no pueden ensayarse
> en todos los ambientes o todos los años)
>
> 2. Dependiendo del objetivo principal se aplican las distintas
> observaciones hechas por los participantes en esta discusión.
>
> Un factor de clasificación se considera aleatorio cuando su efecto no es
> rreproducible (Casos a y b) o cuando conviene considerarlo así (Caso c).
> Los años climáticos, así como los bloques (entendidos como conjuntos de
> unidades experimentales homogeneas) producen efectos no controlables por el
> investigador y son ejemplos típicos de efectos aleatorios. En el ejemplo
> que origina esta discusión, el efecto bloques es un efecto anidado dento de
> años y el experimento se enmarca en el "Caso a". Una distinción importante
> entre los Caso a y b, es que en el primero, la inclusión de efectos
> aleatorio tiene como proposito lidear con la falta de independencia entre
> observaciones (en el ejemplo: observaciones dentro  de un mismo año y
> dentro de un mismo bloque - correlación intraclase), mientra que en el caso
> b, el propósito es estimar componentes de varianza y este caso coincido que
> en que las estimaciones de esas componentes deben basarse en un número
> importante de realizaciones (varios años - ambientes).
>
> 3. Todos los experimentos tienen sesgo, y los hallazgos estadísticamente
> significativos son siempre y sólamente aplicablles al experimento que se
> analiza.
> Decir  a partir de un experimento que el rendimiento del genotipo A difiere
> significativamente del genotipo B, sin recordar que eso ocurrió en ese
> experimento induce a pensar que se trata de una verdad establecida. NADA
> MAS ERRONEO.
>
> 4. Respecto de las técnicas de modelación con R. Mi impresión es que si
> estamos en los Casos a y b, la función lme de la libreria nlme es más
> completa que lmer, ya que ofrece mayor flexibilidad para modelar
> estructuras de covarianzas de los efectos aleatorios y de la matriz de
> covarianzas residual, incluyendo funciones de varianza y correlación.
> Asimismo, es posible obtener no solo pruebas de hipótesis secuenciales sino
> tambien las marginales "tipo III" - mediante una adecuada reparametrización
> del modelo.
>
>
> Prof. Julio Di Rienzo
> Estadística y Biometría
> FCA- U.N. Córdoba
> IBS-RARG President
> http://sites.google.com/site/juliodirienzo
> "Biometry, the active pursuit of biological
> knowledge by quantitative methods."
> (R.A. Fisher, 1948)
>
>
>
> 2012/3/20 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com>
>
>> Estimado Fernando Piston
>>
>> Sobre modelos y efectos
>>
>> No voy a responder eso, simplemente en http://cran.r-project.org/web/**
>> packages/agridat/agridat.pdf<http://cran.r-project.org/web/packages/agridat/agridat.pdf>hay ejemplos.
>>
>> Javier Marcuzzi
>>
>> -----Mensaje original----- From: Fernando Piston
>> Sent: Tuesday, March 20, 2012 10:43 AM
>> To: r-help-es en r-project.org
>> Subject: Re: [R-es] Efectos fijos y aleatorios en un modelo lineal
>>
>>
>> Hola de nuevo a todos,
>>
>> Después de aclarar que se pueden considerar efectos fijos y aleatorios
>> (con sus pros y contras). Me gustaría proponer de nuevo, y una vez que
>> conocemos mas de cerca el análisis, como indicar en un modelo lineal que
>> son efectos fijos y aleatorios:
>>
>> De momento se han propuesto los siguientes modelos mixtos:
>>
>> Mi modelo
>> lme = lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) +
>> (1|Line:Year), data = datos)
>>
>> Modelo propuesto por Olivier
>> lmer(alpha.ug.mg ~ Line + (1|Year/Rep) + (1|Line:Year), data = datos)
>>
>>
>> En ambos casos los resultados son muy similares siendo la F del factor
>> 'line' similar.
>>
>> ¿Son estos modelos adecuados al problema propuesto (Lineas de trigo en
>> un ensayo de bloques al azar repetido dos años)?. Las salidas que
>> generan los dos modelos anteriores, ¿como se interpretan en comparción
>> con la tabla ANOVA que adjunte en mensajes anteriores?
>>
>> ¿se podría utilizar la función 'aov' en lugar de 'lmer'?
>>
>>
>>
>>
>>
>>
>> On 20/03/12 12:17, Javier Martinez wrote:
>>
>>> Muchas gracias por esta interesante discusión. Efectivamente, en mi
>>> caso el intervalo de confianza del modelo es muy amplio, al tener las
>>> variables de estudio valores de partida muy distintos. Lo que se ve
>>> gráficamente en todos los lugares de estudio por igual es que la
>>> respuesta de la variable biológica a la ambiental es
>>> creciente/positiva/directa, y eso en realidad es lo que me interesa
>>> ver con este análisis, que se mantiene esta relación en estos lugares
>>> concretos, que son diversos y a la vez considero representativos de un
>>> mismo tipo de ecosistema. Creo que el hecho de que el modelo sea
>>> significativo corrobora esa relación, y efectivamente sería muy pobre
>>> para predecir más allá de eso en este caso. Además de la mera
>>> representación gráfica por grupos, es la mejor manera que veo de
>>> analizar todos los datos en su conjunto, si no me equivoco. Para hacer
>>> predicciones he usado las diferencias de las variables ambientales y
>>> biológicas entre cada año, así como los años por separado y entonces
>>> sí, he puesto una observación por lugar en una regresión lineal simple
>>> porque ya son obervaciones independientes.
>>>
>>> Muchas gracias de nuevo y saludos,
>>>
>>> Javier
>>>
>>> 2012/3/20 José Trujillo Carmona<trujillo en unex.es>:
>>>
>>>> Como dice Olivier en otro post.
>>>>
>>>> El efecto aleatorio considera que los niveles del factor son una muestra
>>>> (dice textualmente y acertadamente REPRESENTATIVA O NO) de una población
>>>> más
>>>> amplia y toma en cuenta por tanto el efecto aleatorio del muestreo.
>>>>
>>>> Dicho de otro modo más explícito, tomar en cuenta el efecto aleatorio del
>>>> muestreo no significa que automaticamente se pueda utilizar para hacer
>>>> inferencia sobre la población de niveles completa (otros años, otros
>>>> lugares, otras empresas, otras explotaciones, otras variedades de
>>>> cultivo,
>>>> ...) Esto último además de tener en cuenta que tenemos solo una muestra,
>>>> solo se puede hacer si la muestra es representativa de la variabilidad
>>>> en la
>>>> población. Cosa que no suele ocurrir por ejemplo con años consecutivos
>>>> (hay
>>>> ciclos, acumulación de humedad de un año para otro, ...) parcelas todas
>>>> en
>>>> la misma región, variedades cultivadas todas en la misma región y
>>>> pre-adaptadas para esa región.
>>>>
>>>> La variabilidad entre niveles está SESGADA ya sea por falta de
>>>> variabilidad
>>>> (efecto de localidad) o por falta de independencia (efecto de proximidad
>>>> en
>>>> el espacio o en el tiempo) y por tanto la extrapolación no es posible sin
>>>> tomar en cuenta este sesgo que, por lo que yo sé, no es fácil incorporar
>>>> al
>>>> modelo (aunque a veces se puede, utilizando las autocorrelaciones por
>>>> ejemplo en el caso del tiempo y supongo que espacialmente también se
>>>> puede
>>>> hacer, aunque nunca lo he estudiado).
>>>>
>>>> Por supuesto además de la calidad de la muestra en cuanto a su
>>>> representatividad está la cuestión del tamaño ya mencionada. Aunque ésta
>>>> cuestión a su vez depende de la variabilidad que induce el factor en la
>>>> variable respuesta en relación con la variabilidad residual y la
>>>> amplitude
>>>> los límites de confianza que queramos en las estimaciones: poca
>>>> variabilidad
>>>> inducida o límites de confianza muy precisos necesitaremos muchos
>>>> niveles.
>>>> Si la variabilidad es mucho mayor que la residual o nos sirven límites de
>>>> confianza más amplios, necesitaremos menos niveles.
>>>>
>>>> Esta discusión obviamente no es específica sobre R. Pero yo la considero
>>>> muy
>>>> pertinente para no crear en los lectores más noveles la sensación de que
>>>> le
>>>> "damos a la tecla" y R nos cuenta todo, sin que necesitemos saber de
>>>> Estadística. Si le pedimos a R estimaciones y predicciones con una
>>>> muestra
>>>> sesgada, nos las dará; pero serán tan válidas como un billete de siete
>>>> euros.
>>>>
>>>> Saludos.
>>>>
>>>>
>>>>
>>>> El 19/03/12 23:50, Javier Martinez escribió:
>>>>
>>>>> Gracias Olivier,
>>>>>
>>>>> En mi caso, quiero inferir para cualquier parcela y año, es decir, ver
>>>>> si la relación entre la variable biológica y ambiental, que es lo que
>>>>> me interesa, se da igual de maneral general, sin entrar en las
>>>>> particularidades de cada sitio. Podría poner las observaciones de
>>>>> todos los lugares juntas en un modelo de regresión simple entre la
>>>>> variable ambiental y la biológica pero eso, independientemente de que
>>>>> sea o no significativo, que no lo es en mi caso, considero que genera
>>>>> dependencia (a pares) entre mis observaciones, lo que incumple los
>>>>> preceptos de la regresión lineal de que las observaciones tienen que
>>>>> ser independientes. Por eso creo que los modelos mixtos pueden ser una
>>>>> buena alternativa, aunque siga habiendo limitaciones en mis datos,
>>>>> claro.
>>>>>
>>>>> Saludos,
>>>>>
>>>>> Javier
>>>>>
>>>>> 2012/3/19 Olivier Nuñez<onunez en unex.es>:
>>>>>
>>>>>  Con el riesgo de ser redundante respecto a lo que se ha dicho,
>>>>>> empezaría por preguntar:  ¿porqué los efectos de un factor son
>>>>>> aleatorios?
>>>>>> Pues, porque en el caso de que repita mi experimento, las condiciones
>>>>>> descritas por los niveles de este factor cambiarían de manera
>>>>>> aleatoria.
>>>>>> Bien, porque lo decido yo (elección aleatoria de parcelas) o porqué
>>>>>> la elección del año de observación es puramente fortuita.
>>>>>> En realidad, lo que está detrás de este asunto es el alcance del
>>>>>> experimento/estudio.
>>>>>> Es decir, ¿mis conclusiones serán sobre estas parcelas concretas o
>>>>>> para cualquier parcela? ¿sobre estos dos años o para cualquier año?
>>>>>> Si son estas parcelas concretas que me interesan, entonces los
>>>>>> efectos del factor parcela son naturalmente fijos.
>>>>>> En caso contrario, las parcela observadas constituyen una muestra
>>>>>> (¡representativa o no!) del territorio estudiado.
>>>>>> Un saludo. Olivier
>>>>>>
>>>>>>
>>>>>> --
>>>>>> ______________________________**______
>>>>>>
>>>>>> Olivier G. Nuñez
>>>>>> Email: onunez en unex.es
>>>>>> http://kolmogorov.unex.es/~**onunez<http://kolmogorov.unex.es/%7Eonunez>
>>>>>> Tel : +34 663 03 69 09
>>>>>> Departamento de Matemáticas
>>>>>> Universidad de Extremadura
>>>>>>
>>>>>> ______________________________**______
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>> El 19/03/2012, a las 18:26, Gregorio R. Serrano escribió:
>>>>>>
>>>>>>
>>>>>>  Buenas.
>>>>>>>
>>>>>>> No quisiera añadir ruido a la discusión, pero en econometría, con
>>>>>>> datos de
>>>>>>> panel, no solemos plantearnos qué es por naturaleza efecto fijo y
>>>>>>> efecto
>>>>>>> aleatorio, sino qué podemos estimar. Solemos considerar que si de
>>>>>>> cierta
>>>>>>> unidad se dispone de toda la población son efectos fijos y si lo
>>>>>>> que se
>>>>>>> tiene es una muestra, se trata de efectos aleatorios.  Un ejemplo
>>>>>>> que se
>>>>>>> suele usar para ilustrar esto es una muestra de empresas de un
>>>>>>> sector en
>>>>>>> una serie de años. Los años son efectos fijos, tenemos todos los
>>>>>>> disponibles, mientras que las empresas, son efectos aleatorios
>>>>>>> porque se
>>>>>>> trata de una muestra de empresas.
>>>>>>>
>>>>>>> Con esta interpretación, los años tuyos son efectos fijos (efecto
>>>>>>> de la
>>>>>>> climatología, peculiar del año, pero igual para todas las unidades
>>>>>>> en el
>>>>>>> año), los bloques (entiendo parcelas) serían fijos si siempre son las
>>>>>>> mismas parcelas o aleatorios si, digamos, muestreas tres parcelas
>>>>>>> de un
>>>>>>> conjunto más amplio, aunque son pocas para estimar varianzas, y por
>>>>>>> último
>>>>>>> las líneas (¿variedades de trigo?) sí serían fijos.
>>>>>>>
>>>>>>> No obstante, yo no vengo de agricultura/biología y puede que la
>>>>>>> notación
>>>>>>> que usemos sea algo diferente (en econometría es confusa en
>>>>>>> ocasiones).
>>>>>>>
>>>>>>> Un saludo
>>>>>>> Gregorio R. Serrano
>>>>>>>
>>>>>>> El 19 de marzo de 2012 17:37, Fernando Piston
>>>>>>> <fpiston en ias.csic.es>escribió:
>>>>>>>
>>>>>>>
>>>>>>>  Muchas Gracias Luciano por tu pronta respuesta.
>>>>>>>>
>>>>>>>> Como bien decis cuesta imaginar como se puede considerar un factor
>>>>>>>> como
>>>>>>>> aleatorio cuando se tienen solo 2 niveles en el caso de Year y 3
>>>>>>>> en el caso
>>>>>>>> de Rep. Sin embargo, aunque seria deseable tener mas niveles para
>>>>>>>> el factor
>>>>>>>> Year (más años de ensayo) su efecto es, en cualquier caso, aleatorio.
>>>>>>>>
>>>>>>>> Saludos
>>>>>>>> Fernando
>>>>>>>>
>>>>>>>>
>>>>>>>> On 19/03/12 15:22, Luciano Selzer wrote:
>>>>>>>>
>>>>>>>>
>>>>>>>>  Fernando:
>>>>>>>>> Más allá de la solución que alguien de la lista te pueda dar me
>>>>>>>>> gustaría darte una advertencia. Según varios autores, los efectos
>>>>>>>>> aletarorios se pueden determinar correctamente a partir de 6
>>>>>>>>> niveles.
>>>>>>>>> Así que con 3 y 2 niveles es muy dificil que se pueda determinar
>>>>>>>>> correctamente la varianza de cada uno.
>>>>>>>>>
>>>>>>>>> Saludos
>>>>>>>>> Luciano
>>>>>>>>>
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> El día 19 de marzo de 2012 10:21, Fernando Piston
>>>>>>>>> <fpiston en ias.csic.es>      escribió:
>>>>>>>>>
>>>>>>>>>
>>>>>>>>>  Hola a todos,
>>>>>>>>>>
>>>>>>>>>> Tengo algunas dudas sobre como introducir en un modelo lineal
>>>>>>>>>> factores
>>>>>>>>>> con
>>>>>>>>>> efectos fijos y aleatorios. Mi diseño es el siguiente:
>>>>>>>>>>
>>>>>>>>>> Factores
>>>>>>>>>>
>>>>>>>>>> Line: 40 líneas de trigo (Fijo)
>>>>>>>>>>
>>>>>>>>>> Rep: 3 Bloques (Aleatorio)
>>>>>>>>>>
>>>>>>>>>> Year: 2 Años (Aleatorio)
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> Variable dependiente
>>>>>>>>>>
>>>>>>>>>> alpha.ug.mg
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> Nota: Adjunto tabla de datos
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> Dentro del diseño, 'Rep' y 'Year' se considera de efectos
>>>>>>>>>> aleatorios y
>>>>>>>>>> 'Line' es de efecto fijo.
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> Lo he intento llevar a cabo con la función 'lmer' del paquete
>>>>>>>>>> 'lme4',
>>>>>>>>>>
>>>>>>>>>> lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) + (1|
>>>>>>>>>> Line:Year),
>>>>>>>>>> data =
>>>>>>>>>> Dataset)
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> pero el modelo anterior me considera como error del factor
>>>>>>>>>> 'line' el
>>>>>>>>>> error
>>>>>>>>>> de los residuales en lugar del error de Year*Line.
>>>>>>>>>>
>>>>>>>>>> ¿como puede decirle al modelo que para 'line' me considere el
>>>>>>>>>> error de
>>>>>>>>>> 'Year*Line'?
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> Gracias
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>> ______________________________****_________________
>>>>>>>>>> R-help-es mailing list
>>>>>>>>>> R-help-es en r-project.org
>>>>>>>>>> https://stat.ethz.ch/mailman/****listinfo/r-help-es<https://stat.ethz.ch/mailman/**listinfo/r-help-es>
>>>>>>>>>> <https://
>>>>>>>>>> stat.ethz.ch/mailman/listinfo/**r-help-es<http://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>>>> >
>>>>>>>>>>
>>>>>>>>>>  ______________________________****_________________
>>>>>>>>>>
>>>>>>>>>>  R-help-es mailing list
>>>>>>>>> R-help-es en r-project.org
>>>>>>>>> https://stat.ethz.ch/mailman/****listinfo/r-help-es<https://stat.ethz.ch/mailman/**listinfo/r-help-es>
>>>>>>>>> <https://
>>>>>>>>> stat.ethz.ch/mailman/listinfo/**r-help-es<http://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>>> >
>>>>>>>>>
>>>>>>>>>
>>>>>>>>>  ______________________________****_________________
>>>>>>>> R-help-es mailing list
>>>>>>>> R-help-es en r-project.org
>>>>>>>> https://stat.ethz.ch/mailman/****listinfo/r-help-es<https://stat.ethz.ch/mailman/**listinfo/r-help-es>
>>>>>>>> <https://
>>>>>>>> stat.ethz.ch/mailman/listinfo/**r-help-es<http://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>> >
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>
>>>>>>> --
>>>>>>> Dr. Gregorio R. Serrano
>>>>>>> Dpto. Economía Cuantitativa (UCM)
>>>>>>> Voz:+34 91394 2361
>>>>>>> Twitter: @grserrano_
>>>>>>> http://www.grserrano.es
>>>>>>>
>>>>>>>       [[alternative HTML version deleted]]
>>>>>>>
>>>>>>> ______________________________**_________________
>>>>>>> R-help-es mailing list
>>>>>>> R-help-es en r-project.org
>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>
>>>>>>>
>>>>>>        [[alternative HTML version deleted]]
>>>>>>
>>>>>>
>>>>>> ______________________________**_________________
>>>>>> R-help-es mailing list
>>>>>> R-help-es en r-project.org
>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>
>>>>>>
>>>>>>  ______________________________**_________________
>>>>> R-help-es mailing list
>>>>> R-help-es en r-project.org
>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>
>>>>>
>>>> --
>>>> _____---^---_____
>>>>
>>>> Univ. de Extremadura
>>>> Dept. Matemáticas.
>>>> Despacho B29
>>>> Tf: + 34 924 289 300
>>>> Ext. 86823
>>>>
>>>> ______________________________**_________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>
>>> ______________________________**_________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>>
>>
>>
>> [[alternative HTML version deleted]]
>>
>>
>>
>>
>>
>>
>>
>> ______________________________**_________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>
>> ______________________________**_________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
>>
>
>        [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



Más información sobre la lista de distribución R-help-es