[R-es] Efectos fijos y aleatorios en un modelo lineal

Carlos Ortega cof en qualityexcellence.es
Mar Mar 20 17:40:32 CET 2012


Hola,

Muy interesante del pdf que acaba de referenciar Javier las páginas 5,
6 y 7 donde aparecen los múltiples ejemplos (datasets) que incluye el
paquete indicando el tipo de estructura de los experimentos
(genotipos, años, repeticiones, etc) y los modelos estadísticos que se
han aplicado...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 20/03/12, Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com> escribió:
> Estimado Fernando Piston
>
> Sobre modelos y efectos
>
> No voy a responder eso, simplemente en
> http://cran.r-project.org/web/packages/agridat/agridat.pdf hay ejemplos.
>
> Javier Marcuzzi
>
> -----Mensaje original-----
> From: Fernando Piston
> Sent: Tuesday, March 20, 2012 10:43 AM
> To: r-help-es en r-project.org
> Subject: Re: [R-es] Efectos fijos y aleatorios en un modelo lineal
>
> Hola de nuevo a todos,
>
> Después de aclarar que se pueden considerar efectos fijos y aleatorios
> (con sus pros y contras). Me gustaría proponer de nuevo, y una vez que
> conocemos mas de cerca el análisis, como indicar en un modelo lineal que
> son efectos fijos y aleatorios:
>
> De momento se han propuesto los siguientes modelos mixtos:
>
> Mi modelo
> lme = lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) +
> (1|Line:Year), data = datos)
>
> Modelo propuesto por Olivier
> lmer(alpha.ug.mg ~ Line + (1|Year/Rep) + (1|Line:Year), data = datos)
>
>
> En ambos casos los resultados son muy similares siendo la F del factor
> 'line' similar.
>
> ¿Son estos modelos adecuados al problema propuesto (Lineas de trigo en
> un ensayo de bloques al azar repetido dos años)?. Las salidas que
> generan los dos modelos anteriores, ¿como se interpretan en comparción
> con la tabla ANOVA que adjunte en mensajes anteriores?
>
> ¿se podría utilizar la función 'aov' en lugar de 'lmer'?
>
>
>
>
>
>
> On 20/03/12 12:17, Javier Martinez wrote:
>> Muchas gracias por esta interesante discusión. Efectivamente, en mi
>> caso el intervalo de confianza del modelo es muy amplio, al tener las
>> variables de estudio valores de partida muy distintos. Lo que se ve
>> gráficamente en todos los lugares de estudio por igual es que la
>> respuesta de la variable biológica a la ambiental es
>> creciente/positiva/directa, y eso en realidad es lo que me interesa
>> ver con este análisis, que se mantiene esta relación en estos lugares
>> concretos, que son diversos y a la vez considero representativos de un
>> mismo tipo de ecosistema. Creo que el hecho de que el modelo sea
>> significativo corrobora esa relación, y efectivamente sería muy pobre
>> para predecir más allá de eso en este caso. Además de la mera
>> representación gráfica por grupos, es la mejor manera que veo de
>> analizar todos los datos en su conjunto, si no me equivoco. Para hacer
>> predicciones he usado las diferencias de las variables ambientales y
>> biológicas entre cada año, así como los años por separado y entonces
>> sí, he puesto una observación por lugar en una regresión lineal simple
>> porque ya son obervaciones independientes.
>>
>> Muchas gracias de nuevo y saludos,
>>
>> Javier
>>
>> 2012/3/20 José Trujillo Carmona<trujillo en unex.es>:
>>> Como dice Olivier en otro post.
>>>
>>> El efecto aleatorio considera que los niveles del factor son una muestra
>>> (dice textualmente y acertadamente REPRESENTATIVA O NO) de una población
>>> más
>>> amplia y toma en cuenta por tanto el efecto aleatorio del muestreo.
>>>
>>> Dicho de otro modo más explícito, tomar en cuenta el efecto aleatorio del
>>> muestreo no significa que automaticamente se pueda utilizar para hacer
>>> inferencia sobre la población de niveles completa (otros años, otros
>>> lugares, otras empresas, otras explotaciones, otras variedades de
>>> cultivo,
>>> ...) Esto último además de tener en cuenta que tenemos solo una muestra,
>>> solo se puede hacer si la muestra es representativa de la variabilidad en
>>>
>>> la
>>> población. Cosa que no suele ocurrir por ejemplo con años consecutivos
>>> (hay
>>> ciclos, acumulación de humedad de un año para otro, ...) parcelas todas
>>> en
>>> la misma región, variedades cultivadas todas en la misma región y
>>> pre-adaptadas para esa región.
>>>
>>> La variabilidad entre niveles está SESGADA ya sea por falta de
>>> variabilidad
>>> (efecto de localidad) o por falta de independencia (efecto de proximidad
>>> en
>>> el espacio o en el tiempo) y por tanto la extrapolación no es posible sin
>>> tomar en cuenta este sesgo que, por lo que yo sé, no es fácil incorporar
>>> al
>>> modelo (aunque a veces se puede, utilizando las autocorrelaciones por
>>> ejemplo en el caso del tiempo y supongo que espacialmente también se
>>> puede
>>> hacer, aunque nunca lo he estudiado).
>>>
>>> Por supuesto además de la calidad de la muestra en cuanto a su
>>> representatividad está la cuestión del tamaño ya mencionada. Aunque ésta
>>> cuestión a su vez depende de la variabilidad que induce el factor en la
>>> variable respuesta en relación con la variabilidad residual y la
>>> amplitude
>>> los límites de confianza que queramos en las estimaciones: poca
>>> variabilidad
>>> inducida o límites de confianza muy precisos necesitaremos muchos
>>> niveles.
>>> Si la variabilidad es mucho mayor que la residual o nos sirven límites de
>>> confianza más amplios, necesitaremos menos niveles.
>>>
>>> Esta discusión obviamente no es específica sobre R. Pero yo la considero
>>> muy
>>> pertinente para no crear en los lectores más noveles la sensación de que
>>> le
>>> "damos a la tecla" y R nos cuenta todo, sin que necesitemos saber de
>>> Estadística. Si le pedimos a R estimaciones y predicciones con una
>>> muestra
>>> sesgada, nos las dará; pero serán tan válidas como un billete de siete
>>> euros.
>>>
>>> Saludos.
>>>
>>>
>>>
>>> El 19/03/12 23:50, Javier Martinez escribió:
>>>> Gracias Olivier,
>>>>
>>>> En mi caso, quiero inferir para cualquier parcela y año, es decir, ver
>>>> si la relación entre la variable biológica y ambiental, que es lo que
>>>> me interesa, se da igual de maneral general, sin entrar en las
>>>> particularidades de cada sitio. Podría poner las observaciones de
>>>> todos los lugares juntas en un modelo de regresión simple entre la
>>>> variable ambiental y la biológica pero eso, independientemente de que
>>>> sea o no significativo, que no lo es en mi caso, considero que genera
>>>> dependencia (a pares) entre mis observaciones, lo que incumple los
>>>> preceptos de la regresión lineal de que las observaciones tienen que
>>>> ser independientes. Por eso creo que los modelos mixtos pueden ser una
>>>> buena alternativa, aunque siga habiendo limitaciones en mis datos,
>>>> claro.
>>>>
>>>> Saludos,
>>>>
>>>> Javier
>>>>
>>>> 2012/3/19 Olivier Nuñez<onunez en unex.es>:
>>>>
>>>>> Con el riesgo de ser redundante respecto a lo que se ha dicho,
>>>>> empezaría por preguntar:  ¿porqué los efectos de un factor son
>>>>> aleatorios?
>>>>> Pues, porque en el caso de que repita mi experimento, las condiciones
>>>>> descritas por los niveles de este factor cambiarían de manera
>>>>> aleatoria.
>>>>> Bien, porque lo decido yo (elección aleatoria de parcelas) o porqué
>>>>> la elección del año de observación es puramente fortuita.
>>>>> En realidad, lo que está detrás de este asunto es el alcance del
>>>>> experimento/estudio.
>>>>> Es decir, ¿mis conclusiones serán sobre estas parcelas concretas o
>>>>> para cualquier parcela? ¿sobre estos dos años o para cualquier año?
>>>>> Si son estas parcelas concretas que me interesan, entonces los
>>>>> efectos del factor parcela son naturalmente fijos.
>>>>> En caso contrario, las parcela observadas constituyen una muestra
>>>>> (¡representativa o no!) del territorio estudiado.
>>>>> Un saludo. Olivier
>>>>>
>>>>>
>>>>> --
>>>>> ____________________________________
>>>>>
>>>>> Olivier G. Nuñez
>>>>> Email: onunez en unex.es
>>>>> http://kolmogorov.unex.es/~onunez
>>>>> Tel : +34 663 03 69 09
>>>>> Departamento de Matemáticas
>>>>> Universidad de Extremadura
>>>>>
>>>>> ____________________________________
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>> El 19/03/2012, a las 18:26, Gregorio R. Serrano escribió:
>>>>>
>>>>>
>>>>>> Buenas.
>>>>>>
>>>>>> No quisiera añadir ruido a la discusión, pero en econometría, con
>>>>>> datos de
>>>>>> panel, no solemos plantearnos qué es por naturaleza efecto fijo y
>>>>>> efecto
>>>>>> aleatorio, sino qué podemos estimar. Solemos considerar que si de
>>>>>> cierta
>>>>>> unidad se dispone de toda la población son efectos fijos y si lo
>>>>>> que se
>>>>>> tiene es una muestra, se trata de efectos aleatorios.  Un ejemplo
>>>>>> que se
>>>>>> suele usar para ilustrar esto es una muestra de empresas de un
>>>>>> sector en
>>>>>> una serie de años. Los años son efectos fijos, tenemos todos los
>>>>>> disponibles, mientras que las empresas, son efectos aleatorios
>>>>>> porque se
>>>>>> trata de una muestra de empresas.
>>>>>>
>>>>>> Con esta interpretación, los años tuyos son efectos fijos (efecto
>>>>>> de la
>>>>>> climatología, peculiar del año, pero igual para todas las unidades
>>>>>> en el
>>>>>> año), los bloques (entiendo parcelas) serían fijos si siempre son las
>>>>>> mismas parcelas o aleatorios si, digamos, muestreas tres parcelas
>>>>>> de un
>>>>>> conjunto más amplio, aunque son pocas para estimar varianzas, y por
>>>>>> último
>>>>>> las líneas (¿variedades de trigo?) sí serían fijos.
>>>>>>
>>>>>> No obstante, yo no vengo de agricultura/biología y puede que la
>>>>>> notación
>>>>>> que usemos sea algo diferente (en econometría es confusa en
>>>>>> ocasiones).
>>>>>>
>>>>>> Un saludo
>>>>>> Gregorio R. Serrano
>>>>>>
>>>>>> El 19 de marzo de 2012 17:37, Fernando Piston
>>>>>> <fpiston en ias.csic.es>escribió:
>>>>>>
>>>>>>
>>>>>>> Muchas Gracias Luciano por tu pronta respuesta.
>>>>>>>
>>>>>>> Como bien decis cuesta imaginar como se puede considerar un factor
>>>>>>> como
>>>>>>> aleatorio cuando se tienen solo 2 niveles en el caso de Year y 3
>>>>>>> en el caso
>>>>>>> de Rep. Sin embargo, aunque seria deseable tener mas niveles para
>>>>>>> el factor
>>>>>>> Year (más años de ensayo) su efecto es, en cualquier caso, aleatorio.
>>>>>>>
>>>>>>> Saludos
>>>>>>> Fernando
>>>>>>>
>>>>>>>
>>>>>>> On 19/03/12 15:22, Luciano Selzer wrote:
>>>>>>>
>>>>>>>
>>>>>>>> Fernando:
>>>>>>>> Más allá de la solución que alguien de la lista te pueda dar me
>>>>>>>> gustaría darte una advertencia. Según varios autores, los efectos
>>>>>>>> aletarorios se pueden determinar correctamente a partir de 6
>>>>>>>> niveles.
>>>>>>>> Así que con 3 y 2 niveles es muy dificil que se pueda determinar
>>>>>>>> correctamente la varianza de cada uno.
>>>>>>>>
>>>>>>>> Saludos
>>>>>>>> Luciano
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>> El día 19 de marzo de 2012 10:21, Fernando Piston
>>>>>>>> <fpiston en ias.csic.es>      escribió:
>>>>>>>>
>>>>>>>>
>>>>>>>>> Hola a todos,
>>>>>>>>>
>>>>>>>>> Tengo algunas dudas sobre como introducir en un modelo lineal
>>>>>>>>> factores
>>>>>>>>> con
>>>>>>>>> efectos fijos y aleatorios. Mi diseño es el siguiente:
>>>>>>>>>
>>>>>>>>> Factores
>>>>>>>>>
>>>>>>>>> Line: 40 líneas de trigo (Fijo)
>>>>>>>>>
>>>>>>>>> Rep: 3 Bloques (Aleatorio)
>>>>>>>>>
>>>>>>>>> Year: 2 Años (Aleatorio)
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> Variable dependiente
>>>>>>>>>
>>>>>>>>> alpha.ug.mg
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> Nota: Adjunto tabla de datos
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> Dentro del diseño, 'Rep' y 'Year' se considera de efectos
>>>>>>>>> aleatorios y
>>>>>>>>> 'Line' es de efecto fijo.
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> Lo he intento llevar a cabo con la función 'lmer' del paquete
>>>>>>>>> 'lme4',
>>>>>>>>>
>>>>>>>>> lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) + (1|
>>>>>>>>> Line:Year),
>>>>>>>>> data =
>>>>>>>>> Dataset)
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> pero el modelo anterior me considera como error del factor
>>>>>>>>> 'line' el
>>>>>>>>> error
>>>>>>>>> de los residuales en lugar del error de Year*Line.
>>>>>>>>>
>>>>>>>>> ¿como puede decirle al modelo que para 'line' me considere el
>>>>>>>>> error de
>>>>>>>>> 'Year*Line'?
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> Gracias
>>>>>>>>>
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> ______________________________**_________________
>>>>>>>>> R-help-es mailing list
>>>>>>>>> R-help-es en r-project.org
>>>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>>>
>>>>>>>>>   ______________________________**_________________
>>>>>>>>>
>>>>>>>> R-help-es mailing list
>>>>>>>> R-help-es en r-project.org
>>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>>
>>>>>>>>
>>>>>>> ______________________________**_________________
>>>>>>> R-help-es mailing list
>>>>>>> R-help-es en r-project.org
>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>
>>>>>>>
>>>>>>
>>>>>>
>>>>>> --
>>>>>> Dr. Gregorio R. Serrano
>>>>>> Dpto. Economía Cuantitativa (UCM)
>>>>>> Voz:+34 91394 2361
>>>>>> Twitter: @grserrano_
>>>>>> http://www.grserrano.es
>>>>>>
>>>>>>        [[alternative HTML version deleted]]
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-help-es mailing list
>>>>>> R-help-es en r-project.org
>>>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>>>
>>>>>
>>>>>         [[alternative HTML version deleted]]
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-help-es mailing list
>>>>> R-help-es en r-project.org
>>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>>
>>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>> --
>>> _____---^---_____
>>>
>>> Univ. de Extremadura
>>> Dept. Matemáticas.
>>> Despacho B29
>>> Tf: + 34 924 289 300
>>> Ext. 86823
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> [[alternative HTML version deleted]]
>
>
>
>
>
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es



Más información sobre la lista de distribución R-help-es