[R-es] Efectos fijos y aleatorios en un modelo lineal
Marcuzzi, Javier Rubén
javier.ruben.marcuzzi en gmail.com
Mar Mar 20 16:22:39 CET 2012
Estimado Fernando Piston
Sobre modelos y efectos
No voy a responder eso, simplemente en
http://cran.r-project.org/web/packages/agridat/agridat.pdf hay ejemplos.
Javier Marcuzzi
-----Mensaje original-----
From: Fernando Piston
Sent: Tuesday, March 20, 2012 10:43 AM
To: r-help-es en r-project.org
Subject: Re: [R-es] Efectos fijos y aleatorios en un modelo lineal
Hola de nuevo a todos,
Después de aclarar que se pueden considerar efectos fijos y aleatorios
(con sus pros y contras). Me gustaría proponer de nuevo, y una vez que
conocemos mas de cerca el análisis, como indicar en un modelo lineal que
son efectos fijos y aleatorios:
De momento se han propuesto los siguientes modelos mixtos:
Mi modelo
lme = lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) +
(1|Line:Year), data = datos)
Modelo propuesto por Olivier
lmer(alpha.ug.mg ~ Line + (1|Year/Rep) + (1|Line:Year), data = datos)
En ambos casos los resultados son muy similares siendo la F del factor
'line' similar.
¿Son estos modelos adecuados al problema propuesto (Lineas de trigo en
un ensayo de bloques al azar repetido dos años)?. Las salidas que
generan los dos modelos anteriores, ¿como se interpretan en comparción
con la tabla ANOVA que adjunte en mensajes anteriores?
¿se podría utilizar la función 'aov' en lugar de 'lmer'?
On 20/03/12 12:17, Javier Martinez wrote:
> Muchas gracias por esta interesante discusión. Efectivamente, en mi
> caso el intervalo de confianza del modelo es muy amplio, al tener las
> variables de estudio valores de partida muy distintos. Lo que se ve
> gráficamente en todos los lugares de estudio por igual es que la
> respuesta de la variable biológica a la ambiental es
> creciente/positiva/directa, y eso en realidad es lo que me interesa
> ver con este análisis, que se mantiene esta relación en estos lugares
> concretos, que son diversos y a la vez considero representativos de un
> mismo tipo de ecosistema. Creo que el hecho de que el modelo sea
> significativo corrobora esa relación, y efectivamente sería muy pobre
> para predecir más allá de eso en este caso. Además de la mera
> representación gráfica por grupos, es la mejor manera que veo de
> analizar todos los datos en su conjunto, si no me equivoco. Para hacer
> predicciones he usado las diferencias de las variables ambientales y
> biológicas entre cada año, así como los años por separado y entonces
> sí, he puesto una observación por lugar en una regresión lineal simple
> porque ya son obervaciones independientes.
>
> Muchas gracias de nuevo y saludos,
>
> Javier
>
> 2012/3/20 José Trujillo Carmona<trujillo en unex.es>:
>> Como dice Olivier en otro post.
>>
>> El efecto aleatorio considera que los niveles del factor son una muestra
>> (dice textualmente y acertadamente REPRESENTATIVA O NO) de una población
>> más
>> amplia y toma en cuenta por tanto el efecto aleatorio del muestreo.
>>
>> Dicho de otro modo más explícito, tomar en cuenta el efecto aleatorio del
>> muestreo no significa que automaticamente se pueda utilizar para hacer
>> inferencia sobre la población de niveles completa (otros años, otros
>> lugares, otras empresas, otras explotaciones, otras variedades de
>> cultivo,
>> ...) Esto último además de tener en cuenta que tenemos solo una muestra,
>> solo se puede hacer si la muestra es representativa de la variabilidad en
>> la
>> población. Cosa que no suele ocurrir por ejemplo con años consecutivos
>> (hay
>> ciclos, acumulación de humedad de un año para otro, ...) parcelas todas
>> en
>> la misma región, variedades cultivadas todas en la misma región y
>> pre-adaptadas para esa región.
>>
>> La variabilidad entre niveles está SESGADA ya sea por falta de
>> variabilidad
>> (efecto de localidad) o por falta de independencia (efecto de proximidad
>> en
>> el espacio o en el tiempo) y por tanto la extrapolación no es posible sin
>> tomar en cuenta este sesgo que, por lo que yo sé, no es fácil incorporar
>> al
>> modelo (aunque a veces se puede, utilizando las autocorrelaciones por
>> ejemplo en el caso del tiempo y supongo que espacialmente también se
>> puede
>> hacer, aunque nunca lo he estudiado).
>>
>> Por supuesto además de la calidad de la muestra en cuanto a su
>> representatividad está la cuestión del tamaño ya mencionada. Aunque ésta
>> cuestión a su vez depende de la variabilidad que induce el factor en la
>> variable respuesta en relación con la variabilidad residual y la
>> amplitude
>> los límites de confianza que queramos en las estimaciones: poca
>> variabilidad
>> inducida o límites de confianza muy precisos necesitaremos muchos
>> niveles.
>> Si la variabilidad es mucho mayor que la residual o nos sirven límites de
>> confianza más amplios, necesitaremos menos niveles.
>>
>> Esta discusión obviamente no es específica sobre R. Pero yo la considero
>> muy
>> pertinente para no crear en los lectores más noveles la sensación de que
>> le
>> "damos a la tecla" y R nos cuenta todo, sin que necesitemos saber de
>> Estadística. Si le pedimos a R estimaciones y predicciones con una
>> muestra
>> sesgada, nos las dará; pero serán tan válidas como un billete de siete
>> euros.
>>
>> Saludos.
>>
>>
>>
>> El 19/03/12 23:50, Javier Martinez escribió:
>>> Gracias Olivier,
>>>
>>> En mi caso, quiero inferir para cualquier parcela y año, es decir, ver
>>> si la relación entre la variable biológica y ambiental, que es lo que
>>> me interesa, se da igual de maneral general, sin entrar en las
>>> particularidades de cada sitio. Podría poner las observaciones de
>>> todos los lugares juntas en un modelo de regresión simple entre la
>>> variable ambiental y la biológica pero eso, independientemente de que
>>> sea o no significativo, que no lo es en mi caso, considero que genera
>>> dependencia (a pares) entre mis observaciones, lo que incumple los
>>> preceptos de la regresión lineal de que las observaciones tienen que
>>> ser independientes. Por eso creo que los modelos mixtos pueden ser una
>>> buena alternativa, aunque siga habiendo limitaciones en mis datos,
>>> claro.
>>>
>>> Saludos,
>>>
>>> Javier
>>>
>>> 2012/3/19 Olivier Nuñez<onunez en unex.es>:
>>>
>>>> Con el riesgo de ser redundante respecto a lo que se ha dicho,
>>>> empezaría por preguntar: ¿porqué los efectos de un factor son
>>>> aleatorios?
>>>> Pues, porque en el caso de que repita mi experimento, las condiciones
>>>> descritas por los niveles de este factor cambiarían de manera
>>>> aleatoria.
>>>> Bien, porque lo decido yo (elección aleatoria de parcelas) o porqué
>>>> la elección del año de observación es puramente fortuita.
>>>> En realidad, lo que está detrás de este asunto es el alcance del
>>>> experimento/estudio.
>>>> Es decir, ¿mis conclusiones serán sobre estas parcelas concretas o
>>>> para cualquier parcela? ¿sobre estos dos años o para cualquier año?
>>>> Si son estas parcelas concretas que me interesan, entonces los
>>>> efectos del factor parcela son naturalmente fijos.
>>>> En caso contrario, las parcela observadas constituyen una muestra
>>>> (¡representativa o no!) del territorio estudiado.
>>>> Un saludo. Olivier
>>>>
>>>>
>>>> --
>>>> ____________________________________
>>>>
>>>> Olivier G. Nuñez
>>>> Email: onunez en unex.es
>>>> http://kolmogorov.unex.es/~onunez
>>>> Tel : +34 663 03 69 09
>>>> Departamento de Matemáticas
>>>> Universidad de Extremadura
>>>>
>>>> ____________________________________
>>>>
>>>>
>>>>
>>>>
>>>>
>>>> El 19/03/2012, a las 18:26, Gregorio R. Serrano escribió:
>>>>
>>>>
>>>>> Buenas.
>>>>>
>>>>> No quisiera añadir ruido a la discusión, pero en econometría, con
>>>>> datos de
>>>>> panel, no solemos plantearnos qué es por naturaleza efecto fijo y
>>>>> efecto
>>>>> aleatorio, sino qué podemos estimar. Solemos considerar que si de
>>>>> cierta
>>>>> unidad se dispone de toda la población son efectos fijos y si lo
>>>>> que se
>>>>> tiene es una muestra, se trata de efectos aleatorios. Un ejemplo
>>>>> que se
>>>>> suele usar para ilustrar esto es una muestra de empresas de un
>>>>> sector en
>>>>> una serie de años. Los años son efectos fijos, tenemos todos los
>>>>> disponibles, mientras que las empresas, son efectos aleatorios
>>>>> porque se
>>>>> trata de una muestra de empresas.
>>>>>
>>>>> Con esta interpretación, los años tuyos son efectos fijos (efecto
>>>>> de la
>>>>> climatología, peculiar del año, pero igual para todas las unidades
>>>>> en el
>>>>> año), los bloques (entiendo parcelas) serían fijos si siempre son las
>>>>> mismas parcelas o aleatorios si, digamos, muestreas tres parcelas
>>>>> de un
>>>>> conjunto más amplio, aunque son pocas para estimar varianzas, y por
>>>>> último
>>>>> las líneas (¿variedades de trigo?) sí serían fijos.
>>>>>
>>>>> No obstante, yo no vengo de agricultura/biología y puede que la
>>>>> notación
>>>>> que usemos sea algo diferente (en econometría es confusa en
>>>>> ocasiones).
>>>>>
>>>>> Un saludo
>>>>> Gregorio R. Serrano
>>>>>
>>>>> El 19 de marzo de 2012 17:37, Fernando Piston
>>>>> <fpiston en ias.csic.es>escribió:
>>>>>
>>>>>
>>>>>> Muchas Gracias Luciano por tu pronta respuesta.
>>>>>>
>>>>>> Como bien decis cuesta imaginar como se puede considerar un factor
>>>>>> como
>>>>>> aleatorio cuando se tienen solo 2 niveles en el caso de Year y 3
>>>>>> en el caso
>>>>>> de Rep. Sin embargo, aunque seria deseable tener mas niveles para
>>>>>> el factor
>>>>>> Year (más años de ensayo) su efecto es, en cualquier caso, aleatorio.
>>>>>>
>>>>>> Saludos
>>>>>> Fernando
>>>>>>
>>>>>>
>>>>>> On 19/03/12 15:22, Luciano Selzer wrote:
>>>>>>
>>>>>>
>>>>>>> Fernando:
>>>>>>> Más allá de la solución que alguien de la lista te pueda dar me
>>>>>>> gustaría darte una advertencia. Según varios autores, los efectos
>>>>>>> aletarorios se pueden determinar correctamente a partir de 6
>>>>>>> niveles.
>>>>>>> Así que con 3 y 2 niveles es muy dificil que se pueda determinar
>>>>>>> correctamente la varianza de cada uno.
>>>>>>>
>>>>>>> Saludos
>>>>>>> Luciano
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> El día 19 de marzo de 2012 10:21, Fernando Piston
>>>>>>> <fpiston en ias.csic.es> escribió:
>>>>>>>
>>>>>>>
>>>>>>>> Hola a todos,
>>>>>>>>
>>>>>>>> Tengo algunas dudas sobre como introducir en un modelo lineal
>>>>>>>> factores
>>>>>>>> con
>>>>>>>> efectos fijos y aleatorios. Mi diseño es el siguiente:
>>>>>>>>
>>>>>>>> Factores
>>>>>>>>
>>>>>>>> Line: 40 líneas de trigo (Fijo)
>>>>>>>>
>>>>>>>> Rep: 3 Bloques (Aleatorio)
>>>>>>>>
>>>>>>>> Year: 2 Años (Aleatorio)
>>>>>>>>
>>>>>>>>
>>>>>>>> Variable dependiente
>>>>>>>>
>>>>>>>> alpha.ug.mg
>>>>>>>>
>>>>>>>>
>>>>>>>> Nota: Adjunto tabla de datos
>>>>>>>>
>>>>>>>>
>>>>>>>> Dentro del diseño, 'Rep' y 'Year' se considera de efectos
>>>>>>>> aleatorios y
>>>>>>>> 'Line' es de efecto fijo.
>>>>>>>>
>>>>>>>>
>>>>>>>> Lo he intento llevar a cabo con la función 'lmer' del paquete
>>>>>>>> 'lme4',
>>>>>>>>
>>>>>>>> lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) + (1|
>>>>>>>> Line:Year),
>>>>>>>> data =
>>>>>>>> Dataset)
>>>>>>>>
>>>>>>>>
>>>>>>>> pero el modelo anterior me considera como error del factor
>>>>>>>> 'line' el
>>>>>>>> error
>>>>>>>> de los residuales en lugar del error de Year*Line.
>>>>>>>>
>>>>>>>> ¿como puede decirle al modelo que para 'line' me considere el
>>>>>>>> error de
>>>>>>>> 'Year*Line'?
>>>>>>>>
>>>>>>>>
>>>>>>>> Gracias
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>> ______________________________**_________________
>>>>>>>> R-help-es mailing list
>>>>>>>> R-help-es en r-project.org
>>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>>
>>>>>>>> ______________________________**_________________
>>>>>>>>
>>>>>>> R-help-es mailing list
>>>>>>> R-help-es en r-project.org
>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>
>>>>>>>
>>>>>> ______________________________**_________________
>>>>>> R-help-es mailing list
>>>>>> R-help-es en r-project.org
>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>
>>>>>>
>>>>>
>>>>>
>>>>> --
>>>>> Dr. Gregorio R. Serrano
>>>>> Dpto. Economía Cuantitativa (UCM)
>>>>> Voz:+34 91394 2361
>>>>> Twitter: @grserrano_
>>>>> http://www.grserrano.es
>>>>>
>>>>> [[alternative HTML version deleted]]
>>>>>
>>>>> _______________________________________________
>>>>> R-help-es mailing list
>>>>> R-help-es en r-project.org
>>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>>
>>>>
>>>> [[alternative HTML version deleted]]
>>>>
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>> --
>> _____---^---_____
>>
>> Univ. de Extremadura
>> Dept. Matemáticas.
>> Despacho B29
>> Tf: + 34 924 289 300
>> Ext. 86823
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
Más información sobre la lista de distribución R-help-es