[R-es] Efectos fijos y aleatorios en un modelo lineal
Javier Martinez
javi.martinez.lopez en gmail.com
Mar Mar 20 12:17:33 CET 2012
Muchas gracias por esta interesante discusión. Efectivamente, en mi
caso el intervalo de confianza del modelo es muy amplio, al tener las
variables de estudio valores de partida muy distintos. Lo que se ve
gráficamente en todos los lugares de estudio por igual es que la
respuesta de la variable biológica a la ambiental es
creciente/positiva/directa, y eso en realidad es lo que me interesa
ver con este análisis, que se mantiene esta relación en estos lugares
concretos, que son diversos y a la vez considero representativos de un
mismo tipo de ecosistema. Creo que el hecho de que el modelo sea
significativo corrobora esa relación, y efectivamente sería muy pobre
para predecir más allá de eso en este caso. Además de la mera
representación gráfica por grupos, es la mejor manera que veo de
analizar todos los datos en su conjunto, si no me equivoco. Para hacer
predicciones he usado las diferencias de las variables ambientales y
biológicas entre cada año, así como los años por separado y entonces
sí, he puesto una observación por lugar en una regresión lineal simple
porque ya son obervaciones independientes.
Muchas gracias de nuevo y saludos,
Javier
2012/3/20 José Trujillo Carmona <trujillo en unex.es>:
> Como dice Olivier en otro post.
>
> El efecto aleatorio considera que los niveles del factor son una muestra
> (dice textualmente y acertadamente REPRESENTATIVA O NO) de una población más
> amplia y toma en cuenta por tanto el efecto aleatorio del muestreo.
>
> Dicho de otro modo más explícito, tomar en cuenta el efecto aleatorio del
> muestreo no significa que automaticamente se pueda utilizar para hacer
> inferencia sobre la población de niveles completa (otros años, otros
> lugares, otras empresas, otras explotaciones, otras variedades de cultivo,
> ...) Esto último además de tener en cuenta que tenemos solo una muestra,
> solo se puede hacer si la muestra es representativa de la variabilidad en la
> población. Cosa que no suele ocurrir por ejemplo con años consecutivos (hay
> ciclos, acumulación de humedad de un año para otro, ...) parcelas todas en
> la misma región, variedades cultivadas todas en la misma región y
> pre-adaptadas para esa región.
>
> La variabilidad entre niveles está SESGADA ya sea por falta de variabilidad
> (efecto de localidad) o por falta de independencia (efecto de proximidad en
> el espacio o en el tiempo) y por tanto la extrapolación no es posible sin
> tomar en cuenta este sesgo que, por lo que yo sé, no es fácil incorporar al
> modelo (aunque a veces se puede, utilizando las autocorrelaciones por
> ejemplo en el caso del tiempo y supongo que espacialmente también se puede
> hacer, aunque nunca lo he estudiado).
>
> Por supuesto además de la calidad de la muestra en cuanto a su
> representatividad está la cuestión del tamaño ya mencionada. Aunque ésta
> cuestión a su vez depende de la variabilidad que induce el factor en la
> variable respuesta en relación con la variabilidad residual y la amplitude
> los límites de confianza que queramos en las estimaciones: poca variabilidad
> inducida o límites de confianza muy precisos necesitaremos muchos niveles.
> Si la variabilidad es mucho mayor que la residual o nos sirven límites de
> confianza más amplios, necesitaremos menos niveles.
>
> Esta discusión obviamente no es específica sobre R. Pero yo la considero muy
> pertinente para no crear en los lectores más noveles la sensación de que le
> "damos a la tecla" y R nos cuenta todo, sin que necesitemos saber de
> Estadística. Si le pedimos a R estimaciones y predicciones con una muestra
> sesgada, nos las dará; pero serán tan válidas como un billete de siete
> euros.
>
> Saludos.
>
>
>
> El 19/03/12 23:50, Javier Martinez escribió:
>>
>> Gracias Olivier,
>>
>> En mi caso, quiero inferir para cualquier parcela y año, es decir, ver
>> si la relación entre la variable biológica y ambiental, que es lo que
>> me interesa, se da igual de maneral general, sin entrar en las
>> particularidades de cada sitio. Podría poner las observaciones de
>> todos los lugares juntas en un modelo de regresión simple entre la
>> variable ambiental y la biológica pero eso, independientemente de que
>> sea o no significativo, que no lo es en mi caso, considero que genera
>> dependencia (a pares) entre mis observaciones, lo que incumple los
>> preceptos de la regresión lineal de que las observaciones tienen que
>> ser independientes. Por eso creo que los modelos mixtos pueden ser una
>> buena alternativa, aunque siga habiendo limitaciones en mis datos,
>> claro.
>>
>> Saludos,
>>
>> Javier
>>
>> 2012/3/19 Olivier Nuñez<onunez en unex.es>:
>>
>>>
>>> Con el riesgo de ser redundante respecto a lo que se ha dicho,
>>> empezaría por preguntar: ¿porqué los efectos de un factor son
>>> aleatorios?
>>> Pues, porque en el caso de que repita mi experimento, las condiciones
>>> descritas por los niveles de este factor cambiarían de manera aleatoria.
>>> Bien, porque lo decido yo (elección aleatoria de parcelas) o porqué
>>> la elección del año de observación es puramente fortuita.
>>> En realidad, lo que está detrás de este asunto es el alcance del
>>> experimento/estudio.
>>> Es decir, ¿mis conclusiones serán sobre estas parcelas concretas o
>>> para cualquier parcela? ¿sobre estos dos años o para cualquier año?
>>> Si son estas parcelas concretas que me interesan, entonces los
>>> efectos del factor parcela son naturalmente fijos.
>>> En caso contrario, las parcela observadas constituyen una muestra
>>> (¡representativa o no!) del territorio estudiado.
>>> Un saludo. Olivier
>>>
>>>
>>> --
>>> ____________________________________
>>>
>>> Olivier G. Nuñez
>>> Email: onunez en unex.es
>>> http://kolmogorov.unex.es/~onunez
>>> Tel : +34 663 03 69 09
>>> Departamento de Matemáticas
>>> Universidad de Extremadura
>>>
>>> ____________________________________
>>>
>>>
>>>
>>>
>>>
>>> El 19/03/2012, a las 18:26, Gregorio R. Serrano escribió:
>>>
>>>
>>>>
>>>> Buenas.
>>>>
>>>> No quisiera añadir ruido a la discusión, pero en econometría, con
>>>> datos de
>>>> panel, no solemos plantearnos qué es por naturaleza efecto fijo y
>>>> efecto
>>>> aleatorio, sino qué podemos estimar. Solemos considerar que si de
>>>> cierta
>>>> unidad se dispone de toda la población son efectos fijos y si lo
>>>> que se
>>>> tiene es una muestra, se trata de efectos aleatorios. Un ejemplo
>>>> que se
>>>> suele usar para ilustrar esto es una muestra de empresas de un
>>>> sector en
>>>> una serie de años. Los años son efectos fijos, tenemos todos los
>>>> disponibles, mientras que las empresas, son efectos aleatorios
>>>> porque se
>>>> trata de una muestra de empresas.
>>>>
>>>> Con esta interpretación, los años tuyos son efectos fijos (efecto
>>>> de la
>>>> climatología, peculiar del año, pero igual para todas las unidades
>>>> en el
>>>> año), los bloques (entiendo parcelas) serían fijos si siempre son las
>>>> mismas parcelas o aleatorios si, digamos, muestreas tres parcelas
>>>> de un
>>>> conjunto más amplio, aunque son pocas para estimar varianzas, y por
>>>> último
>>>> las líneas (¿variedades de trigo?) sí serían fijos.
>>>>
>>>> No obstante, yo no vengo de agricultura/biología y puede que la
>>>> notación
>>>> que usemos sea algo diferente (en econometría es confusa en
>>>> ocasiones).
>>>>
>>>> Un saludo
>>>> Gregorio R. Serrano
>>>>
>>>> El 19 de marzo de 2012 17:37, Fernando Piston
>>>> <fpiston en ias.csic.es>escribió:
>>>>
>>>>
>>>>>
>>>>> Muchas Gracias Luciano por tu pronta respuesta.
>>>>>
>>>>> Como bien decis cuesta imaginar como se puede considerar un factor
>>>>> como
>>>>> aleatorio cuando se tienen solo 2 niveles en el caso de Year y 3
>>>>> en el caso
>>>>> de Rep. Sin embargo, aunque seria deseable tener mas niveles para
>>>>> el factor
>>>>> Year (más años de ensayo) su efecto es, en cualquier caso, aleatorio.
>>>>>
>>>>> Saludos
>>>>> Fernando
>>>>>
>>>>>
>>>>> On 19/03/12 15:22, Luciano Selzer wrote:
>>>>>
>>>>>
>>>>>>
>>>>>> Fernando:
>>>>>> Más allá de la solución que alguien de la lista te pueda dar me
>>>>>> gustaría darte una advertencia. Según varios autores, los efectos
>>>>>> aletarorios se pueden determinar correctamente a partir de 6
>>>>>> niveles.
>>>>>> Así que con 3 y 2 niveles es muy dificil que se pueda determinar
>>>>>> correctamente la varianza de cada uno.
>>>>>>
>>>>>> Saludos
>>>>>> Luciano
>>>>>>
>>>>>>
>>>>>>
>>>>>> El día 19 de marzo de 2012 10:21, Fernando Piston
>>>>>> <fpiston en ias.csic.es> escribió:
>>>>>>
>>>>>>
>>>>>>>
>>>>>>> Hola a todos,
>>>>>>>
>>>>>>> Tengo algunas dudas sobre como introducir en un modelo lineal
>>>>>>> factores
>>>>>>> con
>>>>>>> efectos fijos y aleatorios. Mi diseño es el siguiente:
>>>>>>>
>>>>>>> Factores
>>>>>>>
>>>>>>> Line: 40 líneas de trigo (Fijo)
>>>>>>>
>>>>>>> Rep: 3 Bloques (Aleatorio)
>>>>>>>
>>>>>>> Year: 2 Años (Aleatorio)
>>>>>>>
>>>>>>>
>>>>>>> Variable dependiente
>>>>>>>
>>>>>>> alpha.ug.mg
>>>>>>>
>>>>>>>
>>>>>>> Nota: Adjunto tabla de datos
>>>>>>>
>>>>>>>
>>>>>>> Dentro del diseño, 'Rep' y 'Year' se considera de efectos
>>>>>>> aleatorios y
>>>>>>> 'Line' es de efecto fijo.
>>>>>>>
>>>>>>>
>>>>>>> Lo he intento llevar a cabo con la función 'lmer' del paquete
>>>>>>> 'lme4',
>>>>>>>
>>>>>>> lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) + (1|
>>>>>>> Line:Year),
>>>>>>> data =
>>>>>>> Dataset)
>>>>>>>
>>>>>>>
>>>>>>> pero el modelo anterior me considera como error del factor
>>>>>>> 'line' el
>>>>>>> error
>>>>>>> de los residuales en lugar del error de Year*Line.
>>>>>>>
>>>>>>> ¿como puede decirle al modelo que para 'line' me considere el
>>>>>>> error de
>>>>>>> 'Year*Line'?
>>>>>>>
>>>>>>>
>>>>>>> Gracias
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> ______________________________**_________________
>>>>>>> R-help-es mailing list
>>>>>>> R-help-es en r-project.org
>>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>>
>>>>>>> ______________________________**_________________
>>>>>>>
>>>>>>
>>>>>> R-help-es mailing list
>>>>>> R-help-es en r-project.org
>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>
>>>>>>
>>>>>
>>>>> ______________________________**_________________
>>>>> R-help-es mailing list
>>>>> R-help-es en r-project.org
>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>
>>>>>
>>>>
>>>>
>>>>
>>>> --
>>>> Dr. Gregorio R. Serrano
>>>> Dpto. Economía Cuantitativa (UCM)
>>>> Voz:+34 91394 2361
>>>> Twitter: @grserrano_
>>>> http://www.grserrano.es
>>>>
>>>> [[alternative HTML version deleted]]
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>
>>>
>>> [[alternative HTML version deleted]]
>>>
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> _____---^---_____
>
> Univ. de Extremadura
> Dept. Matemáticas.
> Despacho B29
> Tf: + 34 924 289 300
> Ext. 86823
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
Más información sobre la lista de distribución R-help-es