[R-es] Efectos fijos y aleatorios en un modelo lineal
José Trujillo Carmona
trujillo en unex.es
Mar Mar 20 09:40:05 CET 2012
Como dice Olivier en otro post.
El efecto aleatorio considera que los niveles del factor son una muestra
(dice textualmente y acertadamente REPRESENTATIVA O NO) de una población
más amplia y toma en cuenta por tanto el efecto aleatorio del muestreo.
Dicho de otro modo más explícito, tomar en cuenta el efecto aleatorio
del muestreo no significa que automaticamente se pueda utilizar para
hacer inferencia sobre la población de niveles completa (otros años,
otros lugares, otras empresas, otras explotaciones, otras variedades de
cultivo, ...) Esto último además de tener en cuenta que tenemos solo una
muestra, solo se puede hacer si la muestra es representativa de la
variabilidad en la población. Cosa que no suele ocurrir por ejemplo con
años consecutivos (hay ciclos, acumulación de humedad de un año para
otro, ...) parcelas todas en la misma región, variedades cultivadas
todas en la misma región y pre-adaptadas para esa región.
La variabilidad entre niveles está SESGADA ya sea por falta de
variabilidad (efecto de localidad) o por falta de independencia (efecto
de proximidad en el espacio o en el tiempo) y por tanto la extrapolación
no es posible sin tomar en cuenta este sesgo que, por lo que yo sé, no
es fácil incorporar al modelo (aunque a veces se puede, utilizando las
autocorrelaciones por ejemplo en el caso del tiempo y supongo que
espacialmente también se puede hacer, aunque nunca lo he estudiado).
Por supuesto además de la calidad de la muestra en cuanto a su
representatividad está la cuestión del tamaño ya mencionada. Aunque ésta
cuestión a su vez depende de la variabilidad que induce el factor en la
variable respuesta en relación con la variabilidad residual y la
amplitude los límites de confianza que queramos en las estimaciones:
poca variabilidad inducida o límites de confianza muy precisos
necesitaremos muchos niveles. Si la variabilidad es mucho mayor que la
residual o nos sirven límites de confianza más amplios, necesitaremos
menos niveles.
Esta discusión obviamente no es específica sobre R. Pero yo la considero
muy pertinente para no crear en los lectores más noveles la sensación de
que le "damos a la tecla" y R nos cuenta todo, sin que necesitemos saber
de Estadística. Si le pedimos a R estimaciones y predicciones con una
muestra sesgada, nos las dará; pero serán tan válidas como un billete de
siete euros.
Saludos.
El 19/03/12 23:50, Javier Martinez escribió:
> Gracias Olivier,
>
> En mi caso, quiero inferir para cualquier parcela y año, es decir, ver
> si la relación entre la variable biológica y ambiental, que es lo que
> me interesa, se da igual de maneral general, sin entrar en las
> particularidades de cada sitio. Podría poner las observaciones de
> todos los lugares juntas en un modelo de regresión simple entre la
> variable ambiental y la biológica pero eso, independientemente de que
> sea o no significativo, que no lo es en mi caso, considero que genera
> dependencia (a pares) entre mis observaciones, lo que incumple los
> preceptos de la regresión lineal de que las observaciones tienen que
> ser independientes. Por eso creo que los modelos mixtos pueden ser una
> buena alternativa, aunque siga habiendo limitaciones en mis datos,
> claro.
>
> Saludos,
>
> Javier
>
> 2012/3/19 Olivier Nuñez<onunez en unex.es>:
>
>> Con el riesgo de ser redundante respecto a lo que se ha dicho,
>> empezaría por preguntar: ¿porqué los efectos de un factor son
>> aleatorios?
>> Pues, porque en el caso de que repita mi experimento, las condiciones
>> descritas por los niveles de este factor cambiarían de manera aleatoria.
>> Bien, porque lo decido yo (elección aleatoria de parcelas) o porqué
>> la elección del año de observación es puramente fortuita.
>> En realidad, lo que está detrás de este asunto es el alcance del
>> experimento/estudio.
>> Es decir, ¿mis conclusiones serán sobre estas parcelas concretas o
>> para cualquier parcela? ¿sobre estos dos años o para cualquier año?
>> Si son estas parcelas concretas que me interesan, entonces los
>> efectos del factor parcela son naturalmente fijos.
>> En caso contrario, las parcela observadas constituyen una muestra
>> (¡representativa o no!) del territorio estudiado.
>> Un saludo. Olivier
>>
>>
>> --
>> ____________________________________
>>
>> Olivier G. Nuñez
>> Email: onunez en unex.es
>> http://kolmogorov.unex.es/~onunez
>> Tel : +34 663 03 69 09
>> Departamento de Matemáticas
>> Universidad de Extremadura
>>
>> ____________________________________
>>
>>
>>
>>
>>
>> El 19/03/2012, a las 18:26, Gregorio R. Serrano escribió:
>>
>>
>>> Buenas.
>>>
>>> No quisiera añadir ruido a la discusión, pero en econometría, con
>>> datos de
>>> panel, no solemos plantearnos qué es por naturaleza efecto fijo y
>>> efecto
>>> aleatorio, sino qué podemos estimar. Solemos considerar que si de
>>> cierta
>>> unidad se dispone de toda la población son efectos fijos y si lo
>>> que se
>>> tiene es una muestra, se trata de efectos aleatorios. Un ejemplo
>>> que se
>>> suele usar para ilustrar esto es una muestra de empresas de un
>>> sector en
>>> una serie de años. Los años son efectos fijos, tenemos todos los
>>> disponibles, mientras que las empresas, son efectos aleatorios
>>> porque se
>>> trata de una muestra de empresas.
>>>
>>> Con esta interpretación, los años tuyos son efectos fijos (efecto
>>> de la
>>> climatología, peculiar del año, pero igual para todas las unidades
>>> en el
>>> año), los bloques (entiendo parcelas) serían fijos si siempre son las
>>> mismas parcelas o aleatorios si, digamos, muestreas tres parcelas
>>> de un
>>> conjunto más amplio, aunque son pocas para estimar varianzas, y por
>>> último
>>> las líneas (¿variedades de trigo?) sí serían fijos.
>>>
>>> No obstante, yo no vengo de agricultura/biología y puede que la
>>> notación
>>> que usemos sea algo diferente (en econometría es confusa en
>>> ocasiones).
>>>
>>> Un saludo
>>> Gregorio R. Serrano
>>>
>>> El 19 de marzo de 2012 17:37, Fernando Piston
>>> <fpiston en ias.csic.es>escribió:
>>>
>>>
>>>> Muchas Gracias Luciano por tu pronta respuesta.
>>>>
>>>> Como bien decis cuesta imaginar como se puede considerar un factor
>>>> como
>>>> aleatorio cuando se tienen solo 2 niveles en el caso de Year y 3
>>>> en el caso
>>>> de Rep. Sin embargo, aunque seria deseable tener mas niveles para
>>>> el factor
>>>> Year (más años de ensayo) su efecto es, en cualquier caso, aleatorio.
>>>>
>>>> Saludos
>>>> Fernando
>>>>
>>>>
>>>> On 19/03/12 15:22, Luciano Selzer wrote:
>>>>
>>>>
>>>>> Fernando:
>>>>> Más allá de la solución que alguien de la lista te pueda dar me
>>>>> gustaría darte una advertencia. Según varios autores, los efectos
>>>>> aletarorios se pueden determinar correctamente a partir de 6
>>>>> niveles.
>>>>> Así que con 3 y 2 niveles es muy dificil que se pueda determinar
>>>>> correctamente la varianza de cada uno.
>>>>>
>>>>> Saludos
>>>>> Luciano
>>>>>
>>>>>
>>>>>
>>>>> El día 19 de marzo de 2012 10:21, Fernando Piston
>>>>> <fpiston en ias.csic.es> escribió:
>>>>>
>>>>>
>>>>>> Hola a todos,
>>>>>>
>>>>>> Tengo algunas dudas sobre como introducir en un modelo lineal
>>>>>> factores
>>>>>> con
>>>>>> efectos fijos y aleatorios. Mi diseño es el siguiente:
>>>>>>
>>>>>> Factores
>>>>>>
>>>>>> Line: 40 líneas de trigo (Fijo)
>>>>>>
>>>>>> Rep: 3 Bloques (Aleatorio)
>>>>>>
>>>>>> Year: 2 Años (Aleatorio)
>>>>>>
>>>>>>
>>>>>> Variable dependiente
>>>>>>
>>>>>> alpha.ug.mg
>>>>>>
>>>>>>
>>>>>> Nota: Adjunto tabla de datos
>>>>>>
>>>>>>
>>>>>> Dentro del diseño, 'Rep' y 'Year' se considera de efectos
>>>>>> aleatorios y
>>>>>> 'Line' es de efecto fijo.
>>>>>>
>>>>>>
>>>>>> Lo he intento llevar a cabo con la función 'lmer' del paquete
>>>>>> 'lme4',
>>>>>>
>>>>>> lmer(alpha.ug.mg ~ Line + (1|Year) + (1|Rep%in%Year) + (1|
>>>>>> Line:Year),
>>>>>> data =
>>>>>> Dataset)
>>>>>>
>>>>>>
>>>>>> pero el modelo anterior me considera como error del factor
>>>>>> 'line' el
>>>>>> error
>>>>>> de los residuales en lugar del error de Year*Line.
>>>>>>
>>>>>> ¿como puede decirle al modelo que para 'line' me considere el
>>>>>> error de
>>>>>> 'Year*Line'?
>>>>>>
>>>>>>
>>>>>> Gracias
>>>>>>
>>>>>>
>>>>>>
>>>>>> ______________________________**_________________
>>>>>> R-help-es mailing list
>>>>>> R-help-es en r-project.org
>>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>>
>>>>>> ______________________________**_________________
>>>>>>
>>>>> R-help-es mailing list
>>>>> R-help-es en r-project.org
>>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>>
>>>>>
>>>> ______________________________**_________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://
>>>> stat.ethz.ch/mailman/listinfo/r-help-es>
>>>>
>>>>
>>>
>>>
>>> --
>>> Dr. Gregorio R. Serrano
>>> Dpto. Economía Cuantitativa (UCM)
>>> Voz:+34 91394 2361
>>> Twitter: @grserrano_
>>> http://www.grserrano.es
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> _______________________________________________
>>> R-help-es mailing list
>>> R-help-es en r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>> [[alternative HTML version deleted]]
>>
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
--
_____---^---_____
Univ. de Extremadura
Dept. Matemáticas.
Despacho B29
Tf: + 34 924 289 300
Ext. 86823
Más información sobre la lista de distribución R-help-es