[R-es] Regresiones logísticas

Olivier Nuñez onunez en iberstat.es
Mie Oct 6 12:07:55 CEST 2010


Si entiendo bien, tienes dos indicadores de mejoría del paciente. Los  
llamamos Y1 e Y2.
Eres capaz de predecir las respectivas variaciones de estos  
indicadores mediante características individuales,
llamamos les X1 y X2, utilizando una regresión lineal del tipo:

Y1 = A1*X1 + eps_1
Y2 = A2*X2 + eps_2

Ahora, pretendes combinar ambos indicadores en uno sólo: Y = Y1 + Y2,
y tu pregunta es si puedes predecir este ultimo indicador por

Y = A1*X1 + A2*X2

La respuesta es sí,  y esta predicción no es segada (es lo bueno de  
los modelos lineales).
El problema viene a la hora de calcular  la precisión de esta  
predicción.
Porque dar una predicción sin conocer su precisión es poco útil.
Una primera aproximación consiste en decir que la variabilidad de la  
predicción de Y (denotada Y^) es
la suma de las varianzas de las predicciones que la componen:

var( Y^ ) = var( Y1^) + var (Y2^).

Este caso corresponde a la situación en la cual las predicciones  Y1^  
e  Y2^ son independientes.
Desgraciadamente, es poco probable que se cumpla en tu marco.
Por lo tanto, si no quieres (no puedes) directamente predecir Y con  
las características individuales X1 y X2,
te propongo aproximar la varianza de Y^ por

var( Y^ ) = 2*(var( Y1^) + var (Y2^))

que sin embargo, tiene la desventaja de siempre sobrestimar la  
varianza real de Y^  (pero nunca la subestimará!)

Un saludo.


--  
____________________________________

Olivier G. Nuñez
Email: onunez en iberstat.es
Tel : +34 663 03 69 09
Web: http://www.iberstat.es

____________________________________




El 06/10/2010, a las 11:29, dolors giralt casellas escribió:

> Hola Olivier,
>
> por cosas del trabajo no se me permite decir que son w e y...
> Os puedo decir que w se relaciona con mejoria de los pacientes, e y  
> se relaciona con empeoramiento (-y seria mejoria).
> Entonces, mi idea era usar las variables relacionadas (ai y bk) con  
> w e y para predecir mejoria sin tener que volver a calcular las  
> betas ya que para los medicos seria más práctico.
> No sé si lo que os he explicado os va a servir...
>
> Merci
>
> Dolors
>
>
> 2010/10/6 Olivier Nuñez <onunez en iberstat.es>
> Dolors,
>
> ¿porqué no explicas la motivación o el contexto para  semejante  
> manipulación?
> Y así, tal vez entenderemos algo y te podremos ayudar.
> Un saludo. Olivier
> --  
> ____________________________________
>
> Olivier G. Nuñez
> Email: onunez en iberstat.es
> Tel : +34 663 03 69 09
> Web: http://www.iberstat.es
>
> ____________________________________
>
>
>
>
> El 06/10/2010, a las 10:44, dolors giralt casellas escribió:
>
>> Hola,
>>
>> Antes no me expliqué muy bien,
>>
>> tengo dos regresiones logisticas
>>
>> w=f(a1, ...,ai)--> ß1a2 + ß4a4+..+ßjaj
>> y=f(b1, ...,bk)--> ß2b2 + ß5b5+..+ßnbn  donde las ß son los 
>> coeficientes de
>> cada variable
>>
>>  la idea era hacer una función z=f(w, -y) = ß1a2 + ß4a4+..+ßjaj -  
>> ( ß2b2 + ß
>> 5b5+..+ßnbn)
>> que no sé si se puede hacer, teniendo en cuenta que z está  
>> relacionada con w
>> e y.
>>
>> Gracias
>>
>> Dolors
>>
>>
>>
>>
>>
>> 2010/10/4 Carlos J. Gil Bellosta <cgb en datanalytics.com>
>>
>>> Hola, ¿qué tal?
>>>
>>> Una alternativa (sin emitir juicios acerca de su superioridad con
>>> respecto a la de los otros correos) es crear el modelo (usado la
>>> nomenclatura que aparece en el de Carlos Ortega, que aparece más
>>> abajo)
>>>
>>> z = f( y, w )
>>>
>>> donde y y w son el el resultado de predict (de tipo "response",  
>>> creo)
>>> de los modelos
>>>
>>> y = f(xi)
>>> w = f(vi)
>>>
>>> Vendría a ser algo parecido a un "perceptrón multicapa" (o "bicapa",
>>> en este caso). Se puede lograr algo parecido usando el paquete nnet.
>>>
>>> Un saludo,
>>>
>>> Carlos J. Gil Bellosta
>>> http://www.datanalytics.com
>>>
>>>
>>> 2010/10/4 Carlos Ortega <coforfe en gmail.com>:
>>>> Hola Dolors,
>>>>
>>>> No sé si entiendo bien el problema que planteas.
>>>> Tienes dos modelos logísticos:
>>>>
>>>> y = f(xi) (la "y" depende linearmente de varias "x")
>>>> w = f(vi) (la "v" depende linearmente de varias "v")
>>>>
>>>> Y dices que la "y"  y la "w" a su vez están relacionadas con una  
>>>> "z".
>>>> Y tu duda es saber si puedes usar alguna de las "x" y alguna de  
>>>> las "v"
>>> para
>>>> realizar un modelo del tipo:
>>>> z = f(xi , vi)
>>>>
>>>> ¿Es esto lo que preguntas?
>>>> ¿Las "xi" y las "vi" que usarías serían las que te han salido
>>> significativas
>>>> en los modelos de "y" y de "w"?
>>>> ¿Qué problema hay en establecer el modelo de "z" con todas las  
>>>> "xi" y con
>>>> todas las "vi" y que el modelo te indique cuáles de ellas son
>>> significativas
>>>> y cuáles no?
>>>>
>>>> Saludos,
>>>> Carlos Ortega
>>>> www.qualityexcellence.es
>>>>
>>>> 2010/10/4 dolors giralt casellas <dolors1985 en gmail.com>
>>>>
>>>>> Hola,
>>>>>
>>>>> tengo dos modelos distintos de regresión logistica donde las  
>>>>> variables
>>>>> dependientes son distintas. Sé que estas dos variables están
>>> relacionadas
>>>>> con una tercera. Me interesaria hacer un nuevo modelo con esta  
>>>>> tercera
>>>>> utilizando las variables que me han salido en las dos regresiones
>>>>> anteriores
>>>>> pero sin utilizar las variables dependientes de las dos  
>>>>> regresiones
>>>>> logisticas. No sé si se puede hacer, pero si se puede, alguien  
>>>>> sabe
>>> como? A
>>>>> lo mejor usando las betas?
>>>>>
>>>>> Muchas gracias
>>>>>
>>>>> Dolors
>>>>>
>>>>>        [[alternative HTML version deleted]]
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-help-es mailing list
>>>>> R-help-es en r-project.org
>>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>>
>>>>>
>>>>
>>>>        [[alternative HTML version deleted]]
>>>>
>>>>
>>>> _______________________________________________
>>>> R-help-es mailing list
>>>> R-help-es en r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>>
>>>
>>
>> [[alternative HTML version deleted]]
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>



Más información sobre la lista de distribución R-help-es