[R-es] test z de tres proporciones

Fernando Sanchez fernandsanche en yahoo.es
Dom Ene 24 19:08:01 CET 2016


Hola Carlos, 
Muchas gracias por tu respuesta. Creo que con tu solución puedo apañarme.
saludos,
Fernando


      De: Carlos J. Gil Bellosta <cgb en datanalytics.com>
 Para: r-help-es <r-help-es en r-project.org> 
 Enviado: Domingo 24 de enero de 2016 18:09
 Asunto: Re: [R-es] test z de tres proporciones
   
Hola, ¿qué tal?

Yo plantearía, de entrada, algo en las siguiente línea:

total <- c(56, 49,51)
positivos <- c(14, 10, 17)
negativos <- total - positivos
grupos <- letters[1:3]

# proporciones <- positivos / total

mod.1 <- glm(cbind(positivos, negativos) ~ grupos, family = binomial)
mod.0 <- glm(cbind(positivos, negativos) ~ 1,      family = binomial)

anova(mod.0, mod.1, test = "Chisq")

El problema de la no independencia de las observaciones (por tener
individuos repetidos), lo afrontaría así:

1) Si son pocos, me quedaría con la primera observación por individuo (es
decir, eliminando observaciones).
2) En el otro caso, introduciendo efectos adicionales (¿por invididuo?) en
el modelo anterior y añadiendo efectos aleatorios (por individuo) si
procede.

Nótese que tanto en los modelos anteriores (mod.0 y mod.1) se podrían
añadir otras variables explicativas relevantes de los individuos en el
estudio.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com/



El 24 de enero de 2016, 16:57, José Trujillo <trujillo en unex.es> escribió:

> El 24/01/16 a las 16:29, Fernando Sánchez Lasheras escribió:
>
>> Hola José,
>>
>> Efectivamente le mensaje me lo enviaste a mí, pero yo al contestar lo
>> mandé
>> a la lista.
>>
>> Los grupos son tratamientos distintos. Es decir, se estudia a una serie de
>> personas a las que se les aplican tres tratamientos distintos (A, B y C)
>> durante el mismo tiempo y vemos el número de eventos (ocurrencias de la
>> enfermedad) en cada grupo, con la peculiaridad que algunas personas pueden
>> enfermar más de una vez. Por tanto, al final, lo que tengo es que después
>> del mismo tiempo de seguimiento, a los que se les aplicó el tratamiento A,
>> que eran 56 pacientes, han sufrido 14 veces la enfermedad (en esas 14
>> veces
>> se incluye que algún paciente la ha sufrido más de una vez).
>>
>
> Pues esa es la situación típica en la que no es posible aplicar ni el test
> Z, ni el test Ji^2 porque ambos son aproximaciones para grandes muestras
> del test binomial en el que se supone que los 50 intentos aproximados de
> encontrar un enfermo son independientes entre sí (y con probabilidad de
> enfermar antes del experimento igual para todos porque todos pertenecen a
> la misma población).
>
> Tendrías que cambiar los datos y pasar a considerar si un individuo la ha
> padecido o no, de este modo tendrías la condición de independencia exigida
> por lo tests.
>
> Por supuesto que si un individuo la ha padecido puede tener predisposición
> genética o ambiental y cambiar la probabilidad de tenerla, o por el
> contrario tener inmunidad. La segunda aparición no puede ser incluida en el
> estudio porque se rige por leyes de probabilidad distintas de la primera.
> No puedes mezclar churras y merinas y esperar que la mezcla cumpla unas
> probabilidades predecibles igual que si no mezclas. Los tests se construyen
> haciendo algunas suposiciones y la de independencia es de las más básicas.
>
> Saludos.
>
> Esto mismo en
>> los grupos de tratamientos B y C, disponiendo en el grupo B de 49
>> pacientes
>> con 10 ocurrencias de la enfermedad y el C de 51 pacientes con 17
>> ocurrencias de la enfermedad en total. ¿Es aplicable aquí un test de
>> Ji-Cuadrado? Es mi gran duda, yo veía más apropiado uno de proporciones.
>>
>> Saludos,
>>
>> Fernando
>>
>> -----Mensaje original-----
>> De: José Trujillo [mailto:trujillo en unex.es]
>> Enviado el: domingo, 24 de enero de 2016 14:43
>> Para: Fernando Sánchez Lasheras <fsanchez en euclides.com>
>> Asunto: Re: [R-es] test z de tres proporciones
>>
>> El 24/01/16 a las 00:32, Fernando Sánchez Lasheras escribió:
>>
>>> Estimado José,
>>>
>>> Muchas gracias por el tiempo que has dedicado a elaborar tu respuesta
>>> que me ha sido de mucha utilidad. Se trata de una serie de individuos,
>>> que en cierto periodo de tiempo pueden presentar una enfermedad o no.
>>> El que haya algunos que tengan más de un evento es porque algunos (muy
>>> pocos) padecen la enfermedad y transcurrido cierto tiempo la vuelven a
>>>
>> sufrir.
>>
>>> Es decir, tengo pacientes de tres tipos:
>>>
>>> Grupo A nº total de casos: 56 nº eventos (ocurrencias de la enfermedad
>>> en un periodo de tiempo de 2 años): 14
>>>
>>> Grupo B nº total de casos: 49 nº eventos (ocurrencias de la enfermedad
>>> en un periodo de tiempo de 2 años):: 10
>>>
>>> Grupo C nº total de casos: 51 nº eventos (ocurrencias de la enfermedad
>>> en un periodo de tiempo de 2 años):: 17
>>>
>>> Espero que con esto haya sido capaz de dejar más claro lo que ando
>>>
>> buscando.
>>
>>> Saludos,
>>>
>>> Fernando
>>>
>>> Deduzco pues que los grupos son periodos de tiempos distintos. Si es así
>> no
>> tienes ningún problema en utilizar una ji-cuadrado.
>>
>> Has hecho el sesguimiento de 50 individuos (más o menos) en tres periodos
>> de
>> tiempo entiendo que diferentes (si no volvemos al problema grave).
>>
>> Me acabo de dar cuenta que estos mensajes no lo estoy enviando a la lista,
>> sino a tí. De modo que si agluien puede aportar algo más no le está
>> siriviendo de pie.
>>
>> Es torpeza mía, pero si te ha servido me alegro.
>>
>> Saludos.
>>
>>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

    [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

  
	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es