[R-es] test z de tres proporciones

Dom Ene 24 00:36:44 CET 2016

Estimado José, 

Muchas gracias por el tiempo que has dedicado a elaborar tu respuesta que me ha sido de mucha utilidad. Se trata de una serie de individuos, que en cierto periodo de tiempo pueden presentar una enfermedad o no. El que haya algunos que tengan más de un evento es porque algunos (muy pocos) padecen la enfermedad y transcurrido cierto tiempo la vuelven a sufrir. 

Es decir, tengo pacientes de tres tipos: 
Grupo A nº total de casos: 56 nº eventos (ocurrencias de la enfermedad en un periodo de tiempo de 2 años): 14 
Grupo B nº total de casos: 49 nº eventos (ocurrencias de la enfermedad en un periodo de tiempo de 2 años):: 10 
Grupo C nº total de casos: 51 nº eventos (ocurrencias de la enfermedad en un periodo de tiempo de 2 años):: 17 

Espero que con esto haya sido capaz de dejar más claro lo que ando buscando. 

Saludos, 

Fernando 

----- Mensaje original -----
De: José Trujillo Carmona <trujillo en unex.es>
Para: Fernando Sanchez <fernandsanche en yahoo.es>
Enviado: Sábado 23 de enero de 2016 17:44
Asunto: Re: [R-es] test z de tres proporciones

El 23/01/16 a las 16:14, Fernando Sanchez escribió:
> Hola a todos,
>
> Quería hacer un test z con tres proporciones. He buscado información acerca de si es posible en R y no he encontrado nada al respecto.
>
> La información de la que dispongo es la siguiente:
>
> A nº total de casos: 56 nº eventos: 14
>
> B nº total de casos: 49 nº eventos: 10
>
> C nº total de casos: 51 nº ecentos: 17
>
> La cuestión es que un mismo individuo puede tener más de un evento y es por eso que he pensado en el test z. Y no en un Ji-cuadrado. ¿Mi suposición es correcta?

El test Z para proporciones convencional utiliza una de estas dos 
distribuciones normales:

f ~ N(p0 , s) ---> z = (p-p0) / s Donde s = raiz( p0 (1-p0)/n)

f1 ~ N(p1, s1) y f2 ~ N(p2, s2) luego f1-f2 ~ N(p1 - p2, raiz(s1^2 + 
s2^2)) ---> Si p1-p2=0 Entonce  z= (f1 - f2)/raiz(s1^2 + s2^2)

No consigo imaginar como se puede construir un test Z con tres proporciones.

Sea el test Z o el test Ji-Cuadrado el test se construyen asumiendo que 
dispones de N = n1+n2+...+nk eventos que bajo hipótesis nula son 
resultados de experimentos binomiales. En cada muestra tienes N intentos 
(individuos) de encontrar un determinado resultado (una respuesta 
concreta, por ejemplo A) y se necesita que si es cierta la hipótesis 
nula del test todos los individuos (intentos) tengan la misma 
probabilidad de de contestar A y además la probabilidad de que cada 
individuos conteste A no depende de las respuestas de los demás individuos.

Dices que el mismo individuo puede producir más de un evento la puedo 
interpretar de dos formas.

1º Al mismo individuo se le pregunta dos veces: te has cargado todos los 
tests que conozco. Las dos respuestas del mismo individuo no cumplirían 
la condición de independencia de las sucesivas respuestas: pueden ser 
más probablemente parecidas o distintas entre sí que entre dos individuos.

2º Estás planteando tres cuestionarios completamente distintos y algunos 
individuos han contestado en más de un cuestionario. Bueno, si las 
cuestiones no están relacionadas (cuestionarios independientes) y no se 
cumple el punto anterior no veo el problema. Cada cuestionario seguiría 
siendo un experimento binomial y para un total de tres cuestionarios en 
los que quieres ver si la probabilidad de tres respuestas concretas es 
la misma en los tres cuestionarios.

En la información que das no aclaras si se trata de tres cuestionarios 
en los que en cada uno preguntas solo sobre si o no. Es decir en el 
primero pueden contestar A o no A, en el segundo grupos de casos pueden 
contestar B o no B, etc... Tendrías condiciones adecuadas para un test 
Ji-Cuadrado aunque algunos individuos participaran de los tres 
cuestionarios.

O por el contrario a n individuos se les ha permitido libremente que 
contesten sobre A, B y C pero algunos han contestado más de una opción y 
por eso el total de respuestas superaría a n. En este caso yo que no soy 
expertos en datos categóricos no conozco el test adecuado que recoja la 
falta de independencia en las respuestas. En todo caso la información 
disponible es insuficiente porque el análisis va a exigir conocer el 
grado de dependencia de las respuestas (saber cuántas veces aparecen 
juntas A y B, A y C, etc...)

Saludos.

>
> saludos,
>
> Fernando
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es