<div>Hola Carlos:</div><div>[Entre líneas]</div><div> </div><div>15.07.2015, 00:18, "Carlos Ortega" <cof@qualityexcellence.es>:</div><blockquote type="cite"><div><div style="font-family:verdana,sans-serif;">Hola,<br /><br /></div><div style="font-family:verdana,sans-serif;">Gracias por el código. </div><div style="font-family:verdana,sans-serif;">Lo he ejecutado y he visto los resultados.<br /><br /></div><div style="font-family:verdana,sans-serif;">Salvo la parte de los test como te dije, todo lo demás creo que se puede hacer más automático.</div><div style="font-family:verdana,sans-serif;">Probaré a hacer alguna prueba de lo que te comento utilizando el conjunto de MASS.<br /><br /></div><div style="font-family:verdana,sans-serif;">Sobre la duda de los nombres, si le pasas el data.frame tal cual, te debiera de conservar los nombres.</div><div style="font-family:verdana,sans-serif;">Si no es así, pásale como argumento adicional a las funciones los nombres de las columnas/variables...</div></div></blockquote><div> </div><div>Había escrito un nuevo mail aclaratorio sin haber leído este. Olvida el último mail y pruebo estas dos cosas que dices.</div><div> </div><div>Muchas gracias y saludos</div><div> </div><blockquote type="cite"><div><div style="font-family:verdana,sans-serif;"> </div><div style="font-family:verdana,sans-serif;"> </div><div style="font-family:verdana,sans-serif;">Saludos,</div><div style="font-family:verdana,sans-serif;">Carlos.</div><div style="font-family:verdana,sans-serif;"> </div></div><div><br /><div>El 14 de julio de 2015, 22:49, Griera <span><<a href="mailto:griera@yandex.com" target="_blank">griera@yandex.com</a>></span> escribió:<br /><blockquote style="margin:0 0 0 0.8ex;border-left:1px #ccc solid;padding-left:1ex;">Hola Carlos:<br /> <br /> Te adjunto un ejemplo de aplicación: las funciones (he borrado los path de las funciones y las ordenes "source()" que las carga ) y un ejemplo para ejecutarlas para las opciones que tengo implementadas con la tabla de datos birthwt del paquete"MASS":<br /> - Descriptiva de todas las variables de una tabla.<br /> - Análisis univariado de todas las variables de una tabla cruzadas con una variable dependiente cualitativa.<br /> <br /> =Inicio funciones ========================================<br /> ##--------------------------------------------------------------<br /> ## DESUNI<br /> ##--------------------------------------------------------------<br /> DESUNI = function(XDADES,<br />                   XDROP=NULL,<br />                   XVD=NULL,<br />                   XSPV=NULL # Si és una anàlisi de SPV # Pot tenir el valor TRUE<br />                   )<br />   {<br />   options(digits = 3, OutDec=",", scipen=999)<br />   ## No existeix VD: descriptiva<br />   if(is.null(XVD))   # No existeix VD: descriptiva<br />     {<br />       cat("\n*** Descriptiva (no existeix variable dependent)\n")<br />       DES(XDADES=XDADES, XDROP=XDROP,<br />           XCAMIF=XCAMIF)<br />     }<br />   ## Existeis VD: anàlisi univariat<br />   else               # Existeis VD: anàlisi univariat<br />     {<br />       UNI(XDADES=XDADES, XDROP=XDROP, XVD=XVD, XSPV=XSPV,<br />           XCAMIF=XCAMIF)<br />     }<br />   }<br /> <br /> ##--------------------------------------------------------------<br /> ## DES: Descriptiva de todas las variables<br /> ##--------------------------------------------------------------<br /> DES = function(XDADES,  XDROP=NULL,<br />                XCAMIF)<br />   {<br />     ifelse(is.null(XDROP), DADES_S <- XDADES, DADES_S <- XDADES[, setdiff(names(XDADES), XDROP) ]) # setdiff Selecciona les variables de XDADES que són diferents de XDROP<br />     attach(DADES_S, warn.conflicts = F)<br />     XVARLLI=names(DADES_S)<br />     for (XVARNOM in names(DADES_S))<br />       {<br />       if(is.numeric(get(XVARNOM)))<br />         {<br />         DES_QUANTI (XVARNOM)<br />         }<br />       else if(is.factor(get(XVARNOM)))<br />         {<br />         DES_QUALI (XVARNOM)<br />         }<br />       else<br />         {<br />         cat("La variable ", XVARNOM, "no és de cap dels tipus coneguts", "\n")<br />         }<br />       }<br />     # Fi de la funció<br />     detach(DADES_S)<br />   }<br /> ##--------------------------------------------------------------<br /> ## DES_QUANTI: Descriptiva variables factor<br /> ##--------------------------------------------------------------<br /> DES_QUANTI <-<br />   function(X) {<br />     OP <- par(no.readonly = TRUE); # save old parameters<br />     par(mfrow=c(1,3))<br />     hist(get(X),    main=c("Histograma de", X), xlab=X);rug(get(X))<br />     boxplot(get(X), main=c("Diagrama de caixa de", X), ylab=X);rug(get(X),side=2)<br />     qqnorm(get(X),  main=c("Diagrama Q-Q de", X));qqline(get(X))<br />     cat("\n")<br />     par(OP)<br />     ESTA_1<-data.frame(Variable      = X,<br />                        N_total       = length(get(X)),<br />                        N_valids      = sum(!<a href="http://is.na/" target="_blank">is.na</a>(get(X))),<br />                        N_desconeguts = sum(<a href="http://is.na/" target="_blank">is.na</a>(get(X)))<br />                        )<br />     ESTA_2<-data.frame(Variable  = X,<br />                        N         = sum(!<a href="http://is.na/" target="_blank">is.na</a>(get(X))),<br />                        Mitjana   = if (mean(get(X) > 10)) {round(mean(get(X), na.rm = TRUE), 2)} else {round(mean(get(X), na.rm = TRUE), 3)},<br />                        Err_tipic = if (sd  (get(X) > 10)) {round(sd  (get(X), na.rm = TRUE), 2)} else {round(sd  (get(X), na.rm = TRUE), 3)},<br />                        Min       = min(get(X), na.rm = TRUE),<br />                        Perc_25   = quantile(get(X),.25),<br />                        Mediana   = median(get(X), na.rm = TRUE),<br />                        Perc_75   = quantile(get(X),.75),<br />                        Max       = max(get(X), na.rm = TRUE),<br />                        Interval  = max(get(X), na.rm = TRUE) - min(get(X), na.rm = TRUE)<br />                        )<br />     cat("----------------------------", "\n")<br />     cat("Valors valids i desconeguts", "\n")<br />     print(ESTA_1, row.names = FALSE)<br />     cat("----------------------------", "\n")<br />     cat("Estadistics", "\n")<br />     print(ESTA_2, row.names = FALSE)<br />     cat("----------------------------", "\n")<br />     return(summary(get(X)))<br />   }<br /> ##--------------------------------------------------------------<br /> ## DES_QUALI: Descriptiva variables factor<br /> ##--------------------------------------------------------------<br /> DES_QUALI <- function(X)<br />   {<br />   cat("Var factor: ",X,"\n")<br />   XOUT <- as.data.frame(table(get(X)))<br />   names(XOUT)[1] = X<br />   XOUT <- transform(XOUT, cumFreq = cumsum(Freq), Percentatge = prop.table(Freq))<br />   print(XOUT)<br />   print("-----------------------------------------------------")<br />   }<br /> ##--------------------------------------------------------------<br /> ## UNI: Análisis univarido<br /> ##--------------------------------------------------------------<br /> UNI = function(XDADES,  XDROP=NULL,<br />                XVD,<br />                XSPV=NULL, # Si és una anàlisi de SPV<br />                XCAMIF<br />                )<br />   {<br />     ifelse(is.null(XDROP), DADES_S <- XDADES, DADES_S <- XDADES[, setdiff(names(XDADES), XDROP) ])<br />     attach(DADES_S, warn.conflicts = F)<br />     cat("\n Descriptiva de totes les variables seleccionades\n")<br />     print(summary(DADES_S))<br />     for (XVARNOMT in names(DADES_S))<br />       {<br />         if (is.factor (get(XVD) ) )<br />           {<br />             if ( is.factor(get(XVARNOMT)) )<br />               {<br />                 UNI_VDQVIQ (XVD=get(XVD), XVDT=XVD, XVARNOM=get(XVARNOMT), XVARNOMT=XVARNOMT, XCAMIF=XCAMIF)<br />               }<br />             else if( is.numeric(get(XVARNOMT)))<br />               {<br />                 cat("\nVD=Qualitativa i VI=Numèrica: UNI_VDQVIN\n")<br />                 cat("\nPer fer \n")<br />               }<br />           }<br />         else if (is.numeric(get(XVD) ) & is.null(XSPV) ) # VD Num però no temps<br />           {<br />             if ( is.factor(get(XVARNOMT)) )<br />               {<br />                 cat("\nVD=Numèrica i VI=Qualitativa: UNI_VDNVIQ\n")<br />                 cat("\nPer fer \n")<br />               }<br />             else if( is.numeric(get(XVARNOMT)))<br />               {<br />                 cat("\nVD=Numèrica i VI=Numèrica: UNI_VDNVIN\n")<br />                 cat("\nPer fer \n")<br />               }<br />           }<br /> <br />         else if (is.numeric(get(XVD) ) & !is.null(XSPV) ) # VD Num de temps: SPV<br />           {<br />             if ( is.factor(get(XVARNOMT)) )<br />               {<br />                 cat("\nVD=Temps i VI=Qualitativa: UNI_VDTVIQ\n")<br />                 cat("\nPer fer \n")<br />               }<br />             else if( is.numeric(get(XVARNOMT)))<br />               {<br />                 cat("\nVD=Temps i VI=Numèrica: UNI_VDTVIN\n")<br />                 cat("\nPer fer \n")<br />               }<br />           }<br />         else<br />           {<br />             MISSATGE = c("Les variable ", XVD, " i ", XVARNOMT, " no són de cap dels tipus coneguts", sep="")<br />             select.list(MISSATGE,title="Atenció", preselect=MISSATGE)<br />           }<br />       }<br />     # Fi de la funció<br />     detach(DADES_S)<br />     cat("\n\bFi de la funció des.r \n")<br />   }<br /> ##--------------------------------------------------------------<br /> ## UNI_VDQVIQ: Análisis univarido Var Dep: Quali Var indep: quali<br /> ##--------------------------------------------------------------<br /> UNI_VDQVIQ = function(XVD, XVDT, XVARNOM, XVARNOMT, XCAMIF)<br />   {<br />     cat ("*** Entra de uni_vdqviq.r ******************************** \n\n")<br />     source("<a href="http://web.udl.es/Biomath/Bioestadistica/R/Instalacio/FuncionsAuxiliars.r" target="_blank">http://web.udl.es/Biomath/Bioestadistica/R/Instalacio/FuncionsAuxiliars.r</a>", local = F, echo=TRUE, encoding = "unknown")<br />     # CrossTabsMod(get(XVD), get(XVARNOM), digits = 2, chisq = T, row = T, expected = T)<br />     CrossTabs(get(XVDT), XVARNOM, digits = 2, chisq = T, row = T, expected = T)<br />     # Oportunitats relatives i IC <a href="http://www.ats.ucla.edu/stat/r/dae/logit.htm" target="_blank">http://www.ats.ucla.edu/stat/r/dae/logit.htm</a><br />     REG_LOG <- glm(XVD ~ XVARNOM, family = "binomial")<br />     print(exp(cbind("Oportunitat Relativa" = coef(REG_LOG), confint(REG_LOG))))<br />     # Valors de p<br />     cat ("\n\nValors de p de les oportunitats relatives (regressió logística):\n")<br />     print(summary(REG_LOG)$coef[, "Pr(>|z|)"])  ## will extract them<br />     cat ("\n\n*** Surt de un_ivdqviq.r ******************************** \n\n")<br />   }<br /> <br /> ##--------------------------------------------------------------<br /> ## Pruebas : comentado con una función<br /> ##--------------------------------------------------------------<br /> function()<br /> {<br /> library(MASS)<br /> data(birthwt, package="MASS")<br /> birthwt$low  <- factor(birthwt$low)<br /> birthwt$race <- factor(birthwt$race)<br /> <br /> # Descriptiva<br /> DESUNI(XDADES=birthwt, XVD=NULL)<br /> <br /> # Análisis univariado con var dependiente qualitativa (factor)<br /> DESUNI(XDADES=birthwt, XVD="low")<br /> <br /> }<br /> =Fin de funciones =======================================<br /> <br /> Muchas gracias por la ayuda y saludos!<br /><div><div><br /> <br /> > Hola Giera,<br /> ><br /> > Sí, puedes hacer lo mismo con "R" usando como te decía funciones que ya generan de forma automática estos estadísticos. La parte de las relaciones bivariadas, puede dar un poco más de trabajo pero luego las funciones para representar los boxplots o las tablas cruzadas y los diferentes test igualmente se hacen de forma muy compacta.<br /> ><br /> > Así, de primeras, yo como atacaría este problema sería:<br /> ><br /> > * Hacer un "summary()" de tu data.frame. De este resultado (no sé si conoces "summary()" )tienes una gran parte de los estadísticos básicos de cada variable. Hay otra función "fivenum()" que genera los cinco estadísticos básicos para un conjunto, aunque salvo por el contenido de "NAs" es casi lo mismo que devuelve "summary()".<br /> ><br /> > * Puedes de forma automática, detectar el tipo de variable que contiene cada columna (si es factor/categórica o si es numérica con la función "class()" ) y crear las relaciones bivariadas.<br /> ><br /> > * Para las numéricas, puedes hacerlo todas de forma cruzada con la función "pairs()".<br /> > * Para las categóricas, puedes ciclar (cada una de ellas para cada numérica) aunque creo que "pairs()" también hace esto de forma automática.<br /> ><br /> > * Quedaría simplemente pensar en los diferentes tests que quieres lanzar, pero seguro que hay alguna librería (además de la que se incluye por defecto "stats") que los implementa.<br /> ><br /> > Sobre el cómo....mejor si me pasas un ejemplo de aplicación lo damos un poco de forma...<br /> ><br /> > Saludos,<br /> ><br /> > Carlos.<br /> ></div></div></blockquote></div><br /><br /><br />-- <br /><div><span style="font-family:verdana,sans-serif;">Saludos,</span><br style="font-family:verdana,sans-serif;" /> <span style="font-family:verdana,sans-serif;">Carlos Ortega</span><br style="font-family:verdana,sans-serif;" /> <span style="font-family:verdana,sans-serif;"><a href="http://www.qualityexcellence.es/" target="_blank">www.qualityexcellence.es</a></span></div></div></blockquote>