[R-es] Conservar el nombre de la variable entre varias funciones: ejemplos de resultados: solucionado
Griera
griera en yandex.com
Mie Jul 15 20:26:46 CEST 2015
Hola:
On Wed, 15 Jul 2015 00:18:32 +0200
Carlos Ortega <cof en qualityexcellence.es> wrote:
[borro]
> Sobre la duda de los nombres, si le pasas el data.frame tal cual, te
> debiera de conservar los nombres.
Tienes razón. Ahora le paso el nombre del data.frame, y ya muestra el nombre de la variable analizada.
Muchas gracias por la sugerencia.
Saludos!
> Si no es así, pásale como argumento adicional a las funciones los nombres
> de las columnas/variables...
>
> Saludos,
> Carlos.
>
>
> El 14 de julio de 2015, 22:49, Griera <griera en yandex.com> escribió:
>
> > Hola Carlos:
> >
> > Te adjunto un ejemplo de aplicación: las funciones (he borrado los path de
> > las funciones y las ordenes "source()" que las carga ) y un ejemplo para
> > ejecutarlas para las opciones que tengo implementadas con la tabla de datos
> > birthwt del paquete"MASS":
> > - Descriptiva de todas las variables de una tabla.
> > - Análisis univariado de todas las variables de una tabla cruzadas con una
> > variable dependiente cualitativa.
> >
> > =Inicio funciones ========================================
> > ##--------------------------------------------------------------
> > ## DESUNI
> > ##--------------------------------------------------------------
> > DESUNI = function(XDADES,
> > XDROP=NULL,
> > XVD=NULL,
> > XSPV=NULL # Si és una anàlisi de SPV # Pot tenir el
> > valor TRUE
> > )
> > {
> > options(digits = 3, OutDec=",", scipen=999)
> > ## No existeix VD: descriptiva
> > if(is.null(XVD)) # No existeix VD: descriptiva
> > {
> > cat("\n*** Descriptiva (no existeix variable dependent)\n")
> > DES(XDADES=XDADES, XDROP=XDROP,
> > XCAMIF=XCAMIF)
> > }
> > ## Existeis VD: anàlisi univariat
> > else # Existeis VD: anàlisi univariat
> > {
> > UNI(XDADES=XDADES, XDROP=XDROP, XVD=XVD, XSPV=XSPV,
> > XCAMIF=XCAMIF)
> > }
> > }
> >
> > ##--------------------------------------------------------------
> > ## DES: Descriptiva de todas las variables
> > ##--------------------------------------------------------------
> > DES = function(XDADES, XDROP=NULL,
> > XCAMIF)
> > {
> > ifelse(is.null(XDROP), DADES_S <- XDADES, DADES_S <- XDADES[,
> > setdiff(names(XDADES), XDROP) ]) # setdiff Selecciona les variables de
> > XDADES que són diferents de XDROP
> > attach(DADES_S, warn.conflicts = F)
> > XVARLLI=names(DADES_S)
> > for (XVARNOM in names(DADES_S))
> > {
> > if(is.numeric(get(XVARNOM)))
> > {
> > DES_QUANTI (XVARNOM)
> > }
> > else if(is.factor(get(XVARNOM)))
> > {
> > DES_QUALI (XVARNOM)
> > }
> > else
> > {
> > cat("La variable ", XVARNOM, "no és de cap dels tipus coneguts",
> > "\n")
> > }
> > }
> > # Fi de la funció
> > detach(DADES_S)
> > }
> > ##--------------------------------------------------------------
> > ## DES_QUANTI: Descriptiva variables factor
> > ##--------------------------------------------------------------
> > DES_QUANTI <-
> > function(X) {
> > OP <- par(no.readonly = TRUE); # save old parameters
> > par(mfrow=c(1,3))
> > hist(get(X), main=c("Histograma de", X), xlab=X);rug(get(X))
> > boxplot(get(X), main=c("Diagrama de caixa de", X),
> > ylab=X);rug(get(X),side=2)
> > qqnorm(get(X), main=c("Diagrama Q-Q de", X));qqline(get(X))
> > cat("\n")
> > par(OP)
> > ESTA_1<-data.frame(Variable = X,
> > N_total = length(get(X)),
> > N_valids = sum(!is.na(get(X))),
> > N_desconeguts = sum(is.na(get(X)))
> > )
> > ESTA_2<-data.frame(Variable = X,
> > N = sum(!is.na(get(X))),
> > Mitjana = if (mean(get(X) > 10))
> > {round(mean(get(X), na.rm = TRUE), 2)} else {round(mean(get(X), na.rm =
> > TRUE), 3)},
> > Err_tipic = if (sd (get(X) > 10)) {round(sd
> > (get(X), na.rm = TRUE), 2)} else {round(sd (get(X), na.rm = TRUE), 3)},
> > Min = min(get(X), na.rm = TRUE),
> > Perc_25 = quantile(get(X),.25),
> > Mediana = median(get(X), na.rm = TRUE),
> > Perc_75 = quantile(get(X),.75),
> > Max = max(get(X), na.rm = TRUE),
> > Interval = max(get(X), na.rm = TRUE) - min(get(X),
> > na.rm = TRUE)
> > )
> > cat("----------------------------", "\n")
> > cat("Valors valids i desconeguts", "\n")
> > print(ESTA_1, row.names = FALSE)
> > cat("----------------------------", "\n")
> > cat("Estadistics", "\n")
> > print(ESTA_2, row.names = FALSE)
> > cat("----------------------------", "\n")
> > return(summary(get(X)))
> > }
> > ##--------------------------------------------------------------
> > ## DES_QUALI: Descriptiva variables factor
> > ##--------------------------------------------------------------
> > DES_QUALI <- function(X)
> > {
> > cat("Var factor: ",X,"\n")
> > XOUT <- as.data.frame(table(get(X)))
> > names(XOUT)[1] = X
> > XOUT <- transform(XOUT, cumFreq = cumsum(Freq), Percentatge =
> > prop.table(Freq))
> > print(XOUT)
> > print("-----------------------------------------------------")
> > }
> > ##--------------------------------------------------------------
> > ## UNI: Análisis univarido
> > ##--------------------------------------------------------------
> > UNI = function(XDADES, XDROP=NULL,
> > XVD,
> > XSPV=NULL, # Si és una anàlisi de SPV
> > XCAMIF
> > )
> > {
> > ifelse(is.null(XDROP), DADES_S <- XDADES, DADES_S <- XDADES[,
> > setdiff(names(XDADES), XDROP) ])
> > attach(DADES_S, warn.conflicts = F)
> > cat("\n Descriptiva de totes les variables seleccionades\n")
> > print(summary(DADES_S))
> > for (XVARNOMT in names(DADES_S))
> > {
> > if (is.factor (get(XVD) ) )
> > {
> > if ( is.factor(get(XVARNOMT)) )
> > {
> > UNI_VDQVIQ (XVD=get(XVD), XVDT=XVD, XVARNOM=get(XVARNOMT),
> > XVARNOMT=XVARNOMT, XCAMIF=XCAMIF)
> > }
> > else if( is.numeric(get(XVARNOMT)))
> > {
> > cat("\nVD=Qualitativa i VI=Numèrica: UNI_VDQVIN\n")
> > cat("\nPer fer \n")
> > }
> > }
> > else if (is.numeric(get(XVD) ) & is.null(XSPV) ) # VD Num però no
> > temps
> > {
> > if ( is.factor(get(XVARNOMT)) )
> > {
> > cat("\nVD=Numèrica i VI=Qualitativa: UNI_VDNVIQ\n")
> > cat("\nPer fer \n")
> > }
> > else if( is.numeric(get(XVARNOMT)))
> > {
> > cat("\nVD=Numèrica i VI=Numèrica: UNI_VDNVIN\n")
> > cat("\nPer fer \n")
> > }
> > }
> >
> > else if (is.numeric(get(XVD) ) & !is.null(XSPV) ) # VD Num de
> > temps: SPV
> > {
> > if ( is.factor(get(XVARNOMT)) )
> > {
> > cat("\nVD=Temps i VI=Qualitativa: UNI_VDTVIQ\n")
> > cat("\nPer fer \n")
> > }
> > else if( is.numeric(get(XVARNOMT)))
> > {
> > cat("\nVD=Temps i VI=Numèrica: UNI_VDTVIN\n")
> > cat("\nPer fer \n")
> > }
> > }
> > else
> > {
> > MISSATGE = c("Les variable ", XVD, " i ", XVARNOMT, " no són
> > de cap dels tipus coneguts", sep="")
> > select.list(MISSATGE,title="Atenció", preselect=MISSATGE)
> > }
> > }
> > # Fi de la funció
> > detach(DADES_S)
> > cat("\n\bFi de la funció des.r \n")
> > }
> > ##--------------------------------------------------------------
> > ## UNI_VDQVIQ: Análisis univarido Var Dep: Quali Var indep: quali
> > ##--------------------------------------------------------------
> > UNI_VDQVIQ = function(XVD, XVDT, XVARNOM, XVARNOMT, XCAMIF)
> > {
> > cat ("*** Entra de uni_vdqviq.r ******************************** \n\n")
> > source("
> > http://web.udl.es/Biomath/Bioestadistica/R/Instalacio/FuncionsAuxiliars.r",
> > local = F, echo=TRUE, encoding = "unknown")
> > # CrossTabsMod(get(XVD), get(XVARNOM), digits = 2, chisq = T, row = T,
> > expected = T)
> > CrossTabs(get(XVDT), XVARNOM, digits = 2, chisq = T, row = T, expected
> > = T)
> > # Oportunitats relatives i IC
> > http://www.ats.ucla.edu/stat/r/dae/logit.htm
> > REG_LOG <- glm(XVD ~ XVARNOM, family = "binomial")
> > print(exp(cbind("Oportunitat Relativa" = coef(REG_LOG),
> > confint(REG_LOG))))
> > # Valors de p
> > cat ("\n\nValors de p de les oportunitats relatives (regressió
> > logística):\n")
> > print(summary(REG_LOG)$coef[, "Pr(>|z|)"]) ## will extract them
> > cat ("\n\n*** Surt de un_ivdqviq.r ********************************
> > \n\n")
> > }
> >
> > ##--------------------------------------------------------------
> > ## Pruebas : comentado con una función
> > ##--------------------------------------------------------------
> > function()
> > {
> > library(MASS)
> > data(birthwt, package="MASS")
> > birthwt$low <- factor(birthwt$low)
> > birthwt$race <- factor(birthwt$race)
> >
> > # Descriptiva
> > DESUNI(XDADES=birthwt, XVD=NULL)
> >
> > # Análisis univariado con var dependiente qualitativa (factor)
> > DESUNI(XDADES=birthwt, XVD="low")
> >
> > }
> > =Fin de funciones =======================================
> >
> > Muchas gracias por la ayuda y saludos!
> >
> >
> > > Hola Giera,
> > >
> > > Sí, puedes hacer lo mismo con "R" usando como te decía funciones que ya
> > generan de forma automática estos estadísticos. La parte de las relaciones
> > bivariadas, puede dar un poco más de trabajo pero luego las funciones para
> > representar los boxplots o las tablas cruzadas y los diferentes test
> > igualmente se hacen de forma muy compacta.
> > >
> > > Así, de primeras, yo como atacaría este problema sería:
> > >
> > > * Hacer un "summary()" de tu data.frame. De este resultado (no sé si
> > conoces "summary()" )tienes una gran parte de los estadísticos básicos de
> > cada variable. Hay otra función "fivenum()" que genera los cinco
> > estadísticos básicos para un conjunto, aunque salvo por el contenido de
> > "NAs" es casi lo mismo que devuelve "summary()".
> > >
> > > * Puedes de forma automática, detectar el tipo de variable que contiene
> > cada columna (si es factor/categórica o si es numérica con la función
> > "class()" ) y crear las relaciones bivariadas.
> > >
> > > * Para las numéricas, puedes hacerlo todas de forma cruzada con la
> > función "pairs()".
> > > * Para las categóricas, puedes ciclar (cada una de ellas para cada
> > numérica) aunque creo que "pairs()" también hace esto de forma automática.
> > >
> > > * Quedaría simplemente pensar en los diferentes tests que quieres
> > lanzar, pero seguro que hay alguna librería (además de la que se incluye
> > por defecto "stats") que los implementa.
> > >
> > > Sobre el cómo....mejor si me pasas un ejemplo de aplicación lo damos un
> > poco de forma...
> > >
> > > Saludos,
> > >
> > > Carlos.
> > >
> >
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
Más información sobre la lista de distribución R-help-es