[R-es] Crear variable con condiciones

Javier Rubén Marcuzzi javier.ruben.marcuzzi en gmail.com
Mie Oct 21 23:35:58 CEST 2015


Estimado Jorge I Velez

Le envío un código, la primer parte es lo que tiene, la segunda lo que desea, a ambos los puse en un mismo data.frame (originales), luego agrego la idea de quitar un elemento en otra columna y lo sumo a todo esto en un nuevo data.frame.

A este nuevo data.frame (mis_datos) le ejecuto una función para contar, creo que en su caso no hay problemas para escribir la función que realiza la tarea que usted necesita.

Ejecute el siguiente código y creo que entenderá cuál es mi idea para su problema

## entrada
datain <- structure(list(REF = c("999", "999", "999", "1099", "731", "731", "731", "731", "1442", "1442", "1442", "1442"),
                         TIMEREF = c(120,240, 360, 30, 30, 60, 90, 120, 30, 60, 90, 120),
                         TOENDREF = c(390,270, 150, 480, 480, 450, 420, 390, 480, 450, 420, 390)),
                      .Names = c("REF","TIMEREF", "TOENDREF"),row.names = c(NA, 12L), class = "data.frame")
datain

## salida
dataout <- structure(list(REF = c(999L, 999L, 999L, 1099L, 731L, 731L, 731L, 731L, 1442L, 1442L, 1442L, 1442L),
                          TIMEREF = c(120L, 240L, 360L,30L, 30L, 60L, 90L, 120L, 30L, 60L, 90L, 120L),
                          TOENDREF = c(390L, 270L, 150L, 120L, 90L, 30L, 420L, 300L, 270L, 210L, 120L, 0L),
                          NEWREF = c(999L, 999L, 999L, 999L, 999L, 999L, 731L, 731L, 731L, 731L, 731L, 731L)),
                     .Names = c("REF", "TIMEREF", "TOENDREF", "NEWREF"), row.names = c(NA, 12L), class = "data.frame")
dataout

originales <- data.frame(datain, dataout)
originales

aux0 <- originales$TOENDREF
#
# primer elemento 0
# luego todos menos el ultimo
# este es eliminado posición lenght(aux0)
aux <- c(0,(aux0[-(length(aux0))]))

mis_datos <- data.frame(originales, aux)
mis_datos
cuento<-do.call(rbind, by(mis_datos, mis_datos$REF, function(x) cbind(1:nrow(x)))) 

Básicamente modificando cuento <- ….. podría solucionarlo (creo).

Javier Rubén Marcuzzi
Técnico en Industrias Lácteas
Veterinario



De: Javier Rubén Marcuzzi
Enviado: miércoles, 21 de octubre de 2015 15:25
Para: Jorge I Velez
CC: R-help-es
Asunto: RE: [R-es] Crear variable con condiciones


Estimado Jorge I Velez

Recién llego y leo los correos mientras me acuesto a descansar un rato, puede ser que no alcance a razonarlo bien, pero posiblemente por la resolución a un problema parecido, lo que yo use es la creación de una nueva columna y se la agregue al mismo data.frame, pero a esta nueva columna, que es una lista copia de los originales pero le quite el primero y le agregue un valor al final (para que los n sean iguales, creo que usted tendría que realizar lo contrario), luego utilicé una función porque habría algo de proceso, pero básicamente con un if pueda decidir si utilizar una columna o la otra ( TOENDREF O TOENDREF_modificada, todos corridos una fila hacia abajo).

Tendría que probarlo, pero seguro que usted lo realiza mas rápido y seguro (cansado no debo escribir R).

Javier Rubén Marcuzzi
Técnico en Industrias Lácteas
Veterinario



De: Jorge I Velez
Enviado: miércoles, 21 de octubre de 2015 10:26
Para: Javier Rubén Marcuzzi
CC: R-help-es
Asunto: Re: [R-es] Crear variable con condiciones


Muchas gracias Javier por tu respuesta.

Si. Para obtener "dataout" se utilizan filas anteriores de acuerdo con la disponibilidad de la variable TOENDREF para cada valor de la variable REF.  Por ejemplo, las filas 3 y 4 de "datain" son

#REF TIMEREF TOENDREF
#3  999     360      150
#4 1099      30      480

En la fila 3, el valor de TOENDREF es 150. Esto indica que hay 150 unidades disponibles de esa referencia. Ahora, en la fila 4, TIMEREF es 30 para REF = 1099.  Como en esta fila TIMEREF es menor que TOENDREF para la referencia anterior, entonces la nueva variable NEWREF debe ser 999 y no 1099.  El nuevo valor de TOENDREF en esta fila sera 150 - 30 = 120.  Esta seria la fila 4 de "dataout":

REF TIMEREF TOENDREF NEWREF
#4  1099      30      120    999

Para la fila 5 de "dataout", los recursos disponibles corresponden al _nuevo_ valor de TOENDREF en NEWREF (i.e., 120).  Siguiendo la misma logica anterior, obtenemos entonces las filas 5 a 12 de "dataout":

REF TIMEREF TOENDREF NEWREF
#5   731      30       90    999
#6   731      60       30    999
#7   731      90      420    731
#8   731     120      300    731
#9  1442      30      270    731
#10 1442      60      210    731
#11 1442      90      120    731
#12 1442     120        0    731

Observa que en la ultima fila se agotaron todos los recursos de TOENDREF para NEWREF = 731, por lo que no fue necesario utilizar la REF = 1442.

Espero que esta vez las cosas sean un poco mas claras.

Los datos se pueden agrupar por la variable REF, que basicamente se refiere a la referencia de un producto.  Si aun tengo disponibilidad de ese producto (variable TOENDREF) entonces lo utilizo y cancelo la referencia siguiente.  Las unidades que se piden de cada producto corresponden a la variable TIMEREF.

Gracias a todos de antemano por sus sugerencias.

Saludos,
Jorge 



	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es