[R-es] Problemas calculo muertes acumuladas mundo COVID-19 dplyr

Marcelino de la Cruz Rot m@rce||no@de|@cruz @end|ng |rom urjc@e@
Dom Mayo 3 21:01:44 CEST 2020


Hola Javier:

Igual te resulta más fácil así:

mundo <-aggregate(datos$deaths, by=list(factor(datos$day)), FUN=sum)

mundo$suma_acumulada<- cumsum(mundo$x)

mundo


Un saludo,

Marcelino


El 03/05/2020 a las 20:39, Javier Gómez Gonzalez escribió:
> Hola a todos:
> Tengo problemas para calcular los casos acumulados y las muertes acumuladas
> para el mundo a partir de los datos diarios por paises de casos y muertes
> Los datos los estoy descargando del European Centre for Disease Prevention
> and Control
>
> library(utils)
> library(httr)
> GET("https://opendata.ecdc.europa.eu/covid19/casedistribution/csv",
>      authenticate(":", ":", type="ntlm"), write_disk(tf <- tempfile(fileext
> = ".csv")))
>
> # Creamos un dataframe con los datos descargados
> datos <- read.csv(tf)
>
> El ejemplo es para el 01-05-2020
> Lo que estoy haciendo es lo siguiente:
>
> # Calculamos las muertes acumuladas y los casos acumulados por países
> names(mundo)
> mundo_1 <- mundo %>%
>    group_by(pais) %>%
>    mutate(casos_totales=cumsum(casos_dia),
>             muertes_totales=cumsum(muertes_dia) )%>% ungroup()
>
> # Creamos las variables casos dia, casos totales,
> # muertes dia y muertes totales por fecha
> mundo_2 <- mundo_1 %>%
>    group_by(fecha) %>%
>    summarise(casos_dia=sum(casos_dia),
>              casos_totales=sum(casos_totales,na.rm=T),
>              muertes_dia=sum(muertes_dia),
>              muertes_totales=sum(muertes_totales)) %>% ungroup()
>
> Y el  problema que tengo es que para el 30-04-2020 los valores acumulados
> son menores que para el 29-04-2020
>
>
> * fecha*
>
> *casos_dia*
>
> *casos_totales*
>
> *muertes_dia*
>
> *muertes_totales*
>
> *123*
>
> 2020-05-01
>
> 83466
>
> 3213554
>
> 5519
>
> 232563
>
> *122*
>
> 2020-04-30
>
> 76380
>
> *2917171*
>
> *6412*
>
> 202769
>
> *121*
>
> 2020-04-29
>
> 72977
>
> 3053708
>
> 6513
>
> 220632
>
> *120*
>
> 2020-04-28
>
> 65432
>
> 2980731
>
> 4897
>
> 214119
>
> *119*
>
> 2020-04-27
>
> 83536
>
> 2915299
>
> 3926
>
> 209222
>
> *118*
>
> 2020-04-26
>
> 101716
>
> 2831763
>
> 6249
>
> 205296
>
>
>
> Muchas gracias
>
> 	[[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> .


-- 
Marcelino de la Cruz Rot
Depto. de Biología y Geología
Física y Química Inorgánica
Universidad Rey Juan Carlos
Móstoles España



Más información sobre la lista de distribución R-help-es