[R-es] Problemas calculo muertes acumuladas mundo COVID-19 dplyr
Javier Gómez Gonzalez
z@r@g@t@n @end|ng |rom gm@||@com
Dom Mayo 3 20:39:06 CEST 2020
Hola a todos:
Tengo problemas para calcular los casos acumulados y las muertes acumuladas
para el mundo a partir de los datos diarios por paises de casos y muertes
Los datos los estoy descargando del European Centre for Disease Prevention
and Control
library(utils)
library(httr)
GET("https://opendata.ecdc.europa.eu/covid19/casedistribution/csv",
authenticate(":", ":", type="ntlm"), write_disk(tf <- tempfile(fileext
= ".csv")))
# Creamos un dataframe con los datos descargados
datos <- read.csv(tf)
El ejemplo es para el 01-05-2020
Lo que estoy haciendo es lo siguiente:
# Calculamos las muertes acumuladas y los casos acumulados por países
names(mundo)
mundo_1 <- mundo %>%
group_by(pais) %>%
mutate(casos_totales=cumsum(casos_dia),
muertes_totales=cumsum(muertes_dia) )%>% ungroup()
# Creamos las variables casos dia, casos totales,
# muertes dia y muertes totales por fecha
mundo_2 <- mundo_1 %>%
group_by(fecha) %>%
summarise(casos_dia=sum(casos_dia),
casos_totales=sum(casos_totales,na.rm=T),
muertes_dia=sum(muertes_dia),
muertes_totales=sum(muertes_totales)) %>% ungroup()
Y el problema que tengo es que para el 30-04-2020 los valores acumulados
son menores que para el 29-04-2020
* fecha*
*casos_dia*
*casos_totales*
*muertes_dia*
*muertes_totales*
*123*
2020-05-01
83466
3213554
5519
232563
*122*
2020-04-30
76380
*2917171*
*6412*
202769
*121*
2020-04-29
72977
3053708
6513
220632
*120*
2020-04-28
65432
2980731
4897
214119
*119*
2020-04-27
83536
2915299
3926
209222
*118*
2020-04-26
101716
2831763
6249
205296
Muchas gracias
[[alternative HTML version deleted]]
Más información sobre la lista de distribución R-help-es