[R-es] Tasa variación diaria COVID-19

Jorge Pradas jorpr@mo @end|ng |rom gm@||@com
Mie Mar 25 12:45:38 CET 2020


Hola,
Aqui tenéis un dataset completo que actualizan todos los días con datos de
provincias de todo el mundo. hay además varios proyectos que se llevan en
marcha para explotar los datos.
https://www.kaggle.com/imdevskp/corona-virus-report

y aqui muchos más datos sobre todo de España y muchas aplicaciones hechas
ya sobre esos datos.
https://github.com/datadista/datasets/tree/master/COVID%2019


El mié., 25 mar. 2020 a las 9:55, Manuel Mendoza (<
mmendoza using fulbrightmail.org>) escribió:

> Gracias Ruben, muy interesante. Algo así estuve buscando, por ciudades y a
> nivel internacional, pero no lo encontré. Me bastaría con el número de
> fallecimientos por día, de cuantas más ciudades del mundo mejor. Si alguno
> supiera de algo así, le agradecería que me lo comunicase.
> Un saludo,
> Manuel
>
> El mar., 24 mar. 2020 a las 21:04, Rubén Fernández Casal (<
> rubenfcasal using gmail.com>) escribió:
>
> > Hola a todos,
> >
> > Aprovecho para comentaros que estuve preparando un repositorio en GitHub
> (
> > https://github.com/rubenfcasal/COVID-19) para facilitar el acceso a los
> > datos oficiales del COVID-19 por CCAA. Principalmente para los que pueden
> > estar interesados en analizarlos empleando R (web:
> > https://rubenfcasal.github.io/COVID-19), pero también puede ser de
> > utilidad
> > simplemente para consultarlos (tablas:
> > https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html).
> >
> > Gracias a vuestros mensajes pude descargarme un fichero pdf que me
> faltaba
> > y también me animé a ponerlo en github por si puede resultar de
> interés...
> >
> > Un saludo, Rubén.
> >
> > El lun., 23 mar. 2020 a las 3:13, Javier Gómez Gonzalez (<
> > zaragatan using gmail.com>) escribió:
> >
> > >  Muchas gracias a todos por su ayuda.
> > >
> > > Hace un rato antes de abrir el correo, he encontrado dos soluciones a
> mi
> > > problema de como calcular el porcentaje de variación.
> > > La primera es usando el paquete dplyr:
> > >
> > >
> >
> https://stackoverflow.com/questions/48196552/calculate-percentage-change-in-r-using-dplyr/48196871
> > >
> > > La segunda usando la función PercChange del paquete DataCombine
> > > https://rdrr.io/cran/DataCombine/man/PercChange.html
> > >
> > >
> > > El dom., 22 mar. 2020 a las 23:51, Carlos Ortega (<
> > > cof using qualityexcellence.es>)
> > > escribió:
> > >
> > > > Hola,
> > > >
> > > > Te sale error porque has cargado el fichero con read.csv().
> > > > Si pruebas a cargarlo con "fread()" tus datos tendrán clase
> data.table.
> > > > El error que obtienes es porque el objeto df (igual que datos) no es
> un
> > > > data.table.
> > > >
> > > > Saludos,
> > > > Carlos Ortega
> > > > www.qualityexcellence.es
> > > >
> > > > El dom., 22 mar. 2020 a las 22:45, Javier Marcuzzi (<
> > > > javier.ruben.marcuzzi using gmail.com>) escribió:
> > > >
> > > > > Eric
> > > > >
> > > > > ¿Que dataset utilizo? Por curiosidad probé su código, pero me salen
> > > > > errores. Copio y pego todo como me sale en la consola.
> > > > >
> > > > > > #
> > > > >
> > > > >
> > > >
> > >
> >
> https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv
> > > > > > datos <-
> > > > > read.csv("C:/Users/HP/Downloads/time-series-19-covid-combined.csv")
> > > > > >
> > > > > > library(data.table)
> > > > > > library(ggplot2)
> > > > > > library(anytime)
> > > > > >
> > > > > > df <-datos
> > > > > >
> > > > > > df[, fec:=anytime(fec)]
> > > > > Error in `:=`(fec, anytime(fec)) :
> > > > >   Check that is.data.table(DT) == TRUE. Otherwise, := and `:=`(...)
> > are
> > > > > defined for use in j, once only and in particular ways. See
> > help(":=").
> > > > > > setkey(df,com,fec)
> > > > > Error in setkeyv(x, cols, verbose = verbose, physical = physical) :
> > > > >   x is not a data.table
> > > > > >
> > > > > > # newc: son los nuevos casos
> > > > > > df[, newc:=ct - shift(ct), by=.(com)]
> > > > > Error in `[.data.frame`(df, , `:=`(newc, ct - shift(ct)), by =
> > .(com))
> > > :
> > > > >   unused argument (by = .(com))
> > > > > >
> > > > > > # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > > > > >
> > > > > > df[, tasa:=newc/ct, by=.(com)]
> > > > > Error in `[.data.frame`(df, , `:=`(tasa, newc/ct), by = .(com)) :
> > > > >   unused argument (by = .(com))
> > > > >
> > > > > El dom., 22 mar. 2020 a las 16:52, neo (<ericconchamunoz using gmail.com
> >)
> > > > > escribió:
> > > > >
> > > > > > Hola Javier, yo lo hice de la siguiente forma:
> > > > > >
> > > > > > library(data.table)
> > > > > > library(ggplot2)
> > > > > > library(anytime)
> > > > > >
> > > > > > df <- fread("/home/neo/Desktop/rhelp/spain.csv")
> > > > > > df[, fec:=anytime(fec)]
> > > > > > setkey(df,com,fec)
> > > > > >
> > > > > >      # newc: son los nuevos casos
> > > > > > df[, newc:=ct - shift(ct), by=.(com)]
> > > > > >
> > > > > >      # tasa: es la tasa de cambio que calculé así (ct2 - ct1)/ct1
> > > > > >
> > > > > > df[, tasa:=newc/ct, by=.(com)]
> > > > > >
> > > > > >
> > > > > > y obtuve lo siguiente:
> > > > > >
> > > > > >
> > > > > >                     fec       com     pob ct newc tasa
> > > > > > 1: 2020-04-02 23:00:00 Andalucía 8414240 13 NA          NA
> > > > > > 2: 2020-05-02 23:00:00 Andalucía 8414240 12   -1 -0.08333333
> > > > > > 3: 2020-06-02 23:00:00 Andalucía 8414240 21    9 0.42857143
> > > > > > 4: 2020-04-02 23:00:00    Aragón 1319291  0 NA          NA
> > > > > > 5: 2020-05-02 23:00:00    Aragón 1319291  1    1 1.00000000
> > > > > > 6: 2020-06-02 23:00:00    Aragón 1319291  6    5 0.83333333
> > > > > > 7: 2020-04-02 23:00:00  Asturias 1022800  2 NA          NA
> > > > > > 8: 2020-05-02 23:00:00  Asturias 1022800  5    3 0.60000000
> > > > > > 9: 2020-06-02 23:00:00  Asturias 1022800  5    0 0.00000000
> > > > > >
> > > > > > Espero que te sirva.
> > > > > >
> > > > > > Saludos !!
> > > > > >
> > > > > > Eric.
> > > > > >
> > > > > >
> > > > > >
> > > > > >
> > > > > > On 21-03-20 14:42, Javier Gómez Gonzalez wrote:
> > > > > > > Hola:
> > > > > > >
> > > > > > > Tengo los datos diarios del número de casos de coronavirus por
> > > > > > comunidades
> > > > > > > autónomas y quiero calcular el número diario de nuevos casos y
> la
> > > > tasa
> > > > > > > diaria de variación del número de casos y no se como hacerlo en
> > R.
> > > > > > >
> > > > > > > *fecha*
> > > > > > >
> > > > > > > *comunidad*
> > > > > > >
> > > > > > > *poblacion*
> > > > > > >
> > > > > > > *casos_totales*
> > > > > > >
> > > > > > > 04/03/2020
> > > > > > >
> > > > > > > Andalucía
> > > > > > >
> > > > > > > 8414240
> > > > > > >
> > > > > > > 13
> > > > > > >
> > > > > > > 05/03/2020
> > > > > > >
> > > > > > > Andalucía
> > > > > > >
> > > > > > > 8414240
> > > > > > >
> > > > > > > 12
> > > > > > >
> > > > > > > 06/03/2020
> > > > > > >
> > > > > > > Andalucía
> > > > > > >
> > > > > > > 8414240
> > > > > > >
> > > > > > > 21
> > > > > > >
> > > > > > > 04/03/2020
> > > > > > >
> > > > > > > Aragón
> > > > > > >
> > > > > > > 1319291
> > > > > > >
> > > > > > > 0
> > > > > > >
> > > > > > > 05/03/2020
> > > > > > >
> > > > > > > Aragón
> > > > > > >
> > > > > > > 1319291
> > > > > > >
> > > > > > > 1
> > > > > > >
> > > > > > > 06/03/2020
> > > > > > >
> > > > > > > Aragón
> > > > > > >
> > > > > > > 1319291
> > > > > > >
> > > > > > > 6
> > > > > > >
> > > > > > > 04/03/2020
> > > > > > >
> > > > > > > Asturias
> > > > > > >
> > > > > > > 1022800
> > > > > > >
> > > > > > > 2
> > > > > > >
> > > > > > > 05/03/2020
> > > > > > >
> > > > > > > Asturias
> > > > > > >
> > > > > > > 1022800
> > > > > > >
> > > > > > > 5
> > > > > > >
> > > > > > > 06/03/2020
> > > > > > >
> > > > > > > Asturias
> > > > > > >
> > > > > > > 1022800
> > > > > > >
> > > > > > > 5
> > > > > > >
> > > > > > > Gracias
> > > > > > >
> > > > > > >       [[alternative HTML version deleted]]
> > > > > > >
> > > > > > > _______________________________________________
> > > > > > > R-help-es mailing list
> > > > > > > R-help-es using r-project.org
> > > > > > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> > > > > >
> > > > > >         [[alternative HTML version deleted]]
> > > > > >
> > > > > > _______________________________________________
> > > > > > R-help-es mailing list
> > > > > > R-help-es using r-project.org
> > > > > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> > > > > >
> > > > >
> > > > >         [[alternative HTML version deleted]]
> > > > >
> > > > > _______________________________________________
> > > > > R-help-es mailing list
> > > > > R-help-es using r-project.org
> > > > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> > > > >
> > > >
> > > >
> > > > --
> > > > Saludos,
> > > > Carlos Ortega
> > > > www.qualityexcellence.es
> > > >
> > > >         [[alternative HTML version deleted]]
> > > >
> > > > _______________________________________________
> > > > R-help-es mailing list
> > > > R-help-es using r-project.org
> > > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> > > >
> > >
> > >         [[alternative HTML version deleted]]
> > >
> > > _______________________________________________
> > > R-help-es mailing list
> > > R-help-es using r-project.org
> > > https://stat.ethz.ch/mailman/listinfo/r-help-es
> > >
> >
> >
> > --
> >
> > Rubén Fernández Casal
> > Dep. Matemáticas
> > UDC
> >
> >         [[alternative HTML version deleted]]
> >
> > _______________________________________________
> > R-help-es mailing list
> > R-help-es using r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es using r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es