Tauti on vaivannut Suomessa ja ulkomailla alkuvuodesta saakka, eikä loppua ole näköpiirissä. Kevään kuukausina internet oli pullollaan erilaisia tartuntadataa visualisoivia sovelluksia, mutta paras pöhinä on jo laantunut. Itse bloggasin THL-koronadatarajapinnoista maaliskuussa ja silloin julkaisemani SARS-Cov-2 -tapausten aikasarjat sairaanhoitopiireittäin -näkymä on päivittinyt joka päivä siitä lähtien, kiitos THL:n datan ja rajapinnan.
Korona on vaikuttanut myös työhöni Kelassa ja julkaisin tutkimusyksikön kollegoitteni kanssa kaksi koronan vaikutuksia seuraavaa verkkosivua.
koronamittarit.kela.fi-palvelussa havainnollistetaan päivä-, viikko- ja kuukausitason analyyseillä korona-aikana tapahtuneita muutoksia Kelan etuuksien hakemisessa, etuuksien saajien määrissä sekä Kelan asiakaspalvelun toiminnassa. Sivusto päivittyy automaattisesti joka arkipäivä klo. 10.
Reseptilääkkeiden ostot ATC-luokittain-verkkosovelluksessa puolestaan seurataan lääkkeiden kulutusta ATC-luokittain sekä sairaanhoitopiirien että koko Suomen tasolla.
Molemmat sivustot tarjoavat suurpiirteisten analyysien ohella avointa dataa. Koronamittareiden datan on kuvattu sivustolla ja ovat ladattavissa Github:sta. Datat päivittyvät joka arkipäivä. Lääkesovelluksen datat löytyvät myös Github:sta.
Datojen käytössä pääset alkuun kokeilemalla R-kielellä tehtyjä esimerkkejä: koronamittaridatasta ja lääkedatasta. Voit esimerkiksi luoda tilin rstudio.cloud:iin ja kopioida em. esimerkkikoodit sinne ja alkaa ihmetellä! Alla yksi esimerkki!
library(dplyr)
library(readr)
library(forcats)
cols(
etuus = col_character(),
vuosi = col_integer(),
aikatyyppi = col_character(),
kuukausi = col_integer(),
viikko = col_integer(),
paiva = col_date(),
viikonpaiva = col_character(),
alue = col_character(),
ikaluokka = col_character(),
sukupuoli = col_character(),
saapuneet_hakemukset = col_double(),
updated = col_datetime()
-> data_cols
)
<- readr::read_csv("https://raw.githubusercontent.com/kelaresearchandanalytics/koronamittarit/master/docs/data/data_etuudet.csv",
dat col_types = data_cols) %>%
# releveloidaan ikäluokka
mutate(ikaluokka = factor(ikaluokka),
ikaluokka = fct_relevel(ikaluokka, c("kaikki","alle 25"))) %>%
# Etuuksien järjestys
mutate(etuus = factor(etuus, levels = c("Työttömyysturva",
"Yrittäjien työmarkkinatuki",
"Yleinen asumistuki",
"Perustoimeentulotuki",
"Sairauspäiväraha",
"Tartuntatautipäiväraha",
"Epidemiatuki")),
vuosi = factor(vuosi)) %>%
arrange(etuus,viikko,paiva)
head(dat)
## # A tibble: 6 × 19
## etuus vuosi aikatyyppi kuukausi viikko paiva viikonpaiva alue ikaluokka
## <fct> <fct> <chr> <int> <int> <date> <chr> <chr> <fct>
## 1 Tyött… 2020 paiva 1 1 2020-01-01 keskiviikko Koko… kaikki
## 2 Tyött… 2020 paiva 1 1 2020-01-02 torstai Koko… kaikki
## 3 Tyött… 2020 paiva 1 1 2020-01-03 perjantai Koko… kaikki
## 4 Tyött… 2020 paiva 1 1 2020-01-04 lauantai Koko… kaikki
## 5 Tyött… 2020 paiva 1 1 2020-01-05 sunnuntai Koko… kaikki
## 6 Tyött… 2021 paiva 1 1 2021-01-04 maanantai Koko… kaikki
## # … with 10 more variables: sukupuoli <chr>, saapuneet_hakemukset <dbl>,
## # data <chr>, saajat_kaikki <dbl>, saajat_uudet <dbl>,
## # saajakotitaloudet_kaikki <dbl>, saajakotitaloudet_uudet <dbl>,
## # saajaruokakunnat_kaikki <dbl>, saajaruokakunnat_uudet <dbl>, updated <dttm>
library(ggplot2)
<- dat %>%
datplot ::filter(aikatyyppi == "viikko",
dplyr== "kaikki",
ikaluokka == "kaikki",
sukupuoli == "Koko Suomi") %>%
alue mutate(viikko = as.integer(viikko))
ggplot(datplot,
aes(x = viikko,
y = saapuneet_hakemukset,
color = vuosi,
fill = vuosi)) +
geom_line() +
geom_point(shape = 21, color = "white", size = 1.6, show.legend = FALSE) +
facet_wrap(~etuus, ncol = 1, scales = "free_y") +
scale_x_continuous(breaks = 1:max(datplot$viikko)) +
labs(fill = NULL,
color = NULL,
y = NULL,
title = "Hakemustilanne viikottain",
subtitle = "Kelaan viikon aikana saapuneet hakemukset",
x = "Viikko") +
theme_light() +
theme(legend.position = "right",
legend.direction = "vertical",
panel.grid.minor = element_blank()) +
scale_y_continuous(labels = function(x) format(x, big.mark = " ",
scientific = FALSE),
limits = c(0,NA))
Katso myös
- THL:n avoin koronavirusdata ja sairaanhoitopiirikohtainen .svg-dashboard
- Tellinkiappi-sovellus kaupunkifillarisysteemin reaaliaikaiseen seuraamiseen
- Digiloikka ja korona-ajan GPS-kisat - gpx-reittiin vauhtia R-kielen avulla
- Avointa kaupunkipyörädataa - Open bikeshare data
- Kesän 2017 kaupunkifillaridata: osa 2 - Käyttö