Kelan koronamittarit ja lääkesovellus

open data
kela
covid19
data
Tekijä

Markus Kainu

Julkaistu

30. marraskuuta 2020

Tauti on vaivannut Suomessa ja ulkomailla alkuvuodesta saakka, eikä loppua ole näköpiirissä. Kevään kuukausina internet oli pullollaan erilaisia tartuntadataa visualisoivia sovelluksia, mutta paras pöhinä on jo laantunut. Itse bloggasin THL-koronadatarajapinnoista maaliskuussa ja silloin julkaisemani SARS-Cov-2 -tapausten aikasarjat sairaanhoitopiireittäin -näkymä on päivittinyt joka päivä siitä lähtien, kiitos THL:n datan ja rajapinnan.

Korona on vaikuttanut myös työhöni Kelassa ja julkaisin tutkimusyksikön kollegoitteni kanssa kaksi koronan vaikutuksia seuraavaa verkkosivua.

koronamittarit.kela.fi-palvelussa havainnollistetaan päivä-, viikko- ja kuukausitason analyyseillä korona-aikana tapahtuneita muutoksia Kelan etuuksien hakemisessa, etuuksien saajien määrissä sekä Kelan asiakaspalvelun toiminnassa. Sivusto päivittyy automaattisesti joka arkipäivä klo. 10.

Reseptilääkkeiden ostot ATC-luokittain-verkkosovelluksessa puolestaan seurataan lääkkeiden kulutusta ATC-luokittain sekä sairaanhoitopiirien että koko Suomen tasolla.

Molemmat sivustot tarjoavat suurpiirteisten analyysien ohella avointa dataa. Koronamittareiden datan on kuvattu sivustolla ja ovat ladattavissa Github:sta. Datat päivittyvät joka arkipäivä. Lääkesovelluksen datat löytyvät myös Github:sta.

Datojen käytössä pääset alkuun kokeilemalla R-kielellä tehtyjä esimerkkejä: koronamittaridatasta ja lääkedatasta. Voit esimerkiksi luoda tilin rstudio.cloud:iin ja kopioida em. esimerkkikoodit sinne ja alkaa ihmetellä! Alla yksi esimerkki!

</>
library(dplyr)
library(readr)
library(forcats)
cols(
  etuus = col_character(),
  vuosi = col_integer(),
  aikatyyppi = col_character(),
  kuukausi = col_integer(),
  viikko = col_integer(),
  paiva = col_date(),
  viikonpaiva = col_character(),
  alue = col_character(),
  ikaluokka = col_character(),
  sukupuoli = col_character(),
  saapuneet_hakemukset = col_double(),
  updated = col_datetime()
) -> data_cols

dat <- readr::read_csv("https://raw.githubusercontent.com/kelaresearchandanalytics/koronamittarit/master/docs/data/data_etuudet.csv", 
                       col_types = data_cols) %>% 
  # releveloidaan ikäluokka
  mutate(ikaluokka = factor(ikaluokka),
         ikaluokka = fct_relevel(ikaluokka, c("kaikki","alle 25"))) %>% 
  # Etuuksien järjestys
  mutate(etuus = factor(etuus, levels = c("Työttömyysturva",
                                          "Yrittäjien työmarkkinatuki",
                                          "Yleinen asumistuki", 
                                          "Perustoimeentulotuki",
                                          "Sairauspäiväraha",
                                          "Tartuntatautipäiväraha",
                                          "Epidemiatuki")),
         vuosi = factor(vuosi)) %>% 
  arrange(etuus,viikko,paiva)
head(dat)
# A tibble: 6 × 19
  etuus    vuosi aikat…¹ kuuka…² viikko paiva      viiko…³ alue  ikalu…⁴ sukup…⁵
  <fct>    <fct> <chr>     <int>  <int> <date>     <chr>   <chr> <fct>   <chr>  
1 Työttöm… 2020  paiva         1      1 2020-01-01 keskiv… Koko… kaikki  kaikki 
2 Työttöm… 2020  paiva         1      1 2020-01-02 torstai Koko… kaikki  kaikki 
3 Työttöm… 2020  paiva         1      1 2020-01-03 perjan… Koko… kaikki  kaikki 
4 Työttöm… 2020  paiva         1      1 2020-01-04 lauant… Koko… kaikki  kaikki 
5 Työttöm… 2020  paiva         1      1 2020-01-05 sunnun… Koko… kaikki  kaikki 
6 Työttöm… 2021  paiva         1      1 2021-01-04 maanan… Koko… kaikki  kaikki 
# … with 9 more variables: saapuneet_hakemukset <dbl>, data <chr>,
#   saajat_kaikki <dbl>, saajat_uudet <dbl>, saajakotitaloudet_kaikki <dbl>,
#   saajakotitaloudet_uudet <dbl>, saajaruokakunnat_kaikki <dbl>,
#   saajaruokakunnat_uudet <dbl>, updated <dttm>, and abbreviated variable
#   names ¹​aikatyyppi, ²​kuukausi, ³​viikonpaiva, ⁴​ikaluokka, ⁵​sukupuoli
</>
library(ggplot2)
datplot <- dat %>% 
  dplyr::filter(aikatyyppi == "viikko",
         ikaluokka == "kaikki",
         sukupuoli == "kaikki",
         alue == "Koko Suomi") %>% 
  mutate(viikko = as.integer(viikko))

ggplot(datplot, 
       aes(x = viikko, 
           y = saapuneet_hakemukset, 
           color = vuosi, 
           fill = vuosi)) +
  geom_line() +
  geom_point(shape = 21, color = "white", size = 1.6,  show.legend = FALSE) +
  facet_wrap(~etuus, ncol = 1, scales = "free_y") +
  scale_x_continuous(breaks = 1:max(datplot$viikko)) +
        labs(fill = NULL, 
             color = NULL, 
             y = NULL,
             title = "Hakemustilanne viikottain",
             subtitle = "Kelaan viikon aikana saapuneet hakemukset",
             x = "Viikko") +
  theme_light() +
        theme(legend.position = "right", 
              legend.direction = "vertical",
              panel.grid.minor = element_blank()) +
        scale_y_continuous(labels = function(x) format(x, big.mark = " ",
                                                       scientific = FALSE),
                           limits = c(0,NA))

Uudelleenkäyttö

CC BY 4.0

Viittaus

BibTeX-viittaus:
@online{kainu,
  author = {Markus Kainu and Markus Kainu},
  title = {Kelan koronamittarit ja lääkesovellus},
  date = {},
  url = {https://markuskainu.fi/posts/2020-11-30-kelan-koronamittarit-ja-laakesovellus},
  langid = {fi}
}
Viitatkaa tähän teokseen seuraavasti:
Markus Kainu, and Markus Kainu. n.d. “Kelan koronamittarit ja lääkesovellus.” https://markuskainu.fi/posts/2020-11-30-kelan-koronamittarit-ja-laakesovellus.