Linkkejä seminaarissa pitämääni esitykseen
Perhevapaavertailu
Kelan avoin data
hyödyntäviä sovelluksia
kelaopendata-esimerkki
library (kelaopendata)
library (dplyr)
dsets <- list_datasets ()
print (dsets, n = 50 )
# A tibble: 25 × 3
modified name id
<date> <chr> <chr>
1 2024-08-26 voimassa-olleet-alkaneet-ja-paattyneet-laakekorvausoikeudet 7083…
2 2024-08-20 kelan-maksaman-perustoimeentulotuen-menot-ja-palautukset 4b64…
3 2024-08-15 kuntien-rahoittama-tyomarkkinatuki 970f…
4 2024-08-15 maksetut-yleiset-asumistuet1 f80f…
5 2024-08-15 kelan-maksamat-elake-etuudet 341d…
6 2024-08-15 maksetut-takuuelakkeet 17cd…
7 2024-08-15 suomen-tyokyvyttomyyselakkeensaajat-sairauden-mukaan 8be0…
8 2024-08-15 etuuksien-ratkaisut 3fec…
9 2024-08-15 perustoimeentulotuen-saajat af7a…
10 2024-08-15 takuuelakkeen-saajat-ja-keskimaaraiset-elakkeet 53d5…
11 2024-08-15 suomen-elakkeensaajat-ja-keskimaaraiset-elakkeet e88d…
12 2024-08-15 sairauspaivarahojen-saajat-ja-maksetut-etuudet-sairauspaary… a2ce…
13 2024-08-15 kelan-elake-etuuden-saajat-ja-keskimaaraiset-etuudet 8df7…
14 2024-08-15 perustoimeentulotuen-saajakotitaloudet 802e…
15 2024-08-15 sairauspaivarahojen-saajat-ja-maksetut-etuudet-diagnooseitt… dd43…
16 2024-08-15 vanhempainpaivarahojen-saajat-ja-maksetut-etuudet fcec…
17 2024-08-15 tyomarkkinatuen-saajat-tukipaivien-kertyman-ja-korvausperus… 06fc…
18 2024-08-15 kelan-tyottomyysetuudet-korvausperusteen-mukaan 3080…
19 2024-08-15 kelan-tyottomyysetuuksien-saajat-kuukauden-lopussa 4378…
20 2024-08-15 kunnan-osarahoittaman-tyomarkkinatuen-saajat-ja-maksetut-et… 5dd6…
21 2024-08-15 koulumatkatuen-saajat-ja-maksetut-tuet 3937…
22 2024-08-15 opintotuen-saajat-ja-maksetut-tuet 6c4d…
23 2024-08-15 kelan-etuuksien-saajat-ja-maksetut-etuudet 9af3…
24 2024-08-15 sairaanhoitokorvausten-saajat-ja-maksetut-korvaukset 2236…
25 2023-06-19 helsingin-seudun-sairastavuusindeksi 06f6…
Valitaan sitten uusimman datan id ja poimitaan data kokonaisuudessaan.
id <- dsets[1 ,]$ id # valitaan eka id
koko_aineisto <- get_data_csv (data_id = id)
koko_aineisto
# A tibble: 1,550,463 × 13
aikatyyppi vuosi hyvinvointialue_nro hyvinvointialue_nimi ikaryhma sukupuoli
<chr> <dbl> <chr> <chr> <chr> <chr>
1 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
2 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
3 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
4 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
5 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
6 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
7 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
8 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
9 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
10 Vuosi 2017 19 Pohjois-Pohjanmaa 10-14 Mies
# ℹ 1,550,453 more rows
# ℹ 7 more variables: korvausoikeus_koodi <dbl>, korvausoikeus_selite <chr>,
# alkanut_lkm <dbl>, kokovuosi_lkm <dbl>, kuolema_lkm <dbl>,
# voimassaolleet_lkm <dbl>, vuodenlopussa_lkm <dbl>
Korvausoikeuksia on datassa kaikkiaan 361.
koko_aineisto %>%
count (korvausoikeus_selite)
# A tibble: 361 × 2
korvausoikeus_selite n
<chr> <int>
1 101 Aivolisäkkeen etulohkon vajaatoiminta 25601
2 102 Vesitystauti 15664
3 103 Diabetes, insuliinihoito 36266
4 104 Kilpirauhasen vajaatoiminta 34288
5 105 Lisämunuaisten kuorikerroksen vajaatoiminta 20383
6 106 Lisäkilpirauhasten vajaatoiminta 19439
7 107 Pernisiöösi anemia ja muut B12-vitamiinin imeytymishäiriöt 26072
8 108 Myasthenia gravis 16362
9 109 MS-tauti 20581
10 110 Parkinsonin tauti ja siihen verrattavat liikehäiriöt 23211
# ℹ 351 more rows
Valitaan niistä 103 Diabetes, insuliinihoito
ja 331 Atomoksetiini, deksamfetamiini, guanfasiini ja lisdeksamfetamiini
, ja piirretään siitä hyvinvointialueiset aikasarjat vuosittain koko ajanjaksolta.
Ryhmitellään datan vuoden ja hyvinvointialueen mukaan ja yhteenlasketaan korvausoikeuksien määrä.
diabetes <- koko_aineisto %>%
filter (korvausoikeus_selite %in% c ("103 Diabetes, insuliinihoito" ,
"331 Atomoksetiini, deksamfetamiini, guanfasiini ja lisdeksamfetamiini" )) %>%
group_by (vuosi,hyvinvointialue_nimi,hyvinvointialue_nro,korvausoikeus_selite) %>%
summarise (vuodenlopussa_lkm = sum (vuodenlopussa_lkm, na.rm = TRUE )) %>%
ungroup ()
Sitten piirretään aikasarjakuva ggplot2:lla.
library (ggplot2)
ggplot (diabetes,
aes (x = vuosi, y =
vuodenlopussa_lkm,
color = hyvinvointialue_nimi,
label = hyvinvointialue_nimi)) +
geom_line () +
theme (legend.position = "none" ) +
geom_text (data = diabetes %>% filter (vuosi == 2023 ), hjust = 2 ) +
facet_wrap (~ korvausoikeus_selite, scales = "free_y" ) +
labs (title = "Erityiskorvausoikeudet vuoden lopussa hyvinvointialueittain" ,
caption = "Kelan avoin data" )
Viittaus BibTeX-viittaus:
@online{kainu2024,
author = {Kainu, Markus},
title = {R User and developer meeting - Open social data},
date = {2024-08-27},
url = {https://markuskainu.fi/posts/2024-05-30-diak-karttasovellus/},
langid = {fi}
}
Viitatkaa tähän teokseen seuraavasti:
Kainu, Markus. 2024.
“R User and developer meeting - Open social
data.” August 27, 2024.
https://markuskainu.fi/posts/2024-05-30-diak-karttasovellus/ .