Quality of Government instituutin 2019 data ja rqog-paketin päivitys

Luokat: research data

Göteborgin yliopiston Quality of Government instituutti julkisti kuun vaihteessa uudet datansa. Datat ovat kattavia kokoelmia erilaisista maatason indikaattoreista. Päivitin samaan syssyyn ylläpitämäni R-paketin rqog, jonka avulla voit käyttää datoja R:ssä. Paketin voit asentaan Github:sta devtools-paketin avulla komennolla devtools::install_github("ropengov/rqog").

Paketin avulla pääset käsiksi kolmeen datakokonaisuuteen basic, standard ja oecd, joista kaikista on sekä poikkileikkausaineisto (cross-sectional) että aikasarja-aineisto (time-series). Eri datoissa on eri määrä indikaattoreita.

library(rqog)
library(dplyr)
library(glue)
library(ggplot2)
library(hrbrthemes)
tribble(
~data, ~indikaattoreita,
"basic poikkileikkaus",length(unique(rqog::meta_basic_cs_2019$code)),
"basic aikasarja",length(unique(rqog::meta_basic_ts_2019$code)),

"standard poikkileikkaus",length(unique(rqog::meta_std_cs_2019$code)),
"standard aikasarja",length(unique(rqog::meta_std_ts_2019$code)),

"oecd poikkileikkaus",length(unique(rqog::meta_oecd_cs_2019$code)),
"oecd aikasarja",length(unique(rqog::meta_oecd_ts_2019$code))
) %>% knitr::kable()
data indikaattoreita
basic poikkileikkaus 409
basic aikasarja 293
standard poikkileikkaus 1983
standard aikasarja 2199
oecd poikkileikkaus 1116
oecd aikasarja 991

Datojen avulla voi tutkia monenlaisia kysymyksiä kuten vaikka bruttokansantuotteen ja taloudellisen eriarvoisuuden välistä yhteyttä.

Aluksi etsitään sopivat indikaattorit.

meta_oecd_ts_2019 %>% 
  filter(grepl("GDP", name, ignore.case = TRUE))
## # A tibble: 42 x 5
##    code          name                                         value label class 
##    <chr>         <chr>                                        <dbl> <chr> <chr> 
##  1 gle_cgdpc     GDP per Capita (Current Prices)                 NA <NA>  numer…
##  2 gle_gdp       Real GDP (2005)                                 NA <NA>  numer…
##  3 gle_rgdpc     Real GDP per Capita (2005)                      NA <NA>  numer…
##  4 mad_gdppc     Real GDP per Capita                             NA <NA>  numer…
##  5 oecd_evogdp_… Real GDP growth                                 NA <NA>  numer…
##  6 oecd_govdebt… Adjusted general government debt-to-GDP (ex…    NA <NA>  numer…
##  7 oecd_govdebt… Adjusted general government debt-to-GDP (in…    NA <NA>  numer…
##  8 oecd_prodinc… GDP per hour worked                             NA <NA>  numer…
##  9 oecd_prodinc… Levels of GDP per capita & labour productiv…    NA <NA>  numer…
## 10 oecd_prodinc… Levels of GDP per capita & labour productiv…    NA <NA>  numer…
## # … with 32 more rows
meta_oecd_ts_2019 %>% 
  filter(grepl("gini", name, ignore.case = TRUE))
## # A tibble: 1 x 5
##   code     name                             value label class  
##   <chr>    <chr>                            <dbl> <chr> <chr>  
## 1 wdi_gini GINI index (World Bank estimate)    NA <NA>  numeric

Tehdään sitten analyysi piirtämällä “aika-hajontakuvio”, jossa vaaka-akselilla on bruttokansantuote henkilöä kohden (gle_cgdpc) ja pystyakselilla taloudellista eriarvoisuutta kuvaava gini-kerroin (wdi_gini). Valitaan kaikista OECD-maista Pohjoismaat sekä Amerikan Yhdysvallat. Rajataan tarkastelu vuodesta 1980 eteenpäin.

oecd_ts <- rqog::read_qog(which_data = "oecd", year = "2019", data_type = "time-series")
# 
oecd_ts %>% 
  select(cname,year,gle_cgdpc,wdi_gini) %>% 
  filter(year >= 1980,
         cname %in% c("Finland","Denmark","Iceland","Sweden","Norway","United States")) %>% 
  na.omit() %>% 
ggplot(., aes(x = gle_cgdpc, y = wdi_gini, label = year)) +
  geom_point(color = alpha("white", 1/3))  + 
  geom_path(color = alpha("white", 1/3)) + 
  geom_text(size = 3, family = "Roboto Condensed", nudge_y = .1) +
  theme(legend.position = "none") +
  facet_wrap(~cname, scales = "free") +
  geom_smooth(method = "lm", se = FALSE) +
  theme_ft_rc() +
  labs(title = "Bruttokansantuote ja taloudellinen eriarvoisuus \nvalituissa OECD maissa 1990 - 2011", 
       caption = "Data: Quality of Government Instititute 2019")

Jätetään tulkinta lukijalle. Todennäköisesti sekä kysymystä että analyysiä on syytä tarkentaa.

Katso myös