Kesän 2017 kaupunkifillaridata: osa 1 - Data

Categories: data analysis

Kesäksi 2017 kaupunkifillariverkosto laajeni kattamaan jo 150 asemaa Helsingissä ja Espoossa. Kun pyörät tuokokuussa ilmestyivät kadulle, kirjoitin ohjelman, joka haki viiden minuutin välein kunkin telineen vapaiden pyörien määrän api.digitransit.fi-rajapinnasta ja kerrytti sitä aina marraskuuhun saakka.

Dataa kertyi kaikenkaikkiaan 7 788 841 riviä yhteensä 52 769 uniikilta ajankohdalta. Datassa ei ole tietoa matkoista, vaan ainoastaan kunkin telineen vapaiden pyörien ja vapaiden telinepaikkojen määrästä.

Data on saatavilla osoitteessa: https://gitlab.com/muuankarski/kaupunkifillari_data/

Alle on poimittu kolme satunnaista riviä datasta.

##                name        x        y bikesAvailable spacesAvailable
## 1   Haukilahdenkatu 24.96767 60.19853              9               9
## 2 Friisinkalliontie 24.72491 60.16897             14               2
## 3       Koskelantie 24.94651 60.20875              1              13
##   allowDropoff realTimeData                time
## 1         TRUE         TRUE 2017-07-04 11:25:02
## 2         TRUE         TRUE 2017-10-20 11:25:03
## 3         TRUE         TRUE 2017-11-03 20:05:03

Kukin rivi datassa kertoo telineen nimen (name), sijainnin (x & y), telineessä olevien pyörien määrän (bikesAvailable) sekä telineen vapaiden paikkojen määrän (spacesAvailable). Lisäsin sarakkeeseen time kulloisenkin latausajankohdan kellonajan ja päivämäärän.

Poimin alla olevaan taulukkoon muutaman yksityiskohdan raakadatasta.

## # A tibble: 8 x 2
##   asia                          arvo               
##   <chr>                         <chr>              
## 1 tapauksia                     7788841            
## 2 muuttujia                     9                  
## 3 datan keräys alkoi            2017-05-08 13:56:23
## 4 datan keräys päättyi          2017-11-11 09:05:03
## 5 uniikkeja ajanhetkiä          52769              
## 6 pienin vapaiden pyörien määrä 0                  
## 7 suurin vapaiden pyörien määrä 228                
## 8 telineitä järjestelmässä      151

Datan käsittely

Datasta puuttuu aseman kapasiteetti eli kuinka monta paikkaa siinä kokonaisuudessaan on. Olen tässä analyysissä se on laskettu mediaanina muuttujasta spacesAvailable niiltä hetkiltä kuin teline on ollut tyhjänä.

Telineiden kapasiteetit vaihtelivat kauden kuluessa. Vaihtelusta osa lienee virheellisiä mittauksia ja osa oikeita muutoksia telineiden kapasiteeteissa. Alla kapasiteetiltaan kolme suurinta ja pienintä asemaa:

## # A tibble: 6 x 3
##   name           kunta    kapasiteetti
##   <chr>          <chr>           <dbl>
## 1 Erottaja       Helsinki           42
## 2 Narinkka       Helsinki           40
## 3 Veturitori     Helsinki           40
## 4 Sepetlahdentie Espoo              10
## 5 Niemenmäenkuja Helsinki            8
## 6 Professorintie Helsinki            8

Kaiken kaikkiaan 151 telineessä oli siis 2977 paikkaa. Paremman käsityksen telineverkostosta saa oheisesta kartasta, jossa pisteen koko on suhteessa telineen kapasiteettiin.

Datan käsittely jatkoanalyysejä varten

Kuvassa on järjestelmän yhteenlaskettu vapaiden pyörien ja vapaiden paikkojen määrä viiden minuutin välein koko keräysjaksolta. Kuvasta voi nähdä ensinnäkin sen, että lokakuusta eteenpäin vaihtelu vähenee ja kuun lopulla pyörien kerääminen talvisäilöön näkyy vapaiden paikkojen nopeana lisääntymisenä.

Kuvassa näkyy myös muutamia hetkiä, jolloin datassa koko järjestelmän vapaiden paikkojen määrä on ollut nolla. Alla olevassa kuvassa data on rajattu alkamaan maanantaista 15. toukokuuta ja päättymään sunnuntaihin 24. syyskuuta.

Ohjeet raakadatan lataamiseen täällä: https://gitlab.com/muuankarski/kaupunkifillari_data/

See also