Kesän 2017 kaupunkifillaridata: osa 1 - Data

Luokat: data analysis

Kesäksi 2017 kaupunkifillariverkosto laajeni kattamaan jo 150 asemaa Helsingissä ja Espoossa. Kun pyörät tuokokuussa ilmestyivät kadulle, kirjoitin ohjelman, joka haki viiden minuutin välein kunkin telineen vapaiden pyörien määrän api.digitransit.fi-rajapinnasta ja kerrytti sitä aina marraskuuhun saakka.

Dataa kertyi kaikenkaikkiaan 7 788 841 riviä yhteensä 52 769 uniikilta ajankohdalta. Datassa ei ole tietoa matkoista, vaan ainoastaan kunkin telineen vapaiden pyörien ja vapaiden telinepaikkojen määrästä.

Data on saatavilla osoitteessa: https://gitlab.com/muuankarski/kaupunkifillari_data/

Alle on poimittu kolme satunnaista riviä datasta.

##           name        x        y bikesAvailable spacesAvailable allowDropoff
## 1 Kriikunakuja 24.89168 60.20568             17               2         TRUE
## 2   Töölöntori 24.92498 60.17914              6              10         TRUE
## 3   Eläinmuseo 24.93187 60.17135              6              14         TRUE
##   realTimeData                time
## 1         TRUE 2017-08-26 13:20:03
## 2         TRUE 2017-06-01 04:00:02
## 3         TRUE 2017-06-18 20:20:02

Kukin rivi datassa kertoo telineen nimen (name), sijainnin (x & y), telineessä olevien pyörien määrän (bikesAvailable) sekä telineen vapaiden paikkojen määrän (spacesAvailable). Lisäsin sarakkeeseen time kulloisenkin latausajankohdan kellonajan ja päivämäärän.

Poimin alla olevaan taulukkoon muutaman yksityiskohdan raakadatasta.

## # A tibble: 8 x 2
##   asia                          arvo               
##   <chr>                         <chr>              
## 1 tapauksia                     7788841            
## 2 muuttujia                     9                  
## 3 datan keräys alkoi            2017-05-08 13:56:23
## 4 datan keräys päättyi          2017-11-11 09:05:03
## 5 uniikkeja ajanhetkiä          52769              
## 6 pienin vapaiden pyörien määrä 0                  
## 7 suurin vapaiden pyörien määrä 228                
## 8 telineitä järjestelmässä      151

Datan käsittely

Datasta puuttuu aseman kapasiteetti eli kuinka monta paikkaa siinä kokonaisuudessaan on. Olen tässä analyysissä se on laskettu mediaanina muuttujasta spacesAvailable niiltä hetkiltä kuin teline on ollut tyhjänä.

Telineiden kapasiteetit vaihtelivat kauden kuluessa. Vaihtelusta osa lienee virheellisiä mittauksia ja osa oikeita muutoksia telineiden kapasiteeteissa. Alla kapasiteetiltaan kolme suurinta ja pienintä asemaa:

## # A tibble: 6 x 3
##   name           kunta    kapasiteetti
##   <chr>          <chr>           <dbl>
## 1 Erottaja       Helsinki           42
## 2 Narinkka       Helsinki           40
## 3 Veturitori     Helsinki           40
## 4 Sepetlahdentie Espoo              10
## 5 Niemenmäenkuja Helsinki            8
## 6 Professorintie Helsinki            8

Kaiken kaikkiaan 151 telineessä oli siis 2977 paikkaa. Paremman käsityksen telineverkostosta saa oheisesta kartasta, jossa pisteen koko on suhteessa telineen kapasiteettiin.

Datan käsittely jatkoanalyysejä varten

Kuvassa on järjestelmän yhteenlaskettu vapaiden pyörien ja vapaiden paikkojen määrä viiden minuutin välein koko keräysjaksolta. Kuvasta voi nähdä ensinnäkin sen, että lokakuusta eteenpäin vaihtelu vähenee ja kuun lopulla pyörien kerääminen talvisäilöön näkyy vapaiden paikkojen nopeana lisääntymisenä.

Kuvassa näkyy myös muutamia hetkiä, jolloin datassa koko järjestelmän vapaiden paikkojen määrä on ollut nolla. Alla olevassa kuvassa data on rajattu alkamaan maanantaista 15. toukokuuta ja päättymään sunnuntaihin 24. syyskuuta.

Ohjeet raakadatan lataamiseen täällä: https://gitlab.com/muuankarski/kaupunkifillari_data/

Katso myös