Kesän 2017 kaupunkifillaridata: osa 1 - Data

data analysis
data
kaupunkifillari
cycling
pyöräily
R
dataviz
Tekijä
Julkaistu

9. maaliskuuta 2018

Kesäksi 2017 kaupunkifillariverkosto laajeni kattamaan jo 150 asemaa Helsingissä ja Espoossa. Kun pyörät tuokokuussa ilmestyivät kadulle, kirjoitin ohjelman, joka haki viiden minuutin välein kunkin telineen vapaiden pyörien määrän api.digitransit.fi-rajapinnasta ja kerrytti sitä aina marraskuuhun saakka.

Dataa kertyi kaikenkaikkiaan 7 788 841 riviä yhteensä 52 769 uniikilta ajankohdalta. Datassa ei ole tietoa matkoista, vaan ainoastaan kunkin telineen vapaiden pyörien ja vapaiden telinepaikkojen määrästä.

Data on saatavilla osoitteessa: https://gitlab.com/muuankarski/kaupunkifillari_data/

Alle on poimittu kolme satunnaista riviä datasta.

      name    x    y bikesAvailable spacesAvailable allowDropoff
1 Kansallismuseo 24.93288 60.17394       10        7     TRUE
2  Unioninkatu 24.95100 60.16756       30        2     TRUE
3 Messitytönkatu 24.91587 60.16109       5       13     TRUE
 realTimeData        time
1     TRUE 2017-08-26 22:55:02
2     TRUE 2017-10-10 15:10:03
3     TRUE 2017-10-10 23:15:03

Kukin rivi datassa kertoo telineen nimen (name), sijainnin (x & y), telineessä olevien pyörien määrän (bikesAvailable) sekä telineen vapaiden paikkojen määrän (spacesAvailable). Lisäsin sarakkeeseen time kulloisenkin latausajankohdan kellonajan ja päivämäärän.

Poimin alla olevaan taulukkoon muutaman yksityiskohdan raakadatasta.

# A tibble: 8 × 2
 asia             arvo        
 <chr>             <chr>       
1 tapauksia           7788841      
2 muuttujia           9         
3 datan keräys alkoi      2017-05-08 13:56:23
4 datan keräys päättyi     2017-11-11 09:05:03
5 uniikkeja ajanhetkiä     52769       
6 pienin vapaiden pyörien määrä 0         
7 suurin vapaiden pyörien määrä 228        
8 telineitä järjestelmässä   151        

Datan käsittely

Datasta puuttuu aseman kapasiteetti eli kuinka monta paikkaa siinä kokonaisuudessaan on. Olen tässä analyysissä se on laskettu mediaanina muuttujasta spacesAvailable niiltä hetkiltä kuin teline on ollut tyhjänä.

Telineiden kapasiteetit vaihtelivat kauden kuluessa. Vaihtelusta osa lienee virheellisiä mittauksia ja osa oikeita muutoksia telineiden kapasiteeteissa. Alla kapasiteetiltaan kolme suurinta ja pienintä asemaa:

# A tibble: 6 × 3
 name      kunta  kapasiteetti
 <chr>     <chr>      <dbl>
1 Erottaja    Helsinki      42
2 Narinkka    Helsinki      40
3 Veturitori   Helsinki      40
4 Sepetlahdentie Espoo       10
5 Niemenmäenkuja Helsinki      8
6 Professorintie Helsinki      8

Kaiken kaikkiaan 151 telineessä oli siis 2977 paikkaa. Paremman käsityksen telineverkostosta saa oheisesta kartasta, jossa pisteen koko on suhteessa telineen kapasiteettiin.

Datan käsittely jatkoanalyysejä varten

Kuvassa on järjestelmän yhteenlaskettu vapaiden pyörien ja vapaiden paikkojen määrä viiden minuutin välein koko keräysjaksolta. Kuvasta voi nähdä ensinnäkin sen, että lokakuusta eteenpäin vaihtelu vähenee ja kuun lopulla pyörien kerääminen talvisäilöön näkyy vapaiden paikkojen nopeana lisääntymisenä.

Kuvassa näkyy myös muutamia hetkiä, jolloin datassa koko järjestelmän vapaiden paikkojen määrä on ollut nolla. Alla olevassa kuvassa data on rajattu alkamaan maanantaista 15. toukokuuta ja päättymään sunnuntaihin 24. syyskuuta.

Ohjeet raakadatan lataamiseen täällä: https://gitlab.com/muuankarski/kaupunkifillari_data/

Uudelleenkäyttö

Viittaus

BibTeX-viittaus:
@online{kainu2018,
 author = {Kainu, Markus},
 title = {Kesän 2017 kaupunkifillaridata: osa 1 - Data},
 date = {2018-03-09},
 url = {https://markuskainu.fi/posts/2018-01-25-kaupunkifillaridatan-data/},
 langid = {fi}
}
Viitatkaa tähän teokseen seuraavasti:
Kainu, Markus. 2018. “Kesän 2017 kaupunkifillaridata: osa 1 - Data.” March 9, 2018. https://markuskainu.fi/posts/2018-01-25-kaupunkifillaridatan-data/.