Pikainen ja likainen analyysi Jukolan tuloksista

Categories: data analysis
Jukolan viesti juostiin viikko sitten Hollolassa ja voiton vei Koovee Tampereelta. Tein aikaisemmin keväällä pienen analyysin 10milaviestin etenemisestä ja tässä saman koodin päälle vastaava analyysi Jukolan viestin etenemisestä kymmenen parhaan joukkueen osalta. Koodi on R-kieltä löysästi ja huolimattomasti kirjoitettuna. Jos et jaksa kahlata koodia läpi ja haluat nähdä vain parhaan kuvan klikkaa: paras kuva! Data Jukolan tulospalvelusta saa datan xml-muodossa tästä http://online.jukola.com/tulokset/results_j2018_ju.xml linkistä. Sen rakenteen ymmärtäminen ja prosessoiminen vaatii hetken ajattelua, mutta alla on koodi joka tekee sen puolestasi

Read More →

Kesän 2017 kaupunkifillaridata: osa 2 - Käyttö

Categories: data analysis
Lataa lähdekoodi Edellisessä blogissa kävin läpi kesän aika kaupunkifillarijärjestelmän telineistä kertynyttä dataa ja tässä katson tarkemmin sitä missä ja milloin pyöriä käytettiin. Raakadatassa oli tieto telineessä vapaana olevista paikoista sekä telineen vapaista pyöristä. Laskin edellisessä postauksessa kullekin telineelle lisäksi niiden kapasiteetin. Kapasiteetista ja vapaiden paikkojen määrästä voidaan laskea järjestelmän sekä kunkin telineen käyttöaste. Järjestelmän käyttöaste Ensimmäisessä analyysissä on laskettu koko järjestelmän käyttöaste kunakin viikonpäivänä siten, että kukin viikko on eri värillä.

Read More →

Kesän 2017 kaupunkifillaridata: osa 1 - Data

Categories: data analysis
Lataa lähdekoodi Kesäksi 2017 kaupunkifillariverkosto laajeni kattamaan jo 150 asemaa Helsingissä ja Espoossa. Kun pyörät tuokokuussa ilmestyivät kadulle, kirjoitin ohjelman, joka haki viiden minuutin välein kunkin telineen vapaiden pyörien määrän api.digitransit.fi-rajapinnasta ja kerrytti sitä aina marraskuuhun saakka. Dataa kertyi kaikenkaikkiaan 7 788 841 riviä yhteensä 52 769 uniikilta ajankohdalta. Datassa ei ole tietoa matkoista, vaan ainoastaan kunkin telineen vapaiden pyörien ja vapaiden telinepaikkojen määrästä. Data on saatavilla osoitteessa: https://gitlab.

Read More →

Vasaloppet 2018: start group rankings

Categories: data analysis
In two previous posts I had a look at the rankings at differents splits and the top overtakers. In this brief post I will dig deeper into who were the best of their starting groups. First a graphs showing the winners of each starting group! Below we have a table for each eleven start groups with top 20 skiers from each. For the complete data, probably including yourself, download an Excel file from here with a tab per startgroup!

Read More →

Vasaloppet 2018: number of overtakes between splits

Categories: data analysis
Introduction In post I am still focusing on splits, but instead of skiing times I am ranking skiers based on number of overtakes per split. I looked at the split rankings i.e. stage results in a post from yesterday, but soon realized that a lot more important measure of success is the number of overtakes one did. From the same data this is pretty easy to dig out. As there were no placement information from prewarning I have dropped the stage off from the analysis meaning that the last table shows the overtakes between Eldris and Finish.

Read More →

Vasaloppet 2018: split rankings i.e. stage results

Categories: data analysis
Introduction Vasaloppet 2018 was raced yesterday from Sälen to Mora with near 16000 participants. The official result service does a decent job in delivering what the folks want to know from their race. However, there are few thing missing and I thougt to address some on our way back to Finland. In this post I will focus on splits and present results for each splits/stage to answer questions like who was fastest between Risberg and Evertsberg?

Read More →