Vasaloppet 2019: split rankings i.e. stage results

Categories: data analysis
Introduction Vasaloppet 2019 was raced yesterday from Sälen to Mora with near 16000 participants. The official result service does a decent job in delivering what the folks want to know from their race. However, there are few thing missing and I thougt to address some on our way back to Finland. In this post I will focus on splits and present results for each splits/stage to answer questions like who was fastest between Risberg and Evertsberg?

Read More →

Quality of Government instituutin 2019 data ja rqog-paketin päivitys

Categories: research data
a.sourceLine { display: inline-block; line-height: 1.25; } a.sourceLine { pointer-events: none; color: inherit; text-decoration: inherit; } a.sourceLine:empty { height: 1.2em; } .sourceCode { overflow: visible; } code.sourceCode { white-space: pre; position: relative; } div.sourceCode { margin: 1em 0; } pre.sourceCode { margin: 0; } @media screen { div.sourceCode { overflow: auto; } } @media print { code.sourceCode { white-space: pre-wrap; } a.sourceLine { text-indent: -1em; padding-left: 1em; } } pre.

Read More →

Pikainen ja likainen analyysi Jukolan tuloksista

Categories: data analysis
Jukolan viesti juostiin viikko sitten Hollolassa ja voiton vei Koovee Tampereelta. Tein aikaisemmin keväällä pienen analyysin 10milaviestin etenemisestä ja tässä saman koodin päälle vastaava analyysi Jukolan viestin etenemisestä kymmenen parhaan joukkueen osalta. Koodi on R-kieltä löysästi ja huolimattomasti kirjoitettuna. Jos et jaksa kahlata koodia läpi ja haluat nähdä vain parhaan kuvan klikkaa: paras kuva! Data Jukolan tulospalvelusta saa datan xml-muodossa tästä http://online.jukola.com/tulokset/results_j2018_ju.xml linkistä. Sen rakenteen ymmärtäminen ja prosessoiminen vaatii hetken ajattelua, mutta alla on koodi joka tekee sen puolestasi

Read More →

Kesän 2017 kaupunkifillaridata: osa 2 - Käyttö

Categories: data analysis
Lataa lähdekoodi Edellisessä blogissa kävin läpi kesän aika kaupunkifillarijärjestelmän telineistä kertynyttä dataa ja tässä katson tarkemmin sitä missä ja milloin pyöriä käytettiin. Raakadatassa oli tieto telineessä vapaana olevista paikoista sekä telineen vapaista pyöristä. Laskin edellisessä postauksessa kullekin telineelle lisäksi niiden kapasiteetin. Kapasiteetista ja vapaiden paikkojen määrästä voidaan laskea järjestelmän sekä kunkin telineen käyttöaste. Järjestelmän käyttöaste Ensimmäisessä analyysissä on laskettu koko järjestelmän käyttöaste kunakin viikonpäivänä siten, että kukin viikko on eri värillä.

Read More →

Kesän 2017 kaupunkifillaridata: osa 1 - Data

Categories: data analysis
Lataa lähdekoodi Kesäksi 2017 kaupunkifillariverkosto laajeni kattamaan jo 150 asemaa Helsingissä ja Espoossa. Kun pyörät tuokokuussa ilmestyivät kadulle, kirjoitin ohjelman, joka haki viiden minuutin välein kunkin telineen vapaiden pyörien määrän api.digitransit.fi-rajapinnasta ja kerrytti sitä aina marraskuuhun saakka. Dataa kertyi kaikenkaikkiaan 7 788 841 riviä yhteensä 52 769 uniikilta ajankohdalta. Datassa ei ole tietoa matkoista, vaan ainoastaan kunkin telineen vapaiden pyörien ja vapaiden telinepaikkojen määrästä. Data on saatavilla osoitteessa: https://gitlab.

Read More →

Vasaloppet 2018: start group rankings

Categories: data analysis
In two previous posts I had a look at the rankings at differents splits and the top overtakers. In this brief post I will dig deeper into who were the best of their starting groups. First a graphs showing the winners of each starting group! Below we have a table for each eleven start groups with top 20 skiers from each. For the complete data, probably including yourself, download an Excel file from here with a tab per startgroup!

Read More →