A lentebb található példaelemzés a budapesti MOL Bubi szolgáltatás egy öthónapos időszakát mutatja be. Az adatok a 2015.01.01.-2015.05.31. közötti időszakot fedik le. Ezzel az elemzéssel nem egy minden részletre kiterjedő tanulmány készítése volt a cél, hanem a főbb sarokpontok bemutatásával azt szeretnénk megmutatni, hogy csapatunk milyen eszközöket és lehetőségeket tud kínálni egy elemzés elkészítése során, pl. analitikai vagy adat vizualizációs területen.

Az oldalon található kimutatások a BKK-SZTAKI MOL Bubi Adatelemző Versenyen részt vevő csapatunk elemzése alapján készültek - az elemzés publikálása a BKK Budapesti Közlekedési Központ Zrt. engedélyével történt.

Sűrű elérhetőség a belvárosban

Budapesten a Bubi állomások a belváros területét jellemzően sűrűn fedik le, úgy hogy az állomások kb. 80%-a a pesti oldalon találhatóak meg. A jobb oldali térkép ezen állomások elhelyezkedését mutatja meg, valamint azt is, hogy adott állomás mekkora kapacitással rendelkezik.

Kicsi és közepes méretű állomások

A legnagyobb méretű állomáson 36 biciklit lehet tárolni, míg a legkisebb állomás kapacitása 14 bicikli.

Az átlagos kapacitás: 20 bicikli.

Átlagos kihasználtság

Az állomások egyik legfontosabb jellemzője, hogy ott mekkora a kihasználtság. Jól látható, hogy pár állomást leszámítva az állomások átlagos napi kihasználtsága 50% körüli értéket mutat. Ez az érték jellemzően nem függ attól, hogy hétközi napokat vagy hétvégét vizsgálunk.

Ezzel szemben egyértelmű kapcsolat van a kihasználtság és a hőmérséklet között: a téli hónapokban alacsonyabb az átlagos kihasználtság, mint a tavaszi hónapokban!

Átlagos kölcsönzési idő

Az állomások kihasználtsága szoros kapcsolatban van azoknak az útvonalaknak a forgalmával, amelyeken az adott állomás fekszik. Az útvonalak forgalmát nagyban befolyásolja, hogy átlagosan mennyi időre viszik el a bicikliket. Ennek az eloszlását a bal oldali grafikonon találjuk. Jól látható, hogy nem túl jelentős, de kimutatható különbség van a hétköznapok és a hétvége között, mivel hétvégén átlagosan hosszabb ideig bicikliznek az emberek:

- Míg hétköznap átlagosan 15 percig használják a kölcsönzött bicikliket, addig hétvégén ez az érték 21 perc.

Havi növekedés a kölcsönzési időben

Nem csak a hétköznap-hétvége viszonylatban van különbség az átlagos kölcsönzési időkben, hanem az időjárás viszonylatában is. Jól látható, hogy télen az alacsonyabb hőmérsékletnek köszönhetően rövidebb kölcsönzési idővel számolhatunk, míg tavasszal a jó időnek köszönhetően egyre hosszabb és hosszabb ideig használják a bicikliket.

Melegebb idő - hosszabb és több kölcsönzés

A hőmérséklettel való szoros kapcsolatot a baloldali ábra is megerősíti:

Az átlagos kölcsönzési idő, valamint a kölcsönzések száma szorosan követi a hőmérséklet alakulását.

Mindezek fényében, ha a teljes időszakot nézzük, akkor a legforgalmasabb útvonalak és állomások térképe az alábbiak szerint alakul:

Napszakok, mint tényezők

A hétvége hatása nem csak az utazások hosszában érhető tetten, hanem abban is, hogy egy adott napszakot vizsgálva hogyan oszlik el a bicikli kölcsönzések száma. Míg hétköznap inkább a délelőtti és esti órák az aktívabbak, addig hétvégén inkább a hajnali és délutáni órák azok, amikor arányaiban több kölcsönzés történik.

Az alábbi két gif egy átlagos hétköznapot és egy átlagos hétvéget hasonlít össze. Jól látható, hogy hétvégén a forgalom jobban koncentrálódik a belvárosi állomásokra, míg hétköznap a forgalom jobban eloszlik a teljes hálózaton köszönhetően azoknak a felhasználóknak, akik munkába járásra használják a Bubit (minél zöldebb egy útvonal annál forgalmasabb)

Hétköznap
Hétvége

Az útvonalak rejtett szerkezete

Megvizsgálva az állomásokat összekötő útvonalak struktúráját, akkor ezen kapcsolatok jellegéből további információkat vonhatunk le a teljes hálózat szerkezetét illetően. Lehetőségünk van arra, hogy jól elkülöníthető partíciókra osszuk fel az útvonalak hálózatát. Egy adott partíciót olyan állomások alkotnak, amik egymással valamilyen szempont szerint erősebb kapcsolatban vannak egymással, mint a többiekkel.

Ezek alapján jól látható, ahogy a budai állomások elkülönülnek a pesti oldalon lévőktől, valamint a pesti állomások is három jól elkülönülő területet alkotnak, amik szoros kapcsolatban vannak az állomások földrajzi elhelyezkedésével

A fentebbi zónás felosztást - ami a forgalom és útvonalak kihasználtságának jellegéből fakad - feltűntethetjük az árazásban pl. a következő módon: egy zónán belüli utazás ingyenes vagy kedvezményes áru, míg a zónán kívülre magasabb árat kell fizetni.

Hatékony prediktív modell

A versenyen az egyik részfeladatban azt várták el a versenyzőktől, hogy a historikus adatok alapján készítsenek egy prediktív modellt, ami adott állomásra, adott napra megjósolja, hogy ott mekkora lesz a kihasználtság maximuma.

A prediktív modellek "jósága" legjobban a lift értékkel jellemezhető, ami definíció szinten a következőt jelenti:

"A lift a konfidencia és a támogatottság (support) hányadosa, azt reprezentálja, hogy egy adott modell a várhatónál mennyi többletinformációt tartalmaz."

Lift-érték: 2,94