Czy można przewidzieć, kiedy i gdzie ludzie wypożyczą elektryczną hulajnogę? Okazuje się, że tak – i to z bardzo dużą dokładnością. W nowej publikacji badacze pokazują, jak użycie zaawansowanych algorytmów, takich jak XGBoost, może zrewolucjonizować zarządzanie mikromobilnością w miastach.
🌍 Tło: Mikromobilność i problem popytu
W wielu miastach świata bezdokowe hulajnogi elektryczne stały się codziennym środkiem transportu. Jednak dla operatorów pozostaje kluczowe pytanie:
Gdzie i kiedy ludzie będą chcieli skorzystać z hulajnogi?
Zbyt dużo pojazdów w jednej lokalizacji to marnotrawstwo. Zbyt mało – to utracony dochód i sfrustrowani użytkownicy. Dlatego trafne przewidywanie popytu jest niezwykle istotne.
🧠 Publikacja: Trójwymiarowy model predykcji
Autorzy pracy z arXiv 2507.02715 opracowali kompleksowy framework uczenia maszynowego, który łączy trzy typy danych:
- Czasowe (np. godzina, dzień tygodnia, pogoda),
- Przestrzenne (np. odległość do transportu publicznego, liczba punktów POI w okolicy),
- Sieciowe (czyli zależności pomiędzy lokalizacjami, np. jak często przemieszczają się między nimi użytkownicy).
Z tych danych wygenerowali aż 341 cech wejściowych, które następnie podano do modelu XGBoost.
🌳 Czym jest XGBoost?
XGBoost to skrót od eXtreme Gradient Boosting. Jest to model:
- Złożony z wielu drzew decyzyjnych,
- Każde kolejne drzewo poprawia błędy poprzednich – tzw. boosting gradientowy,
- Działa bardzo szybko i świetnie radzi sobie z danymi tabelarycznymi.
🛠️ Jak działa?
- Startuje od prostej prognozy (np. średnia),
- Oblicza błąd i gradient,
- Buduje nowe drzewo na tych gradientach,
- Dodaje wynik nowego drzewa do poprzedniej predykcji.
Wzór końcowy:
$ y_{ ext{pred}} = f_0 + \eta \cdot T_1(x) + \eta \cdot T_2(x) + \dots + \eta \cdot T_N(x) $
📈 Dlaczego działa?
Model dobrze działa w publikacji, bo:
- Dane były dobrze przetworzone,
- XGBoost radzi sobie z nieliniowością (np. temperatura, godzina),
- SHAP pokazał, że najważniejsze cechy to topologia sieci (np. centralność punktów).
🔬 Wyniki
- Model poprawił trafność o 27–49% w porównaniu z innymi podejściami,
- Względem modeli czasowych (Prophet) – nawet do 90%.