O fundamentalnych ograniczeniach dwuetapowych dekompozycji CVaR w procesach decyzyjnych Markowa

W codziennych decyzjach – od inwestycji finansowych po planowanie tras autonomicznego pojazdu –nie liczy się tylko średni wynik, lecz także kwestia ryzyka. Jedną z popularnych miar ryzyka jest Conditional Value at Risk, czyli CVaR, definiowane (dla poziomu ufności $\alpha\in(0,1)$) jako: $$ CVaR_\alpha(X) =\inf_{\xi}{\xi + \tfrac{1}{1-\alpha},E[(X-\xi)_+]}. $$ W pracy Godbout i Durand (2025) autorzy przyglądają się, jak tę miarę ryzyka efektywnie oszacować w modelach decyzyjnych nazywanych Procesami Decyzyjnymi Markowa (MDP). Ich wnioski pokazują, że najbardziej rozpowszechnione podejście – dekompozycja dualna – ma fundamentalne ograniczenia. ...

lipca 21, 2025