Optymalizacja pracy call center za pomocą uczenia ze wzmocnieniem: PPO kontra Value Iteration
Czy można usprawnić pracę call center za pomocą sztucznej inteligencji? Artykuł „Optimising Call Centre Operations using Reinforcement Learning: Value Iteration versus Proximal Policy Optimisation” autorstwa Kwong Ho Li i Wathsala Karunarathne pokazuje, że tak — i to z dużym sukcesem. Autorzy badają dwa podejścia do uczenia ze wzmocnieniem (RL) w kontekście optymalizacji procesu kierowania połączeń: klasyczne Value Iteration (VI) i nowoczesne Proximal Policy Optimisation (PPO). Czym jest uczenie ze wzmocnieniem? Uczenie ze wzmocnieniem to dziedzina AI, w której agent podejmuje decyzje w środowisku, otrzymując nagrody za dobre działania. Celem jest maksymalizacja sumy nagród — w praktyce: optymalizacja decyzji. ...