reinforcement learning *
stiimulõpe
olemus
ISO/IEC 22989:
keskkonnaga suhtlemise kaudu saadavat tasu maksimeeriva optimaalse toimingujada õppimine
= learning of an optimal sequence of actions to maximize a reward through interaction with an environment