0401 reinforcement learning의 알고리즘 별 누적 reward

Evaluating Reinforcement Learning Algorithms

reinforcement learning의 알고리즘 별 누적 reward graph.
마음에 안드는 점은 만약 주식거래 프로그램을 만들었을 때 수익곡선이 저렇다면 초반의 손해를 계속 감수해야 한다는 뜻이다. 그것도 물론 주식시장이 항상 같은 방식으로 반응해준다는 가정 하에 말이다. 대략 난감하다.