0401 reinforcement learning의 알고리즘 별 누적 reward

ph
Admin (토론 | 기여)님의 2017년 8월 2일 (수) 17:28 판 (Admin님이 0401 문서를 넘겨주기를 만들지 않고 0401 reinforcement learning의 알고리즘 별 누적 reward 문서로 이동했습니다)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
이동: 둘러보기, 검색

Rlreward.png

Evaluating Reinforcement Learning Algorithms


reinforcement learning의 알고리즘 별 누적 reward graph.
마음에 안드는 점은 만약 주식거래 프로그램을 만들었을 때 수익곡선이 저렇다면 초반의 손해를 계속 감수해야 한다는 뜻이다. 그것도 물론 주식시장이 항상 같은 방식으로 반응해준다는 가정 하에 말이다. 대략 난감하다.