"0401 reinforcement learning의 알고리즘 별 누적 reward"의 두 판 사이의 차이

ph
이동: 둘러보기, 검색
(새 문서: file:rlreward.png [http://artint.info/html/ArtInt_267.html Evaluating Reinforcement Learning Algorithms] reinforcement learning의 알고리즘 별 누적 reward graph.<br />...)
 
잔글 (Admin님이 0401 문서를 넘겨주기를 만들지 않고 0401 reinforcement learning의 알고리즘 별 누적 reward 문서로 이동했습니다)
 
(차이 없음)

2017년 8월 2일 (수) 17:28 기준 최신판

Rlreward.png

Evaluating Reinforcement Learning Algorithms


reinforcement learning의 알고리즘 별 누적 reward graph.
마음에 안드는 점은 만약 주식거래 프로그램을 만들었을 때 수익곡선이 저렇다면 초반의 손해를 계속 감수해야 한다는 뜻이다. 그것도 물론 주식시장이 항상 같은 방식으로 반응해준다는 가정 하에 말이다. 대략 난감하다.