What is 강화학습?: 강화학습 소개, 적용분야
해당 시리즈 포스팅은 "심층 강화학습 인 액션" 책을 읽고 배운내용을 정리하는 차원에서 작성되었음을 밝힙니다 따라서 잘못된 내용이 있다면 댓글로 알려주시기 바랍니다 올바른행동을 하면 보상을 받고 잘못된 행동을 하면 음의 보상(벌)을 받는다 이과정을 반복함으로서 경험이 쌓이면 잘못된 행동을 피하고 올바른 행동을 하게 된다 뭔가 사람의 교육과도 비슷한 이것을 바로 강화"학습"이라고 한다 강화학습에는 state(현재상황), action(행동), agent(모델), reward(보상) 즉 4가지 개념이 있다 현재 상황을 입력으로 받아 모델은 action을 결정하고, 행동의 결과에 따른 보상(음의 보상일수도 있는w)을 받게됨으로 서로 밀접한 관련이 있다 Agent는 하나의 학습자 또는 학습 모형임으로 agent를..
프로그래밍/나도 이해할수있다(강화학습)
2023. 2. 11. 16:53