gymnasium 기반 single agent custom 강화학습 환경 만들기 Published: 2024-02-06 Updated: 2024-04-16 아래 설명중 나오는 게임들의 예시는 다음과 같다
(WIP)TRPO, Trust Region Policy Optimization Published: 2023-10-29 Updated: 2024-04-23 (수정중… 지속적으로 수정될 예정)
snakegame 강화학습 도전기 Published: 2023-09-22 Updated: 2024-03-20 스네이크 게임은 정해진 그리드 격자 배열 안에서 뱀을 움직이면서 1개 이상의 아이템을 먹으면서 몸을 키우는 게임이다. 아이템을 먹으면 몸이 1칸 늘어나게 된다. 자기 몸에 박거나 벽에 박게 되면 게임이 종료된다.