'Maze' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

Today

Total

관리 메뉴

목록Maze (1)

CodingE

[RL] 미로찾기를 통한 강화학습 구현 (1)

강화학습을 공부하며 미로찾기를 강화학습을 통해 구현 하고자 한다. 정책(Policy)는 단순 함수 구현으로 할 예정이다. # import 목록 import numpy as np import matplotlib.pyplot as plt from matplotlib import animation 강화학습에서 Agent가 어떻게 행동할지를 결정하는 규칙을 "정책" 이라고 한다. 정책은 policy의 p 에 해당하는 그리스 문자인 pi(state,action)으로 표현하며 파라미터는 세타로 표현한다. "상태가 s일때 행동 a 를 취할 확률은 파라미터가 결정하는 정책 pi를 따른다" 는 의미이다. 미로탐색에서의 상태(state)는 agent의 미로 내의 위치에 해당한다. 여기서 사용할 미로를 예로 들면 S0 ~ ..

Reinforcement Learning 2024. 4. 1. 13:10

이전 Prev 1 Next 다음

목록Maze (1)

CodingE

티스토리툴바