이야기박스
인공지능) Tree search2 본문
반응형
§ MCTS ( Monte- Carlo Tree Search)
* 몬테 카를로 : 공식이 없어도 시뮬레이션만 수행하면 풀 수 있다.
( 대표적인 예 : 파이(3.141592...) - 랜덤 시뮬레이션으로 품 )
==> 게임 트리를 성장시켜보며 시뮬레이션 하는 기법
- Exploration (탐색) : 새로운 것을 찾는 것
- Exploitation (활용) : 내가 알던 것을 활용하는 것
이 둘 중, 무엇을 중요시 할 것인가에 대한 딜레마가 있다.
○ Bandit Problems : 슬롯 머신을 돌릴 때, 하나의 머신에서 하겟는가? 아니면 여러 머신에서 하겠는가?
- UCB1 : 공식을 이용 --> 현실에서 가장 많이 사용
- Flat Monte Carlo : 동일한 확률
- e-Greedy (입실론 그리디) : e만큼 무작위로 --> (1-e) 만큼 가장 좋은 것
○ UCB1
보편화 된 게임에선
c의 값을 조정함으로서 밸런스 조정
○ MCTS는 불균형 트리를 만든다.
--> 방문 하는 곳만 다시 가기 때문에
--> 상수 c는 경험적으로 조정
○ MCTS 의 과정
Selection -> Expansion -> Simulation -> Backpropagation
반응형
'Computer & Data > Artificial Intelligence' 카테고리의 다른 글
인공지능) Pathfinding2 (0) | 2017.10.17 |
---|---|
인공지능) Pathfinding (0) | 2017.10.17 |
인공지능) Tree search (0) | 2017.10.17 |
인공지능) Behavior authoring2 (0) | 2017.10.17 |
인공지능) Behavior authoring (0) | 2017.10.17 |