(NeurIPS 2020) Dynamic allocation of limited memory resources in reinforcement learning
Dynamic allocation of limited memory resources in reinforcement learning
1. Introduction
1.1 Related work
2. Background and details
2.1 Environment and agent’s memories
2.2 Objective and policy
2.3 Maximizing the objective
2.4 Dynamic allocation of limited memory resources
3. Results on standard RL environments
3.1 2D Grid-world
3.2 Mountain car
4. Results on a model-based planning task
4.1 Task details
4.2 Comparison with an alternative model and black-box optimization
4.3 The speed-accuracy trade-off
5. Discussion
Broader Impact
A Acknowledgments and Disclosure of Funding
B Task parameters and additional results
B.1 Additional results for the planning task
B.2 Task parameters
References
Review (진행 중)....
Abstract
본 논문에서는 문서에서는 제한된 리소스의 제약 조건하에서 예상 보상을 극대화하기 위한 동적 프레임워크를 제안 합니다.
- 메모리의 작업 값에 대한 정확한 표현 가능한 비용 함수 구현
- 파생 알고리즘, 동적 자원 할당기 (DRA), 보강 학습
- 모델 기반 계획 작업
- 더 높은 리소스 예산으로 시작할 때 결국, 작업에 잘 수행하기 위해 할당하는 것보다 더 빠르게 학습하게 됨
Comments
Post a Comment