中文核心期刊
中国科技论文统计源期刊
国际刊号:1005-2615
国内刊号:32-1429/V
用户登录
  E-mail:  
  密  码:  
  作者 审稿  
  编辑 读者  
期刊向导
联系方式ʽ
  • 主管:工业和信息化部
  • 主办:南京航空航天大学
  • 国际刊号:1005-2615
  • 国内刊号:32-1429/V
  • 地址:南京市御道街29号
  • 电话:025-84892726
  • 传真:025-84892726
  • E-mail:tnc01@nuaa.edu.cn
  • 邮编:210016
谭晓阳,张哲.元强化学习综述[J].南京航空航天大学学报,2021,53(5):653-663
元强化学习综述
Review on Meta Reinforcement Learning
投稿时间:2020-10-11  修订日期:2021-03-10
DOI:10.16356/j.1005-2615.2021.05.001
中文关键词:  元强化学习  样本效率  泛化性  归纳偏置
英文关键词:meta reinforcement learning  sample efficiency  generalization  inductive bias
基金项目:国家自然科学基金(61976115,61732006)资助项目;全军共用信息系统装备预研基金(315025305)资助项目;南京航空航天大学“人工智能+”研究基金(NZ2020012,56XZA18009)资助项目。
作者单位邮编
谭晓阳 南京航空航天大学计算机科学与技术学院/人工智能学院南京 211106
模式分析与机器智能工业和信息化部重点实验室南京 211106 
211106
张哲 南京航空航天大学计算机科学与技术学院/人工智能学院南京 211106
模式分析与机器智能工业和信息化部重点实验室南京 211106 
211106
摘要点击次数: 142
全文下载次数: 179
中文摘要:
      元强化学习是指自动从一组相关任务中学习强化学习所需归纳偏置的相关理论和方法,对于提高强化学习算法在困难场景下的样本效率和泛化能力具有重要用途。本文提出一种新的元强化学习框架,指出设计和分析一个元强化学习算法需要同时考虑学习经验(相关任务)、归纳偏置及学习目标3个独立因素及这3个因素之间的依赖关系。在此基础上对该领域的研究现状进行了分析和总结,特别对近年来元强化学习若干文献进行了分析和归类,并详细阐述了几种代表性算法的原理及各自特点。本文还对元强化学习常用的实验环境和性能评价方法进行了介绍,对该领域的不足和未来的发展方向进行了讨论和分析。
英文摘要:
      Meta reinforcement learning (Meta-RL) aims at automatically learning induction bias for a new reinforcement learning task from a set of different but related tasks. It plays an important role in improving the sample efficiency and generalization of reinforcement learning algorithm in difficult scenarios. This paper first introduces a framework in which three key components of Meta-RL are identified, i.e., learning experience (related tasks), inductive bias and learning objective. Based on this, current research progress in this field is analyzed and reviewed, and the principles and characteristics of several representative algorithms are described. The paper also gives a detailed account of commonly used benchmark environments and performance evaluation methods for meta-RL. The limitation of current research and potential future development directions are also discussed.
[HTML]  查看全文  查看/发表评论  下载PDF阅读器
关闭

Copyright @2010-2015《南京航空航天大学学报》编辑部

地址:南京市御道街29号        邮编:210016

电话:025-84892726      传真:025-84892726       E-mail:tnc01@nuaa.edu.cn

您是本站第3864827位访问者 本站今日一共被访问1767

技术支持:北京勤云科技发展有限公司

敬请关注《南航学报》官方微信