北京理工大学机器人研究中心 童亮 龚建伟 熊光明 陆际联等
Robotics Research Center, Beijing Institute of Technology.
L. Tong, J.W. Gong, G.M. Xiong, J.L. Lu
转载此文请署名作者 并标明来自龚建伟技术主页 www.gjwtech.com
此文工作已在学术期刊上正式发表
1研究多智能体系统的必要性 2 2多智能体学习方法研究 3 2.1多智能体学习的框架 3 2.2 双矩阵决策和马尔可夫决策过程 5 2.3 随机决策 7 3多智能体系统中的强化学习 8 3.1智能体强化学习方法分类 9 3.2 Hu 和Wellman算法 11 4基于SLA进行行动预测的多智能体强化学习算法 12 4.1基于SLA进行行动预测的多智能体强化学习算法 13 4.2 多机器人推箱子问题 15 4.3试验及结果比较 16 5 小结 17
本文全文为PDF文档,需要带中文字库的Adobe Reader(5.0以上版本)
打开PDF文档(或右键“目标另存为”)
转载本站原版内容,请注明作者并说明来自http://www.gjwtech.com 龚建伟技术主页
EMAIL