多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
学习、构思、创造、让色彩呈现生命,传达一种体验,这便这部书的一个概况。这本书恰恰处在两个世纪历史的一个转折阶段。在这个阶
《胜任力》内容简介:很多企业在对员工进行绩效考核时都会发现,明明员工的毕业院校、学历、专业都相同,笔试与面试成绩相差无几,
《法学实践(增订版)》内容简介:法学到底如何实践?本书即讨论这个问题,且更多地侧重于中国的背景,同时,还包含了更广阔的理论
CCNA学习指南路由和交换认证-(第2版) 本书特色 本书是通过CCNA考试100-105、200-105和200-125的权威指南。由知名思科技术培训专家To...
内容简介本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的
《石门铭》内容简介:《石门铭》,又称《泰山羊祉开复石门铭》。北魏宣武帝永平二年(五〇九)立,记述了梁、秦二州刺史羊祉和左校
《第一推动丛书·综合系列:控制论》内容简介:这是一本阐述控制论的理论和它在各方面应用的综合性、概论性的书。作者维纳是控制论
《但问旗民:清代的法律与社会(精)》内容简介:《但问旗民:清代的法律与社会》是赖惠敏研究员继《乾隆皇帝的荷包》之后关于清史
《校长手记:我的教育感悟》内容简介:本书是作者几十年教书育人工作感悟,分“且行且思享受教育”“行走世界感悟教育”“著书立说
《CSS与HTMLWeb设计实践指南》主要介绍如何利用CSS和HTML技术进行Web设计。《CSS与HTMLWeb设计实践指南》首先从Web技术的发展和基
《PHP框架高级编程:应用Symfony、CakePHP和Zend》详细比较Symfony、CakePHP和ZendFramework的利弊,并介绍如何使用每种...
《与黑天鹅共舞》内容简介:这只超级巨大的黑天鹅横空出世,瞬间让全球人紧急按下了暂停键,人类的健康与生命受到了严峻的威胁。整
《开国领袖毛泽东》内容简介:《开国领袖毛泽东》真实地再现了共和国开国奠基特定历史环境中领袖人物毛泽东的心路历程、行为轨迹和
主编:海军超过十五年设计管理研究、咨询和实践经验。参与和主持过设计政策、设计产业规划、区域创新、新产品开发、设计组织与设
渡边修司Shujiwatanabe日本立命馆大学教授,日本立命馆游戏研究中心运营委员,日本数字游戏学会研究委员,1997年,以《最终幻想7
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用 内容简介 本书是针对2019年全国计算机等级二级考试编写的辅导用书。本书严格按照新版...
SAP从入门到精通 本书特色 源于实践 成就行家上海软件行业协会 秘书长 杨根兴、江苏省软件行业协会副会长 徐雷鼎力推荐6个核心模块的深入解析50个疑难解答和实...
CX5478中文版PotoshopCS3入门到精通(普及版) 本书特色 海量的内容:上千个photoshop知识点,数百个注意、提示与技巧,近百个示例讲解,为您...
现在,告诉您一个奇迹,让您体验一位绘画大师的创作快乐和真谛。在“300年前”的一个小小的快乐镇里,衣冠楚楚的绅士驾着十八世纪
《互联网金融原理与实务》内容简介:本书在人类三次重大的科技变革中,信息技术对社会与经济的发展影响极为深刻。互联网的出现推动