多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
HTML5、CSS3和JavaScript技术是网页设计的精髓,《精通HTML5+CSS3+JavaScript网页设计》以应用实例和综合实战案例的形式逐一详解
《日本在近代中国的投资》内容简介:日本对华侵略触及两国关系的各个领域,经济侵略与掠夺是不可忽视的方面。本书挖掘了大量档案文
《梭罗密码》内容简介:《梭罗密码》是少年原野科幻探险系列的第六部,前四部《原野时空》《宝石幻镜》《怪物危机》《时间猎人》已
计算机操作系统-(第三版) 本书特色 本书全面介绍了计算机系统中的一个重要软件——操作系统(OS),本书是第三版,对2001年出版的修订版的各章内容均作了较多的...
《锂离子电池智能制造》内容简介:本书是“21700动力锂电池智能制造新模式项目”的结题成果,项目归口管理部门是工业和信息化部。本
奈良美智出生於1959年12月5日,日本青森縣弘前市人。是日本現代美術界極具影響力的畫家。1981~1988年在愛知縣立藝術大學和研究所
老兵新传Visual Basic核心编程及通用模块开发 本书特色 编程“高手”的功力体现在对语言的彻底掌握和丰富的实践经验书稿内容由作者原创编写,直接面向实际应...
《运动与职场人生》内容简介:本教材不把提高学生运动技能作为首要指导思想,而是更加注重体育的文化因素,以知识性、趣味性和可读
《人口浪潮》内容简介:现代世界所经历的最深远变革是人口结构的变迁。以1800年为起点,全球人口经历过两次重大转型。第一次是人口
《C++语言从入门到精通:视频实战版》内容简介:《Visual C++从入门到精通(视频实战版)》详细介绍了使用VC进行C++程序设计的技巧,
《代码的未来》是Ruby之父松本行弘的又一力作。作者对云计算、大数据时代下的各种编程语言以及相关技术进行了剖析,并对编程语言
PPT演义-100%幻灯片设计密码-第2版-升级版-含DVD光盘1张 内容简介 迄今为止*全面的一本ppt教材:九大章节,让你从思维、策划、框架、图文、图表、美...
《市场的逻辑(第三版)》内容简介:为什么人类过去200年的进步比过去几千年大得多?中国40年经济成就举世瞩目,关键原因是什么?什
《读文心雕龙手记》内容简介:本书收入十三篇札记和两篇附录,写于不同时期,是作者二十多年精研《文心雕龙》的会心之作。《文心雕
本书是国际算法大师乌迪·曼博(UdiManber)博士撰写的一本享有盛誉的著作。全书共分12章:第1章到第4章为介绍性内容,涉及数学归
《React Native开发指南(第2版)》内容简介:本书通过丰富的示例和详细的讲解,介绍了React Native这款JavaScript框架。在React...
《淘宝店铺经营管理一册通》内容简介:《淘宝店铺经营管理一册通》基于多家淘宝金冠卖家多年来开店的经验,针对淘宝管理和客服进行
《Arduino完全实战》内容简介:Arduino已成为学习微控制器的首选课程,《Arduino完全实战》是Arduino设计全方位的指引,广泛且深入
Thisbrain-friendlyguideteachesyoueverythingfromJavaScriptlanguagefundamentalstoa...
《基础和声音响建构与应用教程》内容简介:本书包括《基础和声音响建构与应用教程》《基础和声音响建构与应用教程·课后同步配套练