多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
就科学传播领域而言,《新闻、科学与社会:新闻和公共关系中的科学传播》的基本思路是把科学新闻报道和科研机构中公关部门的工作并
《Rootkit和Bootkit:现代恶意软件逆向分析和下一代威胁》内容简介:本书囊括灵活的技巧、操作系统架构观察以及攻击者和防御者创新
拓扑学(原书第2版)中文 本书特色 《拓扑学》(原书第2版)是一本优秀的拓扑学教材,系统讲解了拓扑学理论知识,共分两部分,**部分一般拓扑学,包括集合论、拓扑空...
《Origin8.0实用教程:科技作图与数据分析》主要按Origin基础、数据管理、科技作图、数据分析和自动化编程为系统框架,以模块功能
《危机时刻:德国保守主义革命》内容简介:本辑为读者呈现的是1933年纳粹政权前后,德国思想界影响深远的思潮:保守主义革命。这股
《隔屏相遇:如何做好网络心理咨询》内容简介:本书在新冠肺炎疫情的大背景下,网络心理咨询很好地解决了“日益增长的心理咨询需求
《Linux虚拟化数据中心实战》内容简介:本书共8章,采用循序渐进的方式,帮助读者掌握Linux虚拟化架构的部署和使用,包括开源虚拟化
中文版InDesign CS5技术大全-(附光盘) 本书特色 超厚手册,超大容量,技术全面,39章教学内容,软件功能全覆盖,基础详解、功能全面、理论实践全接触,...
《CSS入门经典(第2版)》主要内容:CSSLevel1、2、2.1和3规范的相关知识、操纵文本和选择字体效果的方式、IE6和IE7的Bug及解决方案
《落花生》内容简介:许地山散文是现代文学中的一方宝藏。《落花生》以他生前著作《空山灵雨》等为底稿,收集了许地山先生一生最菁
《酒店,家的感觉:住进世界38家设计型酒店》所介绍的酒店,大致上按作者过去七年入住的时间顺序排列,故此,这也可以看成作者的
《用“芯”探核:龙芯派开发实战》内容简介:这是一本带领读者快速熟悉、掌握龙芯派开发的专著。本书基于龙芯派二代开发板,首先由
《短视频拍摄与制作(微课版)》内容简介:随着移动互联网的高速发展,短视频行业也发展迅猛,成为5亿多人的信息关注、分享和传播的
《世界是設計》與構思設計本身的面向有關。在此,不把設計理解為精製、美化、裝飾。設計一字的最初意義隱含構思起草。設計首先是
《老南京》内容简介:这是一本全面讲述老南京秦淮胜迹、古寺陵墓、市井文化、百姓生活的图书。全书从亲历亲睹的角度,分别描绘了老
《Unity 2D 游戏开发从入门到精通》内容简介:由于智能手机近些年井喷似的发展和普及,极大地带动了手机游戏的发展,还因此诞生了一
《黑白画理》无疑是一部囊括绘画规律和原则的学术力作。它始于从远古迈入,终于向未来走去。深刻、透彻,深入浅出的精练文字,进
jQuery:NovicetoNinjaisacompilationofbest-practicejQuerysolutionstomeetthemostcha...
◆一本台灣當代裝幀設計新潮流的設計書◆20位設計師X20種風格美學X160件書籍裝幀作品◆海報書衣設計,四款風格(繽紛、極簡、色塊
《OKR使用手册》内容简介:作为《这就是OKR》完美配套产品,本书也是作者近几年辅导企业落地实施OKR的经验大公开。它会告诉你,如何