多主体的研究与应用是近年来备受关注的热点领域,多主体强化学习理论与方法、多主体协作策略的研究是该领域重要研究方向,其理论和应用价值极为广泛,备受广大从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的关注。本书清晰地介绍了多主体、强化学习及多主体协作等基本概念和基础内容,明确地阐述了有关多主体强化学习、协作策略研究的发展过程及*新动向,深入地探讨了多主体强化学习与协作策略的理论与方法,具体地分析了多主体强化学习与协作策略在相关研究领域的应用方法。全书系统脉络清晰、基本概念清楚、图表分析直观,注重内容的体系化和实用性。通过本书的阅读和学习,读者即可掌握多主体强化学习及协作策略的理论和方法,更可了解在实际工作中应用这些研究成果的手段。 本书可作为从事计算机应用、人工智能、自动控制、以及经济管理等领域研究者的学习和阅读参考,同时高等院校相关专业研究生以及人工智能爱好者也可从中获得借鉴。
多主体的研究与应用是近年来备受关注的热点领 域,多主体强化学习理论与方法、多主体协作策略的 研究是该领域重要研究方向,其理论和应用价值极为 广泛,备受广大从事计算机应用、人工智能、自动控 制、以及经济管理等领域研究者的关注。孙若莹、赵 刚所著的《多主体强化学习协作策略研究》清晰地介 绍了多主体、强化学习及多主体协作等基本概念和基 础内容,明确地阐述了有关多主体强化学习、协作策 略研究的发展过程及*新动向,深入地探讨了多主体 强化学习与协作策略的理论与方法,具体地分析了多 主体强化学习与协作策略在相关研究领域的应用方法 。 全书系统脉络清晰、基本概念清楚、图表分析直 观,注重内容的体系化和实用性。通过本书的阅读和 学习,读者即可掌握多主体强化学习及协作策略的理 论和方法,更可了解在实际工作中应用这些研究成果 的手段。本书可作为从事计算机应用、人工智能、自 动控制、以及经济管理等领域研究者的学习和阅读参 考,同时高等院校相关专业研究生以及人工智能爱好 者也可从中获得借鉴。
chapter 1introduction1.1reinforcement learning1.1.1generality of reinforcement learning1.1.2reinforcement learning on markov decision processes1.1.3integrating reinforcement learning into agent architecture1.2multiagent reinforcement learning1.2.1multiagent systems1.2.2reinforcement learning in multiagent systems1.2.3learning and coordination in multiagent systems1.3ant system for stochastic combinatorial optimization1.3.1ants forage behavior1.3.2ant colony optimization1.3.3max-min ant system1.4motivations and consequences1.5book summarybibliographychapter 2reinforcement learning and its combination with ant colony system2.1introduction2.2investigation into reinforcement learning and swarm intelligence2.2.1temporal differences learning method2.2.2active exploration and experience replay in reinforcement learning2.2.3ant colony system for traveling salesman problem2.3the q-acs multiagent learning method2.3.1the q-acs learning algorithm2.3.2some properties of the q-acs learning method2.3.3relation with ant-q learning method2.4simulations and results2.5conclusionsbibliographychapter 3multiagent learning methods based on indirect media information sharing3.1introduction3.2the multiagent learning method considering statistics features3.2.1accelerated k-certainty exploration3.2.2the t-acs learning algorithm3.3the heterogeneous agents learning3.3.1the d-acs learning algorithm3.3.2some discussions about the d-acs learning algorithm3.4comparisons with related state-of-the-arts3.5simulations and results3.5.1experimental results on hunter game3.5.2experimental results on traveling salesman problem3.6conclusionsbibliographychapter 4action conversion mechanism in multiagent reinforcement learning4.1introduction4.2model-based reinforcement learning4.2.1dyna-q architecture4.2.2prioritized sweeping method4.2.3minimax search and reinforcement learning4.2.4rtp-q learning4.3the q-ac multiagent reinforcement learning4.3.1task model4.3.2converting action4.3.3multiagent cooperation methods4.3.4q-value update4.3.5the q-ac learning algorithm4.3.6using adversarial action instead o{ ~ probability exploration4.4simulations and results4.5conclusionsbibliographychapter 5multiagent learning approaches applied to vehicle routing problems5.1introduction5.2related state-of-the-arts5.2.1some heuristic algorithms5.2.2the vehicle routing problem with time windows5.3the multiagent learning applied to cvrp and vrptw5.4simulations and results5.5conclusionsbibliographychapter 6multiagent learning methods applied to multicast routing problems6.1introduction6.2multiagent q-learning applied to the network routing6.2.1investigation into q-routing6.2.2antnet investigation6.3some multicast routing in mobile ad hoc networks6.4the multiagent q-learning in the q-map multicast routing method6.4.1overview of the q-map multicast routing6.4.2join query packet, join reply packet and membership maintenance6.4.3convergence proof of q-map method6.5simulations and results6.6conclusionsbibliographychapter 7multiagent reinforcement learning for supply chain management7.1introduction7.2related issues of supply chain management7.3scm network scheme with multiagent reinforcement learning7.3.1scm with multiagent7.3.2the rl agents in scm network7.4application of the q-acs method to scm7.4.1the application model in scm7.4.2the q-acs learning applied to the scm system7.5conclusionbibliographychapter 8multiagent learning applied in supply chain ordering management8.1introduction8.2supply chain management model8.3the multiagent learning model for sc ordering management8.4simulations and results8.5conclusionsbibliography
本书以作者自身学习、使用模式和多年来为软件开发人员(包括面向对象技术老兵和新手)讲授模式的经验为基础撰写而成。首先概述了模
《Python人工智能项目实战》内容简介:本书可帮助你结合深度学习和强化学习来构建智能而且实用的基于人工智能的系统。本书涉及的项
Youdontneedprogrammingexperiencetoaddinteractiveandvisualeffectstoyourwebpageswi...
《平面设计材料表现与特殊效果》是一本涉及到数百种处理方式的指导书,并讲述了在你的设计中如何正确运用这些处理方式的相关知识
PacoHope,是Cigital公司的一名技术经理,《MasteringFreeBsDand0penBsDsecurity》(由O’Reilly出版)的合著者...
《中国能源国际合作报告(2018/2019)》内容简介:本报告在整理和分析2018年和2019年中国能源国际合作的趋势和成果的基础上,对中国
《杜甫的五城》内容简介:本书是作者在20世纪80年代末至90年代初九次在中国大陆旅行的记录。作者赖瑞和是海外研究唐代历史的知名学
《汉语词汇讲稿 汉语拼音字母学习法》内容简介:本卷收录周祖谟先生专著两种:《汉语词汇讲稿》和《汉语拼音字母学习法》。《汉语词
TheInternetRevolutionintheSciencesandHumanitiestakesanewlookatC.P.Snowsdistincti...
《大嘴巴漫谈数据挖掘(全彩)》从最基本的概率统计学开始,全面、系统、形象而又深入地描述了数据挖掘的基础概念、应用领域以及
从零开始学Eclipse-(附赠光盘) 本书特色 首先本书的读者定位为eclipse的初学者,也包括java的初学者。先让初学者认识eclipse,然后从ecl...
《《辽史》探源》内容简介:本书希望重新对元修《辽史》的史源问题加以全面检讨,其中的学术旨趣主要有三:其一,系统深入地考证《
《人才画像:让招聘准确率倍增》内容简介:在本书中,我们将咨询项目中常用的素质做成“素质菜单”,针对素质项的所有提问给出“精
《日本对中国东北的殖民统治》内容简介:九一八事变后,日本在中国东北地区扶植伪满政权,并以之为工具,把东北地区的政治、经济、
《演讲的逻辑:关键时刻真实、清晰、高效表达》内容简介:《演讲的逻辑:关键时刻真实、清晰、高效表达》是一本实战演讲指南,针对
MATLAB图像处理实例详解 本书特色 本书全面、系统地介绍了matlab在数字图像处理中的各种技术及应用。本书对图像处理的基础概念做了必要交代,重点给出了ma...
《黑洞旅行指南》内容简介:这本引人入胜的科普小书解读了当代科学里极具挑战性的现象—黑洞,它也是我们理解整个宇宙的方向标。在
《梁庄十年》内容简介:2010年,《中国在梁庄》首次出版,向我们展现了一个急速变化的时代下的中国村庄的变迁。十年之后,作者梁鸿
地理信息系统实习教程 内容简介 本教程由一系列的练习组成,可使学习者循序渐进地掌握地理信息系统(GIS)的基本功能,特别是通用的空间分析功能。内容包括:空间、属...
Manycompaniesrecognizethatpeopleexpecteffortless,engaginginteractionwithdesktopa...