Reinforcement learning, one of the most active research areas in artificial intelligence, is a computational approach to learning whereby an agent tries to maximize the total amount of reward it receives when interacting with a complex, uncertain environment. In Reinforcement Learning, Richard Sutton and Andrew Barto provide a clear and simple account of the key ideas and algorithms of reinforcement learning. Their discussion ranges from the history of the field's intellectual foundations to the most recent developments and applications. The only necessary mathematical background is familiarity with elementary concepts of probability.The book is divided into three parts. Part I defines the reinforcement learning problem in terms of Markov decision processes. Part II provides basic solution methods: dynamic programming, Monte Carlo methods, and temporal-difference learning. Part III presents a unified view of the solution methods and incorporates artificial neural networks, eligibility traces, and planning; the two final chapters present case studies and consider the future of reinforcement learning.
Thisbeginninggraduatetextbookdescribesbothrecentachievementsandclassicalresultso...
《阿长与《山海经》》内容简介:本书从鲁迅作品中精选了适合青少年读者阅读的篇目,题材上偏向于作者年少的成长故事,对亲人、朋友
《Docker全攻略》内容简介:Docker是一个充满挑战性和趣味性的开源项目,它彻底释放了Linux虚拟化的威力,极大地缓解了云计算资源供
《常春藤英语(精编版·六级)》内容简介:本书根据《常春藤英语·六级(上下)》两本书进行修订,从中选取难度相对较低的文本,并
分布式算法20多年来一直是倍受关注的主流方向。本书第二版不仅给出了算法的最新进展,还深入探讨了与之相关的理论知识。这本教材
《行云集》内容简介:《行云集》为周瘦鹃先生随笔集,包括“新西湖”“秋栖霞”“万古飞不去的燕子”“南湖的颂歌”“双洞江南第一
《软件工程实践者的研究方法》(原书第6版)第6版在结构和内容上均有不少调整、更新和充实。第6版更加突出了软件过程,增加了敏捷开
本书作为一本专门针对网页美工的书籍,在阐述网页设计理念的基础上,以生动的实例引导读者深入地掌握网页的美工技术,使读者在短
《第三层大脑》内容简介:脑机接口技术在近两年方兴未艾,促使人类更加清晰地想要去探知脑科学这最后一块人类身体的未知领域,这项
《毛泽东周恩来与长征》内容简介:《王朝柱精选文集:毛泽东周恩来与长征》内容简介::长征堪称人类战争史上的奇迹,它不仅在中国人民
《刚好遇见你》内容简介:本书从改编理论出发,囊括了影视改编理论、影视改编案例到改编实践理论,分三编,共十个章节。影视改编理
《高新科技知多少》内容简介:本书由重庆市科学技术协会、重庆市科学技术局和重庆市全民科学素质纲要实施工作办公室主编,是一本面
本书作为有关VisualC++Debugger的专著,是一本非常难得的好书。书中深入地分析了开发不包含逻辑和语法错误的代码技巧以及调试程
《神神鬼鬼》内容简介:《神神鬼鬼》堪称名人谈鬼神的合集,由陈平原选编而成。节录了现当代文学史上如茅盾、周作人、梁实秋、老舍
MATLAB金融算法分析实战-基于机器学习的股票量化分析 本书特色 本书全面系统地讲解了MATLAB金融算法设计应用,以及金融数据挖掘中趋向和发展趋势指标,并结...
ThisconcisebookdemystifiestheDocumentObjectModel(DOM),asetoftoolsformanipulating...
计算机审计情景案例 内容简介 计算机审计在我国正处于探索和发展的过程中,审计实践中会遇到各种各样的问题。本书选编了50个计算机审计的典型案例。从数据审计到信息系...
SystemVerilog验证 本书特色 本书可以作为学习system verilog验证语言的初级阶段读物。书中描述了语言的工作原理并且包含了很多例子,这些例...
《学习书法的十三个问题》内容简介:本书是近现代著名书法家启功先生对书法学习中常见问题的专题讲解,包括:迷信由于误解、字形结
《宋代衣食住行》内容简介:本书为四色印制的有关宋代衣食住行的彩图珍藏类图书。两宋时期是中国古代历史上的一个特殊时期,商品经