Reinforcement learning, one of the most active research areas in artificial intelligence, is a computational approach to learning whereby an agent tries to maximize the total amount of reward it receives when interacting with a complex, uncertain environment. In Reinforcement Learning, Richard Sutton and Andrew Barto provide a clear and simple account of the key ideas and algorithms of reinforcement learning. Their discussion ranges from the history of the field's intellectual foundations to the most recent developments and applications. The only necessary mathematical background is familiarity with elementary concepts of probability.The book is divided into three parts. Part I defines the reinforcement learning problem in terms of Markov decision processes. Part II provides basic solution methods: dynamic programming, Monte Carlo methods, and temporal-difference learning. Part III presents a unified view of the solution methods and incorporates artificial neural networks, eligibility traces, and planning; the two final chapters present case studies and consider the future of reinforcement learning.
Inapost-9/11world,thepresentisasunpredictableasanyfuture...Paidtopredictthehotte...
《中国当代经典电影赏析》内容简介:本书是南京大学国际化合作项目“一带一路国家中国文化教学合作研究”的成果,主要针对中高级汉
《心若莲花处处开》内容简介:南怀瑾精研儒、释、道,将中国文化各种思想融会贯通,可谓一代宗师。在他眼里,儒、道、佛的经典学问
C++ STL 标准程序库开发指南 本书特色 在开发语言中,c++的应用越来越广泛。而c++stl是标准的c++模板库,是算法和其他一些标准组件的集合,可...
赵鑫磊阿里巴巴集团资深Linux系统专家。自1998年开始使用Linux,曾参与国内著名的Linux社区发行版MagicLinux的开发工作,是一个土
《不变与万变:葛剑雄说国史》内容简介:复旦大学资深教授葛剑雄讲述中国历史的血脉精神,在兴衰、传承与变迁中,寻找中国历史的源
《时光与你:唯美人像摄影与后期养成攻略》内容简介:关于摄影的知识纷繁而复杂,并没有一条特定的逻辑线贯穿始终,而本书所梳理的
《零基础学C语言》的特点是内容全面、翔实,通俗易懂,循序渐进地介绍了C语言各方面的知识,重点突出。《零基础学C语言》含有大量
《阿尔泰山游牧者》内容简介:本书是作者在阿尔泰山区富蕴县境内,长达4年多田野调查基础上完成的民族志报告。全书立足于阿尔泰山哈
《绽放:第二十一届新概念作文获奖者作品精选. A卷》内容简介:本书精选2019年第21届全国新概念作文大赛一、二等奖获奖者的作品,结
《数据化网站运营深度剖析》内容简介:近些年,互联网促进经济迅速发展,越来越多的企业把互联网当作产品营销的重要渠道。网络营销
《开放创新和平台经济:IT及互联网产业商业模式创新之道(第2版)》内容简介:本书分为8章,其中,第1~4章主要以理论分析和研究为
《特种作战装备》内容简介:本书主要介绍各国特种作战单位使用的各式装备,包括主战武器、自卫武器、特种作战车辆、特种作战飞机、
《计算机科学概论(Python版)》内容简介:本书是美国哈维玛德学院“计算机科学通识”课程的配套教材,用独特的方法介绍计算机科学
《好玩的生物学:陪中学生一起阅读生命》内容简介:本书是一本适合全学段中学生进行严肃阅读的生物学科普读物。全书以“系统”“适
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信
UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高
《Node.js》内容简介:Node.js作为近几年新兴的一种编程运行时,托V8引擎的福,在作为后端服务时有比较高的运行效率,在很多场景下
王绍强,著名设计文化出版人及设计师,三度传媒创始人,2006年创办《Design360°观念与设计》杂志并任总编辑,2003年创办《APD亚
ForKidsAged10+(AndTheirParents)Thecodeinthisbookrunsonalmostanything:Windows,Mac...