图像语义分割(Image Semantic Segmentation,ISS)是涉及计算机视觉、模式识别与人工智能的研究热点,基于深度学习的图像语义分割(Image Semantic Segmentation based on Deep Learning,ISSbDL)方法利用深层计算模型来学习抽象的图像特征,促进了ISS 相关研究的发展。在ISSbDL方法中,基于编码器.解码器模型的ISS方法存在像素空间位置信息丢失、无法有效利用图像上下文等问题。本文对编码器.解码器模型进行了两点改进并以这两点改进为基础,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(Densely ConnectedAtrous Spatial Pyramid Pooling Deconvlution Network,DenseASPPDeconvNet)用于图像语义分割。本书的主要贡献如下:(1)对ISSbDL的经典方法与研究现状进行系统性总结和梳理。对基于深度学习的图像语义分割的经典方法与研究现状进行系统分类、梳理和总结。根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法。把基于区域分类的图像语义分割方法细分为2类子方法,把基于像素分类的图像语义分割方法进一步细分为7类不同的方法。对每类方法的代表性算法进行了详细地分析介绍,并详细总结了每类方法的基本思想和优缺点,系统阐述了深度学习技术对图像语义分割领域的贡献。(2)改进基于编码器一解码器模型的ISS算法,设计出DenseASPPDeconvNet网络模型。为提取更多的图像特征和图像上下文,对基于编码器一解码器模型的ISS算法中的编码器模块进行了两点改进:①以更密集的连接方式连接多个带孔卷积,优化初级特征提取器,提出“密集连接带孔卷积网络”(Densely Connected Atrous Convolution Network,DenseAtrous CNet),使用DenseAtrousCNet代替卷积神经网络(Convolutional NeuralNetworks,CNN)作为初级特征提取器,能够捕获更多的稠密特征。②对传统带孔空间金字塔池化模型进行优化,以密集连接组合数个不同带孔率的带孔卷积,对稠密特征图进行融合,提出“密集连接全局平均带孔金字塔池化”(Densely Connected Global Atrous Spatial Pyramid Pooling,DenseGlobalASPP)模型,使用DenseGlobalASPP代替带孔空间金字塔池化(Atrous Spatial Pyramid Pooling)作为特征再编码器,对初级特征进行再编码,以捕获更多的全局语义信息和图像上下文。基于以上两点改进,对传统的编码器一解码器模型的网络结构进行优化,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(DenseASPPDeconvNet网络模型)。DenseASPPDeconvNet是一种非对称的网络结构,其编码器模块使用DenseAtrousCNet进行初级特征提取,使用DenseGobalASPP对初级特征进行再编码,解码器模块使用反卷积来逐步恢复特征图的分辨率。DenseASPPDeconvNet能够捕获更多的稠密特征图,扩大网络的感受野,捕获更多的图像上下文,进而提高ISS的分割准确率。实验部分使用PASCAL VOC 2012公开数据集进行实验和测试:将Dense ASPPDeconvNet 与其他经典网络模型进行详细地分析与对比,证明了DenseASPPDeconvNet能够提升ISS 的性能,具有一定的合理性和优越性。将DenseAtrousCNet、DenseASPPD econvNet分别与CNN、ASPP进行对比,证明了DenseAtrousCNet与DenseASPPDeconvNet拥有较好的特征提取效果,能够捕获更多的图像特征,有助于提升ISS的性能。
《天文学简史(中文版)》内容简介:史前的农夫利用天上的星辰判断季节的更替;古希腊天文学与古巴比伦天文学合流;17世纪,牛顿提
《TypeScript项目开发实战》内容简介:本书是一本TypeScript进阶实践指南,通过9个实用项目,详细讲解如何使用TypeScript 3.0和不同
《女儿的早餐》内容简介:这是一个妈妈对于女儿成长生活的笔记,更记录了7年来,每天坚持不断的为女儿准备早餐的过程,以及简单的早
《法国语言政策研究》内容简介:本书首先解释了法国语言政策体系的核心是“合法语言的建构”,并对法语标准语的形成、立法、规范化
《三四越界》内容简介:我所有小说、诗歌和白日梦的出处索隐。近年来屡获小说大奖的青年作家文珍首部散文力作 手绘三十四幅温暖回甘
《投资大白话》内容简介:一本让股市小白看得懂的书,一本值得投资老手重视的书。用人人都听得懂的话阐明股市投资的真谛,让人人都
《左宗棠(中华先贤人物故事汇)》内容简介:左宗棠(1812—1885),字季高,一字朴存,号湘上农人,湖南湘阴人。他一生参与镇压太
在内容上,本书结合使用情景,全面、深入、细致地分析Android系统的源代码,涉及到Linux内核层、硬件抽象层(HAL)、运行时库层(
数据库重构 本书特色 本书首次专门讨论数据库重构,向数据专业人员展示了如何运用重构、测试驱动及其他敏捷技术进行演进式数据库开发。书中通过许多实际例子,详细说明了...
《初级会计实务辅导教材》内容简介:《2013年会计专业技术资格全国统考专用辅导教材:初级会计实务辅导教材》是针对2013年全国会计
WithEarlyReleaseebooks,yougetbooksintheirearliestform—theauthorsrawanduneditedco...
《高端装备制造中精密直线电机电磁力分析及控制技术》内容简介:在以多轴高档数控机床、极大规模集成电路和重大科学仪器为代表的高
《当你自信独立,才能无所畏惧》内容简介:你有没有在某一刻认真的问过自己:到底想成为一个什么样的姑娘?自己内心真正想要的是什
Thegapbetweenwhodesignersanddevelopersimaginetheirusersare,andwhothoseusersreall...
深度学习与人体姿态动作识别/关晨至 内容简介 本书主要阐述了深度学习下人体姿态动作识别的相关技术和方法。全书共六章,章介绍了深度学习的发展历史;第二章介绍了各种...
Photoshop Lightroom 5 摄影师专业技法 本书特色 《photoshoplightroom5摄影师专业技法》作者scottkelby撰写过多本...
本书作为Java程序的入门与应用教材,共分为3部分:第一部分讲解Java程序设计的基础知识,包括Java基本编程语言、面向对象设计思想
全国计算机等级考试二级教程:公共基础知识(2008年版) 内容简介 本书是根据教育部考试中心*新颁布的《全国计算机等级考试二级公共基础知识考试大纲(2007年版...
《漫长的寒冬:失落之城》内容简介:永生不再是神话,而是选择 ●《亚特兰蒂斯》作者A.G.利德尔 ●颠覆想象的史诗级科幻巨著完结篇
本书从最基本的光纤、光发射和光接收机讲起,随后按章节分别讨论了系统设计、光纤损耗和色散管理所涉及的先进技术、光网络中的波