图像语义分割(Image Semantic Segmentation,ISS)是涉及计算机视觉、模式识别与人工智能的研究热点,基于深度学习的图像语义分割(Image Semantic Segmentation based on Deep Learning,ISSbDL)方法利用深层计算模型来学习抽象的图像特征,促进了ISS 相关研究的发展。在ISSbDL方法中,基于编码器.解码器模型的ISS方法存在像素空间位置信息丢失、无法有效利用图像上下文等问题。本文对编码器.解码器模型进行了两点改进并以这两点改进为基础,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(Densely ConnectedAtrous Spatial Pyramid Pooling Deconvlution Network,DenseASPPDeconvNet)用于图像语义分割。本书的主要贡献如下:(1)对ISSbDL的经典方法与研究现状进行系统性总结和梳理。对基于深度学习的图像语义分割的经典方法与研究现状进行系统分类、梳理和总结。根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法。把基于区域分类的图像语义分割方法细分为2类子方法,把基于像素分类的图像语义分割方法进一步细分为7类不同的方法。对每类方法的代表性算法进行了详细地分析介绍,并详细总结了每类方法的基本思想和优缺点,系统阐述了深度学习技术对图像语义分割领域的贡献。(2)改进基于编码器一解码器模型的ISS算法,设计出DenseASPPDeconvNet网络模型。为提取更多的图像特征和图像上下文,对基于编码器一解码器模型的ISS算法中的编码器模块进行了两点改进:①以更密集的连接方式连接多个带孔卷积,优化初级特征提取器,提出“密集连接带孔卷积网络”(Densely Connected Atrous Convolution Network,DenseAtrous CNet),使用DenseAtrousCNet代替卷积神经网络(Convolutional NeuralNetworks,CNN)作为初级特征提取器,能够捕获更多的稠密特征。②对传统带孔空间金字塔池化模型进行优化,以密集连接组合数个不同带孔率的带孔卷积,对稠密特征图进行融合,提出“密集连接全局平均带孔金字塔池化”(Densely Connected Global Atrous Spatial Pyramid Pooling,DenseGlobalASPP)模型,使用DenseGlobalASPP代替带孔空间金字塔池化(Atrous Spatial Pyramid Pooling)作为特征再编码器,对初级特征进行再编码,以捕获更多的全局语义信息和图像上下文。基于以上两点改进,对传统的编码器一解码器模型的网络结构进行优化,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(DenseASPPDeconvNet网络模型)。DenseASPPDeconvNet是一种非对称的网络结构,其编码器模块使用DenseAtrousCNet进行初级特征提取,使用DenseGobalASPP对初级特征进行再编码,解码器模块使用反卷积来逐步恢复特征图的分辨率。DenseASPPDeconvNet能够捕获更多的稠密特征图,扩大网络的感受野,捕获更多的图像上下文,进而提高ISS的分割准确率。实验部分使用PASCAL VOC 2012公开数据集进行实验和测试:将Dense ASPPDeconvNet 与其他经典网络模型进行详细地分析与对比,证明了DenseASPPDeconvNet能够提升ISS 的性能,具有一定的合理性和优越性。将DenseAtrousCNet、DenseASPPD econvNet分别与CNN、ASPP进行对比,证明了DenseAtrousCNet与DenseASPPDeconvNet拥有较好的特征提取效果,能够捕获更多的图像特征,有助于提升ISS的性能。
《Flashcs4动画制作与特效设计200例》共14章,通过200个精美实用的案例,为用户介绍了使用Flash设计与制作动画的方法,内容涉及卡
《给孩子的幸福力1》内容简介:在孩子成长的道路上,我们给予他们太多的关注和爱,却常常忘了告诉他们,成长是一件多么美好的事情;
Thisessentiallyself-contained,deliberatelycompact,anduser-friendlytextbookisdesi...
Ourcitiesare"smart"andgettingsmarterasinformationprocessingcapabilityisembeddedt...
Wouldyoulikeanoverviewofthestateoftheartinwebdesigninaspecificfield?WEBDESIGNIND...
《名著系列·幽默三国:吉祥乌鸦嘴》内容简介:“孔明兄,祝贺你呀。”“祝贺我什么?”“祝贺你打了大胜仗啦。”“你指的是一一?
《清华版双语教学用书•数字信号处理:基于计算机的方法(第3版)》于2001年由清华大学出版社推出以来,得到了广大院校师生的一致好评
Entwerfen.Programmieren.Visualisieren.MitinternationalenBest-Practise-Beispielen...
《迎接互联网的明天-玩转3DWeb(附盘)》,全书共5章,第1章主要阐述了国内外空前繁荣的3D互联网技术领域,以及这些领域透射出来的
《Struts2权威指南:基于WebWork核心的MVC开发》介绍的Struts2已经完全超出了Struts1框架原有的高度,Struts2建立在Struts1...
李永志管理3000人的客户服务团队,集团级内训师,承担客户运营管理、落实工作,实战经验丰富。从基层的集团客户管理员做起,到VI
社会媒体挖掘 本书特色 本书集成了近年来社会媒体、社会网络分析以及数据挖掘的前沿成果,为学生、从业者、研究人员和项目经理提供了一个方便的平台,以便理解社会媒体挖...
Increasingly,designersneedtopresentinformationinwaysthataidtheiraudiencesthinkin...
想象一下,一个网页只有HTML,没有CSS,那就是素颜和上妆的区别。而一个网页只有CSS,没用CSS3,那就是马车和汽车的区别!汽车代
《郭敬明,不为所动》内容简介:郭敬明说,“我身上的时间是凝固的状态,我面前的年轻人永远都是17岁”。从身高外貌到抄袭拜金,十
內容簡介沒有令人皺眉的繪圖技巧,只是激發你對空間的探索樂趣!一門帶領所有人進入建築世界的必備基礎課10項主題X10堂練習X10年
《当我们走进心理咨询室》内容简介:为什么在亲密关系中,一些人总是扮演“受害者”的角色?为什么一些人总是习惯讨好别人,对所有
Recentyearshaveseenthedevelopmentofpowerfultoolsforverifyinghardwareandsoftwares...
《WCDMA关键技术详解》全面、深入地介绍了WCDMA系统核心技术的各个方面。《WCDMA关键技术详解》所涉及的技术细节分析包括:系统结
《不插电的计算机科学》主要内容简介:“ComputerSciericeUnplugged”(不插电的计算机科学)是面向世界范围的信息科学普及项目,