基于深度学习的图像语义分割技术

基于深度学习的图像语义分割技术

作者:田萱

出版社:海洋出版社

出版年:2019-12-01

评分:5分

ISBN:9787521003543

所属分类:网络科技

书刊介绍

基于深度学习的图像语义分割技术 目录

1 绪论
1.1 研究背景与意义
1.2 国内外研究状况与发展趋势
1.2.1 传统的图像语义分割技术
1.2.2 基于深度学习的图像语义分割技术
1.3 主要工作与研究成果
1.4 本书的主要内容与结构安排
2 深度学习和其他相关技术介绍
2.1 引言
2.2 深度神经网络基本类型
2.2.1 卷积神经网络
2.2.2 循环神经网络
2.2.3 生成对抗网络
2.3 深度学习经典网络模型
2.3.1 LeNet-5网络模型
2.3.2 AlexNet网络模型
2.3.3 VGGNet网络模型
2.3.4 ResNet网络模型
2.3.5 GoogLeNet网络模型
2.3.6 Siamese网络模型
2.3.7 MobileNets网络模型
2.4 迁移学习
2.4.1 迁移学习的基本类型
2.4.2 迁移学习的主要优点
2.4.3 迁移学习在图像语义分割领域的应用
2.5 本章小节
3 基于深度学习的图像语义分割方法综述
3.1 引言
3.2 相关背景及早期研究介绍
3.3 基于区域分类的图像语义分割方法
3.3.1 基于候选区域的图像语义分割方法
3.3.2 基于分割掩膜的图像语义分割方法
3.4 基于像素分类的图像语义分割方法
3.4.1 基于FCN的图像语义分割方法
3.4.2 基于优化卷积结构的图像语义分割方法
3.4.3 基于编码器一解码器模型的图像语义分割方法
3.4.4 基于概率图模型的图像语义分割方法
3.4.5 基于特征融合的图像语义分割方法
3.4.6 基于RNN的图像语义分割方法
3.4.7 基于GAN的图像语义分割方法
3.5 本章小结
4 一种改进“编码器一解码器模型”的图像语义分割算法
4.1 引言
4.2 一种改进的密集连接带孔卷积网络
4.2.1 密集卷积网络
4.2.2 带孔卷积
4.2.3 密集连接带孔卷积网络
……
5 算法实验与结果分析
6 总结与展望
参考文献

基于深度学习的图像语义分割技术 内容简介

图像语义分割(Image Semantic Segmentation,ISS)是涉及计算机视觉、模式识别与人工智能的研究热点,基于深度学习的图像语义分割(Image Semantic Segmentation based on Deep Learning,ISSbDL)方法利用深层计算模型来学习抽象的图像特征,促进了ISS 相关研究的发展。在ISSbDL方法中,基于编码器.解码器模型的ISS方法存在像素空间位置信息丢失、无法有效利用图像上下文等问题。本文对编码器.解码器模型进行了两点改进并以这两点改进为基础,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(Densely ConnectedAtrous Spatial Pyramid Pooling Deconvlution Network,DenseASPPDeconvNet)用于图像语义分割。本书的主要贡献如下:(1)对ISSbDL的经典方法与研究现状进行系统性总结和梳理。对基于深度学习的图像语义分割的经典方法与研究现状进行系统分类、梳理和总结。根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法。把基于区域分类的图像语义分割方法细分为2类子方法,把基于像素分类的图像语义分割方法进一步细分为7类不同的方法。对每类方法的代表性算法进行了详细地分析介绍,并详细总结了每类方法的基本思想和优缺点,系统阐述了深度学习技术对图像语义分割领域的贡献。(2)改进基于编码器一解码器模型的ISS算法,设计出DenseASPPDeconvNet网络模型。为提取更多的图像特征和图像上下文,对基于编码器一解码器模型的ISS算法中的编码器模块进行了两点改进:①以更密集的连接方式连接多个带孔卷积,优化初级特征提取器,提出“密集连接带孔卷积网络”(Densely Connected Atrous Convolution Network,DenseAtrous CNet),使用DenseAtrousCNet代替卷积神经网络(Convolutional NeuralNetworks,CNN)作为初级特征提取器,能够捕获更多的稠密特征。②对传统带孔空间金字塔池化模型进行优化,以密集连接组合数个不同带孔率的带孔卷积,对稠密特征图进行融合,提出“密集连接全局平均带孔金字塔池化”(Densely Connected Global Atrous Spatial Pyramid Pooling,DenseGlobalASPP)模型,使用DenseGlobalASPP代替带孔空间金字塔池化(Atrous Spatial Pyramid Pooling)作为特征再编码器,对初级特征进行再编码,以捕获更多的全局语义信息和图像上下文。基于以上两点改进,对传统的编码器一解码器模型的网络结构进行优化,设计了一种“密集连接带孔空间金字塔池化反卷积网络”(DenseASPPDeconvNet网络模型)。DenseASPPDeconvNet是一种非对称的网络结构,其编码器模块使用DenseAtrousCNet进行初级特征提取,使用DenseGobalASPP对初级特征进行再编码,解码器模块使用反卷积来逐步恢复特征图的分辨率。DenseASPPDeconvNet能够捕获更多的稠密特征图,扩大网络的感受野,捕获更多的图像上下文,进而提高ISS的分割准确率。实验部分使用PASCAL VOC 2012公开数据集进行实验和测试:将Dense ASPPDeconvNet 与其他经典网络模型进行详细地分析与对比,证明了DenseASPPDeconvNet能够提升ISS 的性能,具有一定的合理性和优越性。将DenseAtrousCNet、DenseASPPD econvNet分别与CNN、ASPP进行对比,证明了DenseAtrousCNet与DenseASPPDeconvNet拥有较好的特征提取效果,能够捕获更多的图像特征,有助于提升ISS的性能。

相关推荐

微信二维码