大数据智能核心技术入门

大数据智能核心技术入门

作者:杜圣东

出版社:电子工业

出版年:2019年4月

ISBN:9787121356841

所属分类:网络科技

书刊介绍

《大数据智能核心技术入门》内容简介

本书跟从大数据和人工智能应用的融合之路,通过分析和解读整个数据驱动智能核心技术,希望能给读者提供一个大数据智能核心技术体系的入门学习和应用参考指南。本书前半部分内容重在核心技术解读:包括大数据智能的概论、大数据智能核心技术体系的多维解读、深度学习关键技术要点的分析,大数据智能应用三段论和敏捷大数据方法论的提出等内容。后半部分内容重在应用实践的探讨,深入分析了当前大数据智能独角兽Palantir、AlphaGo、Watson等核心产品和技术,并从个人学习到工程实践,从企业应用到政府治理,从业务理解到技术选型等多个层面,逐一解读大数据智能技术在学习、应用过程中面临的关键问题、陷阱,并给出参考意见。
本书通过核心技术解读帮助读者学习、理解、应用大数据智能,具有重要的参考价值。本书适合的读者包括关注大数据和人工智能相关技术领域的在校学生、个人学习者和研发工程师、技术主管、企业高管、政府管理人员等。
杜圣东,西南交通大学信息科学与技术学院(人工智能研究院)讲师,大数据与人工智能方向在职博士,硕土与本科毕业于重庆大学计算机学院。兼任多家单位技术顾问和大数据培训专家,曾为中国中车集团、广州地铁集团、成都铁路局等多家企事业单位做大数据和人工智能培训讲座。首次提出了敏捷大数据方法论,在数据挖掘、商业智能、机器学习和交通、政务、医疗大数据等领域有10余年的系统研发、管理与咨询经验。迄今为止,主研国家自然科学基金和国家重点研发计划项目4项、主持企业课题和产品研发20余项,获得专利和软件著作权6项,发表论文10余篇。

作品目录

作者介绍
自序
第1章:大数据智能概论
1、大数据现象的本质
2、大数据是个“筐”,什么都能往里装
3、何谓大数据智能
4、大数据智能三要素
5、大数据智能的马太效应
第2章:多维度解构大数据智能技术
1、“四位一体”看大数据智能
2、大数据智能产业链版图
3、大数据智能的关键技术体系
4、从数据科学看大数据智能
5、从商业智能看大数据智能
6、智能时代的基础信息架构
第3章:大数据驱动的深度智能
1、深度学习的崛起
2、机器如何智能:从感知到认知
3、机器如何学习:从知识到数据
4、机器学习五大学派
5、神经网络的“三起两落”
6、深度学习原理及核心网络结构
7、深度强化学习:深度感知+强化决策
8、深度学习的“深度”价值
9、深度学习的瓶颈与挑战
第4章:敏捷大数据智能
1、为什么需要敏捷
2、敏捷大数据方法论
3、微服务、容器与数据融合
4、敏捷大数据智能技术架构
5、结论与展望
第5章:大数据智能“独角兽”探秘
1、Palantir的本体人机共生
2、Google的深度智能样板工程
3、IBM的认知智能
4、TensorFlow的Android式进化
第6章:大数据智能个人学习篇:入门与实践
1、智能时代的学习革命
2、大数据智能技术“盲人摸象”
3、大数据智能“3+3”学习路线
4、如何避免大数据智能学习的误区
5、Kaggle,众包与大数据教育
6、三种核心职业角色
7、理性看待所谓的“风口”
第7章:大数据智能企业应用篇:战略与规划
1、智能时代的商业革命
2、大数据智能应用全周期模型
3、如何避免大数据智能应用的陷阱
4、大数据应用战略
第8章:大数据智能政府管理篇:治理与决策
1、智能时代的治理革命
2、政务大数据治理挑战
3、政务大数据治理与应用框架
4、政务大数据决策安全
5、应用标准与落地应用的悖论
6、政务治理的现代化
第9章:结语
1、认知泡沫与应用价值
2、机器智能与人类智能
3、人技融合,学以“治”用
4、智能时代,我们将走向何方
致谢
反侵权盗版声明

热门书摘

机器学习算法的设计和应用可以参考如下选型思路进行(见图3-17)。图片: 图3-17 机器学习算法不完全选型参考流程(1)首先考虑数据规模,一般来讲小数据多采用浅层学习方法,而大数据可以考虑深度学习模型。这种选择也不是绝对的,传统的机器学习方法也可以应用于大数据建模,只是相对来讲深度学习的效果会更好。当然要还要考虑计算资源的条件是否足够,数据格式类型是否匹配。(2)其次要搞清楚要学习的问题属于什么类别?是预测一个类别,还是预测数值,一般来讲分类和聚类都属于类别预测问题,数值预测属于回归问题,如果都不属于,那么再考虑降维、探索,或关联分析等问题。(3)再次采用大家普遍认同的主流学习算法。比如解决分类问题时会想到支持向量机;回归问题会想到线性回归和逻辑斯特回归;大规模图像识别会想到CNN;大规模序列数据学习使用LSTM会比较有效等。(4)再则还要考虑如何对模型的性能进行提升?一般来讲,通过集成学习方法能提升原模型的预测准确率,而训练和测试过程中采用交叉验证、正则化等技术也能提高模型性能。(5)最后看如何与决策支持对接,模型的预测结果如何跟行为决策在算法层面进行结合?这是工程应用最难的环节,比如AlphaGo 采用深度学习加强化学习(结合蒙特卡洛树搜索算法)集成架构的设计,这需要丰富的机器学习经验才能得以实现。上述五个方面的选型参考并没有覆盖涉及机器学习的所有问题(比如提升模型泛化能力的正则化算法、梯度计算和误差计算等方法的选择等)。在实际应用中,要找到一个合适的算法实则不容易,选定算法之后怎么调到最优和稳定状态更不容易。如同机器学习本身,没有精确解,甚至很难说有最优解,很多时候我们是在选择一个足够好的算法和寻找一个相对最优解来解决学习问题。

相关推荐

微信二维码