本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
Originallypublishedin1985,NeilPostmansgroundbreakingpolemicaboutthecorrosiveeffe...
《解读区块链》内容简介:本书用通俗的语言介绍了区块链相关的起源、发展和目前的状况,主要介绍了区块链对于金融行业的影响,以及
C语言程序设计---现代方法第二版 本书特色 《C语言程序设计:现代方法(第2版)》是C语言的经典之作,被誉为“近10年来*好的一部C语言著作”。书中讨论了标准...
《颠覆完美软件:软件测试必须知道的几件事》是从事软件行业五十余年的GeraldM.Weinberg针对软件测试所写的新作。他在软件项目的
《轮船史》内容简介:本书是由我国著名科技史学者、中科院院士杨槱教授继《帆船史》后的又一本船史图书。杨槱教授长期从事船舶的生
《色彩感知学》内容简介:色彩学习从视觉上论证客观事实与主观感受之间的落差——观看的心理因素。是关于“看”的哲学和心理学。
《匆匆》内容简介:本书共收录了朱自清31篇随笔、散文,他用清隽的笔调写看花、春晖的一月、扬州的夏日、荷塘月色,也写白马湖、威
《只愿你曾被这世界温柔相待》内容简介:“在冷酷和粗暴的世界里,用自己温柔的方式生存下去的人,是了不起的人。”这是一本关乎内
《预防医学实习和学习指导(第2版)》内容简介:本书分为实习和复习思考题两篇。实习篇分为5个部分,即医学统计学实习、流行病学实
ACalltoActionthatAnswerstheQuestionsPosedbytheGrammyAward-WinningAnInconvenientT...
ThisbookpresentsguidelinesforprofessionalWebdevelopment,includingcommunicatingwi...
一部值得所有行业和企业借鉴的发展战略案例集。全球最著名的华人经济学家郎咸平教授为中国高科技文明把脉,助中国高新技术企业实
《现代编译原理:C语言描述》全面讲述了现代编译器的结构、编译算法和实现方法,是Andreww.Apple的“虎书”——ModernCompilerIm
HTML5实战 本书特色 作为web开发领域里发展*快的技术之一,html5凭借其动态特性及跨平台特性日益成为程序设计领域备受推崇的语言。作为一门新兴语言,ht...
ThisthirdvolumeofKinfolkexploreshowweallmightbenefitfromincorporatingmoreoftheth...
《数据化网站运营深度剖析》内容简介:近些年,互联网促进经济迅速发展,越来越多的企业把互联网当作产品营销的重要渠道。网络营销
《现代化的政治》内容简介:该书对发展中国家的政治现代化道路进行了深入的分析,特别是在实现政治现代化的过程中影响政治变革的一
《众妙之门——抓住访客心理的网页设计》是知名Web设计网站SmashingMagazine关于网页设计心理学的知识及经验的分享。这些文章都是
谭浩强教授,我国著名计算机教育专家。1934年生,广东台山人。1985年清华大学自动控制系毕业。学生时代曾担任清华大学学生会主席
计算机图形学 内容简介 本书主要讲述计算机图形学的有关原理、软硬件环境、几何建模和图形处理的基本方法。介绍了计算机图形学的基本概念、发展和应用,计算机图形系统的...