本书主要框架是基于跨行业数据挖掘标准流程 (CRISP-DM) 这一知识发现 (KDD) 过程模型展开, 其内容主要包括互联网数据 (来自新浪微博、Facebook和Twitter) 的收集、准备、建模、评估和实施, 并利用R软件和Microsoft SQL Server软件在实务案例中进行文本挖掘。
《文本挖掘技术及其应用》包括四个部分。**部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在r软件上详细介绍了文本挖掘,包括r 软件的简介与安装,文本挖掘所需的基本r包,facebook、微博、twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在ms sql sever上介绍如何实现文本挖掘,**章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在ms sql sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
《杨家将演义(插图本)》内容简介:杨家将故事,是我国民间流传最广的英雄传奇故事之一。《杨家将演义》为明人编撰的一部杨家将小
计算机网络的发展正改变着整个社会,这种改变影响了人们的工作、生活和受教育的方式,甚至渗透到我们每个人的行为中。网络已成为
属性拓扑理论及其应用 本书特色 本书以属性拓扑理论及其应用为主线,系统地介绍了属性拓扑基本理论及其应用的*研究成果. 全书分为基础知识、概念计算、关联分析、记忆...
《拜托了,黏土!插画风黏土小物制作》内容简介:手作,充盈了我们的闲适时光。有趣、新鲜的手工小物,给我们的生活增添了多彩的乐
《Quarkus实战》内容简介:Quarkus建立在我们已熟知的基础技术之上。它使用JPA、JAX-RS、Eclipse Vert.x、Eclipse Micr...
《通盘无妙手》内容简介:本书是陆宝投资CEO刘红女士多年来写的随笔文章合集,包括投资、读书、人生等多方面的感悟。作者以其丰富的
《讲述中国历史》内容简介:这是一部美国历史学家魏斐德从全球范围来解析中国历史的著作,堪称其40年中国史研究集大成之作!内容涵
《趣学Python——教孩子学编程》内容简介:Python是一款解释型、面向对象、动态数据类型的高级程序设计语言。Python语法简捷而清晰
《掘金:互联网+时代创业黄金指南》内容简介:“互联网+”这个词随着政府工作报告变得炙手可热,这个词既是对过去已经发生的总结,
JAVASCRIPT DOM编程艺术(第2版) 本书特色 amazon超级畅销书*新版,释放javascript和dom编程的惊人潜力,涵盖html5及jque...
《PhoneGap实战》由来自腾讯的资深专家团队撰写,Adobe中国区专家和PhoneGap中国社区联袂推荐。《PhoneGap实战》内容全面、注重实
《规模思维》内容简介:本书聚焦数字时代的复杂性,强调了一个有趣的悖论:我们处于一个信息大爆炸时代,但具有讽刺意味的是,我们
Creo2.0产品设计实用教程 内容简介 全书共分十一章, 主要内容包括: 比较系统地介绍了Pro—E的工作界面、文件的操作以及鼠标的使用 ; 草绘 ; 拉伸、...
《大数据时代的IT架构设计》以大数据时代为背景,邀请著名企业中的一线架构师,结合工作中的实际案例展开与架构相关的讨论。《大
《Android 9编程通俗演义》内容简介:本书严格参考Android 9官方开发文档的逻辑,全面讲解Android开发中的各种技术,章节内容循序渐
空间碎片的危害正受到科学、商业等领域空间用户越来越广泛的关注。《空间碎片--模型与风险分析(精)》(作者克林克瑞德)是一部空间
《编程珠玑》第一版是我早期职业生涯中阅读过的对我影响较大的书籍之一,在书中首次接触到的很多观点都让我长期受益。作者在这一
深入浅出AutoCAD.NET二次开发B4003 本书特色 《深入浅出AutoCAD.NET二次开发(附光盘)》由李冠亿编,全书结构合理、图文并茂、讲解生动、实...
《曾国藩家书》内容简介:本书辑录了曾国藩在清道光30年至同治10年前后达30年的翰苑和从武生涯的书信一百六十余篇。家书涉及的内容
《人文知识与改错(英语专业八级考试培训教程)》内容简介:本书是针对专八考试人文知识与改错部分的专项辅导书。人文知识大致从英