"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
在计算机发展的历史上,没有哪一种程序设计语言像C语言这样应用广泛。本书是C语言的设计者之一DennisM.Ritchie和著名计算机科学家
InTheSemioticEngineeringofHuman-ComputerInteraction,ClarisseSieckeniusdeSouzapro...
《市场研究与应用》收集、整理、归纳和丰富了市场研究的最新成果,内容涉及市场细分与定位、产品测试、营销渠道及其管理研究体系
本书是一部论述中国自史前至近代数千年纺织生产和工艺技术发展历史的著作。全书分为四编。第一编阐述古代的纺织生产情况;第二编
这本鼓舞人心的指南结合新鲜简洁的生活经验,用一两句话和看似简单的图表曲线,教你怎样才能活得更加丰富多彩。书中鼓励你小小地
《国外电子与通信教材系列·无线通信》深入浅出地讲解了无线通信原理、技术和系统设计的所涉及到的各个方面。全书共分5个部分,2
HarnessthepowerofJavaServerFacestocreateyourownserver-sideuserinterfacesfortheWe...
EndNote&Word文献管理与论文写作-第二版 本书特色 本书共分为6章,第1~3章介绍endnote的操作,包括带领读者建立并利用个人endnote li...
《理解Unix进程》从Unix编程的基础概念着手,采用循序渐进的方法,详细介绍了Unix进程的内部工作原理。《理解Unix进程》提供的许
《控制阀设计及先进制造技术》内容简介:控制阀是过程自动化装置中极为重要的设备之一,是流程工业自动控制系统的执行器,流程控制
《网络空间的劳动图景》内容简介:本书探讨的是传播政治经济学的新鲜话题。作者认为,网络用户劳动是互联网时代资本和劳动重构的产
未来信息时代的城市是什么样的?构成城市肌理的建筑又以怎样的面貌呈现?本书从电子会场、电子公民、比特业等多角度,既系统又深
《考古有意思:秦始皇的兵与城》内容简介:考古大咖写给大众的考古版寻秦记! 兵马俑一号坑第三次发掘和秦咸阳城发掘领队许卫红根据
《iPad玩乐志(ios4.2全面进化版)》的主要内容是:完全基于iOS4.2,解说最详细。iOS4.2新功能应用全解析,照着操作绝对没问题。
《千年贸易战争史:贸易冲突与大国兴衰》内容简介:贸易与冲突是构成世界历史的主要内容之一,经贸利益是世界历史上很多重大战争的
《Android 9编程通俗演义》内容简介:本书严格参考Android 9官方开发文档的逻辑,全面讲解Android开发中的各种技术,章节内容循序渐
《特大型城市公共服务资源配置》内容简介:本书运用问卷调查、个案访谈、典型事件等社会调查方法,研究了特大型城市基层治理与创业
《亚细亚生产方式与东方社会发展道路》内容简介:对马克思的亚细亚生产方式的讨论和争论,不仅关系到对这一理论本身的评价和东方社
ThisconcisebookdemystifiestheDocumentObjectModel(DOM),asetoftoolsformanipulating...
《多面的制度:跨学科视野下的制度研究》内容简介:从三皇五帝到品秩爵位,从中央集权到地方自治,从自上而下到自下而上,从正式规