"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
《真幌站前狂骚曲》内容简介:《真幌站前狂骚曲》中,多田与行天在彼此嫌弃与互相扶持中,又迎来了新的一年。“真幌站前”系列大结
“不作恶”的Google何以身陷“三重门”?聪明的Google为何在中国变得不够聪明?强大的Google在与百度的交锋中为何会完败?作者简
自然语言处理技术基础 本书特色 本书包括了三个方面的内容。**部分介绍基于规则的自然语言处理技术,分别从语法和语义两个层面入手。第二部分介绍基于统计的自然语言处...
設計是什麼?為什麼設計?原研哉與阿部雅世,東京與柏林,居住在兩個不同城市的設計者,進行了一場以「設計」為題的討論。本書是
《大清后宫的正面与侧面》内容简介:这里有你在影视剧中遇到的种种问题的正面回答—— 历史上真有甄嬛这个人吗? 帝王在后宫中的权
《影响中国历史的十篇政治美文》内容简介:中华文章浩如烟海,其中有一支“政治美文”,即既有思想,文字又美的文章,其作用远在其
C++Primer中文版第4版 内容简介 作为目前业界广泛使用的编程语言,C++可谓包罗万象、博大精深。20年来,讲述C++的图书早已经汗牛充栋、层出不穷,但其...
《长问西东》内容简介:本书为刘东先生对中西文化进行长期比较思考的结晶。书名“长问西东”从清华校歌“无问西东”中来。作者深入
《HBase企业应用开发实战》内容简介:国内资深Hadoop技术专家实践经验结晶,完全从企业实际生产环境和需求出发,旨在帮助企业真正解
《新零售模式下的快消品营销策略》内容简介:《新零售模式下的快消品营销策略》通过作者亲自操盘过的各种行业标杆性案例,对传统营
《情绪密码》内容简介:其实,在子女成长过程中,他们的快乐指数取决于家长是否能够在其心理成长关键期,能够对他们的“情绪免疫力
物联网概览以及联网装置设计原则因特网原理原型设计与制作及具体案例介绍物联网装置涉及的编程技术物联网产品商业模式制造阶段可
本书作者利用丰富的时尚类杂志设计和宝贵的数字出版方面(iPad交互杂志)的经验为我们展示了不需要编程的知识,如何使用平面软件
《微课设计与制作一本通》内容简介:本书分为“微课视频的设计和制作”“微课视频制作软件”上下两篇,上篇介绍微课设计的基本概念
《Python预测分析实战》内容简介:本书先介绍预测分析的重要概念和原则,然后给出一系列的代码示例和算法讲解,引导读者了解完整的
《移动界面(Web/App)Photoshop UI设计十全大补》内容简介:智能手机App,UI设计是目前比较热门的专业,也是一块新兴的平面设计领
陆中浪:一位从零创业,没有打过一天工,也未领过一天工资,仅仅用了5年时间就拥有二十余项投资产业、三十多家公司,涉及服装、餐
《HAWQ数据仓库与数据挖掘实战》内容简介:ApacheHAWQ是一个SQL-on-Hadoop产品,它非常适合用于Hadoop平台上快速构建数据仓库系统。
《数字抑郁时代》内容简介:你不经意间养成的习惯,背后都是高科技的老谋深算 慕尼黑大学心理学教授教你认清套路,看穿隐藏在数字技
《资本主义民主的批判与反思》内容简介:本书集中收入了国外马克思主义者对民主问题的研究动态,并进行了理论上的探讨和分析。关于