"Mining the Web: Discovering Knowledge from Hypertext Data" is the first book devoted entirely to techniques for producing knowledge from the vast body of unstructured Web data. Building on an initial survey of infrastructural issues - including Web crawling and indexing - Chakrabarti examines low-level machine learning techniques as they relate specifically to the challenges of Web mining. He then devotes the final part of the book to applications that unite infrastructure and analysis to bring machine learning to bear on systematically acquired and stored data. Here the focus is on results: the strengths and weaknesses of these applications, along with their potential as foundations for further progress. From Chakrabarti's work-painstaking, critical, and forward-looking-readers will gain the theoretical and practical understanding they need to contribute to the Web mining effort. Features include: a comprehensive, critical exploration of statistics-based attempts to make sense of Web Mining; details the special challenges associated with analyzing unstructured and semi-structured data; looks at how classical Information Retrieval techniques have been modified for use with Web data; focuses on today's dominant learning methods: clustering and classification, hyperlink analysis, and supervised and semi-supervised learning; analyzes current applications for resource discovery and social network analysis; and, an excellent way to introduce students to especially vital applications of data mining and machine learning technology.
《服务市场营销(第二版)》内容简介:《服务市场营销(第2版)》以市场营销的基本原理为指导 ,以服务领域为研究重点,深入浅出地
《时光与你:唯美人像摄影与后期养成攻略》内容简介:关于摄影的知识纷繁而复杂,并没有一条特定的逻辑线贯穿始终,而本书所梳理的
《中国私募基金投资年度报告2015》内容简介:“私募股权(PE)”、“阳光私募”(即对冲基金)和“私募房地产”,是全球资产规模最大
ItseemsthateveryoneandhersisterhasdevelopedaniPhoneApp—everyoneexceptyou,thehard...
《李济平 邓定海传》内容简介:本书为雨花台烈士传丛书第四批之一,为李济、邓定海烈士的合传。李济于1927年加入中国,曾任扬州地委
张量数据的特征提取与分类 本书特色 《张量数据的特征提取与分类》的主要研究内容是在模式识别应用领域中,提出新的基于张量数据的特征提取和分类算法,并且对这些张量型...
《生命的战争》内容简介:最早的那批可以自我复制并且随机突变的复杂有机分子,经历了怎样的发展,才最终造就了如今这个多姿多彩的
《金融促进高质量发展之路》内容简介:随着我国经济不断发展,国家综合实力不断提升,加之受新冠肺炎疫情的影响,金融业发展在我国
《爱上古诗文》内容简介:一年一度的上海小学生古诗文大会暨古诗文“桂冠少年”选拔活动即将在9月份启动,承办方上海教育报刊总社《
在这个信息技术无所不在的时代,编程能力正在变得越来越重要。C++以高性能、易移植而著称,而且同时支持过程式、面向对象和泛型编
水下运载器操纵控制及模拟仿真技术 本书特色 《水下运载器操纵控制及模拟仿真技术》是由国防工业出版社出版的。水下运载器操纵控制及模拟仿真技术 内容简介 本书通过水...
《Arduino互动设计》内容简介:本书使用Arduino硬件平台和Mixly图形化编程工具,从简单的“点亮创客之灯”开始,以生活中常见的具体
本书是RogerL.Peterson等人合著的经典著作。本书自成体系,内容连贯,由浅入深详细介绍了扩频通信的基本概念、原理和分析方法。内
《传播文书写作》内容简介:本书简明扼要地论述了传播文书写作的相关知识,详细地对新闻类传播文书、宣讲类传播文书、广告类传播文
《101个有科学根据的减肥小偏方》内容简介:热量过多就是中毒,体重过多就是自杀! 专业医师邱正宏将多年的研究成果与实践经验,总
《Go微服务实战》内容简介:当今世界,软件的规模越来越大、功能越来越复杂,研发团队的规模也变得越来越大,运维人员和研发人员之
计算机组装与维护教程 节选 本书根据应用型本科计算机科学与相关专业的培养目标、特点和要求,详细介绍了*新的计算机系统的各组件,包括主板、CPU、内存、显卡、外设...
《合伙人制度》内容简介:在这个“大众创业,万众创新”的时代,合伙人制度的优势得到了充分的凸显:可以避免传统的职业经理人制带
《你不知道的美国那些事儿》内容简介:作者专从华侨华人及留学生在美国政治、经济、文化和其他领域的生活视点出发,展示美国华人社
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信