本专著对抄袭检测,尤其是高模糊抄袭检测,开展深入的研究。以大幅提高抄袭检测系统性能为目标,提出了基于统计机器学习方法解决抄袭检测问题的方法,探索了抄袭检测的语料库构建、web环境下的抄袭源检索和基于语义的高模糊抄袭检测的问题、方法、架构和模型。具体内容包括:1、综述了抄袭检测的概念、类型和框架;2、提出了基于自然标注的抄袭语料构建方法,解决了高质量、反映真实抄袭情况的抄袭语料匮乏问题;3、提出了基于排序学习的源检索查询生成模型和基于检索结果聚合性的源检索过滤模型,解决了以互联网为抄袭资源的抄袭源检索问题;4、提出了句法和语义交互的文本深度释义匹配模型和基于序列标注的文本对齐模型,解决了高模糊抄袭的检测问题。
《抄袭检测研究》以文本的抄袭检测为研究对象,探索了抄袭检测的语料库构建、Web环境下的抄袭源检索和高模糊抄袭检测的文本对齐的问题、数据、架构和模型。《抄袭检测研究》共9章,第1~3章介绍了抄袭检测的概念、类型和框架,综述了抄袭检测的方法;第4章介绍了现有抄袭语料构建方法,提出了基于自然标注的抄袭语料构建方法;第5和第6章对抄袭源检索开展研究,描述了基于排序学习的源检索查询生成模型和关注检索结果聚合性的源检索过滤模型;第7~9章,对抄袭检测的文本对齐开展研究,提出了基于排序学习的抄袭文本匹配模型、句法和语义交互的释义文本深度匹配模型以及基于序列标注的文本对齐模型。
《岛屿来信》内容简介:翁达杰说,如果你从空中俯瞰,这个世界是没有疆界的,地图上那些边界线都不存在。因为对这个世界心存向往,
《世界经典口琴小品111首》内容简介:口琴,是人们喜闻乐见的一件乐器,拥有广泛的群众基础。然而在乐谱市场中,高质量的口琴乐谱极
商业数据流挖掘模型.方法及应用 本书特色 本书是商业数据流挖掘方面的一本学术专著,包括商业数据流数据管理模型、概念漂移模型、商业数据流关联规则、分类、聚类方法,...
Onlinecommunitiesofferawiderangeofopportunitiestoday,whetheryouresupportingacaus...
《短视频拍摄与制作(微课版)》内容简介:随着移动互联网的高速发展,短视频行业也发展迅猛,成为5亿多人的信息关注、分享和传播的
《如果舌尖能思考》内容简介:人工智能AlphaGo能把人类的九段围棋手们打得遍地找牙,但是没法跟人比赛吃喝。吃喝,也许是最后能给人
《东京迷上车》内容简介:有一本书,我想为你写,是关于东京的。很对不起,时间和资源不允许我带着你慢慢走。不过,看了这本书,只
《叶秀山全集·第九卷》内容简介:本选题分类结集叶秀山先生全部已经出版的专著,在学术期刊上发表的所有论文,以及部分笔记、札记
《研究生英语学术论文写作》内容简介:本教材以任务型教学为编写原则与核心理念,将论文写作步骤与语言技能训练融为一体,使学术论
《摄影构图书(全彩)》内容简介:构图是摄影之本。在摄影院校的教学体系中,曝光、用光、色彩、构图并称摄影“四大核心”。要想学
本书是一本关于数字技术的科普书,作者通过50篇短小精干的短文,介绍了改变我们这个世界的50种数码知识,包括云计算、文化反赌、
《与哲学家一起思考》内容简介:1. 本书为施太格缪勒(Wolfgang Stegmüller)获奖作品 2. 作者是德国哲学家恩斯特教授 3. 本书内容
《深度学习实践:计算机视觉》内容简介:本书主要介绍了深度学习在计算机视觉方面的应用及工程实践,以Python 3为开发语言,并结合
日本設計大師原研哉為其設計生涯的諸多作品,以淺顯易懂的精鍊語言,做全面性解說。近年來的新作,如「HAPTIC」展、北京奧運象徵
《深入理解MySQL》深入源代码,剖析了MySQL数据库系统的架构,并提供了分析、集成和修改MySQL源代码的专家级建议。《深入理解MyS
《图像处理、分析与机器视觉(第3版)》是为计算机专业图像处理、图像分析和机器视觉课程编写的教材。《图像处理、分析与机器视觉(
《世界大学生程序设计竞赛(ACM/ICPC)高级教程(第1册):程序设计中常用的计算思维方式》主要介绍了大赛程序设计中的常用思维方式,
淘宝天猫网店设计从入门到精通-店铺装修.广告海报.修图修片.架构布局.配色应用.设计模版 本书特色 《淘宝天猫网店设计从入门到精通 店铺装修+广告海报+修图修片...
《互联网+模型构建》内容简介:“互联网+”构建了一个庞大的跨界体系,在这个框架下,大数据、云计算、移动互联、物联网、虚拟现实
《黄河三角洲高效生态经济区发展报告(2014)》内容简介:本书是对黄河三角洲地区进行全景式分析的研究报告。总报告对黄河三角洲地