知网检测样例–学术不端文献检测系统存在的局限性
发布时间:2017-09-30 点击率:0
在许多研究者对检测系统大加赞赏的同时,也有不少人提出了不同意见,认为决不能以检测结果作为判定是否学术不端的标准,它存在许多负面效应。他们认为,检测系统仅仅是编辑提高检测效率的辅助工具,而不是判定是否学术不端的标准,检测结果可能存在假阳性。
“《中国青年报》就高校引进学位论文学术不端行为检测系统反抄袭对网民调查的结果显示: 有77.01%的网民不相信仅仅靠检测系统就能杜绝造假。
有人担心系统全面推广会成为人肉搜索和互相倾轧的工具; 有人认为为防止造假而制造专门的学术‘测谎仪’是学术界的悲哀; 还有相当比例的人担心越检测造假越精明。”
而且,利用机器进行检测必然存在使用盲点,它还有许多需要进一步完善的地方。
《中国学术文献网络出版总库》是检测系统的全文比对数据库,尽管数据库的收录种类上已经具有明显的优势,但收录上的盲区仍然存在,例如图书,大量的博客、微博、论坛上的文章,大量的外文文献,内部资料文献,期刊的增刊论文,内部刊物论文,其他一些网络数据库的文献,等等,未能收录。
数据库资料的收集都有一个范围,检测系统所依托的数据库都不可能穷尽所有文献,如果抄袭了来自数据库以外的文献,反剽窃软件就无能为力。所以,检测系统的辨别范围是有局限的。
2.检测出的文字复制比并不等同于抄袭度
一般情况下,文字复制比与抄袭度呈正比,重复文字越多学术不端越严重。但数量是相对的,文字复制比对判定是否存在学术不端只能起到一个辅助作用,因为有些重合的文字并非抄袭,属于合理使用。而有些文章复制比并不高,但重复的是文章的核心部分,这种情况仍然可以判定为学术不端。
反剽窃软件不能分辨是正常引用还是抄袭。此外,对比较隐蔽的学术不端行为,检测系统也无法识别,比如改头换面、变换句式、调整语序,等等。对剽窃他人的研究方法与研究观点的行为也无法用仪器检测,观点与方法是抽象的、逻辑性的东西,检测系统主要采用“外形”比对,所以意义抄袭、观点抄袭这种隐蔽抄袭很难比对出来。
还有,检测系统对文字敏感,对图表则手段缺乏,科技论文中的化学方程式、数学公式、插图等均不能有效识别。
3.检测系统的滞后性
一篇论文从投稿到发表有一个时滞,如果有人利用这个时间差将文章同时投向几个刊物,由此产生的重复发表系统是无法检测的。此外,一篇论文在印刷版刊出后,仍然需要一两个月甚至更长时间才能上传到知网数据库,才能在《中国学术文献网络出版总库》中以电子版的形式发表,这也是文献利用中出现的一个时间“盲区”,如果复制这一时段里已经发表但未上网的学术论文并快速发表,也能逃避系统检测。
.—— END ——.