设为首页|收藏本站|
开启左侧

[问答] 知网查重的原理是什么,具体规则经验总结!

[复制链接]
99952 0
ztubriyy 发表于 2022-5-12 23:33:12 | 只看该作者 打印 上一主题 下一主题
 
其实知网官方并未公布其查重的规则原理,所有的论文查重系统都不会告诉你他的原理!
这是人家的商业机密哟!所以网络上的都是经验总结,知网查重的原理咱们也来总结一下:

知网查重的原理是什么,具体规则经验总结! 第1张图片

知网查重的原理是什么,具体规则经验总结!


  • 原文作者:纳兰德学姐
  • 原文出处:百家号
  • 原文链接:https://bAIjiahao.baidu.com/s?id=1732061545705756369&wfr=spider&for=pc
查重原理 1:句群语义模糊算法
知网论文查重采用最先进的语义模糊算法,关注句子中心意思和关键词,「了、着、的、可以」等虚词的修改并不会降低重复率。虽然查重报告左右两边红色部分内容并不完全一致,但是系统会智能判定为语句重复。  
查重原理 2:划分章节分别检测,阈值 5%
整篇论文上传后,系统会自动根据文章生成的目录检测该论文的章节信息,然后系统会将论文分章节检测,可以获得每一单章节的复制比,同时目录显灰色不参与正文检测;否则会自动分段按照 1 万字符左右检测,同时,目录有可能被当成正文检测,重复就会标红。  
正规学术不端查重:学术不端网-集维普,万方,源文鉴查重入口,为实惠论文检测而生
中国知网对该套查重系统的灵敏度设置了一个阀值,该阈值为 5%,以段落计,低于 5% 的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。  
查重原理 3:疑似部分二次检测
查重系统最厉害的地方就是这个功能,即它会对疑似的部分进行二次检测。 以下面这段文字为例: 我曾经看过一段文字,它是这么说的:「生而为人,我很抱歉」。我认为这有点悲观。  
「生而为人,我很抱歉」这句话是很容易被发现重复的,如果第一次被系统判定为疑似重复,那么系统就会加强这句话和相关的讨论太宰治作品、影视作品的文字或者网络文章进行对比,并且前后文也会加强检测。经过如此的重重检测,想逃避重复的事实难如登天。
知网是如何「查重」的?知网查重怎么查?中国知网的 CNKI 工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,从硕博研究生学术论文强制使用开始,几年的发展快速延伸到所有 211 和 985 院校,其他高校也开始以抽检的方式在陆续使用,使用范围包括出版社的审稿、职称评定、科研成果的查重等。目前,知网学术不端系统的数据库包含博士和硕士学位论文、期刊和会议论文、专利、网页数据、图书等文献资源。


上一篇:北京楼市:学区房/学籍房即将进入冷淡期
下一篇:谷爱凌&全红婵,两个天才少女的不同人生
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-5-8 17:00