拿到 Turnitin 报告,首页显示的相似度是 28%。你按照攻略操作,把"排除引用"和"排除参考文献"两个选项都勾上了,数字一下子掉到了 9%。问题来了——学校到底看哪个数字?是 28% 还是 9%?你自己心里又该按哪个标准来评判这篇论文是不是过关?
排除前后的两个百分比,含义不一样,使用场景也不一样。把它们混为一谈,要么会让你对论文的重复程度过度焦虑,要么会让你漏掉真正需要处理的问题。这篇文章把这两个数字的关系拆开来说清楚。
排除前的百分比:一锅端的总数
排除前的相似度,就是 turnitin查重 报告刚生成时显示的那个数字。它把系统比对出来的所有匹配都算进去了——你正文里的引用句、文末的参考文献列表、附录里的量表、甚至致谢页里的套话,凡是数据库里有类似文本的地方,统统计入。
这个数字的参考价值其实不高,因为它包含了大量在学术规范内完全合理的内容。一篇引用了 40 篇文献的综述类论文,引用句本身的字数加起来可能就有好几百词,再加上参考文献列表的格式化条目,这些内容被算进相似度之后会把总百分比推到虚高的位置。换句话说,排除前的 28% 里,可能有一半以上是"合法的重复"。
但排除前的数字有一个不可替代的价值——它让你看到论文的全貌。如果你发现排除前的数字异常高(比如超过 40%),那就算其中大部分是引用和参考文献,也说明这篇论文里别人的东西占比太大了,原创内容的空间被压缩得很厉害。这种情况下,即使排除了引用之后数字看起来还行,论文本身的原创性也值得重新审视。
排除后的百分比:反映正文的真实状态
勾上"排除引用"和"排除参考文献"之后重新计算的百分比,更接近论文正文在原创性层面的真实情况。这个数字剔除了两个最大的"合法重复源":用引号标注的直接引文,和文末参考文献列表里的格式化条目。
大部分导师和学校看 Turnitin检测 报告时,默认参考的就是排除后的数字。如果你的学校对相似度有明确的阈值要求(比如不超过 15% 或 20%),一般指的就是排除引用和参考文献之后的结果。不放心的话可以翻一下课程大纲或者问一下导师——但绝大多数情况下,这个理解是没错的。
不过排除后的百分比也不是万能的。它有两个容易被忽略的局限:
第一,它只能排除被引号包住的直接引文。如果你引用了别人的观点但没有用引号,只是用自己的话改写了一下,那这种改写后的段落不会被"排除引用"功能过滤掉。如果你的改写跟原文的措辞仍然很接近,Turnitin 照样子会把它标记为重复。所以排除后的 9% 里,可能还藏着你以为自己改写充分了但实际上措辞仍然太接近原文的段落。
第二,"排除参考文献"有时候排不干净。参考文献列表的识别依赖于 Turnitin 自动判断哪些内容是参考文献条目。如果你没有用标准的参考文献格式(比如条目之间没有明显的分段、或者使用了比较冷门的引用格式),系统可能识别不全,导致部分参考文献条目仍然被计入正文的相似度。所以排除之后如果参考文献区域还有些标黄残留,可以手动忽略,不用纠结。
排除小片段匹配:要不要勾
Turnitin 报告里还有一个排除选项——排除小于一定字数或百分比的匹配。比如勾上"排除少于 10 个词的匹配",那些零星的短语级别的重复就会被过滤掉,报告的相似度还会再降一点。
这个选项要不要勾,取决于你的使用目的。如果只是为了了解论文的大致重复状况,而且你已经确定那些小片段不是问题,勾上可以让报告更聚焦于值得关注的连续匹配。但如果你的导师对查重要求比较严格,或者你正在排查论文里可能存在的无意间引用遗漏,那把阈值设得低一点、不排除小片段,能帮你看到更多细节。
有一个小建议——不管你怎么设置,提交之前最好把排除了参考文献和引用但保留了小片段匹配的那份报告截图存一份。这样你手头同时有"排除前"和"排除后"的两组数据,万一导师问起来,你能说明白每一步过滤之后数字变化的原因。
不同场景下应该关注哪个数字
如果你是在写初稿阶段做自查,重点看排除后的百分比。它能帮你快速判断正文里哪些段落真正需要降重改写,不会被引用和参考文献干扰判断。
如果你已经定稿,要确认论文能不能达到学校要求,那就得两个数字都看——先看排除后的百分比是否在你学校规定的阈值以下,再看排除前的百分比有没有高到离谱(比如超过了 35%)。如果排除前很高但排除后很低,说明你引用了大量文献但正文措辞是独立的,这种情况通常解释一下就过去了。
如果你在准备期刊投稿,那么编辑一般会参考排除后的 turnitin相似性检测 结果。不过投稿场景下还有一个额外的关注点——编辑会仔细看相似度的分布,而不仅仅是百分比数字。如果正文的方法部分和讨论部分的相似度都很低,只是引言里有几段对前人研究的概述导致了匹配,编辑通常不会因此拒稿。
一个容易忽略的细节
Turnitin 报告的排除功能不会改变原始的相似度数据,它只是在显示层面做了一个过滤。你把报告导出成 PDF 或者在线上直接展示给导师看的时候,系统会默认显示你当前选择的那组过滤条件下的相似度数字。所以导出报告之前记得确认一下排除选项是不是你想要的设置,别导出之后才发现数字跟预想的不一样。
说到最后
排除引用和参考文献后的百分比,反映的是正文在去掉规范化引用内容之后的原创状态,这也是学校和编辑最关注的那个数字。但排除前和排除后两个数字之间的落差,本身就是一个很有用的信息——落差越大,说明你论文里规范化引用的内容占比越高,正文本身的原创空间越充足。比起死盯一个数字,理解两个数字之间的关系,才是真正读懂 Turnitin 报告的方式。




