投稿前用 iThenticate 自查了一遍,报告上写着 19%。你盯着这个数字看了五分钟,脑子里来回转一个问题——改还是不改?改的话不知道改到什么程度算够,不改的话又怕编辑那边拿到报告之后直接退稿。
这个纠结很多第一次投稿的人都有。iThenticate 跟 Turnitin 虽然底层引擎同源,但在投稿场景下读报告的逻辑跟交作业不完全一样。编辑看 iThenticate 报告时的关注点,也跟你自己盯着一个百分比数字看的方式差别很大。搞清楚编辑在看什么,你就能自己判断这 19% 到底要不要改、改哪里、改到什么程度收手。
编辑打开报告,第一眼看的不是百分比
大部分作者拿到报告就直奔那个带颜色的数字——绿的还行,黄的就紧张,红的心就凉了半截。但期刊编辑打开同一份报告的时候,他们的信息接收顺序跟你完全不一样。
编辑先看的是高重复来源列表——页面右侧或下方那一列显示匹配来源的条目。如果最高的几个匹配来源都只占 1% 到 2%,而且来源是分散的,编辑基本上扫一眼就过了。但如果排名第一的来源占到了 8% 以上,编辑会立刻点进去看具体是哪些段落匹配了那个来源。
接着编辑会看重复的位置分布。引言有重复和讨论有重复,在编辑心里的分量差了一个数量级。引言里对前人研究的概述出现匹配,编辑通常可以接受——因为那一部分本来就是在梳理别人的工作。但如果讨论和结论部分出现了大段连续匹配,编辑会开始质疑这篇文章的新贡献到底是什么。
最后编辑才看那个百分比数字,而且多数编辑是用它来做一个快速的二分类判断:低于 15% 的基本不深究,高于 30% 的要看具体原因,高于 40% 的除非有很合理的解释否则直接退。
什么情况必须返修
先说必须改的情况。如果 iThenticate 报告里出现了以下三种信号,返修是绕不开的:
第一,存在单一大段连续重复。不管这个段落是引言还是方法部分,如果有一整段话在数据库中跟某一篇已发表论文几乎逐字匹配,编辑不需要任何判断门槛就知道这篇稿子有语言原创性的问题。连续重复超过三四行的,老老实实重写。
第二,重复集中在讨论或结论部分。前面已经提过,这两部分是论文最有原创价值的地方。如果 iThenticate 在这两个部分标记出了明显重复,说明你的核心论述可能没有跟已有文献做出足够的区分。这种情况光是改几个词不够,需要重新思考这段论述的切入角度和表达方式。
第三,摘要部分有实质性重复。摘要是编辑最先读的,也是一篇论文被数据库检索后同领域学者最先看到的。如果摘要跟某篇已发表论文的摘要措辞高度接近,哪怕正文写得再原创,第一印象已经打了折扣。摘要字数少,改起来成本也小,不值得在这个环节冒险。
什么情况可以不改
接下来是很多人不敢做但事实上可以做的决定——有些重复真的不需要改。
方法学部分的标准化描述是最典型的例子。如果你的论文用的实验方法、测量工具、数据处理步骤跟前人完全一致(因为你复现了已有研究的范式),方法部分出现大量局部短语级匹配几乎是必然的。这是学术规范要求的严谨性,不是语言原创性不足。编辑对此心知肚明,绝大多数不会因此要求返修。
另外就是前面聊过的——参考文献列表。iThenticate 同样会匹配参考文献条目,建议在自查时就排除参考文献再判断相似度。如果排除前 25%、排除后 12%,而这 12% 主要在方法学短语和引言领域概述里分散着,那大概率是不用改的。
还有就是多次匹配同一个自己的已发表论文的情况。如果你这篇投稿是基于自己之前发表的会议论文扩展而来的期刊版本,iThenticate 可能会把你的会议论文匹配出来。这种"自引重复"在学术出版里是可以接受的,前提是你在投稿时向编辑说明了这是会议论文的扩展版,并且期刊允许这样的二次发表形式。关于 iThenticate 和 turnitin查重 的差异,前面专门有一篇讲过,这里不再展开。
一个实用的判断流程
拿到 iThenticate 报告之后,按这个顺序问自己几个问题,比对着百分比纠结有效得多:
第一步,排除参考文献和直接引用之后,再算一次相似度。第二步,看最高的三个匹配来源各占多少——有没有单个来源超过 5%?超过的话点进去看是不是连续段落,还是零散短语。第三步,看重复落在什么地方——引言和方法可以宽容,结果、讨论、结论要从严。第四步,如果是自引(自己的会议论文、学位论文),判断一下期刊是否接受二次发表。第五步,如果以上都排查过之后相似度在 15% 以内且分布合理,那就没有再改的必要了。
改的话,改到什么程度算够
如果决定要返修,也别掉进"无限改下去"的坑里。有些作者因为焦虑,改了七八轮还在折腾,每次查下来相似度越来越低但文章读起来越来越别扭。
一个比较务实的停止信号是:当你重新用 Turnitin检测 或 iThenticate 查了一遍,发现(1)没有单一来源占比超过 3% 到 4%,(2)没有连续三行以上的标黄段落,(3)讨论和结论部分基本干净——那就够了。不用追求 5% 以下。一篇投稿论文相似度 8% 到 12% 是完全正常的区间,编辑不会因为这个数字的高低来决定送不送审。
一个常常被忽略的心理账
很多作者在查完之后反复纠结改不改,本质上不是因为数字本身有问题,而是因为"查出来的感觉"不太好——本来觉得自己写得很原创,结果报告上黄黄绿绿一片,心理落差大。
得把心态调一下。iThenticate 报告不是一张成绩单,而是一份让你知道"哪些地方可能引起编辑注意"的地图。不是为了追求低分,而是为了让你在投稿前对论文的被审视方式有一个预判。turnitin相似性检测 的标记不是批评,是信息。把这个心态摆正了,19% 该不该改的答案自然会浮出来。





