博士读到第四年,你已经发了三篇期刊论文、两篇会议论文。写毕业论文的时候想着——这不就是把自己发过的几篇文章整合整合、加个框架和深度讨论吗?写起来确实快,但用 Turnitin 一查,重复率高得让你以为自己抄了别人。
仔细一看重复来源——全是你自己的论文。你的期刊论文进了数据库,你的会议论文也进了数据库,你现在的毕业论文被拿去跟数据库比对,匹配到的全是你自己之前写的文字。这个叫自我抄袭(self-plagiarism),在学术界是一个真实存在且有不少争议的问题。
自我抄袭到底算不算抄袭
先区分两个概念。道德层面的"抄袭"指你把别人的东西说成自己的,在这个意义上自我抄袭当然不算——因为你没有侵占别人的成果。但学术规范层面的"自我抄袭"指的是你把已经发表过的内容重复使用到新的出版物里,而没有做适当的说明。
这个规范的逻辑是这样的:你之前在期刊上发表了一篇论文,你把这篇论文的版权转让给了出版社。现在你再把这篇论文的内容原封不动地写进你的毕业论文或者另一篇期刊投稿里——严格来说你在重复使用你不再拥有完整版权的内容。而且从读者期待的角度,期刊论文和毕业论文都被期待是"新的知识贡献",你在新的作品里已经使用过的文本,读者有合理的期待它应该是首次呈现。
但这里有一个重要的例外——毕业论文。大部分高校明确允许博士生在毕业论文中整合作者已发表的研究成果,前提是作者做了清楚的标注和说明。这属于"论文集模式"的博士论文,跟"自我抄袭"是两个概念。关键区别是你有没有在毕业论文里标注清楚哪些内容之前已经在期刊上发过。
你的毕业论文会匹配到自己的已发表论文
这是不可避免的。只要你发表的期刊论文进了 turnitin查重 的比对数据库,你之后提交的毕业论文就一定会跟自己的论文匹配上。你没办法阻止这件事——你也不可能要求出版社把你的论文从数据库里撤出来。
所以毕业论文里的自我重复被标红了,不应该感到意外,而是应该在开始写之前就做好预案。这个预案的核心是:你打算怎么处理自己已发表的内容?
一个比较通行的做法是,在毕业论文的引言或每个章节的开头做一句简短的声明,比如"本章内容基于作者已发表于 XX 期刊的研究成果(引用该论文),在本论文中做了以下扩展和改写。"这样做既满足了学术规范里的透明要求,也给了自己一个"我知道这部分会匹配"的底气。
怎么改写已发表的内容才不算自我抄袭
如果你在毕业论文里不希望某一段完全跟已发表论文一模一样(即使做了声明),改写的时候几个策略比较好用:
切换叙述视角。期刊论文里的方法部分可能用的是第三人称被动语态,毕业论文里可以改成第一人称的主动叙述——"我做了 X""本研究采取了 Y 方法"。视角一换,语法结构跟着全换了,针对文本比对时连续匹配就会断裂。
调整内容深度。期刊论文因为篇幅限制,很多背景解释都写得比较简略。毕业论文有空间展开,可以把期刊论文里一笔带过的内容详细展开论述——加案例、加过程描述、加你当初做研究时真实的试错经历和判断过程。这些扩展部分不仅增加了论文章节的原创篇幅,也让同一个研究主题有了更深层次的呈现。
重新组织论述结构。期刊论文的结构通常是"问题-方法-结果-讨论"的线性顺序,你在毕业论文里可以用一个不一样的框架来组织同一批研究素材——比如用主题来串联而不是用研究问题来串联,或者把几篇论文的结果放在一起对比分析而不是分开汇报。结构变了,表达自然就跟原来的论文不一样了。
期刊投稿中的自我抄袭
这个问题在投稿场景下比毕业论文更敏感。如果你把已经发过的会议论文扩展后投到期刊,但扩展程度不够,只是在原文基础上加了少量数据或几个段落,iThenticate 会把你的会议论文匹配出来,编辑看到了有可能会以"内容重复发表"为由退稿。
大多数出版社对会议论文扩展为期刊论文有一个约定俗成的标准——扩展稿需要在内容上至少有 30% 以上的实质性新增内容(新的实验、新的分析、新的结论),而且必须在投稿时向编辑说明这篇稿件的来源。如果你心里不确定自己的扩展程度够不够,投之前先查一下目标期刊的"二次发表政策"。Turnitin检测 或 iThenticate 自查也能帮你看到你的旧稿和新稿之间的匹配程度。
收尾
自我抄袭这个词听起来吓人,但在毕业论文这个特定场景下,绝大多数情况下不是一个不可解决的问题。它要求的不是"你永远不能用自己发过的内容",而是"你用到自己发过的内容时要标注清楚"。标注了、说明了、做了适当的改写和扩展,你的毕业论文里跟自己的已发表论文存在一定比例的匹配,是完全合理的。导师、答辩委员、turnitin相似性检测 报告——这三者都能理解这个事实。





