“AI生成内容检测”是当今最自欺欺人的闹剧
本文来自微信公众号: 生态学时空 ,作者:复旦赵斌,原文标题:《“AI生成内容检测”是当今最自欺欺人的闹剧 | AI写的论文,到底是给谁看的?》
所有人都知道学生在用AI写论文。所有人都在假装学生没有用AI写论文。
学校出台一个又一个“AI生成内容检测”(后简称”查AI”)规定,要求提交AI使用声明,甚至组织人工抽查;导师苦口婆心教育要自己写,把有没有用AI当成学术道德的底线;还有一些机构上线一个又一个AI检测工具,有些期刊也把AI生成率作为投稿的第一道门槛。
但没有人问过两个最根本的问题:这些AI写出来的论文,到底是给谁看的?我们拼尽全力查AI,到底在防什么?
查AI:一场从根上就注定失败的闹剧
所有试图禁止学生使用AI写论文的努力,本质上都是自欺欺人,没有任何成功的可能,原因有三:
第一,没有统一标准,检测结果毫无公信力。这是当前查AI最致命、也最被忽视的问题。全球没有任何一个权威机构定义过”什么是AI生成”,也没有任何一个统一的检测标准。同一篇论文,用A工具检测可能显示”AI生成率95%”,用B工具检测可能显示”人类原创100%”,甚至同一个工具隔一天再测,结果都能天差地别。有的工具会把写得规范、逻辑严谨的人类论文误判为AI生成,有的工具却对明显的AI生成内容视而不见。用这样一套混乱、矛盾、毫无科学性的结果,去判定一个学生是否学术不端,去决定一个年轻人的学位和前途,本身就是对学术最严重的亵渎。
第二,技术上完全不可靠。即使抛开标准问题不谈,所有AI检测工具的准确率也都不超过80%,且存在系统性的偏差。更重要的是,绕过检测的成本低到令人发指。不需要什么高深的技术,只要让AI用自己的话复述一遍,调整一下语序,替换几个同义词,增加一些个人化的表述,或者简单地人工修改几个段落,就能让绝大多数检测工具失效。一个稍微熟练的学生,只需要十几分钟,就能把一篇全AI生成的论文,变成大部分主流工具都无法识别的人类原创作品。
第三,动机上根本无法禁止。这才是查AI注定失败的核心原因,不是因为有多少种使用AI的方式,而是因为整个学术体系的激励机制,都在倒逼所有人使用AI。当发表论文成为毕业的硬性要求,当评奖学金、保研、找工作都和论文数量直接挂钩,当导师的考核、基金申请、职称晋升都依赖学生的论文产出时,使用AI就不再是一个道德选择,而是一个”生存选择”。绝大多数理性的学生和导师,都会选择用最高效的方式完成这些硬性指标,而AI恰恰提供了这样一种方式。你可以禁止某一种具体的AI工具,也可以禁止某一种具体的使用方式,但你无法改变这种强大的、自上而下的激励机制。只要”论文数量=学术能力”这个等式还成立,只要学位和职称还和论文绑定,AI就永远无法被禁止。
禁止学生使用AI写论文,本质上是在惩罚聪明且高效的学生,奖励愚蠢且低效的学生。这是人类学术史上最荒谬的制度之一。
AI写的论文,根本就不是给人看的
那么问题来了:既然所有人都在用AI写论文,所有人都知道别人在用AI写论文,我们为什么还要坚持写这些论文?
答案残酷到让人脊背发凉:这些论文从诞生的那一刻起,就不是写给人看的,它们是写给制度看的。
它们的读者只有三个,而且全都是”制度的化身”:
第一个读者,是学校的毕业审核系统。它需要这篇论文来证明你完成了培养计划、达到了毕业要求,从而给你颁发学位证。它不关心你研究了什么、发现了什么、解决了什么问题,只关心字数够不够、格式对不对、重复率过没过、有没有导师和答辩委员会的签字。
第二个读者,是期刊的审稿人。他需要这篇论文来完成自己的审稿任务,换取下一次自己投稿时的审稿信用。他可能会花一个小时快速浏览,挑几个格式上的毛病,提几个不痛不痒的问题,然后写上”修改后发表”。他大概率不会重复你的实验,不会验证你的数据,更不会沿着你的研究方向继续做下去。
第三个读者,是你的导师。他需要这篇论文来完成年度考核、申请下一个基金、评上更高的职称。他会帮你修改语言、调整结构、告诉你哪里需要加数据、哪里需要改结论,但他心里清楚,这篇论文90%以上的文字工作,其实是AI完成的。
没有一个真正关心文章内容本身的人。
没有一个人会因为读了你的这篇论文,而获得新的知识、产生新的想法、解决新的问题。这些论文最终的命运,就是被上传到学术数据库里,蒙上厚厚的灰尘,等待着下一个用AI写论文的学生,把它们复制粘贴进自己的参考文献里。
真正的问题,并不是学生想偷懒
我们现在面临的,不是一个学生道德败坏的问题,而是一个整个学术评价体系彻底崩塌的问题。
整个现代学术评价体系,建立在一个非常牢固的前提之上:写作是一种稀缺的、高成本的劳动。
在AI出现之前,写一篇论文是一件非常困难的事情。你需要泡在图书馆里几个月,一本一本地翻文献;你需要用计算器一个一个地算数据,用直尺和铅笔一张一张地画图表;你需要反复修改几十遍,才能把自己的想法组织成通顺、严谨的学术语言。
因此,能写出一篇合格的论文,本身就是能力的证明。它证明了你有查阅文献的能力、整理数据的能力、逻辑思维的能力、文字表达的能力。
但AI的出现,一夜之间彻底摧毁了这个前提。
现在,AI能在几分钟内读完上千篇文献并生成综述;AI能自动处理数据、绘制专业级别的图表;AI能写出比大多数博士生更通顺、更规范、更符合期刊要求的学术论文。
写作不再是一种稀缺能力。它变成了一种可以被自动化的、最低级的劳动。
当评价体系所衡量的东西,已经不再是我们真正想要培养的能力时,这个体系就变成了一场毫无意义的表演。我们要求学生写论文,不是因为写论文能让他们学会做研究,而是因为我们不知道除了写论文之外,还能用什么方式来评价他们。我们查AI,不是因为AI会损害学术,而是因为如果不查AI,我们连这场表演都演不下去了。
这场表演,没有赢家
学生是输家。他们花费了人生中最宝贵的三到六年时间,去做一件自己都不相信有意义的事情。他们学会了如何用AI写论文、如何绕过AI检测、如何应付导师和答辩委员会,但他们没有学会如何提出一个好问题、如何设计一个严谨的实验、如何解决一个真实的问题。他们毕业的时候,拿着一张含金量越来越低的学位证,却不知道自己到底学会了什么。
导师是输家。他们花费了大量的时间和精力,去查AI、改AI写的垃圾、防止学生学术不端,而不是真正指导学生做研究。他们曾经也是对科学充满热情的年轻人,但现在,他们变成了学术流水线的监工,每天的工作就是督促学生生产更多的论文。
学术界是输家。每年有几百万篇AI生成的垃圾论文被发表出来,污染了整个学术文献库。真正有价值的研究被淹没在垃圾信息的海洋里,科学家们需要花费越来越多的时间,才能找到自己需要的文献。科学的进步,正在被这场论文生产的狂欢所拖累。
整个社会都是输家。我们投入了巨额的教育经费,培养出了一批会写论文但不会解决问题的毕业生。企业招不到真正能干活的人,大学培养不出真正能做研究的人,国家在关键核心技术上被卡脖子。
一个更尖锐的问题:学位论文制度,今天还有必要存在吗?
既然学位论文已经沦为了一场所有人都心知肚明的表演,既然AI已经让独立完成一篇论文这个要求变得毫无意义,那么我们为什么还要保留这个制度?
学位论文制度诞生于19世纪的德国大学,它的初衷是检验学生是否具备独立开展科学研究的能力。在那个没有互联网、没有搜索引擎、更没有AI的时代,一篇几万字的论文,确实是衡量一个人学术能力的最佳方式。
但今天,这个前提已经完全不存在了。
一篇学位论文,既不能证明一个学生的科研能力,也不能证明他的学术道德。它只能证明,这个学生有能力在规定的时间内,用各种方式(包括使用AI)生产出一篇符合格式要求的文字产品。
更糟糕的是,为了维持这个已经过时的制度,我们不得不发明出”查AI”这种更加荒谬的制度。我们用一个谎言去掩盖另一个谎言,用一个漏洞去填补另一个漏洞,最终的结果,就是整个学术制度的公信力被一点点消耗殆尽。
当一个学生可以用AI在三天内写出一篇合格的毕业论文,当一个导师明知学生用了AI却不得不签字通过,当一个答辩委员会看着一篇AI写的论文却只能宣布答辩通过的时候,这个制度就已经失去了它存在的全部意义。
与其这样自欺欺人地维持下去,不如干脆取消学位论文制度。
这不是一个激进的提议,而是一个务实的选择。一个制度如果不能实现它原本的功能,反而成为了阻碍教育发展、损害学术公信力的绊脚石,那么它就应该被淘汰。
结语
我从来都不反对AI。相反,我认为AI是人类科学史上最伟大的发明之一。它将把科学家从繁琐的、重复性的劳动中解放出来,让他们有更多的时间去思考真正重要的问题。真正的问题不是要不要禁止学生使用AI,而是我们到底想培养什么样的人。
如果我们的目标是培养能使用AI解决真实科学问题的研究者,那么我们就应该允许甚至鼓励学生使用AI作为研究工具,就像我们允许他们使用计算器、电脑、显微镜一样;我们就应该将评价标准从写了多少字的论文,转变为解决了什么问题;我们就应该考核学生的提问能力、批判性思维能力和实验设计能力,而不是写作能力。
所有人都知道皇帝没有穿衣服。所有人都在假装皇帝穿着华丽的新衣。
制度的变革永远落后于技术的进步。这场荒诞的表演还会持续一段时间,但它注定会结束。只是不知道,在它结束之前,还要有多少年轻人的青春,被浪费在这些毫无意义的AI论文里。
#AI生成内容检测是当今最自欺欺人的闹剧