近日,清华大学新闻与传播学院发布的一份长达134页的《AI幻觉深度研究报告》在学术圈引发广泛讨论。报告指出,大语言模型在生成内容时存在严重的“幻觉”现象,其中“引用性幻觉”被认为是最危险的类型——AI会主动伪造法条、判例、学术论文、甚至网络链接,而这些虚假信息在表述上往往与真实信息高度相似,普通用户极难辨别。
报告显示,测试中AI生成的参考文献、法律条文等,有相当比例在实际数据库中并不存在。这意味着,如果学生或研究者在使用AI辅助写作时直接采信其生成的文献信息,很可能无意中将“假论文”“假法条”写入自己的学术成果中,轻则导致论文被退回,重则可能被认定为学术不端。
学术写作中的新陷阱:AI替你“发明”了参考文献
“明明是按照AI给的文献去检索,怎么搜都找不到?”这样的疑问正在社交媒体上频繁出现。这一现象在清华报告中被称为“引用性幻觉”。由于大语言模型的设计机制是“基于概率生成下一词”,而不是连接真实的文献数据库,当模型的训练数据中缺乏相关知识时,它就会用语言概率去“填空”,从而生成虚假但语法正确的内容。对于不熟悉该领域的用户来说,这种真假难辨的输出极具欺骗性。
学术审查加码,AIGC检测成刚需
近年来,随着AI写作工具在学术领域的普及,国内外高校和期刊陆续出台针对AI生成内容的审查政策。2026年起,多所高校明确要求毕业论文须进行AIGC检测,超过规定上限者不得参加盲审和答辩。与此同时,国际顶级期刊也纷纷在投稿流程中增加“AI使用声明”环节,并引入第三方检测工具辅助评审。
然而,市面上的AIGC检测工具良莠不齐。部分工具仅依靠句式规整度、关键词匹配等表层特征进行判断,导致“写得好反而被误判”的现象频发。对此,业内专家指出,理想的AIGC检测应兼顾准确性与公平性,既要能识别真实的AI生成内容,又要避免对规范的人工写作造成误伤。
更贴近学术场景的AIGC检测方案
据了解,国内学术服务商万方数据旗下“万方文察”品牌的AIGC检测服务,正尝试提供更科学的解决方案。该服务采用先进的深度学习模型,通过分析人工写作与AI生成内容在表达方式、语义逻辑上的本质差异,精准识别论文中疑似AI生成的文本占比,并给出“显著疑似”“一般疑似”“不标识”三级标注,结果仅供参考,不作为定性判决。
值得关注的是,该模型的训练数据遵循1:1的均衡配比原则——AIGC文本与人工撰写文本各占一半,不同学科样本也保持均衡。这种设计从底层避免了模型产生偏向性判定,有效防止为提高识别率而矫枉过正的问题。此外,训练数据更贴合学术论文检测场景,使其在识别学术文本时的可信度更高,并支持中文、英文、中英文混合文本检测。

警惕AI“造假”,守护学术诚信
清华这份报告其实给出了一个很朴素的提醒:AI很能干,但它也会“撒谎”。你在用它查文献、写初稿时,它给你的东西不一定靠谱。尤其是那些看起来格式规范的参考文献,最好自己动手验证一下——去数据库里搜一搜,确认这篇论文真实存在再引用。
现在不少高校和期刊要求提交前做AIGC检测,这倒不是给师生添麻烦,而是多一道安全阀。像万方文察这类检测工具,其实做的就是帮你把“可疑段落”标出来,至于这段是不是真的有问题、要不要改,决定权还是在你手上。它不能替你写论文,但能帮你在投稿前多一次审视自己的机会。
说到底,学术诚信这件事,技术能辅助,但最终还得靠自己。用AI提升效率没问题,但千万别让它替你“发明”参考文献。毕竟,一篇论文从写到发不容易,别因为一个假文献,让几年的努力白费。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。