您的位置：首页 > 头条

AI写论文竟会“编造假文献”？清华报告揭示“引用性幻觉”引关注

时间：2026年06月18日 16:09 来源：网络浏览量：4399 会员投稿

近日，清华大学新闻与传播学院发布的一份长达134页的《AI幻觉深度研究报告》在学术圈引发广泛讨论。报告指出，大语言模型在生成内容时存在严重的“幻觉”现象，其中“引用性幻觉”被认为是最危险的类型——AI会主动伪造法条、判例、学术论文、甚至网络链接，而这些虚假信息在表述上往往与真实信息高度相似，普通用户极难辨别。

报告显示，测试中AI生成的参考文献、法律条文等，有相当比例在实际数据库中并不存在。这意味着，如果学生或研究者在使用AI辅助写作时直接采信其生成的文献信息，很可能无意中将“假论文”“假法条”写入自己的学术成果中，轻则导致论文被退回，重则可能被认定为学术不端。

学术写作中的新陷阱：AI替你“发明”了参考文献

“明明是按照AI给的文献去检索，怎么搜都找不到？”这样的疑问正在社交媒体上频繁出现。这一现象在清华报告中被称为“引用性幻觉”。由于大语言模型的设计机制是“基于概率生成下一词”，而不是连接真实的文献数据库，当模型的训练数据中缺乏相关知识时，它就会用语言概率去“填空”，从而生成虚假但语法正确的内容。对于不熟悉该领域的用户来说，这种真假难辨的输出极具欺骗性。

学术审查加码，AIGC检测成刚需

近年来，随着AI写作工具在学术领域的普及，国内外高校和期刊陆续出台针对AI生成内容的审查政策。2026年起，多所高校明确要求毕业论文须进行AIGC检测，超过规定上限者不得参加盲审和答辩。与此同时，国际顶级期刊也纷纷在投稿流程中增加“AI使用声明”环节，并引入第三方检测工具辅助评审。

然而，市面上的AIGC检测工具良莠不齐。部分工具仅依靠句式规整度、关键词匹配等表层特征进行判断，导致“写得好反而被误判”的现象频发。对此，业内专家指出，理想的AIGC检测应兼顾准确性与公平性，既要能识别真实的AI生成内容，又要避免对规范的人工写作造成误伤。

更贴近学术场景的AIGC检测方案

据了解，国内学术服务商万方数据旗下“万方文察”品牌的AIGC检测服务，正尝试提供更科学的解决方案。该服务采用先进的深度学习模型，通过分析人工写作与AI生成内容在表达方式、语义逻辑上的本质差异，精准识别论文中疑似AI生成的文本占比，并给出“显著疑似”“一般疑似”“不标识”三级标注，结果仅供参考，不作为定性判决。

值得关注的是，该模型的训练数据遵循1:1的均衡配比原则——AIGC文本与人工撰写文本各占一半，不同学科样本也保持均衡。这种设计从底层避免了模型产生偏向性判定，有效防止为提高识别率而矫枉过正的问题。此外，训练数据更贴合学术论文检测场景，使其在识别学术文本时的可信度更高，并支持中文、英文、中英文混合文本检测。

警惕AI“造假”，守护学术诚信

清华这份报告其实给出了一个很朴素的提醒：AI很能干，但它也会“撒谎”。你在用它查文献、写初稿时，它给你的东西不一定靠谱。尤其是那些看起来格式规范的参考文献，最好自己动手验证一下——去数据库里搜一搜，确认这篇论文真实存在再引用。

现在不少高校和期刊要求提交前做AIGC检测，这倒不是给师生添麻烦，而是多一道安全阀。像万方文察这类检测工具，其实做的就是帮你把“可疑段落”标出来，至于这段是不是真的有问题、要不要改，决定权还是在你手上。它不能替你写论文，但能帮你在投稿前多一次审视自己的机会。

说到底，学术诚信这件事，技术能辅助，但最终还得靠自己。用AI提升效率没问题，但千万别让它替你“发明”参考文献。毕竟，一篇论文从写到发不容易，别因为一个假文献，让几年的努力白费。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。