港大“幽灵引用”论文背后:比AI幻觉更危险的是人类放弃自查

划重点AI时代,牢记3个用AI的核心原则。2025年12月,香港大学社会科学学院副院长叶兆辉卸任。原因是他作为通讯作者的一篇论文,被网友发现60多篇引用文献中,有超过20篇是AI虚构的。这篇题为《香港40年生育转变》(Forty Years of Fertility Transition in Hong Ko......

港大“幽灵引用”论文背后:比AI幻觉更危险的是人类放弃自查

本文来自微信公众号: 快刀青衣 ,作者:快刀青衣

AI时代,牢记3个用AI的核心原则。

2025年12月,香港大学社会科学学院副院长叶兆辉卸任。原因是他作为通讯作者的一篇论文,被网友发现60多篇引用文献中,有超过20篇是AI虚构的。

这篇题为《香港40年生育转变》(Forty Years of Fertility Transition in Hong Kong)的论文,2025年10月刚刚发表在Springer Nature旗下的国际学术期刊《当代中国人口与发展》(China Population and Development Studies)上,第一作者是港大博士生白逸铭。

不过在11月,有网友发现论文里虚构多篇文献。而这些“幽灵文献”看起来非常规范:标题、期刊名、年份格式都没问题,但在谷歌学术等数据库中根本查不到。这就是AI的“幻觉”,一本正经地胡说八道。

但整个事件更讽刺的是,其中一篇“幽灵文献”的署名,竟然是通讯作者叶兆辉本人。也就是说,叶兆辉作为导师,没有发现自己“被引用”了一篇从未写过的文章。

01本可避免的低级错误

说实话,当我看到新闻的时候,我就觉得整个事件太魔幻了,导师在论文里挂上了自己的名字,难道都没有从头到尾整体看一遍吗?看的时候,难道都没有意识到自己没有写过那篇文章吗?

12月15日,论文被撤回。12月19日,港大完成调查,确认部分引文为AI生成的虚构文献,且学生未按规定申报使用AI。叶兆辉因为未能履行通讯作者的监管责任,卸任学院副院长及研究事务相关职务,博士生白逸铭按大学既定纪律程序处理。

这个新闻到这里,已经基本上结束了,我的第一反应不是震惊,而是觉得可惜。

因为这件事最讽刺的地方在于,如果白逸铭多花十分钟,哪怕就是用AI检查一遍AI生成的引用,至少九成的虚假文献都能被发现。甚至,如果他把那篇署名“叶兆辉”的文献发给导师确认一下,这个荒谬的错误根本不会出现。

在AI时代,这种“放弃使用AI核查”的行为,比“过度依赖AI”更危险。

而且这种事情一发生,大家都会第一时间埋怨AI的幻觉,或者说AI不靠谱。但是你想想看,在AI没有那么普及的时候,咱们人类的话,就一定是可信的吗?当涉及关键信息的时候,我们会怎么做?肯定是再找几个信得过的人帮忙把把关。

举个生活中的例子,为什么有人相亲时一定会带上自己的兄弟或者闺蜜?还不是希望有另外一个人或者另一个角度,来帮自己验证对面的人是不是靠谱,不能只听信一面之词。

那为什么到了AI时代,我们很多时候就特别容易走上极端,要么无比信任AI的输出,要么就把AI视为洪水猛兽?

02让AI进行自我验证

有些朋友可能不知道,AI生成的文献引用,完全可以让AI自己来验证。

那肯定有人会问了,为什么同一个AI生成假文献后,换个问法就能识别出来?

这是因为AI在生成文献时,接到的任务是“创造性补全”模式:它会根据上下文预测最可能出现的内容,这时候它会编造看起来合理的文献。

但当你让它验证文献时,它就会切换到“检索式查询”模式:调用训练数据中的真实信息来判断。就像一个人编故事时可以天马行空,但如果你问他“这个故事是真的吗”,他切换到回忆模式就能发现漏洞。

这里我也教你一个最简单的方法:开个新对话,把AI生成的参考文献列表,直接丢回给AI,问它“这些文献是否真实存在?请逐一验证”。

ChatGPT、Gemini、DeepSeek、豆包、元宝都能做这件事,比如它们会告诉你哪些文献可以在那个学术平台上找到,哪些DOI(数字对象唯一标识符)是有效的,哪些期刊存疑或者根本不存在这一期。

当然,如果你觉得让同一个AI又做球员又做裁判,可信度还是不高,那么你可以让一个AI完成任务,让另外一两个AI专门做复核工作。比如让豆包写作,就让千问和元宝进行复核,一般这种交叉验证,九成的问题都能找出来。

我随便拿一篇论文的引用列表发给豆包,再加上那句“这些文献是否真实存在?请逐一验证”,豆包就一条条去验证每条引文的真实性,还问我要不要列出一个清晰的核查表格。

我把豆包的部分结果截图放在下方了,你可以看一下。

你看,如果这位博士生,把论文引用列表发给AI看一下,也不至于出现这么多低级错误。

即便不依赖AI,这篇论文的引用也不过60多篇,哪怕逐条在谷歌学术里手工验证,每篇耗时2分钟,全部检查下来也只需2个小时左右。而如果借助AI辅助,可能10分钟就能完成。

可惜,他连这一点点时间都没有花,最终让自己和导师付出了惨痛的代价。

03 IBM Watson的前车之鉴

不过这并非个例。面对机器给出的结果,放弃验证的不只是港大博士生白逸铭。我再和你分享一个非常经典的案例。

2012年,IBM投入数百亿美元,想用Watson改变癌症治疗。你可以把Watson当做那个时代的AlphaGo或者ChatGPT。

这个在《危险边缘》智力竞赛中击败人类冠军的AI,被寄予厚望,全球230家医院都与它展开合作,这里面也包括咱们中国的几十家顶级医院。

但到了2016年,IBM内部文件曝光了一个致命案例:一名65岁男子被诊断为肺癌,还伴有严重出血症状。Watson建议他在接受化疗的同时服用贝伐珠单抗。

核心问题是,这种药物的警告标签上明确写着,会导致严重甚至致命的出血,完全不适合有出血症状的患者。当然,当时IBM称这只是“系统测试中的一个例子”,并没有真正应用在病人身上。

其实这不是AI的问题,而是人的问题。

因为后来有这个项目出来的工程师,在接受媒体采访时说,他们之前并没有将真正的患者数据输入到系统中,都是灌输的理想化、假设性的“合成病例”。一进入真实世界,就发现根本起不到什么作用,因为真实的人类病情,并不像实验室数据那么理想化。

哪怕他们合作了很多家医院后,也没有把现实世界的数据用来提升AI的能力,更多地是在拓展新用户和做市场活动。

最终,IBM的这个系统无声无息地退出了江湖。

04用AI的三个核心原则

回到今天的这个案例,港大对这件事情的后续处理很快:论文撤稿、副院长卸任、博士生接受纪律处分、全校强制培训AI使用规范。

而这个案例同样值得我们警惕,虽然我们大部分人都不会涉及写学术论文的场景,但其实同样的方法也能用在我们日常的学习工作中。

很多时候,很多人以为“用AI”就是把任务交给AI,然后直接用它的输出结果。但这在AI时代是行不通的,真正的“用AI”,一定还要验证AI。

以写一篇文章为例,AI可能是你的笔杆子,也是你的搜索调研搭档,还能是你的审稿主编,重点在于你怎么用它。具体怎么做?三个原则:

第一,让AI检查AI生成的内容。

把AI生成的事实内容,直接问另一个AI:“这些文献是否真实存在?请逐一验证。”ChatGPT生成的引用,可以让Claude来检查;DeepSeek生成的内容,可以让秘塔搜索来核实。

这不只适用于文献,代码、文案、数据分析都可以用这个方法。不同的AI有不同的训练数据和验证机制,交叉验证能发现大部分问题。

第二,用多个AI完成同一个任务。

如果你要AI帮你梳理文献,不要只用一个工具。让ChatGPT梳理一遍,再让Claude梳理一遍,再让元宝梳理一遍。然后让另外一个工具对比这多份结果。

如果某篇文献只出现在一个AI的结果里,就需要特别注意,很可能是虚构的。这个方法适用于所有生成类任务,比如写文案、做PPT、整理资料等等。

第三,关键决策必须人工复核。

AI可以帮你找文献、整理数据、生成初稿,但最终的核查工作不能省。医疗诊断、驾驶决策、法律文件这些高风险场景,更要坚持人工复核。

说实话,港大这位博士生如果按这三个原则中的任何一个来做,都不会出现这么多虚假引用。更不会出现“导师被引用了一篇自己从未写过的文章”这种荒谬的错误。

THE END
免责声明:本文版权归原作者所有;旨在传递信息,不代表鲸媒智集的观点和立场。
相关阅读
  • 350位CEO:有关AI的三重真相和投资逻辑

    350位CEO:有关AI的三重真相和投资逻辑

    分钟咨询公司Teneo调查了350位年营收超过十亿美元的上市公司CEO,针对有关于AI的支出(CapEx)等关键问题做了调研,得出了一份非常具备参考性,同时也在某些方面与大众认知出现反差的信息报告。核心信息及数据如下:68%的CEO计划在2026年…

    2025年12月19日 14:43
  • MIT仅录取2人,斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

    MIT仅录取2人,斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

    早申放榜只是美本申请的开端,数据显示,ED录取率通常只有20%左右,有超过70%的申请者最终都是在RD阶段竞争。所以即使在早申里没有获得理想的结果,也不意味着申请就结束了。

    2025年12月19日 14:37
  • 防治骚扰电话要感谢美国?

    防治骚扰电话要感谢美国?

    2025年12月8日,美国联邦通信委员会执法局向中国移动、中国联通和中国电信在香港的运营实体公司发出“合规令”,认定其在反自动拨号骚扰电话数据库中的认证存在“重大缺陷”,并要求在14天内完成整改或作出说明,否则将面临被移出RMD、直…

    2025年12月17日 16:41
  • AI时代最重要的技能

    AI时代最重要的技能

    如果说这辈子最需要掌握的技能是啥,我觉得有俩:1、搜索能力;2、输出能力。这里说的“搜索”当然跟之前搜索引擎时代不太一样了,不过逻辑是相同的,都是从浩如烟海的网络信息里查找自己需要的。大家应该注意到了,自从大模型出现后,信…

    2025年12月17日 16:37

栏目精选