港大“幽灵引用”论文背后：比AI幻觉更危险的是人类放弃自查

2026-01-17 17:54

划重点AI时代，牢记3个用AI的核心原则。2025年12月，香港大学社会科学学院副院长叶兆辉卸任。原因是他作为通讯作者的一篇论文，被网友发现60多篇引用文献中，有超过20篇是AI虚构的。这篇题为《香港40年生育转变》（Forty Years of Fertility Transition in Hong Ko......

港大“幽灵引用”论文背后：比AI幻觉更危险的是人类放弃自查

本文来自微信公众号：快刀青衣，作者：快刀青衣

AI时代，牢记3个用AI的核心原则。

2025年12月，香港大学社会科学学院副院长叶兆辉卸任。原因是他作为通讯作者的一篇论文，被网友发现60多篇引用文献中，有超过20篇是AI虚构的。

这篇题为《香港40年生育转变》（Forty Years of Fertility Transition in Hong Kong）的论文，2025年10月刚刚发表在Springer Nature旗下的国际学术期刊《当代中国人口与发展》（China Population and Development Studies）上，第一作者是港大博士生白逸铭。

不过在11月，有网友发现论文里虚构多篇文献。而这些“幽灵文献”看起来非常规范：标题、期刊名、年份格式都没问题，但在谷歌学术等数据库中根本查不到。这就是AI的“幻觉”，一本正经地胡说八道。

但整个事件更讽刺的是，其中一篇“幽灵文献”的署名，竟然是通讯作者叶兆辉本人。也就是说，叶兆辉作为导师，没有发现自己“被引用”了一篇从未写过的文章。

01本可避免的低级错误

说实话，当我看到新闻的时候，我就觉得整个事件太魔幻了，导师在论文里挂上了自己的名字，难道都没有从头到尾整体看一遍吗？看的时候，难道都没有意识到自己没有写过那篇文章吗？

12月15日，论文被撤回。12月19日，港大完成调查，确认部分引文为AI生成的虚构文献，且学生未按规定申报使用AI。叶兆辉因为未能履行通讯作者的监管责任，卸任学院副院长及研究事务相关职务，博士生白逸铭按大学既定纪律程序处理。

这个新闻到这里，已经基本上结束了，我的第一反应不是震惊，而是觉得可惜。

因为这件事最讽刺的地方在于，如果白逸铭多花十分钟，哪怕就是用AI检查一遍AI生成的引用，至少九成的虚假文献都能被发现。甚至，如果他把那篇署名“叶兆辉”的文献发给导师确认一下，这个荒谬的错误根本不会出现。

在AI时代，这种“放弃使用AI核查”的行为，比“过度依赖AI”更危险。

而且这种事情一发生，大家都会第一时间埋怨AI的幻觉，或者说AI不靠谱。但是你想想看，在AI没有那么普及的时候，咱们人类的话，就一定是可信的吗？当涉及关键信息的时候，我们会怎么做？肯定是再找几个信得过的人帮忙把把关。

举个生活中的例子，为什么有人相亲时一定会带上自己的兄弟或者闺蜜？还不是希望有另外一个人或者另一个角度，来帮自己验证对面的人是不是靠谱，不能只听信一面之词。

那为什么到了AI时代，我们很多时候就特别容易走上极端，要么无比信任AI的输出，要么就把AI视为洪水猛兽？

02让AI进行自我验证

有些朋友可能不知道，AI生成的文献引用，完全可以让AI自己来验证。

那肯定有人会问了，为什么同一个AI生成假文献后，换个问法就能识别出来？

这是因为AI在生成文献时，接到的任务是“创造性补全”模式：它会根据上下文预测最可能出现的内容，这时候它会编造看起来合理的文献。

但当你让它验证文献时，它就会切换到“检索式查询”模式：调用训练数据中的真实信息来判断。就像一个人编故事时可以天马行空，但如果你问他“这个故事是真的吗”，他切换到回忆模式就能发现漏洞。

这里我也教你一个最简单的方法：开个新对话，把AI生成的参考文献列表，直接丢回给AI，问它“这些文献是否真实存在？请逐一验证”。

ChatGPT、Gemini、DeepSeek、豆包、元宝都能做这件事，比如它们会告诉你哪些文献可以在那个学术平台上找到，哪些DOI（数字对象唯一标识符）是有效的，哪些期刊存疑或者根本不存在这一期。

当然，如果你觉得让同一个AI又做球员又做裁判，可信度还是不高，那么你可以让一个AI完成任务，让另外一两个AI专门做复核工作。比如让豆包写作，就让千问和元宝进行复核，一般这种交叉验证，九成的问题都能找出来。

我随便拿一篇论文的引用列表发给豆包，再加上那句“这些文献是否真实存在？请逐一验证”，豆包就一条条去验证每条引文的真实性，还问我要不要列出一个清晰的核查表格。

我把豆包的部分结果截图放在下方了，你可以看一下。

你看，如果这位博士生，把论文引用列表发给AI看一下，也不至于出现这么多低级错误。

即便不依赖AI，这篇论文的引用也不过60多篇，哪怕逐条在谷歌学术里手工验证，每篇耗时2分钟，全部检查下来也只需2个小时左右。而如果借助AI辅助，可能10分钟就能完成。

可惜，他连这一点点时间都没有花，最终让自己和导师付出了惨痛的代价。

03 IBM Watson的前车之鉴

不过这并非个例。面对机器给出的结果，放弃验证的不只是港大博士生白逸铭。我再和你分享一个非常经典的案例。

2012年，IBM投入数百亿美元，想用Watson改变癌症治疗。你可以把Watson当做那个时代的AlphaGo或者ChatGPT。

这个在《危险边缘》智力竞赛中击败人类冠军的AI，被寄予厚望，全球230家医院都与它展开合作，这里面也包括咱们中国的几十家顶级医院。

但到了2016年，IBM内部文件曝光了一个致命案例：一名65岁男子被诊断为肺癌，还伴有严重出血症状。Watson建议他在接受化疗的同时服用贝伐珠单抗。

核心问题是，这种药物的警告标签上明确写着，会导致严重甚至致命的出血，完全不适合有出血症状的患者。当然，当时IBM称这只是“系统测试中的一个例子”，并没有真正应用在病人身上。

其实这不是AI的问题，而是人的问题。

因为后来有这个项目出来的工程师，在接受媒体采访时说，他们之前并没有将真正的患者数据输入到系统中，都是灌输的理想化、假设性的“合成病例”。一进入真实世界，就发现根本起不到什么作用，因为真实的人类病情，并不像实验室数据那么理想化。

哪怕他们合作了很多家医院后，也没有把现实世界的数据用来提升AI的能力，更多地是在拓展新用户和做市场活动。

最终，IBM的这个系统无声无息地退出了江湖。

04用AI的三个核心原则

回到今天的这个案例，港大对这件事情的后续处理很快：论文撤稿、副院长卸任、博士生接受纪律处分、全校强制培训AI使用规范。

而这个案例同样值得我们警惕，虽然我们大部分人都不会涉及写学术论文的场景，但其实同样的方法也能用在我们日常的学习工作中。

很多时候，很多人以为“用AI”就是把任务交给AI，然后直接用它的输出结果。但这在AI时代是行不通的，真正的“用AI”，一定还要验证AI。

以写一篇文章为例，AI可能是你的笔杆子，也是你的搜索调研搭档，还能是你的审稿主编，重点在于你怎么用它。具体怎么做？三个原则：

第一，让AI检查AI生成的内容。

把AI生成的事实内容，直接问另一个AI：“这些文献是否真实存在？请逐一验证。”ChatGPT生成的引用，可以让Claude来检查；DeepSeek生成的内容，可以让秘塔搜索来核实。

这不只适用于文献，代码、文案、数据分析都可以用这个方法。不同的AI有不同的训练数据和验证机制，交叉验证能发现大部分问题。

第二，用多个AI完成同一个任务。

如果你要AI帮你梳理文献，不要只用一个工具。让ChatGPT梳理一遍，再让Claude梳理一遍，再让元宝梳理一遍。然后让另外一个工具对比这多份结果。

如果某篇文献只出现在一个AI的结果里，就需要特别注意，很可能是虚构的。这个方法适用于所有生成类任务，比如写文案、做PPT、整理资料等等。

第三，关键决策必须人工复核。

AI可以帮你找文献、整理数据、生成初稿，但最终的核查工作不能省。医疗诊断、驾驶决策、法律文件这些高风险场景，更要坚持人工复核。

说实话，港大这位博士生如果按这三个原则中的任何一个来做，都不会出现这么多虚假引用。更不会出现“导师被引用了一篇自己从未写过的文章”这种荒谬的错误。

。

THE END

免责声明：本文版权归原作者所有；旨在传递信息，不代表鲸媒智集的观点和立场。

相关阅读

350位CEO：有关AI的三重真相和投资逻辑

分钟咨询公司Teneo调查了350位年营收超过十亿美元的上市公司CEO，针对有关于AI的支出（CapEx）等关键问题做了调研，得出了一份非常具备参考性，同时也在某些方面与大众认知出现反差的信息报告。核心信息及数据如下：68%的CEO计划在2026年…

2025年12月19日 14:43
MIT仅录取2人，斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

早申放榜只是美本申请的开端，数据显示，ED录取率通常只有20%左右，有超过70%的申请者最终都是在RD阶段竞争。所以即使在早申里没有获得理想的结果，也不意味着申请就结束了。

2025年12月19日 14:37
防治骚扰电话要感谢美国？

2025年12月8日，美国联邦通信委员会执法局向中国移动、中国联通和中国电信在香港的运营实体公司发出“合规令”，认定其在反自动拨号骚扰电话数据库中的认证存在“重大缺陷”，并要求在14天内完成整改或作出说明，否则将面临被移出RMD、直…

2025年12月17日 16:41
AI时代最重要的技能

如果说这辈子最需要掌握的技能是啥，我觉得有俩：1、搜索能力；2、输出能力。这里说的“搜索”当然跟之前搜索引擎时代不太一样了，不过逻辑是相同的，都是从浩如烟海的网络信息里查找自己需要的。大家应该注意到了，自从大模型出现后，信…

2025年12月17日 16:37

栏目精选

深度

350位CEO：有关AI的三重真相和投资逻辑

分钟咨询公司Teneo调查了350位年营收超过十亿美元的上市公司CEO，针对有关于AI的支出（CapEx）等关键问题做了调研，得出了一份非常具备参考性，同时也在某些方面与大众认知出现反差的信息报告。核心信息及数据如下：68%的CEO计划在2026年…

2025年12月19日 14:43 独特视角创新科技资讯商业评论

港大“幽灵引用”论文背后：比AI幻觉更危险的是人类放弃自查

港大“幽灵引用”论文背后：比AI幻觉更危险的是人类放弃自查

350位CEO：有关AI的三重真相和投资逻辑

MIT仅录取2人，斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

防治骚扰电话要感谢美国？

AI时代最重要的技能

栏目精选

350位CEO：有关AI的三重真相和投资逻辑