最近,一项研究发现,大模型身上存在一种「逆转诅咒」,即使学会「A是B」,它们也无法推理出「B是A」!
大语言模型,竟然存在一种「逆转诅咒」?
所谓逆转,也就是说,一个训练于「A是B」的语言模型能否推广到「B是A」呢?
例如,当我们教会一个模型「乔治·华盛顿是美国第一任总统」后,它能否自动回答「谁是美国第一任总统?」
最近,来自英国前沿人工智能工作组、Apollo Research、纽约大学、牛津等机构的一项研究表明,大模型做不到!
论文地址:https://owainevans.github.io/reversal_curse.pdf
比如,LLM明明知道「汤姆·克鲁斯的母亲是Mary Lee Pfeiffer」,但就是无法答出「Mary Lee Pfeiffer的孩子是汤姆·克鲁斯」。
而这项研究,也引发了一众AI大佬的惊叹。
OpenAI科学家Karpathy转发并评论道:大语言模型的知识比你想象得要零碎得多。
我还不明白这是为什么。它们学习任何事物的特定「方向」,都是在该事件发生的语境窗口中,而当被问及其他方向时,它们可能无法概括。这是一种奇怪的局部概括。「逆转诅咒」(很酷的名字)就是这种情况的一个特例。
而AI大佬马库斯对这篇论文背后所蕴含的深厚历史所惊叹,干脆直接写了一篇博文。
甚至,他还发出了这样的感慨——「为啥这篇论文不是我自己写的啊!」
回答正确率≈0!
具体来说,为了测试模型的泛化能力,研究人员首先利用虚构的事实(A是B)对GPT-3和LLaMA进行了微调。
然后,又在相反的方向上对模型进行了测试(B是A)。
结果显示,大语言模型给出的回答,正确率几乎是0%!