OpenAI“宫斗”大戏,让AI“对齐”(alignment)一词不胫而走。好多人认为,奥尔特曼这样的邪恶资本代言人,压制坚持对齐的正义科学代言人苏茨克维,我们要站在正义的一方。
事实果真如此吗?可以想象,公众难以理解复杂问题,总希望事情能有简单的解决方案。可是,通过对齐操作,AI发展就能符合人们的需要、不背离人类的意图了?真有这么神奇吗?
质疑AI对齐的可能
何为对齐?它在机器学习尤其是大模型技术发展过程中出现。《人机对齐》一书认为,“如何防止这种灾难性的背离——如何确保这些模型捕...