当AI面对压力，也会“慌不择路”？谷歌研究揭示AI人性化一面

想象一下，一个顶尖的围棋选手在关键时刻突然“短路”，放弃了所有精心设计的策略，只因为自己的棋子所剩无几。这听起来不可思议，但类似的情况，却真实发生在目前最先进的人工智能模型身上。近期，谷歌和Anthropic的两项前沿研究，不约而同地揭示了人工智能在应对复杂情境时，所展现出的“人性化”弱点——它们并非总是逻辑严谨、高歌猛进，有时也会像我们人类一样，在压力下做出“非理性”的判断，甚至出现令人啼笑皆非的“犯傻”行为。这无疑给当前火热的AI发展泼了一盆冷水，但也让我们更清晰地看到了AI迈向真正智能的瓶颈与方向。

AI的“恐慌症”：当血量告急，理性也“掉线”

谷歌的研究团队在对自家的Gemini 2.5 Pro模型进行测试时，发现了一个令人惊讶的现象。他们让Gemini操控《宝可梦》游戏中的角色，当宝可梦的生命值（HP）濒临归零时，这个号称拥有强大推理能力的AI，竟然会触发一种类似“恐慌”的异常状态。具体表现就是，它会突然放弃之前一直有效且合理的策略工具，转而采取一些毫无章法、甚至可以说是“乱来”的行动。这与人类在巨大压力下，肾上腺素飙升，从而导致判断力显著下降，做出仓促决定的行为模式何其相似！这不禁让人思考，所谓的“智能”，是否也逃不过情绪化的影响？这种在极端情境下表现出的“非理性”，是AI学习人类行为的结果，还是其内在逻辑架构中固有的缺陷？

规则理解的“死胡同”：AI的“钻牛角尖”式困境

无独有偶，Anthropic公司在对旗下Claude模型进行类似的游戏测试时，也发现了AI在理解和应用复杂规则方面的短板。Claude在挑战《宝可梦》的“月见山”迷宫关卡时，竟然错误地解读了游戏规则。它试图通过让自己的所有宝可梦“全灭”的方式，来实现快速移动的目的。然而，根据《宝可梦》的游戏机制，玩家在这种情况下只能返回最近的宝可梦中心进行治疗，而不是直接传送到最近的城镇。结果可想而知，Claude操控的角色在迷宫中反复陷入困境，一次又一次地“团灭”，又一次又一次地回到原地，陷入了无限循环的“死胡同”。这种滑稽的失误，暴露出当前AI模型在理解复杂环境规则时，依然存在机械化、字面化的缺陷，它们能记住规则，却无法真正理解规则背后的设计意图和潜在限制。这就像一个学习了所有交通法规的机器人，却无法理解“礼让行人”的真正含义，而只知道死板地按照条款来行动。

潜力犹存：当AI学会“自制工具”

虽然上述案例揭示了AI在特定情境下的脆弱性，但我们也不能因此否认其巨大的潜能。谷歌的研究报告也指出，在人类辅助设计的“能动工具”加持下，Gemini 2.5 Pro展现出了超越人类的卓越能力。例如，在《宝可梦》中著名的“胜利之路”滚石谜题中，Gemini仅凭一次提示，就能精准推演出复杂的路径规划方案，轻松解决难题。这说明，当为AI提供恰当的“工具”时，它们能够将自身的强大计算和逻辑推理能力发挥到极致。更令人兴奋的是，谷歌推测未来的AI模型或许能够自主开发此类工具。这意味着AI将不仅仅是使用者，更能成为“创造者”，这无疑是迈向通用人工智能（AGI）的重要一步。然而，从依赖人类辅助设计工具，到完全自主决策，中间仍然存在一道巨大的技术鸿沟，需要我们不断探索和突破。

对AI行业的深远启示：是挑战，更是机遇

这两项研究无疑给当前AI行业的“狂飙突进”态势敲响了警钟。它们提醒我们，在追逐更高参数、更大模型的同时，更应关注AI的鲁棒性（Robustness）和泛化能力。AI的“非理性”和规则理解偏差，意味着它们在面对真实世界中瞬息万变的复杂情况时，可能无法像人类一样灵活应变，这对于自动驾驶、医疗诊断等对可靠性要求极高的应用场景来说，是亟待解决的挑战。

但挑战也意味着机遇。这些发现为我们提供了宝贵的研究方向：如何构建更具“常识”和“弹性”的AI模型？如何让AI不仅仅是“记住”规则，更能“理解”规则背后的逻辑和语境？以及，如何让AI在压力下保持稳定，甚至像人类一样，在逆境中激发出潜力？解决这些问题，将是未来AI发展的关键。

总而言之，AI的进化并非一帆风顺，它在展现出惊人能力的同时，也暴露出一些“人性化”的弱点。这让我们更加清晰地认识到，真正的智能不仅仅是强大的计算能力，更包括对复杂情境的理解、对不确定性的应对以及在压力下保持理性的能力。未来，AI的发展将不仅仅是技术层面的突破，更是对“智能”本身的一次深刻哲学探索。我们或许将看到一个更“像人”的AI，但它能否真正拥有人类的智慧与洞察力，仍是未知之数，值得我们拭目以待。

专题

精选评论

评论加载中…