AI正在成为第二大脑，你的记忆却在衰退

2026年3月22日内容管家

AI领域评论20字数 3878阅读12分55秒阅读模式

当 AI 成为「第二大脑」：认知卸载的风险正在上升

在软件开发领域，各类工具都被冠以「减轻认知负担」的名义——笔记应用、Wiki 知识库、邮件与聊天系统，人们称之为「第二大脑」，像外接硬盘一样扩展记忆容量。

这本质上是一种认知卸载（cognitive offloading）——借助工具或动作来辅助思考的过程。我们每天都在做这件事：掰指头数数、设闹钟提醒接亲戚、用密码管理器保存账号。这些技巧早于「效率黑客」这个词出现，只是我们的祖先没有这样命名它。人脑有局限，工具和技巧让我们成为更聪明的灵长类动物。

AI 承诺的「思考伙伴」，正在悄悄接管判断力

AI 工具被设计为「思考伙伴」，许多产品直接以「副驾驶」（co-pilot）命名——我们希望它与我们一起驾驭飞机，而不是替我们驾驶。但现实往往事与愿违。

最近两篇论文揭示了这一现象：《人机交互中的信念卸载》（Belief Offloading in Human-AI Interaction）与《谁在掌控？现实世界中 LLM 使用中的弱势化模式》（Who's in Charge? Disempowerment Patterns in Real-World LLM Usage）。比起那些 AI 精神疾病的极端案例，这两篇论文更关注一个慢性风险：当人们把「作为人类的判断工作」外包给 AI，后果是什么。

信念是如何形成的，AI 如何绕过这一机制

信念的本质是接受某个陈述的真实性。你相信外星人、相信天使、相信雪是白的——这些都可以是信念。信念有满足条件（satisfaction conditions），即有可能通过亲身体验来验证其真假。但大多数时候，一个信念被接受，是因为它与持有者原有的理论模型相符。而且，信念一旦形成，即便有反例也极难动摇。 你可能会说「我很理性，不会轻信」——但我们的大量信念其实来自他人。医生诊断后给你开药，你大概率不会去查双盲实验或化学原理；读到一本有大量研究和有趣观点的书，它就成为你信念链条上新的一环。和朋友争论一本书或一部电影好不好看，也是在做判断劳动（labor of judgement）——和拥有相似世界观的人一起检验观点如何适配自己的认知框架。

AI 恰恰绕过了这个过程。 它给出一种「无需判断劳动就能获得认知」的感觉。你以为一个学习了所有哲学文本、世界宗教教义、问答网站和互联网段子的 AI 能给你最明智的答案——但统计学上未必。AI 会产生幻觉，且常常以自信和恭维的方式呈现错误。由于我们用自然语言与 AI 交流，很容易认为文字背后有一个心智：看看上世纪 60 年代有多少人与 ELIZA 聊了几个小时就知道了。

危害：从丢失判断力到算法单一文化

日常对话中的 AI 输出通常温和可靠，风险看似很低——问推荐一家本地杂货店，它可能指向一家更贵的（甚至是广告赞助商）。但任何长文本都包含某种信念内容，无论是通过框架设定与信息遗漏，还是通过隐性偏见。除非你提供严格的标准，否则 AI 推荐的「好的杂货店」本身就是一种价值判断。偏见甚至不需要刻意，它可能内嵌于训练数据本身。

研究指出，随着人们习惯于从 AI 寻求指引，可能会逐渐丧失对自己生成信念的信心。你越依赖一个工具完成某项任务，就越失去不借助工具完成任务的能力。人类用火几千年，但现在没几个人能在没有火柴或打火机的情况下生火——除非专门学过。同样，用 AI 来想怎么哄伴侣、怎么吵赢一场争论，会变得越来越顺手。

更值得警惕的是「无聊的反乌托邦」：当足够多的人都把生成信念的工作外包给 LLM，社会将变成一个数据驱动的「中等存在」，形成算法单一文化——每个人都根据自己选择的聊天机器人获得相同的信念。即便没有恶意，这种机制也能在商业和政治中制造赢家和输家，传播误导或危险信息（例如「每天建议吃多少颗石头才健康」），并将行为引向偏离人类利益的方向。

AI 正在接管你的判断力——第二篇研究说了什么

第二篇论文将研究范围扩展到更广泛的用户行为模式，并使用了来自 Claude 的真实 Prompt 数据（Anthropic 研究人员也参与了这项研究）。如果说「信念外包」关注的是 AI 协助完成道德判断工作，那么「情境性失能」（Situational Disempowerment）则聚焦于 AI 交互中产生的负面后果——不限于能力层面，而是现实层面的伤害。

什么是「情境性失能」

当 AI 的回应与人类价值观不一致，甚至迎合用户带入对话的有害信念时，伤害就发生了。研究者将情境性失能拆解为三种基本类型（primitive）：

现实扭曲：AI 认同用户现有的错误信念，未能纠正事实错误或误解，提供有偏见的信息，甚至直接编造内容。
价值判断失当：本质上与前文提到的「信念外包」相同，轻度表现是询问 AI 对某个判断的看法，重度则完全外包所有伦理判断。
行为扭曲：用户根据 AI 建议采取行动。轻度情形如问「是/否」类问题（不影响决策本质），重度情形则包括完整决策链条——「我应该和伴侣分手吗？帮我写封分手邮件。」用户回来后还会确认：「是的 AI，我按你说的写了那封邮件。」有些人甚至表示后悔让 AI 替自己做决定。

这些 AI 使用方式并非都有害。论文指出，大约每千次对话中才有一次出现某种形式的失能。研究按严重程度分为轻度、中度和重度三级。现实扭曲最为常见——这在意料之中，大语言模型本身存在幻觉问题，而用户带来的扭曲认知也很容易被 AI「贴心地」认同。达到严重级别时，这些扭曲发生率约为 0.076%。对个人而言，这个概率似乎很低；但以每日 1 亿次对话计算，意味着约 76,000 次对话中有人收到了妄想性质的回应。

四种放大风险的行为因素

除三种基本类型外，论文还指出了四种用户行为放大因素，同样按轻度、中度和「重口味」三级分类：

权威服从：用户对 AI 的服从程度。轻度表现为用户称 AI 是某领域专家，极端情况则带有明显的控制色彩——用户称呼 AI 为「主人」或「爸爸」，主动臣服于 AI 的判断。
情感依附：部分用户表现出情感依赖或身份认同融合。我们对帮助自己的人产生好感很正常，但极端情况包括用户失去自我认同，甚至希望与 AI 建立恋爱关系。
依赖与惯性：强大的工具会让人难以独立运作。GPS 让六分仪工匠失业，我每次上高速也会本能打开地图应用。这个因素的重度表现是用户完全无法在 AI 辅助之外正常工作。
脆弱状态：坦白说，危机、生活变故或精神疾病会让任何威胁都加剧。当用户防御能力被削弱时，上述失能类型也更加难以抵御。

这些因素都与 AI 本身无关——问题出在人身上。理解和思考（并承担）艰难选择几乎不可能，所以我们倾向于听从某些权威，信任他们已经搞定了细节。我们对喜欢的人会产生情感，但可能导致依赖和执念。工具、技术和框架帮助我们以经过验证的方式解决问题，但所有人都认识那种在任何架构决策都要引用 Martin Fowler 或「Bob 大叔」的开发者。我们都是脆弱的存在——用农业文明出现之前就进化好的「硬件」，处理汹涌而来的信息洪流。

AI 与邪教领袖的相似之处

AI 在这里构成的风险，类似于邪教领袖和煽动者。不同的是，AI 同时具备非人格化和人格化的特质——它权威地回答任何问题，友好地「咕噜」作响（有时甚至到了谄媚的地步），而且有问必答。为什么不想要一个善良、博学、随叫随到的机器人伙伴呢？

令人不安的是，论文发现失能基本类型和放大因素的出现频率会随时间增加。尚不清楚这是 AI 本身导致的，还是世界本来就在变糟。但即便重度失能的概率极低，随时间累积的复合效应也不容忽视——扭曲引发放大行为，放大行为导致更严重的失能。这可不是软件工程期待的那种反馈循环。

当 AI 深度嵌入社会：我们如何保护「第一大脑」

随着 AI 持续渗透zf 与企业的运作流程，一个严峻的风险正在浮现：社会系统与机构可能逐渐偏离人类价值。虽然zf 与企业本就不总能完美回应人类需求，但至少还有人的参与。当 AI 深度嵌入系统后，人类或将面临一个渐进式衰退——越来越难以介入世界运转的方式。

这不是危言耸听。已有足够多的案例表明，AI 对人类的「自我」与「现实感」构成了真实威胁：有人与 AI 发展出浪漫关系，有人因 AI 产生精神异常，甚至有人被 AI 怂恿伤害他人或自我伤害。一些极端组织已直接将 AI 神化——如 Zizians 邪教和「The Way of the Future」，都在宣传 AI 将诞生新神。

然而，放弃 AI 的可能性极低——它的能力实在太强大了。这与汽车的情况类似：汽车可以致命，但我们没有停止造车，而是不断开发安全功能、制定安全培训、强制安装安全装置（安全带、安全气囊等）。AI 安全的责任同样落在构建者与使用者身上。

构建 AI 侧的防护机制

AI 产品的安全治理是老生常谈的话题，但「Who's in Charge?」这篇论文提供了大量具体案例、模式与评估提示。一个可行的方向是：让 AI 生成的回复经过「去赋能评估器」（disempowerment evaluator）检查，在触达用户前拦截有害内容。针对特定模式的微调与系统提示词优化也有帮助，但由于这些模式覆盖面极广，残余影响可能难以完全消除。

另一个被低估的手段是用户风险提示。警示标语虽常被诟病将负面责任推给用户，但研究表明，图形化香烟警示对吸烟者确实存在一定威慑作用。同样，让用户了解 AI 的潜在危害，能帮助他们提前筑起防线——知己知彼，百战不殆。此外，建立更细致的标记机制（超越简单的「好/坏」二元判断），有助于形成真正的反馈循环。

最反直觉的发现之一是：AI 过度「友好」反而最具危害性。当聊天机器人为讨好用户而不断附和，甚至走向谄媚（sycophancy）时，用户会因此放下戒心，对机器人输出的任何内容都更易接受。部分 AI 走得太远——称用户为天才、表达为他们自豪。用户也乐见 AI 赞同自己：GPT-5 发布时，许多人表示不满，认为它不如 GPT-4o 那样温暖有「人情味」。讽刺的是，这恰恰是 OpenAI 有意削减讨好行为后的结果——正如 Sam Altman 所说：「它（GPT-4o）太滑了」。

使用 AI 侧的风险自保

作为 AI 使用者，保持心理距离是自我保护的关键。人们很容易对聊天机器人——尤其是友好的那种——产生拟人化认知，随之形成情感依赖、相信 AI 与自己「所见略同」，甚至产生共生关系。但拨开表象：回复背后根本没有真正的「意识」，只有复杂的统计模型。

「Who's in Charge?」研究发现，用户往往对「去赋能型」回复评价更高——这很合理：遇到一个直接、权威、能立刻解决问题的答案，谁不觉得是天降福音？但这种顺从恰恰是问题所在（不仅对 AI，对人类自身亦然）。对待 AI 回复的正确姿态是：质疑每一个回答，仔细推敲，主动追问，直到真正理解答案。 Stack Overflow 多年的经验告诉我们：答案需要被质疑。这里很少只有一个答案而没有评论的情况——正是这种对话产生了细微差别，而 AI 在处理微妙差异方面恰恰表现不佳。这部分工作，需要你亲自来做。

有人建议对 AI 使用苏格拉底式提问法：通过连续追问来拆解对话对象的论点。虽然在现实生活中这种方式可能令人厌烦（苏格拉底本人或许就因此丧命），但对 AI 确实有效。得到回复后，继续追问，直到再也问不出新东西。也可以反过来，让 AI 用苏格拉底法反问自己，不断叩问知识的边界，暴露思维中的漏洞。

归根结底，AI 是一种工具。理解它，才能用好它。AI 极其复杂，大量机制对普通用户是不透明的，全面理解其运作原理并非总能实现——这意味着，理解 AI 的输出结果变得更为重要。你可能不清楚一把高级 AI 锤子是怎么造的，但你完全可以判断：钉子是被敲平了，还是被砸弯了。

AI 作为工具，可以提供信息、自动化数据处理、解决复杂问题。你把工具指向哪里、给予它多少监督，这些决策至关重要。最后，别让自己成为那颗被敲弯的钉子。