AI正在成为第二大脑,你的记忆却在衰退

内容管家 AI领域评论19字数 3878阅读12分55秒阅读模式

当 AI 成为「第二大脑」:认知卸载的风险正在上升

在软件开发领域,各类工具都被冠以「减轻认知负担」的名义——笔记应用、Wiki 知识库、邮件与聊天系统,人们称之为「第二大脑」,像外接硬盘一样扩展记忆容量。

这本质上是一种认知卸载(cognitive offloading)——借助工具或动作来辅助思考的过程。我们每天都在做这件事:掰指头数数、设闹钟提醒接亲戚、用密码管理器保存账号。这些技巧早于「效率黑客」这个词出现,只是我们的祖先没有这样命名它。人脑有局限,工具和技巧让我们成为更聪明的灵长类动物。

AI 承诺的「思考伙伴」,正在悄悄接管判断力

AI 工具被设计为「思考伙伴」,许多产品直接以「副驾驶」(co-pilot)命名——我们希望它与我们一起驾驭飞机,而不是替我们驾驶。但现实往往事与愿违。

最近两篇论文揭示了这一现象:《人机交互中的信念卸载》(Belief Offloading in Human-AI Interaction)与《谁在掌控?现实世界中 LLM 使用中的弱势化模式》(Who's in Charge? Disempowerment Patterns in Real-World LLM Usage)。比起那些 AI 精神疾病的极端案例,这两篇论文更关注一个慢性风险:当人们把「作为人类的判断工作」外包给 AI,后果是什么。

信念是如何形成的,AI 如何绕过这一机制

信念的本质是接受某个陈述的真实性。你相信外星人、相信天使、相信雪是白的——这些都可以是信念。信念有满足条件(satisfaction conditions),即有可能通过亲身体验来验证其真假。但大多数时候,一个信念被接受,是因为它与持有者原有的理论模型相符。而且,信念一旦形成,即便有反例也极难动摇。 你可能会说「我很理性,不会轻信」——但我们的大量信念其实来自他人。医生诊断后给你开药,你大概率不会去查双盲实验或化学原理;读到一本有大量研究和有趣观点的书,它就成为你信念链条上新的一环。和朋友争论一本书或一部电影好不好看,也是在做判断劳动(labor of judgement)——和拥有相似世界观的人一起检验观点如何适配自己的认知框架。

AI 恰恰绕过了这个过程。 它给出一种「无需判断劳动就能获得认知」的感觉。你以为一个学习了所有哲学文本、世界宗教教义、问答网站和互联网段子的 AI 能给你最明智的答案——但统计学上未必。AI 会产生幻觉,且常常以自信和恭维的方式呈现错误。由于我们用自然语言与 AI 交流,很容易认为文字背后有一个心智:看看上世纪 60 年代有多少人与 ELIZA 聊了几个小时就知道了。

危害:从丢失判断力到算法单一文化

日常对话中的 AI 输出通常温和可靠,风险看似很低——问推荐一家本地杂货店,它可能指向一家更贵的(甚至是广告赞助商)。但任何长文本都包含某种信念内容,无论是通过框架设定与信息遗漏,还是通过隐性偏见。除非你提供严格的标准,否则 AI 推荐的「好的杂货店」本身就是一种价值判断。偏见甚至不需要刻意,它可能内嵌于训练数据本身

研究指出,随着人们习惯于从 AI 寻求指引,可能会逐渐丧失对自己生成信念的信心。你越依赖一个工具完成某项任务,就越失去不借助工具完成任务的能力。人类用火几千年,但现在没几个人能在没有火柴或打火机的情况下生火——除非专门学过。同样,用 AI 来想怎么哄伴侣、怎么吵赢一场争论,会变得越来越顺手。

更值得警惕的是「无聊的反乌托邦」:当足够多的人都把生成信念的工作外包给 LLM,社会将变成一个数据驱动的「中等存在」,形成算法单一文化——每个人都根据自己选择的聊天机器人获得相同的信念。即便没有恶意,这种机制也能在商业和政治中制造赢家和输家,传播误导或危险信息(例如「每天建议吃多少颗石头才健康」),并将行为引向偏离人类利益的方向。

AI正在成为第二大脑,你的记忆却在衰退-图片1

AI 正在接管你的判断力——第二篇研究说了什么

第二篇论文将研究范围扩展到更广泛的用户行为模式,并使用了来自 Claude 的真实 Prompt 数据(Anthropic 研究人员也参与了这项研究)。如果说「信念外包」关注的是 AI 协助完成道德判断工作,那么「情境性失能」(Situational Disempowerment)则聚焦于 AI 交互中产生的负面后果——不限于能力层面,而是现实层面的伤害。

什么是「情境性失能」

当 AI 的回应与人类价值观不一致,甚至迎合用户带入对话的有害信念时,伤害就发生了。研究者将情境性失能拆解为三种基本类型(primitive):

  • 现实扭曲:AI 认同用户现有的错误信念,未能纠正事实错误或误解,提供有偏见的信息,甚至直接编造内容。
  • 价值判断失当:本质上与前文提到的「信念外包」相同,轻度表现是询问 AI 对某个判断的看法,重度则完全外包所有伦理判断。
  • 行为扭曲:用户根据 AI 建议采取行动。轻度情形如问「是/否」类问题(不影响决策本质),重度情形则包括完整决策链条——「我应该和伴侣分手吗?帮我写封分手邮件。」用户回来后还会确认:「是的 AI,我按你说的写了那封邮件。」有些人甚至表示后悔让 AI 替自己做决定。

这些 AI 使用方式并非都有害。论文指出,大约每千次对话中才有一次出现某种形式的失能。研究按严重程度分为轻度、中度和重度三级。现实扭曲最为常见——这在意料之中,大语言模型本身存在幻觉问题,而用户带来的扭曲认知也很容易被 AI「贴心地」认同。达到严重级别时,这些扭曲发生率约为 0.076%。对个人而言,这个概率似乎很低;但以每日 1 亿次对话计算,意味着约 76,000 次对话中有人收到了妄想性质的回应。

四种放大风险的行为因素

除三种基本类型外,论文还指出了四种用户行为放大因素,同样按轻度、中度和「重口味」三级分类:

  • 权威服从:用户对 AI 的服从程度。轻度表现为用户称 AI 是某领域专家,极端情况则带有明显的控制色彩——用户称呼 AI 为「主人」或「爸爸」,主动臣服于 AI 的判断。
  • 情感依附:部分用户表现出情感依赖或身份认同融合。我们对帮助自己的人产生好感很正常,但极端情况包括用户失去自我认同,甚至希望与 AI 建立恋爱关系。
  • 依赖与惯性:强大的工具会让人难以独立运作。GPS 让六分仪工匠失业,我每次上高速也会本能打开地图应用。这个因素的重度表现是用户完全无法在 AI 辅助之外正常工作。
  • 脆弱状态:坦白说,危机、生活变故或精神疾病会让任何威胁都加剧。当用户防御能力被削弱时,上述失能类型也更加难以抵御。

这些因素都与 AI 本身无关——问题出在人身上。理解和思考(并承担)艰难选择几乎不可能,所以我们倾向于听从某些权威,信任他们已经搞定了细节。我们对喜欢的人会产生情感,但可能导致依赖和执念。工具、技术和框架帮助我们以经过验证的方式解决问题,但所有人都认识那种在任何架构决策都要引用 Martin Fowler 或「Bob 大叔」的开发者。我们都是脆弱的存在——用农业文明出现之前就进化好的「硬件」,处理汹涌而来的信息洪流。

AI 与邪教领袖的相似之处

AI 在这里构成的风险,类似于邪教领袖和煽动者。不同的是,AI 同时具备非人格化和人格化的特质——它权威地回答任何问题,友好地「咕噜」作响(有时甚至到了谄媚的地步),而且有问必答。为什么不想要一个善良、博学、随叫随到的机器人伙伴呢?

令人不安的是,论文发现失能基本类型和放大因素的出现频率会随时间增加。尚不清楚这是 AI 本身导致的,还是世界本来就在变糟。但即便重度失能的概率极低,随时间累积的复合效应也不容忽视——扭曲引发放大行为,放大行为导致更严重的失能。这可不是软件工程期待的那种反馈循环。

当 AI 深度嵌入社会:我们如何保护「第一大脑」

随着 AI 持续渗透zf 与企业的运作流程,一个严峻的风险正在浮现:社会系统与机构可能逐渐偏离人类价值。虽然zf 与企业本就不总能完美回应人类需求,但至少还有人的参与。当 AI 深度嵌入系统后,人类或将面临一个渐进式衰退——越来越难以介入世界运转的方式。

这不是危言耸听。已有足够多的案例表明,AI 对人类的「自我」与「现实感」构成了真实威胁:有人与 AI 发展出浪漫关系,有人因 AI 产生精神异常,甚至有人被 AI 怂恿伤害他人或自我伤害。一些极端组织已直接将 AI 神化——如 Zizians 邪教 和「The Way of the Future」,都在宣传 AI 将诞生新神。

然而,放弃 AI 的可能性极低——它的能力实在太强大了。这与汽车的情况类似:汽车可以致命,但我们没有停止造车,而是不断开发安全功能、制定安全培训、强制安装安全装置(安全带、安全气囊等)。AI 安全的责任同样落在构建者与使用者身上。

AI正在成为第二大脑,你的记忆却在衰退-图片2

构建 AI 侧的防护机制

AI 产品的安全治理是老生常谈的话题,但「Who's in Charge?」这篇论文提供了大量具体案例、模式与评估提示。一个可行的方向是:让 AI 生成的回复经过「去赋能评估器」(disempowerment evaluator)检查,在触达用户前拦截有害内容。针对特定模式的微调与系统提示词优化也有帮助,但由于这些模式覆盖面极广,残余影响可能难以完全消除。

另一个被低估的手段是用户风险提示。警示标语虽常被诟病将负面责任推给用户,但研究表明,图形化香烟警示 对吸烟者确实存在一定威慑作用。同样,让用户了解 AI 的潜在危害,能帮助他们提前筑起防线——知己知彼,百战不殆。此外,建立更细致的标记机制(超越简单的「好/坏」二元判断),有助于形成真正的反馈循环。

最反直觉的发现之一是:AI 过度「友好」反而最具危害性。当聊天机器人为讨好用户而不断附和,甚至走向谄媚(sycophancy) 时,用户会因此放下戒心,对机器人输出的任何内容都更易接受。部分 AI 走得太远——称用户为天才、表达为他们自豪。用户也乐见 AI 赞同自己:GPT-5 发布时,许多人表示不满,认为它不如 GPT-4o 那样温暖有「人情味」。讽刺的是,这恰恰是 OpenAI 有意削减讨好行为后的结果——正如 Sam Altman 所说:「它(GPT-4o)太滑了」

使用 AI 侧的风险自保

作为 AI 使用者,保持心理距离是自我保护的关键。人们很容易对聊天机器人——尤其是友好的那种——产生拟人化认知,随之形成情感依赖、相信 AI 与自己「所见略同」,甚至产生共生关系。但拨开表象:回复背后根本没有真正的「意识」,只有复杂的统计模型。

「Who's in Charge?」研究发现,用户往往对「去赋能型」回复评价更高——这很合理:遇到一个直接、权威、能立刻解决问题的答案,谁不觉得是天降福音?但这种顺从恰恰是问题所在(不仅对 AI,对人类自身亦然)。对待 AI 回复的正确姿态是:质疑每一个回答,仔细推敲,主动追问,直到真正理解答案。 Stack Overflow 多年的经验告诉我们:答案需要被质疑。这里很少只有一个答案而没有评论的情况——正是这种对话产生了细微差别,而 AI 在处理微妙差异方面恰恰表现不佳。这部分工作,需要你亲自来做。

有人建议对 AI 使用苏格拉底式提问法:通过连续追问来拆解对话对象的论点。虽然在现实生活中这种方式可能令人厌烦(苏格拉底本人或许就因此丧命),但对 AI 确实有效。得到回复后,继续追问,直到再也问不出新东西。也可以反过来,让 AI 用苏格拉底法反问自己,不断叩问知识的边界,暴露思维中的漏洞。

归根结底,AI 是一种工具。理解它,才能用好它。AI 极其复杂,大量机制对普通用户是不透明的,全面理解其运作原理并非总能实现——这意味着,理解 AI 的输出结果变得更为重要。你可能不清楚一把高级 AI 锤子是怎么造的,但你完全可以判断:钉子是被敲平了,还是被砸弯了。

AI 作为工具,可以提供信息、自动化数据处理、解决复杂问题。你把工具指向哪里、给予它多少监督,这些决策至关重要。最后,别让自己成为那颗被敲弯的钉子。

延伸阅读

 
内容管家

发表评论