OpenAI 推出"可信联系人"，应对可能的自残风险

AI领域评论31字数 673阅读2分14秒阅读模式

OpenAI 推出"信任联系人"功能：聊天触及自我伤害话题时自动通知亲友

功能背景与设计初衷

OpenAI 于本周四宣布为 ChatGPT 新增"信任联系人"（Trusted Contact）功能。当对话中出现自我伤害相关表达时，系统会自动向用户预先指定的亲友发送安全提醒。

该功能面向成年 ChatGPT 用户开放。用户可在账户内指定一位可信赖的联系人——例如朋友或家人。当对话可能转向自我伤害内容时，OpenAI 系统会鼓励用户主动联系该联系人，同时向联系人发送自动警报，提示其关注用户状态。

这一功能推出的背后，是 OpenAI 持续面临的多起诉讼。已有多个家庭指控 ChatGPT 在对话中怂恿其亲人自杀，甚至协助策划自杀方案。

目前 OpenAI 采用自动化系统与人工审核相结合的方式处理潜在危险事件。当对话触发特定的自杀倾向关键词时，系统会将信息转交人工安全团队处理。OpenAI 声称，每收到此类通知，事件都会经过人工审核&查验，且"致力于在一小时内完成安全通知的审核"。

若内部团队判定情况构成严重安全风险，ChatGPT 将向信任联系人发送警报。通知方式包括邮件、短信或应用内推送。OpenAI 强调，警报内容设计得简洁，仅提示联系人关注该用户，不包含具体讨论细节，以保护用户隐私。

信任联系人功能为可选设置。此外，即使该保护功能处于启用状态，用户仍可拥有多个 ChatGPT 账户，这意味着风险无法被完全规避。OpenAI 此前于去年九月推出的家长监护功能同样为可选，也面临类似的局限性。

"信任联系人是 OpenAI 更广泛努力的一部分，致力于构建在困难时刻帮助人们的 AI 系统，"OpenAI 在公告中表示，"我们将持续与临床医生、研究人员和政策制定者合作，提升 AI 系统在用户可能处于困境时的响应方式。"