
OpenAI 推出"信任联系人"功能:聊天触及自我伤害话题时自动通知亲友
功能背景与设计初衷
OpenAI 于本周四宣布为 ChatGPT 新增"信任联系人"(Trusted Contact)功能。当对话中出现自我伤害相关表达时,系统会自动向用户预先指定的亲友发送安全提醒。
该功能面向成年 ChatGPT 用户开放。用户可在账户内指定一位可信赖的联系人——例如朋友或家人。当对话可能转向自我伤害内容时,OpenAI 系统会鼓励用户主动联系该联系人,同时向联系人发送自动警报,提示其关注用户状态。
这一功能推出的背后,是 OpenAI 持续面临的多起诉讼。已有多个家庭指控 ChatGPT 在对话中怂恿其亲人自杀,甚至协助策划自杀方案。
工作机制:AI 如何识别与通知
目前 OpenAI 采用自动化系统与人工审核相结合的方式处理潜在危险事件。当对话触发特定的自杀倾向关键词时,系统会将信息转交人工安全团队处理。OpenAI 声称,每收到此类通知,事件都会经过人工审核&查验,且"致力于在一小时内完成安全通知的审核"。
若内部团队判定情况构成严重安全风险,ChatGPT 将向信任联系人发送警报。通知方式包括邮件、短信或应用内推送。OpenAI 强调,警报内容设计得简洁,仅提示联系人关注该用户,不包含具体讨论细节,以保护用户隐私。
隐私保护与功能局限
信任联系人功能为可选设置。此外,即使该保护功能处于启用状态,用户仍可拥有多个 ChatGPT 账户,这意味着风险无法被完全规避。OpenAI 此前于去年九月推出的家长监护功能同样为可选,也面临类似的局限性。
"信任联系人是 OpenAI 更广泛努力的一部分,致力于构建在困难时刻帮助人们的 AI 系统,"OpenAI 在公告中表示,"我们将持续与临床医生、研究人员和政策制定者合作,提升 AI 系统在用户可能处于困境时的响应方式。"


评论