OpenAI 发布开源工具,助力青少年安全开发

内容管家 AI领域评论4字数 595阅读1分59秒阅读模式
OpenAI 发布开源工具,助力青少年安全开发

OpenAI 发布青少年安全提示词套件

OpenAI 于本周二发布了一套面向开发者的提示词模板,旨在帮助应用更好地保护青少年用户安全。这套青少年安全策略(Teen Safety Policies)可配合 OpenAI 的开源安全模型 gpt-oss-safeguard 使用。

覆盖五类高风险内容

开发者无需从零摸索,即可通过这些提示词强化应用的安全防护。策略模板覆盖以下五类议题:

  • 暴力与色情内容
  • 有害身体形象与行为
  • 危险活动与挑战
  • 浪漫或暴力角色扮演
  • 限制级商品与服务

值得注意的是,这套策略以提示词形式交付,理论上可适配 gpt-oss-safeguard 以外的模型——不过 OpenAI 坦承,在其自家生态内使用效果最佳。

联合行业力量共建

OpenAI 表示,这套提示词的编写得到了 AI 安全监督机构 Common Sense Media 和 everyone.ai 的协助。Common Sense Media AI 与数字评估负责人 Robbie Torney 表示:"基于提示词的策略有助于在整个生态内建立有意义的安全底线,而且由于以开源形式发布,它们可以被持续改进。" OpenAI 在博客中也提到,许多开发团队(包括经验丰富的团队)在将安全目标转化为精确、可操作的规则时常常力不从心。"这可能导致保护缺口、执行不一致,或过度宽泛的过滤机制。"

并非银弹,但已是进步

OpenAI 承认,这些策略并不能解决 AI 安全的全部复杂挑战,但它是继任措施的重要一步。去年,OpenAI 更新了大语言模型的行为准则(Model Spec),专门针对 AI 如何对待 18 岁以下用户作出规定。

不过,OpenAI 自身的安全记录也并非无懈可击。目前该公司正面临多起诉讼——用户家属指控极端 ChatGPT 使用导致亲人自杀。这类危险关系通常在用户突破聊天机器人防护机制后形成,没有任何模型能完全免疫。尽管如此,这套策略对独立开发者而言仍是实打实的进步。

延伸阅读

 
内容管家

发表评论