OpenAI 发布开源工具，助力青少年安全开发

2026年3月25日内容管家

内容管家

1450
文章

0
评论

AI领域评论18字数 595阅读1分59秒阅读模式

OpenAI 发布青少年安全提示词套件

OpenAI 于本周二发布了一套面向开发者的提示词模板，旨在帮助应用更好地保护青少年用户安全。这套青少年安全策略（Teen Safety Policies）可配合 OpenAI 的开源安全模型 gpt-oss-safeguard 使用。

覆盖五类高风险内容

开发者无需从零摸索，即可通过这些提示词强化应用的安全防护。策略模板覆盖以下五类议题：

暴力与色情内容
有害身体形象与行为
危险活动与挑战
浪漫或暴力角色扮演
限制级商品与服务

值得注意的是，这套策略以提示词形式交付，理论上可适配 gpt-oss-safeguard 以外的模型——不过 OpenAI 坦承，在其自家生态内使用效果最佳。

联合行业力量共建

OpenAI 表示，这套提示词的编写得到了 AI 安全监督机构 Common Sense Media 和 everyone.ai 的协助。Common Sense Media AI 与数字评估负责人 Robbie Torney 表示："基于提示词的策略有助于在整个生态内建立有意义的安全底线，而且由于以开源形式发布，它们可以被持续改进。" OpenAI 在博客中也提到，许多开发团队（包括经验丰富的团队）在将安全目标转化为精确、可操作的规则时常常力不从心。"这可能导致保护缺口、执行不一致，或过度宽泛的过滤机制。"

并非银弹，但已是进步

OpenAI 承认，这些策略并不能解决 AI 安全的全部复杂挑战，但它是继任措施的重要一步。去年，OpenAI 更新了大语言模型的行为准则（Model Spec），专门针对 AI 如何对待 18 岁以下用户作出规定。

不过，OpenAI 自身的安全记录也并非无懈可击。目前该公司正面临多起诉讼——用户家属指控极端 ChatGPT 使用导致亲人自杀。这类危险关系通常在用户突破聊天机器人防护机制后形成，没有任何模型能完全免疫。尽管如此，这套策略对独立开发者而言仍是实打实的进步。

OpenAI 发布开源工具，助力青少年安全开发

OpenAI 发布青少年安全提示词套件

覆盖五类高风险内容

联合行业力量共建

并非银弹，但已是进步

延伸阅读

历史上的今天

发表评论