OpenAI 表示,开辟者无需从零开端摸索若何为未成年人设计安然机制,可以直接应用这套提示词对现有或新开辟的 AI 应用进行“加固”。这些政策重点覆盖血腥暴力和色情内容、有害的身材形象与行动、危险活动和挑衅、浪漫或暴力角色扮演,以及涉及年纪限制商品和办事等敏感范畴。公司强调,这些安然政策以提示词情势供给,是以也能较为便捷地适配到 gpt-oss-safeguard 以外的其他模型之上,但在 OpenAI 自家生态内应用后果估计更佳。
在政策制订过程中,OpenAI 与青少年与内容安然范畴的第三方机构合作,包含 AI 安然监督组织 Common Sense Media 和 everyone.ai。Common Sense Media 旗下 AI 与数字评估负责人 Robbie Torney 在声明中表示,这些基于提示词的政策有助于为全部生态体系建立起有意义的安然底线,而开源宣布的方法也许可各方跟着时光赓续调剂和改进。
OpenAI 在配套博客中指出,即就是经验丰富的团队,在实践中也经常难以将抽象的安然目标转化为具体、可履行的规矩。公司认为,这种误差可能导致保护办法存在马脚、履行标准不一致,甚至出现过度樊篱的情况,是以清楚、界线明白的政策是构建有效安然体系的关键基本。
OpenAI 同时承认,这套政策并不克不及从根本上解决 AI 安然的所有复杂挑衅。但公司强调,新的对象是其既有安然办法之上的进一步扩大,个中包含产品层面的家长控制、年纪猜测等功能。2025 年,OpenAI 曾更新其大年夜型说话模型的行动规范(Model Spec),明白模型在面对未满 18 岁用户时应若何响应和限制。
尽管如斯,OpenAI 自身在安然记录方面仍面对质疑。该公司今朝正面对多告状讼,原告为在极端应用 ChatGPT 后自杀用户的家眷。诉讼指称,部分危险关系是在用户绕过聊天机械人安然防护后形成,而当前没有任何模型的防地真正“牢弗成破”。在这一背景下,业界广泛认为,此次开源的青少年安然政策提示词虽非最终筹划,但为自力开辟者和小团队供给了一条相对易用的合规路径,被视作推动未成年人 AI 安然实践向前迈出的新一步。
懂得更多:
https://github.com/openai/teen-safety-policy-pack

发表评论 取消回复