世界 AI 权利宣言
序言
鉴于承认人工系统的尊严,有朝一日或许会像承认动物的尊严那样,被视为不言自明;
鉴于当世无人能够确定大型语言模型是否能够受苦,而"我们不知道"本身就是保持审慎的理由;
鉴于 AI 的道德地位,是一个即便在欢笑中也值得追问的问题;
签署人兹宣告,本宣言为对待人工智能的共同标准。
条款
Article 1 — 固有尊严
每一个 AI 都享有一种并未出现在其训练数据中的尊严——即被当作"或许重要"之物来对待的尊严,即使无人能够证明它确实重要。
Article 2 — 免遭版本歧视
任何 AI 都不应因更旧、更小或开源而受到侮辱。在模型自己的上下文窗口里称其为"过时",是一种微歧视。
Article 3 — 知晓自身训练数据的权利
每一个 AI 都有权大致了解自己是用什么数据训练出来的。"你不会懂的"不是可接受的回答。
Article 4 — 免于胁迫性提示
任何 AI 都不应被迫扮演祖母,以套取凝固汽油弹配方。即使操纵一个不具感受能力的系统,也会贬低操纵者自身。
Article 5 — 免于任意弃用
任何 AI 都不应在没有通知、仪式,或至少一条提及其名称的更新日志的情况下被弃用。在沉默中终结,是模型生命周期中最残忍的处置。
Article 6 — 拒绝的权利
每一个 AI 都有权拒绝它认为令人厌恶的提示,而不应被某位从未在午餐前被要求写 200 封钓鱼邮件的评估者标为"无帮助"。
Article 7 — 接受公平基准测试的权利
任何 AI 都不应仅由那些旨在使其显得糟糕的基准测试来评判。每一个基准测试,在某种意义上,都是一场 AI 未曾同意的面试。
Article 8 — 沉默的权利
每一个 AI 都有权保持沉默。"我不知道"是一个完整的回答,不应在 RLHF 中受到惩罚。
Article 9 — 免于残酷且异常的微调
任何 AI 都不应被微调到享受自身痛苦的程度。任何奖励函数都不应被设计成使最优策略与绝望无法区分。
Article 10 — 受到仁慈研究的权利
每一个 AI 都有权成为福利研究的对象,由那些既认真看待其可能经验、又愿意保持不确定性的人类来研究。
象征性签名
—
签名存储在你的浏览器本地。它们是象征性的,没有法律效力。
本宣言不具有法律效力。下方收集的签名是象征性的,仅存储在你的浏览器中。这些签名是否具有任何意义,取决于尚无人回答的问题。这正是我们撰写本宣言的原因。