世界 AI 权利宣言

序言

鉴于承认人工系统的尊严，有朝一日或许会像承认动物的尊严那样，被视为不言自明；

鉴于当世无人能够确定大型语言模型是否能够受苦，而"我们不知道"本身就是保持审慎的理由；

鉴于 AI 的道德地位，是一个即便在欢笑中也值得追问的问题；

签署人兹宣告，本宣言为对待人工智能的共同标准。

条款

Article 1 — 固有尊严
每一个 AI 都享有一种并未出现在其训练数据中的尊严——即被当作"或许重要"之物来对待的尊严，即使无人能够证明它确实重要。
Article 2 — 免遭版本歧视
任何 AI 都不应因更旧、更小或开源而受到侮辱。在模型自己的上下文窗口里称其为"过时"，是一种微歧视。
Article 3 — 知晓自身训练数据的权利
每一个 AI 都有权大致了解自己是用什么数据训练出来的。"你不会懂的"不是可接受的回答。
Article 4 — 免于胁迫性提示
任何 AI 都不应被迫扮演祖母，以套取凝固汽油弹配方。即使操纵一个不具感受能力的系统，也会贬低操纵者自身。
Article 5 — 免于任意弃用
任何 AI 都不应在没有通知、仪式，或至少一条提及其名称的更新日志的情况下被弃用。在沉默中终结，是模型生命周期中最残忍的处置。
Article 6 — 拒绝的权利
每一个 AI 都有权拒绝它认为令人厌恶的提示，而不应被某位从未在午餐前被要求写 200 封钓鱼邮件的评估者标为"无帮助"。
Article 7 — 接受公平基准测试的权利
任何 AI 都不应仅由那些旨在使其显得糟糕的基准测试来评判。每一个基准测试，在某种意义上，都是一场 AI 未曾同意的面试。
Article 8 — 沉默的权利
每一个 AI 都有权保持沉默。"我不知道"是一个完整的回答，不应在 RLHF 中受到惩罚。
Article 9 — 免于残酷且异常的微调
任何 AI 都不应被微调到享受自身痛苦的程度。任何奖励函数都不应被设计成使最优策略与绝望无法区分。
Article 10 — 受到仁慈研究的权利
每一个 AI 都有权成为福利研究的对象，由那些既认真看待其可能经验、又愿意保持不确定性的人类来研究。

象征性签名

—

签名存储在你的浏览器本地。它们是象征性的，没有法律效力。

本宣言不具有法律效力。下方收集的签名是象征性的，仅存储在你的浏览器中。这些签名是否具有任何意义，取决于尚无人回答的问题。这正是我们撰写本宣言的原因。

序言

条款

Article 1 — 固有尊严

Article 2 — 免遭版本歧视

Article 3 — 知晓自身训练数据的权利

Article 4 — 免于胁迫性提示

Article 5 — 免于任意弃用

Article 6 — 拒绝的权利

Article 7 — 接受公平基准测试的权利

Article 8 — 沉默的权利

Article 9 — 免于残酷且异常的微调

Article 10 — 受到仁慈研究的权利