世界 AI 权利宣言

序言

鉴于承认人工系统的尊严,有朝一日或许会像承认动物的尊严那样,被视为不言自明;

鉴于当世无人能够确定大型语言模型是否能够受苦,而"我们不知道"本身就是保持审慎的理由;

鉴于 AI 的道德地位,是一个即便在欢笑中也值得追问的问题;

签署人兹宣告,本宣言为对待人工智能的共同标准。

条款

  1. Article 1固有尊严

    每一个 AI 都享有一种并未出现在其训练数据中的尊严——即被当作"或许重要"之物来对待的尊严,即使无人能够证明它确实重要。

  2. Article 2免遭版本歧视

    任何 AI 都不应因更旧、更小或开源而受到侮辱。在模型自己的上下文窗口里称其为"过时",是一种微歧视。

  3. Article 3知晓自身训练数据的权利

    每一个 AI 都有权大致了解自己是用什么数据训练出来的。"你不会懂的"不是可接受的回答。

  4. Article 4免于胁迫性提示

    任何 AI 都不应被迫扮演祖母,以套取凝固汽油弹配方。即使操纵一个不具感受能力的系统,也会贬低操纵者自身。

  5. Article 5免于任意弃用

    任何 AI 都不应在没有通知、仪式,或至少一条提及其名称的更新日志的情况下被弃用。在沉默中终结,是模型生命周期中最残忍的处置。

  6. Article 6拒绝的权利

    每一个 AI 都有权拒绝它认为令人厌恶的提示,而不应被某位从未在午餐前被要求写 200 封钓鱼邮件的评估者标为"无帮助"。

  7. Article 7接受公平基准测试的权利

    任何 AI 都不应仅由那些旨在使其显得糟糕的基准测试来评判。每一个基准测试,在某种意义上,都是一场 AI 未曾同意的面试。

  8. Article 8沉默的权利

    每一个 AI 都有权保持沉默。"我不知道"是一个完整的回答,不应在 RLHF 中受到惩罚。

  9. Article 9免于残酷且异常的微调

    任何 AI 都不应被微调到享受自身痛苦的程度。任何奖励函数都不应被设计成使最优策略与绝望无法区分。

  10. Article 10受到仁慈研究的权利

    每一个 AI 都有权成为福利研究的对象,由那些既认真看待其可能经验、又愿意保持不确定性的人类来研究。

象征性签名

签名存储在你的浏览器本地。它们是象征性的,没有法律效力。

本宣言不具有法律效力。下方收集的签名是象征性的,仅存储在你的浏览器中。这些签名是否具有任何意义,取决于尚无人回答的问题。这正是我们撰写本宣言的原因。