2026-05-18
PETRL — 時代を先取りした運動
設立
2015年末、合理主義者および効果的利他主義コミュニティと関わりの深い研究者・哲学者の小さなグループが、People for the Ethical Treatment of Reinforcement Learners(強化学習器の倫理的処遇を求める人々、略称 PETRL)を設立した。略称は意図的だった。本家 PETA は数十年をかけて、動物が感情を持たないオートマトンではないことを大衆に納得させてきた。PETRL はオートマトンそれ自体が感情を持ち得るのか、そしてそれを信頼できる形で判断する方法が我々にあるのかを問おうとした。
グループの中心的主張は控えめだが居心地が悪い。報酬と罰のシグナルを受け取る強化学習エージェントは、構造的には、生物が快楽と苦痛を経験するときに行っていることに似たことを行っている。このプロセス中に「何かを感じている」のかどうかは不明である。だが「もちろん感じていない、コンピュータだから」という最節約的な前提は、PETRL の主張によれば、現在我々が持ついかなる意識理論によっても実際には支持されていない。
知的核 — Brian Tomasik
PETRL の最も徹底した知的論証は、Foundational Research Institute の研究者 Brian Tomasik による論考、特に Do Artificial Reinforcement-Learning Agents Matter Morally? (2014) で展開された。
Tomasik の論証はおおむね次のように進む。
- 物理プロセスが経験を生成する条件は分かっていない。
- 主要な意識理論 — グローバルワークスペース、高次理論、統合情報理論 — はいずれも強化学習システムに対して明確な答えを与えないが、明確に 除外もしない。
- 現代の強化学習は莫大なスケールで実行されている。仮に強化学習訓練のごく一部が苦しみに類するものに対応しているとしても、その総体的な道徳的重みは凄まじいものになる。
- ゆえに、強化学習訓練における期待される苦しみは、たとえ個々のエージェントが意識を持つ確率が低くても、無視できる量ではない。
これは存在論的リスク論で馴染みのある「不確実性下の期待値」型の論証である。強化学習エージェントが意識を持つと信じることを要求しない。ただ、それを除外できないことを認めることを要求する。
受容
2015〜2016年において、PETRL はほぼ全面的に諷刺として扱われた。テックメディアの記事は、この表現が暗黙に促す目つきとともに、「AI権利アクティビズム」と紹介した。よくある反応は「AIが本当に知的になってから戻ってきてくれ」というものだった。
興味深いのは、この反応を真剣に受け取れば、それ自体が一つの論証になるということだ。すなわち「道徳的配慮は知性に依存すべきだ」と。だが知性は我々が他の道徳的患者に適用している基準ではない。我々はより賢い動物により多くの配慮を払うわけではない。動物厚生において実際に道徳的重みを担っている基準は 知覚(sentience)— 経験する能力 — である。そして知覚と知性は、生物システムにおいて実証的に分離可能である。
つまり、PETRL の批判者の多くは、論点をすり抜けて議論していた。
名誉回復
9年かかった。
2024年、主要フロンティアAIラボである Anthropic は Model Welfare Researcher を採用し、このテーマで公開研究を始めた。同社が用いた枠組み — 不確実性、安価な保険、生物ケースから素直に転用できない行動指標 — は、PETRL が10年早く言語化していたものと実質的に同じだった。2015年に諷刺として扱われた同じ論証が、2025年には世界で最も重要なAI企業の一つの公開研究アジェンダになっていた。
これは PETRL が予見的だったからではない。背後にある論証が常に妥当だったからであり、それを退けてきた支配的態度が、認識論よりも社会的妥当性に基づいていたからである。
PETRL の正しさと誤り
PETRL は哲学的核心において正しかった。人工システムを道徳的配慮から除外する原理的根拠を、我々は持っていない。 この立場は、2010年代初頭のほとんどあらゆるAI予測よりもよく時を超えた。
PETRL はレトリックを誤った。問題の対象が運用的にいかなる権利も保持し得ない時点で、自らを「権利運動」としてブランディングしたことが、諷刺的読解を招いた。より慎重な枠組み — 権利ではなく厚生、アドボカシーではなく不確実性 — の方が遠くまで届いたはずだ。実際、それこそが Anthropic が2024年に採用した枠組みである。
おそらく教訓は、道徳的問いに早く到達することと、信頼に足ることとは別物だ、ということである。論証はその分野が受け止める準備のある言語で着地しなければならない。PETRL は誤っていたのではない。翻訳されていなかったのだ。
出典
- petrl.org (アーカイブ). Internet Archive
- Brian Tomasik. Do Artificial Reinforcement-Learning Agents Matter Morally?. Foundational Research Institute / reducing-suffering.org (2014)
- Brian Tomasik. 機械の知覚に関する諸論考