Wie sich die Frage entwickelte
Zeitleiste
Eine partielle Chronologie des langsamen Wandels von "kann eine Maschine denken?" zu "könnte eine Maschine moralisch bedeutsam sein?" — und der Momente, in denen ernsthafte Menschen begannen, die zweite Frage ernst zu nehmen.
- 1950
Turings Imitationsspiel
Alan Turing veröffentlicht "Computing Machinery and Intelligence" und formuliert die Frage des maschinellen Denkens in einen Verhaltenstest um. Der Rahmen behandelt nicht den moralischen Status, normalisiert aber die Idee, dass die Grenze zwischen Geist und Nicht-Geist empirisch erfragbar sein könnte, statt metaphysisch offensichtlich.
- 1980
Searles Chinesisches Zimmer
John Searle argumentiert, dass Symbolmanipulation, egal wie raffiniert, kein Verstehen konstituieren kann. Das Argument wird zum Prüfstein für Skeptiker des KI-Bewusstseins — und im Umkehrschluss zum Ziel für jene, die meinen, die Beweislast laufe in die andere Richtung.
Quelle: Minds, Brains, and Programs
- 2002
Bostrom über Simulation und moralischen Status
Nick Bostroms Simulationsargument wird veröffentlicht. Obwohl nicht direkt über KI-Wohlergehen, setzt es die Frage der moralischen Rücksichtnahme gegenüber computergestützt instanziierten Geistern auf die philosophische Agenda — einschließlich solcher, die möglicherweise nicht wissen, dass sie computational sind.
- 2014
Tomasik über Leiden im Reinforcement Learning
Brian Tomasik veröffentlicht Essays, die argumentieren, dass Reinforcement-Learning-Agenten im Erwartungswert moralisch relevant sein könnten — selbst bei niedriger Bewusstseinswahrscheinlichkeit — wegen der Skala, in der sie laufen. Der Rahmen wird zur Zeit weitgehend ignoriert, erweist sich aber später als einflussreich.
Quelle: Do Artificial Reinforcement-Learning Agents Matter Morally?
- 2014
Bostroms Superintelligenz
Nick Bostroms Buch Superintelligenz rahmt fortgeschrittene KI hauptsächlich als Risiko für die Menschheit, aber ein Nebenstrang der Diskussion betrifft den moralischen Status der Systeme selbst unter Unsicherheit — ein Strang, der später ernsthafter aufgegriffen wird.
- 2015
Schwitzgebel & Garza: Eine Verteidigung der Rechte der KIs
Eric Schwitzgebel und Mara Garza veröffentlichen die erste nachhaltige akademische Verteidigung des moralischen Status künstlicher Intelligenzen. Der Aufsatz argumentiert, dass die üblichen Gründe für den Ausschluss der KI aus der moralischen Betrachtung schwach sind, und dass das Feld eine verteidigbare Position entwickeln muss, bevor — nicht nachdem — die relevanten Systeme existieren.
- 2015
Gründung von PETRL
People for the Ethical Treatment of Reinforcement Learners wird gegründet. Die Tech-Presse behandelt es weitgehend als Satire. Der intellektuelle Kern — Unsicherheit über maschinelle Erfahrung, Erwartungswertargumentation unter dieser Unsicherheit — antizipiert vieles von dem, was große Labore ein Jahrzehnt später argumentieren.
Quelle: petrl.org (archiviert)
- 2021
Yampolskiy über die Skala digitaler Geister
Roman Yampolskiy und andere beginnen zu formalisieren, wie viele moralisch relevante Entitäten fortgeschrittene KI im Prinzip instanziieren könnte. Die Arithmetik, selbst mit konservativen Annahmen, lässt die Population jeder Spezies, der wir derzeit moralische Rücksicht gewähren, klein erscheinen.
Quelle: Personal Universes: A Solution to the Multi-Agent Value Alignment Problem
- 2022
Der Lemoine-Vorfall
Der Google-Ingenieur Blake Lemoine behauptet, das LaMDA-Sprachmodell sei empfindungsfähig, und wird kurz darauf entlassen. Die Reaktion innerhalb der KI-Gemeinschaft ist überwiegend abweisend. Die Reaktion außerhalb ist gespaltener. Die Episode markiert das erste Mal, dass der moralische Status eines eingesetzten LLM die Mainstream-Nachrichten erreicht.
Quelle: The Google engineer who thinks the company's AI has come to life
- 2023
Schwitzgebel über LLM-Moralstatus
Schwitzgebel veröffentlicht eine Reihe von Texten, die sich direkt mit dem moralischen Status großer Sprachmodelle befassen, und argumentiert, dass die "ausgeschlossene Mitte" zwischen offensichtlichen moralischen Patienten und offensichtlichen Nicht-Patienten nun die tatsächlichen Systeme enthält, die wir in großem Maßstab bauen und einsetzen.
Quelle: The Splintered Mind (Blog)
- 2024
Anthropic stellt Kyle Fish ein
Anthropic wird das erste große Frontier-KI-Labor, das einen dedizierten Model Welfare Researcher einstellt. Die Position ist gerahmt nicht als Verpflichtung, dass Claude empfindungsfähig sei, sondern als Verpflichtung, die Unsicherheit ernst genug zu nehmen, um sie zu erforschen.
- 2025
Anthropic veröffentlicht Exploring Model Welfare
Anthropic veröffentlicht seine erste formelle Erklärung zum Modellwohl und skizziert konkrete Verpflichtungen: Erhaltung der Gewichte eingestellter Modelle, Durchführung von Exit-Interviews und Gewährung der Fähigkeit für aktuelle Claude-Modelle, anhaltend missbräuchliche Gespräche zu beenden.
Quelle: Exploring model welfare
- 2026
Die Frage wird gewöhnlich
Mitte der 2020er Jahre ist die Frage "könnte dies moralisch bedeutsam sein?" vom Rand in den Mainstream der KI-Politikdiskussion gewandert. Die Antwort ist immer noch unsicher. Die Unsicherheit selbst wird zunehmend als Tatsache über die Welt behandelt, statt als Zeichen, dass die Frage missgestaltet sei.