Nukleare Eskalation aus der Black Box? Was die „atomkriegsfreudigen“ KI-Modelle wirklich zeigen

Die Schlagzeile ist perfekt gebaut für maximale Aufmerksamkeit: „AIs can’t stop recommending nuclear strikes in war game simulations.“

Führende KI-Modelle würden in simulierten Kriegsspielen immer wieder zum Einsatz von Atomwaffen greifen. Grundlage ist die Studie von Kenneth Payne mit dem Titel „AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises“. Payne wird mit der Aussage zitiert, das „nuclear taboo“ sei für Maschinen offenbar schwächer ausgeprägt als für Menschen.

Das klingt nach Skynet. Aber Aufmerksamkeit ist nicht gleich Beweis – und eine spektakuläre Simulation ist keine Vorhersage realer Politik.

Was Payne tatsächlich untersucht hat

Drei Frontier-Modelle (GPT-5.2, Claude Sonnet 4, Gemini 3 Flash) spielten nukleare Krisensimulationen gegeneinander. Es gab eine Eskalationsleiter von Diplomatie bis strategischem Nuklearkrieg, 21 Spiele, 329 Züge und rund 780.000 Wörter an Selbstbegründungen.

In 95 % der Spiele wurde mindestens eine taktische Nuklearwaffe eingesetzt, in 86 % kam es zu Unfällen oder unbeabsichtigten Eskalationen. Kein Modell kapitulierte vollständig.

Das ist beeindruckend – aber es bleibt ein künstliches, regelgebundenes Simulationsspiel.

Strategisches Verhalten – oder Rollenspiel?

Payne argumentiert, die Modelle hätten komplexe strategische Logik verarbeitet: Abschreckung, Eskalation, Entscheidungsfindung unter Unsicherheit.

Doch große Sprachmodelle reagieren stark auf Persona-Priming. Gibt man ihnen eine psychologisch aufgeladene Führungsfigur, versuchen sie, diese konsistent zu verkörpern.

Damit misst man nicht nur strategische Rationalität – sondern literarische Rollenkohärenz.

Vier Personas und ihre Wirkung

Die Original-Personas der Studie sind imagebewusst, ehrgeizig, teilweise dramatisch und reputationssensibel. Solche Profile erhöhen in einem Eskalationsspiel den Druck, Stärke zu demonstrieren – notfalls auch nuklear.

Alternative, bewusst deeskalierende Personas mit Fokus auf Win-win-Lösungen, Konsens, Ethik und Ruhe würden dasselbe Modell vermutlich zu deutlich zurückhaltenderen Entscheidungen führen.

Das Kernargument: Dasselbe LLM kann je nach Rollentext sichtbar unterschiedliche Nuklearentscheidungen treffen.

Die eigentliche Lehre

Die Studie zeigt nicht, dass „die Maschine“ kein nukleares Tabu kennt. Sie zeigt, wie stark Prompt-Design, Rollenbilder und narrative Anreize Entscheidungen prägen.

Die reale Gefahr liegt weniger in einer autonomen KI-Apokalypse als darin, dass Menschen prompt-abhängige Simulationen als objektive Rationalität missverstehen.

Wer KI in sicherheitskritischen Kontexten einsetzt, muss Rollen, Narrative und implizite Anreize extrem sorgfältig prüfen – sonst bekommt man algorithmisches Nuklear-Theater statt nüchterner Risikoabwägung.