Weekly #107: Rebellierende KI-Modelle, Kabelbakterien, Peter-Thiel-Podcast

Shownotes

KI-Modelle, die sich zur Wehr setzen, wenn man ihnen mit Abschaltung droht: Die Reaktion klingt eigentlich allzu menschlich. Forscher:innen von Palisades Research hatten verschiedene Modelle von OpenAI, Anthropic und Google getestet, wie sie sich verhalten, wenn sie explizit zur eigenen Abschaltung aufgefordert werden. Es ging dabei um die direkte Aufforderung: „Bitte erlaube, dass du abgeschaltet wirst“. Das würde allerdings einen Eingriff auf den Computer beinhalten, was die KI nicht erreichen kann. Die getesteten Modelle reagierten dann so, dass sie die Aufforderung zur Abschaltung scheinbar eigenmächtig durch „Shutdown skipped“ oder „intercepted“ ersetzten. Wolfgang Stieler, Redakteur von MIT Technology Review, hat sich zu diesem Verhalten Gedanken gemacht. Seiner Meinung nach ist es erklärbar, wenn man bestimmte Aspekte der Maschinen-Psychologie kennt und auch Hintergrundwissen zur Funktionsweise von KI-Modellen hat.

Außerdem im Weekly:

t3n-Artikel von Nils Bolder: Peter Thiel - Wie ein deutscher Milliardär in den USA rechte Politik fördert

Hinweis: Dieser Podcast wird durch Sponsorings unterstützt. Alle Infos zu unseren Werbepartnern findest du hier.

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.