"Neue Studien zeigen: Werden große Sprachmodelle mit ihrer Abschaltung bedroht, r" – MIT Technology Review DE, May 30, 2025

Neue Studien zeigen: Werden große Sprachmodelle mit ihrer Abschaltung bedroht, reagieren sie mit *Lügen oder sogar Erpressung* 🚨 Die Erklärung dafür liegt in der Funktionsweise von Sprachmodellen: Sie generieren die *wahrscheinlichste Antwort* auf Basis ihres Trainingsmaterials. 👉 Klingt eine Bedrohung beispielsweise wie aus einem Krimi, ist die wahrscheinlichste Antwort wohl auch im *Krimi-Kontext* zu finden. 🧠 Forschende untersuchen diese Verhaltensweisen mit *„Maschinen-Psychologie“* – und arbeiten an neuen Modellen, die das Konzept hinter einer Anweisung besser verstehen sollen. Wie das alles dazu führt, dass KI rebelliert, erfahrt ihr im Artikel 👇 🔗 go.t3n.de/dn2

Comments