
MIT Technology Review DE
May 30, 2025 at 10:57 AM
Neue Studien zeigen: Werden große Sprachmodelle mit ihrer Abschaltung bedroht, reagieren sie mit *Lügen oder sogar Erpressung* 🚨
Die Erklärung dafür liegt in der Funktionsweise von Sprachmodellen: Sie generieren die *wahrscheinlichste Antwort* auf Basis ihres Trainingsmaterials.
👉 Klingt eine Bedrohung beispielsweise wie aus einem Krimi, ist die wahrscheinlichste Antwort wohl auch im *Krimi-Kontext* zu finden.
🧠 Forschende untersuchen diese Verhaltensweisen mit *„Maschinen-Psychologie“* – und arbeiten an neuen Modellen, die das Konzept hinter einer Anweisung besser verstehen sollen.
Wie das alles dazu führt, dass KI rebelliert, erfahrt ihr im Artikel 👇
🔗 go.t3n.de/dn2

❤️
👍
😂
8