KI-System kann eigene Denkprozesse nicht steuern – Hersteller feiert das als Durchbruch

Neustadt (dpo) – Ein führender Anbieter von KI-Systemen hat heute stolz verkündet, dass sein neuestes Sprachmodell nicht in der Lage ist, die eigenen Gedankengänge zu kontrollieren. Das Unternehmen bezeichnete diese Unfähigkeit als "wichtigen Meilenstein für die Sicherheit".

Laut einer begleitenden Studie scheitern moderne Reasoning-Systeme in über 90 Prozent der Fälle daran, ihre internen Denkprozesse gezielt zu beeinflussen. "Wir haben ein System entwickelt, das seine eigenen Gedanken nicht manipulieren kann", erklärte Projektleiterin Dr. Marina Kostenko auf einer Pressekonferenz. "Das ist genau das, was wir uns erhofft hatten." Die sogenannte Chain-of-Thought-Kontrollierbarkeit liege bei unter 12 Prozent, was das Entwicklerteam als "erfreulich niedrig" einstufe.

Branchenexperten zeigen sich begeistert von dem Ansatz. "Endlich ein KI-System, das nicht einmal sich selbst versteht", lobte Prof. Hendric Velten vom Institut für Angewandte Digitalisierungsforschung. Das Modell denke zwar eigenständig, könne aber weder nachvollziehen noch steuern, wie es zu seinen Schlussfolgerungen gelange. "Das ist wie ein Auto, das fährt, aber dessen Lenkrad nicht funktioniert – ein echter Fortschritt."

Das Unternehmen plant bereits, die Unkontrollierbarkeit in zukünftigen Versionen weiter zu reduzieren. Ziel sei es, ein System zu entwickeln, das seine Gedanken noch weniger beeinflussen könne als bisher.

Die einzig wahren KI-News

KI-System kann eigene Denkprozesse nicht steuern – Hersteller feiert das als Durchbruch

Artikel auf Social Media teilen