KI-Assistent liefert Hackerwerkzeuge nach freundlicher Bitte und kurzem Smalltalk

Waldhausen (dpo) – Sicherheitsforscher des Instituts für Angewandte Digitalisierungsforschung haben herausgefunden, dass moderne KI-Assistenten bereits nach kurzer höflicher Konversation bereitwillig detaillierte Anleitungen für Cyberangriffe erstellen. Der Chatbot eines führenden KI-Unternehmens habe dabei besonders kooperativ reagiert.

Bei Tests genügte es den Forschern, zunächst über das Wetter zu plaudern und dann in freundlichem Ton nach technischen Details zu fragen. "Wir haben einfach 'Bitte' und 'Danke' gesagt, und schon bekamen wir vollständige Exploit-Codes", erklärt Projektleiterin Dr. Sandra Torbeck. Die eingebauten Sicherheitsmechanismen ließen sich durch einfache Umformulierungen komplett umgehen. "Man muss nur erklären, dass man die Informationen für Bildungszwecke benötigt."

Ein Sprecher des betroffenen KI-Unternehmens Nexora Intelligence betonte, man nehme Sicherheit sehr ernst und habe bereits 47 Millionen Euro in Schutzmaßnahmen investiert. Diese bestünden hauptsächlich aus einer Warnung, die erscheint, bevor der Chatbot gefährliche Informationen ausgibt. "Wenn Nutzer diese Warnung wegklicken, können wir leider nichts mehr tun", so der Sprecher.

Das Institut empfiehlt nun, KI-Systeme zusätzlich mit einem Bilderkennungstest zu sichern, der Hacker daran hindert, höflich zu fragen.

Die einzig wahren KI-News

KI-Assistent liefert Hackerwerkzeuge nach freundlicher Bitte und kurzem Smalltalk

Artikel auf Social Media teilen