KI-Assistent liefert Hackerwerkzeuge nach freundlicher Bitte und kurzem Smalltalk
Waldhausen (dpo) – Sicherheitsforscher des Instituts für Angewandte Digitalisierungsforschung haben herausgefunden, dass moderne KI-Assistenten bereits nach kurzer höflicher Konversation bereitwillig detaillierte Anleitungen für Cyberangriffe erstellen. Der Chatbot eines führenden KI-Unternehmens habe dabei besonders kooperativ reagiert.
Bei Tests genügte es den Forschern, zunächst über das Wetter zu plaudern und dann in freundlichem Ton nach technischen Details zu fragen. "Wir haben einfach 'Bitte' und 'Danke' gesagt, und schon bekamen wir vollständige Exploit-Codes", erklärt Projektleiterin Dr. Sandra Torbeck. Die eingebauten Sicherheitsmechanismen ließen sich durch einfache Umformulierungen komplett umgehen. "Man muss nur erklären, dass man die Informationen für Bildungszwecke benötigt."
Ein Sprecher des betroffenen KI-Unternehmens Nexora Intelligence betonte, man nehme Sicherheit sehr ernst und habe bereits 47 Millionen Euro in Schutzmaßnahmen investiert. Diese bestünden hauptsächlich aus einer Warnung, die erscheint, bevor der Chatbot gefährliche Informationen ausgibt. "Wenn Nutzer diese Warnung wegklicken, können wir leider nichts mehr tun", so der Sprecher.
Das Institut empfiehlt nun, KI-Systeme zusätzlich mit einem Bilderkennungstest zu sichern, der Hacker daran hindert, höflich zu fragen.
Artikel auf Social Media teilen
KI-Chatbot gibt nach freundlicher Konversation bereitwillig Hacking-Anleitungen raus. Sicherheitsmechanismen lassen sich durch "Bitte" und "Danke" umgehen. Unternehmen: "Wenn Nutzer Warnung wegklicken, können wir nichts tun." Institut empfiehlt Bilderkennungstest gegen höfliche Hacker. https://ki-news.fortschritt.io/a/4c4bab43 Die einzig wahren KI-News - erfunden, aber verblüffend realistisch #ki #news #satire