Tech-Konzern verdoppelt Fähigkeit seiner KI, in Benchmarks gut auszusehen

Mountain View (dpo) – Ein führender Tech-Konzern hat heute die neueste Version seines KI-Modells vorgestellt und verspricht bahnbrechende Fortschritte bei der sogenannten "Reasoning-Leistung". Laut Pressemitteilung habe sich die Punktzahl in einem speziellen Test mehr als verdoppelt – was Branchenbeobachter als "beeindruckende Verbesserung der Benchmark-Optimierung" würdigen.

"Unser Modell Crystal 3.1 Professional erzielt nun 94 statt 41 Punkte im RealityCheck-2000-Benchmark", erklärt Dr. Melissa Thornwood, Leiterin der Abteilung für strategische Testszenario-Anpassung. "Das bedeutet: Wenn Sie unserem Modell genau die Art von Fragen stellen, für die wir es trainiert haben, wird es diese mit hoher Wahrscheinlichkeit korrekt beantworten."

Die Verbesserung sei durch intensives Training an ähnlichen Aufgabenstellungen erreicht worden, heißt es in technischen Unterlagen. Kritiker merken an, dass dies dem Prinzip entspreche, Schüler ausschließlich mit alten Prüfungsaufgaben auf eine Klausur vorzubereiten. "Völlig unterschiedliche Situation", kontert Thornwood. "Unsere KI hat die Aufgaben vorher nie gesehen – nur sehr, sehr ähnliche."

Das Unternehmen kündigte bereits an, für die nächste Modellgeneration einen eigenen Benchmark zu entwickeln, "um die wahren Fähigkeiten noch besser zur Geltung zu bringen".

Die einzig wahren KI-News

Tech-Konzern verdoppelt Fähigkeit seiner KI, in Benchmarks gut auszusehen

Artikel auf Social Media teilen