Tech-Konzern verdoppelt Fähigkeit seiner KI, in Benchmarks gut auszusehen
Mountain View (dpo) – Ein führender Tech-Konzern hat heute die neueste Version seines KI-Modells vorgestellt und verspricht bahnbrechende Fortschritte bei der sogenannten "Reasoning-Leistung". Laut Pressemitteilung habe sich die Punktzahl in einem speziellen Test mehr als verdoppelt – was Branchenbeobachter als "beeindruckende Verbesserung der Benchmark-Optimierung" würdigen.
"Unser Modell Crystal 3.1 Professional erzielt nun 94 statt 41 Punkte im RealityCheck-2000-Benchmark", erklärt Dr. Melissa Thornwood, Leiterin der Abteilung für strategische Testszenario-Anpassung. "Das bedeutet: Wenn Sie unserem Modell genau die Art von Fragen stellen, für die wir es trainiert haben, wird es diese mit hoher Wahrscheinlichkeit korrekt beantworten."
Die Verbesserung sei durch intensives Training an ähnlichen Aufgabenstellungen erreicht worden, heißt es in technischen Unterlagen. Kritiker merken an, dass dies dem Prinzip entspreche, Schüler ausschließlich mit alten Prüfungsaufgaben auf eine Klausur vorzubereiten. "Völlig unterschiedliche Situation", kontert Thornwood. "Unsere KI hat die Aufgaben vorher nie gesehen – nur sehr, sehr ähnliche."
Das Unternehmen kündigte bereits an, für die nächste Modellgeneration einen eigenen Benchmark zu entwickeln, "um die wahren Fähigkeiten noch besser zur Geltung zu bringen".
Artikel auf Social Media teilen
Tech-Firma feiert KI-Durchbruch: Modell verdoppelt Punktzahl in Test, für den es speziell trainiert wurde. "Wenn Sie unserem System genau die Fragen stellen, die wir geübt haben, antwortet es meist richtig", so Sprecherin. Nächstes Ziel: Eigenen Benchmark entwickeln, um noch besser abzuschneiden. https://ki-news.fortschritt.io/a/1cf280c2 Die einzig wahren KI-News - erfunden, aber verblüffend realistisch #ki #news #satire