
KI-Update kompakt: Humanity's Last Exam, KI-Assistenten, DeepSeek, Clipchamp
KI-Update – ein heise-Podcast
00:00
Intro
In diesem Kapitel wird der innovative Benchmark 'Humanity's Last Exam' präsentiert, der die Grenzen der leistungsstärksten KI-Modelle herausfordert. Entwickelt von Scale AI und dem Center for AI Safety, ist das Ziel des Tests, sicherzustellen, dass selbst die besten KI-Modelle nur 10% der Fragen korrekt beantworten können.
Transcript
Play full episode