Tech and Tales cover image

#43 Was kann ChatGPT 5? KI Expertinnen und Nerdinnen Barbara Lampl und Elisabeth L’Orange über neue KI-Trends, Data Readiness in Unternehmen und die Folgen für Gesellschaft.

Tech and Tales

00:00

Bewertung von KI-Modellen im Wettbewerb

Dieses Kapitel beleuchtet die Bewertung und den Vergleich von KI-Modellen, insbesondere in der LLM-Arena. Es wird die Verwendung von ELO-Scores zur Performance-Messung erläutert und die Manipulation von Benchmarks kritisch hinterfragt.

Transcript
Play full episode

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app