
#43 Was kann ChatGPT 5? KI Expertinnen und Nerdinnen Barbara Lampl und Elisabeth L’Orange über neue KI-Trends, Data Readiness in Unternehmen und die Folgen für Gesellschaft.
Tech and Tales
00:00
Bewertung von KI-Modellen im Wettbewerb
Dieses Kapitel beleuchtet die Bewertung und den Vergleich von KI-Modellen, insbesondere in der LLM-Arena. Es wird die Verwendung von ELO-Scores zur Performance-Messung erläutert und die Manipulation von Benchmarks kritisch hinterfragt.
Transcript
Play full episode