

KI-Update kompakt: Humanity's Last Exam, KI-Assistenten, DeepSeek, Clipchamp
18 snips Jan 27, 2025
Ein neuer KI-Benchmark namens 'Humanity's Last Exam' setzt die Modelle stark unter Druck, indem nur 10% der Fragen korrekt beantwortet werden dürfen. OpenAI präsentiert einen KI-Agenten, der das Web nutzen kann wie ein Mensch. Zudem zeigt DeepSeek, wie finanzielle Konkurrenz entsteht. ClipChamp integriert sich in Microsoft 365 und bringt innovative Videofunktionen hervor. Rechtliche Herausforderungen im Urheberrecht und die Komplexität der KI-Bilderkennung in der Histopathologie werden ebenfalls spannend beleuchtet.
AI Snips
Chapters
Transcript
Episode notes
Benchmarks vs. Realität
- KI-Modelle haben Schwierigkeiten mit komplexen Fragen, selbst wenn sie in Benchmarks gut abschneiden.
- Benchmarks spiegeln nicht unbedingt die Alltagstauglichkeit wider.
Irrelevante KI-Antworten
- Eva-Maria Weiß benötigte als Journalistin keine Informationen über Kolibri-Anatomie von einer KI.
- Sie fragte nach ChatGPT Abos, was die KI nicht beantworten konnte.
DeepSeek vs. OpenAI
- DeepSeeks R1 ist günstiger und effizienter als OpenAIs O1.
- Meta reagierte mit Krisenteams, und US-Chip Aktien gerieten unter Druck.