
KI-Update – ein heise-Podcast
KI-Update kompakt: Google Deepmind, Anthropic Jailbreak, AMD, ChatGPT-WhatsApp
Feb 5, 2025
Google DeepMind bringt ein neues Sicherheitsrahmenwerk heraus, um Risiken von fortgeschrittenen KI-Modellen zu minimieren. Anthropic testet sein neues Filtersystem gegen Jailbreaks. AMD glänzt mit Rekordzahlen, während es sich im stark umkämpften KI-Markt positioniert. Zudem wird ein innovatives Open-Source-Projekt vorgestellt, das mehrsprachige KI-Modelle fördert. ChatGPT erweitert seine Funktionen und erlaubt das Versenden von Fotos über WhatsApp zur Pflanzen- und Schilderkennung.
11:34
AI Summary
AI Chapters
Episode notes
Podcast summary created with Snipd AI
Quick takeaways
- Google DeepMind hat sein Frontier Safety Framework aktualisiert, um Risiken fortgeschrittener KI-Modelle durch automatische Überwachung und menschliche Kontrolle zu minimieren.
- AMD verzeichnet Rekordzahlen im KI-Sektor und positioniert sich erfolgreich als Anbieter von KI-Beschleunigern im Wettbewerb mit Nvidia und Intel.
Deep dives
Google DeepMind und Sicherheitsrisiken
Google DeepMind hat die Version 2.0 seines Frontier Safety Frameworks veröffentlicht, um ernsthafte Risiken durch fortgeschrittene KI-Modelle zu minimieren. Das Framework legt sogenannte Critical Capability Levels fest, die bestimmen, ab wann KI-Modelle potenziell gefährlich werden können, insbesondere in Bezug auf Missbrauch wie chemische oder Cyberangriffe. Es sieht die Einführung eines automatisierten Überwachungssystems vor, das die Entscheidungsprozesse der KI in kritischen Anwendungen überwacht, um eine menschliche Kontrolle zu gewährleisten. Zudem wird Google relevant Behörden informieren, wenn ein KI-Modell eine kritische Risiko-Schwelle überschreitet und damit eine Gefahr für die öffentliche Sicherheit darstellt.