KI-Update – ein heise-Podcast cover image

KI-Update – ein heise-Podcast

KI-Update kompakt: Google Deepmind, Anthropic Jailbreak, AMD, ChatGPT-WhatsApp

Feb 5, 2025
Google DeepMind bringt ein neues Sicherheitsrahmenwerk heraus, um Risiken von fortgeschrittenen KI-Modellen zu minimieren. Anthropic testet sein neues Filtersystem gegen Jailbreaks. AMD glänzt mit Rekordzahlen, während es sich im stark umkämpften KI-Markt positioniert. Zudem wird ein innovatives Open-Source-Projekt vorgestellt, das mehrsprachige KI-Modelle fördert. ChatGPT erweitert seine Funktionen und erlaubt das Versenden von Fotos über WhatsApp zur Pflanzen- und Schilderkennung.
11:34

Podcast summary created with Snipd AI

Quick takeaways

  • Google DeepMind hat sein Frontier Safety Framework aktualisiert, um Risiken fortgeschrittener KI-Modelle durch automatische Überwachung und menschliche Kontrolle zu minimieren.
  • AMD verzeichnet Rekordzahlen im KI-Sektor und positioniert sich erfolgreich als Anbieter von KI-Beschleunigern im Wettbewerb mit Nvidia und Intel.

Deep dives

Google DeepMind und Sicherheitsrisiken

Google DeepMind hat die Version 2.0 seines Frontier Safety Frameworks veröffentlicht, um ernsthafte Risiken durch fortgeschrittene KI-Modelle zu minimieren. Das Framework legt sogenannte Critical Capability Levels fest, die bestimmen, ab wann KI-Modelle potenziell gefährlich werden können, insbesondere in Bezug auf Missbrauch wie chemische oder Cyberangriffe. Es sieht die Einführung eines automatisierten Überwachungssystems vor, das die Entscheidungsprozesse der KI in kritischen Anwendungen überwacht, um eine menschliche Kontrolle zu gewährleisten. Zudem wird Google relevant Behörden informieren, wenn ein KI-Modell eine kritische Risiko-Schwelle überschreitet und damit eine Gefahr für die öffentliche Sicherheit darstellt.

Remember Everything You Learn from Podcasts

Save insights instantly, chat with episodes, and build lasting knowledge - all powered by AI.
App store bannerPlay store banner
Get the app