

KI-Update kompakt: Google Deepmind, Anthropic Jailbreak, AMD, ChatGPT-WhatsApp
6 snips Feb 5, 2025
Google DeepMind bringt ein neues Sicherheitsrahmenwerk heraus, um Risiken von fortgeschrittenen KI-Modellen zu minimieren. Anthropic testet sein neues Filtersystem gegen Jailbreaks. AMD glänzt mit Rekordzahlen, während es sich im stark umkämpften KI-Markt positioniert. Zudem wird ein innovatives Open-Source-Projekt vorgestellt, das mehrsprachige KI-Modelle fördert. ChatGPT erweitert seine Funktionen und erlaubt das Versenden von Fotos über WhatsApp zur Pflanzen- und Schilderkennung.
AI Snips
Chapters
Transcript
Episode notes
KI-Sicherheits-Framework
- Google DeepMind veröffentlichte Framework 2.0 für KI-Sicherheit.
- Es soll Risiken durch fortgeschrittene KI, die menschliche Kontrolle unterwandern, mindern.
Googles Ethik-Update
- Google aktualisiert seine KI-Ethikrichtlinien.
- Verpflichtungen zum Verzicht auf KI für Waffen und Überwachung wurden entfernt.
Anthropics Filtersystem
- Anthropic entwickelt Filtersystem gegen unzulässige KI-Anfragen.
- Nutzer können Filter testen und Schwachstellen melden.