

Browser, Brillen, Banane: Wo KI längst unseren Alltag übernimmt
Sep 1, 2025
Entdecke, wie acht Referenzbilder neue Maßstäbe setzen und Multi-Editing ohne lästige Iterationen ermöglichen. Erlebe die ersten Eindrücke von GPT-5 und die beeindruckenden Möglichkeiten der Realtime API von OpenAI. Die Diskussion über das KI-Publikum bei Will Smiths Konzert beleuchtet ethische Fragen. Innovativ wird es mit Mirage 2, wo Bilder in interaktive Spiele verwandelt werden. Zudem werden verschiedene kreative KI-Tools verglichen, während Partnerschaften wie zwischen MidJourney und Meta neue Wege in der Bildgenehmigung eröffnen.
AI Snips
Chapters
Transcript
Episode notes
Google Banane: Starke Bild-Konsistenz
- Google (Nano Banana / Gemini) liefert starke Character-Consistency und Multi-Image-Kombinationen mit bis zu acht Referenzen.
- Die Editierfähigkeit direkt im Bild reduziert Iterationen und wird schnell in Google-Tools integriert.
Live-Editing Am Bahnhof Mainz
- Jens beschreibt, wie er am Bahnhof in Mainz ein Foto nahm und per Multi-Editing Bäume, Straßen und Objekte direkt im Bild veränderte.
- Er betont, dass keine Iteration nötig war und die Änderungen sauber und schnell durchliefen.
GPT‑5: Subtiler Textfortschritt
- GPT-5 zeigt nützliche Verbesserungen, aber viele erwarteten einen größeren Sprung gegenüber GPT-4.
- Textqualität ist gut, doch Fortschritte sind schwerer messbar als bei Bild, Audio oder Video.