NewMinds.AI - KI Podcast

Browser, Brillen, Banane: Wo KI längst unseren Alltag übernimmt

Sep 1, 2025
Entdecke, wie acht Referenzbilder neue Maßstäbe setzen und Multi-Editing ohne lästige Iterationen ermöglichen. Erlebe die ersten Eindrücke von GPT-5 und die beeindruckenden Möglichkeiten der Realtime API von OpenAI. Die Diskussion über das KI-Publikum bei Will Smiths Konzert beleuchtet ethische Fragen. Innovativ wird es mit Mirage 2, wo Bilder in interaktive Spiele verwandelt werden. Zudem werden verschiedene kreative KI-Tools verglichen, während Partnerschaften wie zwischen MidJourney und Meta neue Wege in der Bildgenehmigung eröffnen.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Google Banane: Starke Bild-Konsistenz

  • Google (Nano Banana / Gemini) liefert starke Character-Consistency und Multi-Image-Kombinationen mit bis zu acht Referenzen.
  • Die Editierfähigkeit direkt im Bild reduziert Iterationen und wird schnell in Google-Tools integriert.
ANECDOTE

Live-Editing Am Bahnhof Mainz

  • Jens beschreibt, wie er am Bahnhof in Mainz ein Foto nahm und per Multi-Editing Bäume, Straßen und Objekte direkt im Bild veränderte.
  • Er betont, dass keine Iteration nötig war und die Änderungen sauber und schnell durchliefen.
INSIGHT

GPT‑5: Subtiler Textfortschritt

  • GPT-5 zeigt nützliche Verbesserungen, aber viele erwarteten einen größeren Sprung gegenüber GPT-4.
  • Textqualität ist gut, doch Fortschritte sind schwerer messbar als bei Bild, Audio oder Video.
Get the Snipd Podcast app to discover more snips from this episode
Get the app