Björn Ommer – der Mann, der Computern das Sehen beibringt
Jan 24, 2025
auto_awesome
Björn Ommer, Informatikprofessor an der LMU München und Pionier im Bereich generative KI, spricht über seine Mission, Computern das Sehen beizubringen. Er erklärt, wie die Entwicklung des Bildmodells Stable Diffusion ihm ermöglicht, Maschinenumgebungen besser erkennen zu lassen. Ommer beleuchtet auch die Herausforderungen, die KI-Forschung durch Betrug und unethisches Verhalten plagen, und thematisiert die Rolle von Weltmodellen im autonomen Fahren. Zudem teilt er seine Faszination für die menschliche Intelligenz und die ethischen Standards in der Künstlichen Intelligenz.
Björn Ommer betont, dass das Ziel seiner Forschung darin besteht, Computern das Sehen beizubringen, um deren Verständnis der realen Welt zu verbessern.
Stable Diffusion zeigt, wie KI durch flexibles Lernen Bilder kontextuell erfassen und somit die Entwicklung innovativer Anwendungen vorantreiben kann.
Die Herausforderungen im autonomen Fahren verdeutlichen, dass präzise Datenauswertung und umfassende Tests notwendig sind, um effektive Systeme zu entwickeln.
Deep dives
Entwicklung von KI-Modellen und deren Hype
Die kontinuierliche Weiterentwicklung von KI-Modellen führt zu einem aufkommenden Hype, insbesondere um 3D-Datenverarbeitung und World-Modelle. Diese Modelle ermöglichen es, ein digitales Abbild der realen Welt zu erstellen, was enorme Fortschritte in verschiedenen Anwendungsbereichen, wie Robotik und medizinischer Diagnostik, verspricht. Forscher und Unternehmen setzen auf diesen Hype, um innovative Lösungen für komplexe Probleme zu entwickeln. Trotz bemerkenswerter Fortschritte bleibt die Herausforderung bestehen, wie KI diese Fortschritte im praktischen Einsatz effektiv umsetzen kann.
Herangehensweise der Wissenschaft an KI und Bilderkennung
Die Forschung im Bereich der Computer Vision konzentriert sich darauf, Maschinen zu lehren, Bilder zu verstehen und Objekte zu erkennen. Ein Beispiel für flexibles Lernen ist die Entwicklung von Stable Diffusion, die es Computer ermöglicht, den Kontext von Bildern zu erfassen. Die schnelle Lernfähigkeit von KI zeigt, dass sie sackartige Zusammenhänge erkennen kann, die Menschen nur schwer benennen könnten. Dies fördert die Entwicklung innovativer Anwendungen, die über das bloße Generieren von Bildern hinausgehen.
Herausforderungen bei autonomen Systemen
Der Fortschritt in autonomen Fahrzeugsystemen verdeutlicht die Herausforderungen, vor denen Forscher stehen, insbesondere bei der Verarbeitung komplexer Umgebungen. Während die Technologie auf Autobahnen gut funktioniert, finden sich zahlreiche Probleme in weniger vorhersehbaren Situationen, z.B. bei schlechtem Wetter oder unerwarteten Hindernissen. Ein sicheres und effektives autonomes Fahren erfordert eine präzise Datenauswertung und die Fähigkeit, aus vorherigen Erfahrungen zu lernen. Diese Komplexität verdeutlicht die Notwendigkeit für umfassende Simulationen und Tests, bevor autonome Systeme breitflächig eingesetzt werden können.
Wettbewerb und Chancen in der KI-Industrie
Die aktuellen Entwicklungen im Bereich generative KI erfordern ein tiefes Verständnis der zugrunde liegenden Technologien sowie der Marktbedürfnisse. Unternehmen müssen sich darauf konzentrieren, wie sie ihre Kompetenzen verbessern und innovative Ansätze finden, um im internationalen Wettbewerb bestehen zu können. Es wird betont, dass Manipulation und Misstrauen in der wissenschaftlichen Gemeinschaft zunehmen, was zu Problemen wie Betrug führen kann. Daher ist es wichtig, ein Gleichgewicht zwischen wissenschaftlichem Fortschritt und ethischen Standards zu finden, während gleichzeitig die Kommerzialisierung vorangetrieben wird.
Zukunftsperspektiven der KI-Entwicklung
Die Zukunft der KI-Entwicklung beruht auf der Erkennung und Nutzung ihrer Potenziale in verschiedenen Industriebereichen. Der Fortschritt in der generativen KI zeigt ein großes Potenzial für Transformationsprozesse, die weit über die textbasierte oder bildgenerierende KI hinausgehen. Um von diesen Entwicklungen zu profitieren, erfordert es ein Umdenken in der Industrie und Bildung, um Fachwissen und praktische Anwendungen erfolgreich zu integrieren. Die Diversifizierung und Multimodalität von KI-Systemen spielen dabei eine entscheidende Rolle für die nächsten Innovationssprünge.
Björn Ommer gilt als einer der Pioniere bei generativer Künstlicher Intelligenz. Mit seinen Team hat er vor Jahren das Bildmodell Stable Diffusion entwickelt. Heute stehen die damaligen Doktoranden hinter Black Forest Labs und begeistern mit ihren fotorealistischen KI-Bildern Nutzer und Investoren.
Den Wissenschaftler selbst interessiert aber eigentlich etwas ganz anderes als das Generieren von Bildern. Er will „Computern das Sehen beibringen“, wie er sagt. Dabei sind die KI-generierten Bilder für ihn ein Mittel, um zu erfahren, wie gut Maschinen ihre Umgebung bereits erkennen und verstehen können. Denn das könnte große Fortschritte etwa in der Robotik und beim autonomen Fahren ermöglichen.
Wie viele andere KI-Wissenschaftler ist Ommer aber auch von der Hoffnung motiviert, durch seine Arbeit an Künstlicher Intelligenz etwas über den Menschen herauszufinden. „Ich finde menschliche Intelligenz als Ganzes enorm faszinierend“, sagt er. Den Ansatz, bestimmte Vorgänge nachzubauen, sieht er als Möglichkeit nachzuvollziehen, „wie es in unserem Kopf potenziell abgehen könnte“.
Welche Bedeutung Ommer den neuen sogenannten Weltmodellen beim autonomen Fahren zuschreibt, warum er offenbar auch kritisch auf den Erfolg seiner Doktoranden blickt und wieso es unter KI-Wissenschaftlern offenbar immer häufiger Fälle von Betrug und unethischem Verhalten gibt, darüber spricht Ommer in dieser Folge von Handelsblatt Disrupt mit KI-Teamleiterin Larissa Holzki.
Exklusives Angebot nur für Disrupt Hörer: mit dem Code "MATTHES" erhalten Sie für 12 Monate 40% Rabatt auf das H+ Premium Abo.
Sichern Sie sich jetzt das Angebot unter handelsblatt.com/disrupt40 und erhalten Sie unbegrenzten Zugang zu allen Handelsblatt-Inhalten im Web und in der App inkl. ePaper am Vorabend. Das Abo endet automatisch.