Weekly #91: Deepseek, Arte-Doku “Die Geschichte des Automobils“
Jan 29, 2025
auto_awesome
Wolfgang Stieler, Redakteur bei MIT Technology Review, spricht über das innovative Sprachmodell Deepseek R1, das gleichwertig mit OpenAI konkurrieren kann und kostengünstiger ist. Er erläutert die Marktreaktionen, die durch den Hype um Deepseek ausgelöst wurden, und die Auswirkungen auf Tech-Unternehmen wie Nvidia. Zudem diskutiert er die Herausforderungen von Sprachmodellen, insbesondere beim Erstellen von Haikus. Außerdem wird die faszinierende Geschichte des Automobils thematisiert, die in einer neuen arte-Doku beleuchtet wird.
Das chinesische Unternehmen Deepseek hat ein innovatives Sprachmodell entwickelt, das kostengünstiger ist und mit OpenAI konkurrieren kann.
Die Veröffentlichung von Deepseek R1 hat den Markt beeinflusst und die Relevanz strenger Exportkontrollen für KI-Technologien neu beleuchtet.
Deep dives
DeepSeek überholt OpenAI
Das chinesische Unternehmen DeepSeek hat ein neues Sprachmodell namens DeepSeq R1 entwickelt, das mit OpenAI konkurrieren kann und dabei kostengünstiger in der Entwicklung und im Betrieb ist. Die Veröffentlichung dieses Modells hat an den Börsen für Aufregung gesorgt und führte zu einem erheblichen Kursrückgang bei Unternehmen wie Nvidia. Das Modell verwendet einen innovativen Ansatz, der es ermöglicht, mehrere Antworten auf Anfragen zu generieren und die beste Lösung auszuwählen, was durch den ihn unterstützenden Mechanismus des Verstärkungslernens realisiert wird. Besonders bemerkenswert ist, dass DeepSeek durch die strategische Beschaffung leistungsfähiger Chips vor der Einführung strengerer Exportbeschränkungen in den USA in der Lage war, dieses hochwertige Modell zu trainieren und bereitzustellen.
Technische Eigenschaften des DeepSeq R1
Das DeepSeq R1-Modell hat einzigartige technische Merkmale, die es von anderen Sprachmodellen abheben. Es ermöglicht sowohl tiefes Denken als auch eine Websuche, wobei Letztere zum Zeitpunkt des Tests aufgrund der hohen Nachfrage zeitweise nicht verfügbar war. Bei der Bearbeitung von Anfragen zeigt das Modell eine bemerkenswerte Fähigkeit, komplexe Probleme zu zerlegen und die relevantesten Antworten zu formulieren. Ein interessantes Beispiel war die Fähigkeit des Modells, ein Haiku zu erstellen und dabei das geforderte Silbenmaß zu beachten, auch wenn es anfänglich Schwierigkeiten mit der korrekten Silbenzählung hatte.
Auswirkungen auf die KI-Entwicklung
Die schnelle Entwicklung von DeepSeek hat das Interesse an den Folgen strenger Exportkontrollen für KI-Technologie verstärkt und viele Analysten dazu veranlasst, die Wirksamkeit solcher Maßnahmen in Frage zu stellen. Während die US-Regierung versucht, den Technologietransfer nach China zu begrenzen, haben Rumors gezeigt, dass DeepSeek möglicherweise durch geschicktes Management seiner Ressourcen sogar Vorteile aus diesen Beschränkungen ziehen konnte. Die gemeldete Leistungsfähigkeit des Modells könnte darauf hinweisen, dass KI-Entwickler in China effizienter arbeiten müssen, um wettbewerbsfähig zu bleiben und gleichzeitig unter den bestehenden Restriktionen zu agieren. Einige Experten glauben, dass die Konkurrenz zwischen US-amerikanischen und chinesischen KI-Entwicklern in den kommenden Jahren weiter zunehmen wird.
Das chinesische Unternehmen Deepseek hat nicht nur ein Sprachmodell herausgebracht, das es mit den Modellen von OpenAI aufnehmen kann, es soll außerdem noch deutlich günstiger in der Entwicklung und im Betrieb sein. In der Folge hat dieses Deepseek-R1 genannte Modell eine Lawine losgetreten. An der Börse waren herrschte große Aufregung und die Kurse, allen voran dem von Chiphersteller Nvidia, gingen auf Talfahrt. Was steckt hinter dem Hype und wie hat Deepseek das trotz strenger US-Ausfuhrkontrollen hinbekommen? TR-Redakteur Wolfgang Stieler gibt einen Einblick, ob das jetzt das Ende von KI von OpenAI und Meta bedeutet. Außerdem hat er das LLM auch selbst ausprobiert.