Das chinesische Unternehmen DeepSeek sorgt für Aufsehen in der KI-Welt. Mit einem Open-Source-Ansatz und kostenfreien Modellen präsentiert es sich als ernstzunehmende Konkurrenz zu OpenAI. Besonders im Bereich komplexer logischer Aufgaben und mathematischen Reasonings hebt sich DeepSeek hervor und setzt damit neue Maßstäbe.
DeepSeek V3 und Reasoning-Modell R1
Bereits im Dezember veröffentlichte DeepSeek die dritte Version seines großen Sprachmodells (LLM), DeepSeek V3, welches in vielerlei Hinsicht mit GPT-4o vergleichbar ist – allerdings mit bis zu 90 % geringeren Kosten. Kürzlich wurde das spezialisierte Reasoning-Modell DeepSeek-R1 vorgestellt, das gezielt mit den o1-Modellen von OpenAI konkurrieren soll. Dieses Modell überzeugt vor allem durch eine transparente „Chain-of-Thought“-Technik, bei der jeder Schritt einer Problemlösung systematisch offengelegt wird.
In Benchmarks wie MMLU-Pro (reasoning-fokussierte Fragen) und GPQA (PhD-Level-Wissen) schneidet DeepSeek-R1 besser ab als GPT-4o:
- MMLU-Pro: 75,9 % (DeepSeek V3) vs. 74,68 % (GPT-4o)
- GPQA: 59,1 % (DeepSeek V3) vs. 53,6 % (GPT-4o)
Kostenlose Nutzung und Websuche
Ein besonderes Highlight ist die kostenfreie Nutzung von DeepSeek, die es von OpenAI unterscheidet. Während GPT-4o in kostenpflichtigen ChatGPT-Versionen eingeschränkt ist, bietet DeepSeek unbegrenzten Zugang. Zudem ermöglicht das Reasoning-Modell DeepSeek-R1 die Echtzeit-Recherche im Internet – ein Feature, das OpenAI-Modelle in dieser Form nicht bieten. Während OpenAI mit GPT-4o lediglich auf 5 bis 15 Seiten recherchiert, durchsucht DeepSeek laut internen Tests zwischen 40 und 70 Seiten.
Kernfunktionen von DeepSeek
Im Kern funktioniert DeepSeek identisch zum Chat von ChatGPT. Darüber hinaus bietet DeepSeek innovative Features:
- Websuche: Echtzeit-Zugriff auf aktuelle Informationen wie Nachrichten oder Fachdaten.
- Dateianalyse: Unterstützung für die Analyse von PDFs, Word-Dokumenten und Bildern (inklusive Texterkennung via Foto).
Durch die Kombination der Websuche mit dem Reasoning-Modell kann DeepSeek eine Synthese aus Echtzeitdaten und logischer Argumentation liefern, was die Ergebnisse sowohl präzise als auch nachvollziehbar macht.
App und lokale Nutzung
Seit kurzem ist auch eine App verfügbar, die nach Angaben der Entwickler einwandfrei funktioniert. Für Nutzer mit eigener Hardware gibt es die Möglichkeit, das Modell auf Hugging Face herunterzuladen (siehe DeepSeek-R1 auf Hugging Face). Selbst auf Hardware mit begrenztem VRAM laufen quantifizierte Versionen reibungslos. Tests auf einer EVGA RTX 3080 Ti, einer AORUS RTX 2080 Ti und einem MacBook M4 haben beeindruckende Ergebnisse geliefert. Dennoch bleibt die Online-Variante unschlagbar, da sie nicht nur höhere Leistung bietet, sondern auch auf die Websuche zugreifen kann.
DeepSeek zeigt, wie leistungsstarke KI auch kostenlos und Open Source bereitgestellt werden kann. Mit seiner Transparenz, der starken Performance und den innovativen Features stellt es eine spannende Alternative zu den etablierten Modellen von OpenAI dar. Besonders für Nutzer, die großen Wert auf Echtzeitdaten und logisches Reasoning legen, ist DeepSeek eine ernstzunehmende Option.
Open-Source-Konkurrenz wie DeepSeek belebt den Markt und bringt Fortschritte, die sowohl Anwendern als auch der Branche insgesamt zugutekommen. Wie die etablierten Hersteller OpenAI, Microsoft, Meta und Google reagieren werden, bleibt abzuwarten.