Das chinesische KI-Unternehmen Deepseek hat mit Janus Pro eine deutlich verbesserte Version seines multimodalen KI-Systems vorgestellt. Janus Pro baut auf seinem Vorgänger auf und zeichnet sich durch verfeinerte Trainingsmethoden, erweiterte Datensätze und größere Modellgrößen aus. Die Verbesserungen betreffen sowohl das Verständnis als auch die Generierung von Bildern und Texten.
Deepseek hat die Trainingsmethoden für Janus Pro umfassend überarbeitet, um die Datennutzung zu optimieren. Der Trainingsdatensatz wurde erheblich erweitert und umfasst nun rund 90 Millionen zusätzliche Beispiele für multimodales Verständnis. Diese stammen aus verschiedenen Quellen, darunter YFCC-Bildbeschreibungsdatensätze und spezialisierte Sammlungen zum Verständnis von Tabellen, Diagrammen, Memes und Dokumenten. Für die Bildgenerierung wurden etwa 72 Millionen synthetische Trainingsbeispiele hinzugefügt, einige davon mit Midjourney erstellt. Das Verhältnis von realen zu synthetischen Daten liegt nun bei 1:1.
Eine der wichtigsten Neuerungen ist die Einführung größerer Modellgrößen. Während die ursprüngliche 1B-Version weiterhin verfügbar ist, gibt es nun eine 7B-Version, die sowohl beim Verständnis als auch bei der Generierung von Bildern eine deutlich bessere Leistung zeigt. In Benchmark-Tests erreichte Janus Pro-7B im MMBench für multimodales Verständnis einen Wert von 79,2, deutlich über den 69,4 des Vorgängers. Obwohl dies einen erheblichen Fortschritt darstellt, schneiden einige konkurrierende Modelle ähnlicher Größe noch besser ab.
Die deutlichsten Verbesserungen zeigen sich in der Prompt-Verarbeitung. Während die frühere Version mit kurzen Anweisungen und inkonsistenter Bildqualität zu kämpfen hatte, kann Janus Pro nun detaillierte, konsistente Bilder aus kurzen Prompts erstellen und komplexere Anweisungen effektiver verarbeiten. Diese Verbesserungen spiegeln sich auch in den Zahlen wider: Janus Pro erreichte eine Genauigkeit von 80% im GenEval, verglichen mit 61% beim Vorgänger. Es übertraf sogar DALL-E 3 (67%) und Stable Diffusion 3 Medium (74%) in dieser Metrik – obwohl diese Benchmarks nicht die ganze Geschichte über die Bildqualität erzählen, wo beide Konkurrenten in der Regel immer noch bessere Ergebnisse liefern und bessere Modelle verfügbar sind.
Eine wesentliche Einschränkung von Janus Pro besteht darin, dass sowohl Eingabe- als auch Ausgabebilder auf 384 x 384 Pixel beschränkt sind. Dies beeinträchtigt die Qualität, insbesondere bei feinen Details wie Gesichtern, und erschwert dem System das Verständnis von Text in Bildern. Das Team geht davon aus, dass zukünftige Versionen mit höherer Auflösung diese Probleme lösen könnten. Obwohl Deepseek nicht bestätigt hat, ob diese Verbesserungen in einer zukünftigen Janus-Version erscheinen werden, ist es wahrscheinlich. Das Unternehmen erlangte kürzlich mit seinem R1-Modell Aufmerksamkeit – einige nannten es den KI-"Sputnik-Moment" für die USA – und gewann neue Kunden. Ein leistungsfähiges multimodales Modell könnte ihnen helfen, effektiver mit OpenAIs ChatGPT zu konkurrieren, vorausgesetzt, sie verfügen über die notwendige Recheninfrastruktur.
Bibliographie: - https://the-decoder.com/deepseeks-janus-pro-is-a-good-upgrade-but-it-wont-fuel-a-us-ai-sputnik-crisis/ - https://www.reuters.com/technology/deepseeks-janus-pro-ai-model-beats-rivals-image-generation-2025-01-27/ - https://fortune.com/2025/01/27/marc-andreessen-deepseek-sputnik-ai-markets/ - https://www.theverge.com/2025/1/27/24353056/deepseek-says-its-newest-ai-model-janus-pro-can-outperform-stable-diffusion-and-dall-e-3 - https://www.mi-3.com.au/27-01-2025/massive-gen-ai-disruption-incoming-deepseekr1-trigger-massive-gen-ai-commoditisation - https://www.yahoo.com/news/chinese-ai-deepseek-jolts-silicon-170807101.html - https://www.wsj.com/tech/ai/deepseek-us-ai-stocks-nvidia-broadcom-6cdfae81 - https://www.nytimes.com/2025/01/27/business/us-stock-market-deepseek-ai-sp500-nvidia.html - https://www.theguardian.com/business/live/2025/jan/28/global-tech-sell-off-trump-deepseek-wake-up-call-us-ai-firms-business-live - https://www.aivanet.com/2025/01/deepseek-everything-you-need-to-know-about-the-ai-that-dethroned-chatgpt/Entdecken Sie die Vorteile gegenüber ChatGPT Plus
Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.
Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.
❌ Kein strukturierter Dokumentenvergleich
❌ Keine Bearbeitung im Dokumentkontext
❌ Keine Integration von Unternehmenswissen
✅ Gezielter Dokumentenvergleich mit Custom-Prompts
✅ Kontextbewusste Textbearbeitung im Editor
✅ Wissensbasierte Analyse & Zusammenfassungen
Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.
❌ Nur ein Modellanbieter (OpenAI)
❌ Keine Modellauswahl pro Use Case
❌ Keine zentrale Modellsteuerung für Teams
✅ Zugriff auf über 50 verschiedene KI-Modelle
✅ Modellauswahl pro Prompt oder Assistent
✅ Zentrale Steuerung auf Organisationsebene
❌ Keine echte Teamkollaboration
❌ Keine Rechte- oder Rollenverteilung
❌ Keine zentrale Steuerung oder Nachvollziehbarkeit
✅ Teamübergreifende Bearbeitung in Echtzeit
✅ Granulare Rechte- und Freigabeverwaltung
✅ Zentrale Steuerung & Transparenz auf Organisationsebene
Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.
Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.
🎯 Kostenlose Demo buchenLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen