NVIDIA stellt Nemotron 3 Super vor: Fortschrittliches Sprachmodell für agentische KI-Anwendungen

Kategorien:

No items found.

Freigegeben:

March 12, 2026

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Das Wichtigste in Kürze

NVIDIA hat das Sprachmodell Nemotron 3 Super mit 120 Milliarden Parametern (davon 12 Milliarden aktiv) veröffentlicht.
Das Modell nutzt eine hybride Mamba-Transformer-MoE-Architektur für verbesserte Effizienz und Genauigkeit.
Ein Kontextfenster von bis zu 1 Million Token ermöglicht die Bearbeitung komplexer und umfangreicher Aufgaben.
Nemotron 3 Super ist für agentische KI-Anwendungen optimiert und bietet verbesserte Fähigkeiten für Coding und Tool-Nutzung.
NVIDIA stellt das Modell mit offenen Gewichten, Trainingsdaten und Rezepten zur Verfügung, um die Entwicklung und Anpassung zu fördern.

NVIDIA präsentiert Nemotron 3 Super: Ein offenes Hybridmodell für erweiterte KI-Agenten

NVIDIA hat kürzlich die Veröffentlichung von Nemotron 3 Super auf Hugging Face bekannt gegeben. Dieses Sprachmodell, das auf einer hybriden Mamba-Transformer-Mixture-of-Experts (MoE)-Architektur basiert, ist für seine Fähigkeiten im Bereich des agentischen Denkens, insbesondere für Coding und die Nutzung von Tools, konzipiert. Mit insgesamt 120 Milliarden Parametern, von denen 12 Milliarden aktiv sind, und einem Kontextfenster von bis zu 1 Million Token, positioniert sich Nemotron 3 Super als eine Entwicklung im Bereich der offenen Modelle für anspruchsvolle B2B-Anwendungen.

Architektonische Innovationen für Effizienz und Leistung

Die Architektur von Nemotron 3 Super integriert mehrere Schlüsseltechnologien, um eine optimierte Leistung zu erzielen:

Hybride Mamba-Transformer-Architektur: Diese Kombination nutzt Mamba-Schichten für eine verbesserte Speicher- und Recheneffizienz bei der Sequenzmodellierung und Transformer-Schichten für detaillierte Aufmerksamkeitsmechanismen, die für präzises Denken in komplexen Aufgaben erforderlich sind.
Mixture-of-Experts (MoE): Obwohl das Modell 120 Milliarden Parameter umfasst, werden bei der Inferenz nur 12 Milliarden aktiv genutzt. Dies trägt zur Reduzierung des Rechenaufwands bei und ermöglicht eine skalierbare Effizienz.
LatentMoE: Eine neue Technik, die die Genauigkeit verbessert, indem sie spezialisierte Experten aktiviert. Dies geschieht durch die Komprimierung von Eingabetoken in eine kleinere latente Dimension, bevor sie an Experten weitergeleitet werden, was den Kommunikationsaufwand minimiert und die Nutzung mehrerer Experten ohne Leistungseinbußen ermöglicht.
Multi-Token Prediction (MTP): Nemotron 3 Super ist darauf trainiert, mehrere zukünftige Token gleichzeitig vorherzusagen. Dies kann die Inferenzgeschwindigkeit beschleunigen und die Planungs- sowie Verständnisleistungen des Modells verbessern.
NVFP4-Quantisierung: Das Modell wurde mit NVIDIAs 4-Bit-Gleitkomma-Trainingsformat trainiert, um die Speicherkapazität zu reduzieren und die Inferenz zu beschleunigen, ohne die Genauigkeit zu beeinträchtigen.

Agentisches Denken und breite Anwendungsbereiche

Ein zentraler Fokus von Nemotron 3 Super liegt auf agentischen Workflows. Dies bedeutet, dass das Modell in der Lage ist, Aufgaben autonom zu planen, auszuführen und zu überwachen. Die Modelle sind darauf ausgelegt, komplexe Teilaufgaben innerhalb eines Multi-Agenten-Systems zu bewältigen. Beispiele für potenzielle Anwendungsfälle sind:

Softwareentwicklung: Einbindung ganzer Codebasen zur End-to-End-Codegenerierung und Fehlerbehebung.
Finanzanalyse: Verarbeitung tausender Seiten von Finanzberichten zur Beschleunigung von Prozessen und zur Betrugserkennung.
Cybersicherheit: Automatisches Triage von Schwachstellen und Durchführung von Malware-Analysen.
Forschung und Produktivität: Verbesserung von Suchfunktionen und Erstellung von komplexen Anweisungs-Workflows.

Das 1-Million-Token-Kontextfenster ist hierbei von Bedeutung, da es KI-Agenten ermöglicht, den vollständigen Workflow-Zustand im Speicher zu behalten und somit ein "Ziel-Drift" über längere Aufgaben hinweg zu verhindern. Zudem bietet das Modell konfigurierbare "Reasoning ON/OFF"-Modi und ein "Thinking Budget", um die Anzahl der Tokens, die für Denkprozesse im Gegensatz zur Standardgenerierung verwendet werden, präzise zu steuern und so die Inferenzkosten zu optimieren.

Offenheit und Verfügbarkeit

NVIDIA verfolgt mit Nemotron 3 Super einen Ansatz der Offenheit. Das Modell wird mit offenen Gewichten unter einer permissiven Lizenz veröffentlicht. Zusätzlich stellt NVIDIA die verwendeten Trainingsdaten und Rezepte zur Verfügung, einschliesslich über 10 Billionen Tokens an Pre- und Post-Trainingsdatensätzen sowie 15 Trainingsumgebungen für Reinforcement Learning. Dies soll Entwicklern und Forschern die Möglichkeit geben, das Modell anzupassen und weiterzuentwickeln.

Nemotron 3 Super ist über Plattformen wie Hugging Face zugänglich und kann über verschiedene Partner und Cloud-Dienste bereitgestellt werden, darunter Google Cloud's Vertex AI, Oracle Cloud Infrastructure, und in Kürze auch Amazon Bedrock sowie Microsoft Azure. Das Modell ist auch als NVIDIA NIM Mikroservice verfügbar, was die Bereitstellung von lokalen Systemen bis zur Cloud ermöglicht.

Leistungsmerkmale und Benchmarks

Das Modell demonstriert seine Leistung in verschiedenen Benchmarks. Nemotron 3 Super erreicht laut NVIDIA eine bis zu 2,2-mal höhere Inferenz-Durchsatzrate als GPT-OSS-120B und eine bis zu 7,5-mal höhere Rate als Qwen3.5-122B bei vergleichbarer oder höherer Genauigkeit. Insbesondere bei langen Kontextlängen übertrifft es andere Modelle auf RULER bei 1 Million Kontextlänge. Das Modell hat zudem Spitzenpositionen in Benchmarks wie DeepResearch Bench und DeepResearch Bench II erreicht, die die Fähigkeit eines KI-Systems zur Durchführung gründlicher, mehrstufiger Forschung über große Dokumentensätze hinweg messen.

Zusammenfassung

NVIDIA Nemotron 3 Super stellt eine Entwicklung in der Landschaft der offenen Sprachmodelle dar. Durch die Kombination einer hybriden Mamba-Transformer-MoE-Architektur mit einem umfangreichen Kontextfenster und einem Fokus auf agentisches Denken bietet das Modell eine Grundlage für die Entwicklung anspruchsvoller KI-Anwendungen im B2B-Bereich. Die Offenheit in Bezug auf Gewichte, Daten und Trainingsrezepte fördert zudem die Kollaboration und Weiterentwicklung innerhalb der KI-Gemeinschaft.

Bibliographie

- Alexiuk, Chris. "Introducing Nemotron 3 Super: An Open Hybrid Mamba-Transformer MoE for Agentic Reasoning | NVIDIA Tech." NVIDIA Developer Blog, 11. März 2026. - Briski, Kari. "New NVIDIA Nemotron 3 Super Delivers 5x Higher Throughput for Agentic AI | NVIDIA Blog." NVIDIA Blog, 11. März 2026. - Dickson, Ben. "Nvidia sets a new bar for open source models with Nemotron 3." BDTechTalks, 17. Dezember 2025. - "nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4." Hugging Face. Abgerufen am 11. März 2026. - "NVIDIA Nemotron 3 Super." NVIDIA Nemotron Research Labs, 10. März 2026. - "NVIDIA Nemotron 3 Super API." Together AI. Abgerufen am 11. März 2026. - Boudier, Jeff. "NVIDIA just dropped Nemotron 3 Super on Hugging Face..." LinkedIn, 11. März 2026.