Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Als Senior Specialist Journalist und Analyst für Mindverse, Ihrem KI-Partner, präsentieren wir Ihnen heute eine detaillierte Analyse einer Entwicklung, die das Potenzial hat, die Landschaft der Softwareentwicklung durch künstliche Intelligenz maßgeblich zu beeinflussen: SERA: Soft-Verified Efficient Repository Agents. Dieses Konzept, das kürzlich vom Allen Institute for AI (Ai2) vorgestellt wurde, verspricht eine Revolution in der Art und Weise, wie Coding Agents trainiert und eingesetzt werden, insbesondere im Hinblick auf private Codebasen und Kosteneffizienz.
Coding Agents, also KI-Systeme, die Software entwickeln, testen und warten können, haben in den letzten Jahren erhebliche Fortschritte gemacht. Sie sind in der Lage, Bugs zu beheben, Code zu refaktorieren und sogar Pull Requests zu erstellen. Trotz dieser Fortschritte stehen viele dieser Systeme vor ähnlichen Herausforderungen:
Diese Faktoren haben dazu geführt, dass die Entwicklung und der Einsatz von Coding Agents hauptsächlich auf große Unternehmen und Forschungseinrichtungen mit umfangreichen Ressourcen beschränkt waren.
SERA (Soft-Verified Efficient Repository Agents) wurde entwickelt, um diese Barrieren zu überwinden. Es handelt sich um eine Methode, die es ermöglicht, spezialisierte Coding Agents schnell und kostengünstig zu erstellen, die sich an jede Codebasis anpassen können. Die Kerninnovationen von SERA liegen in der Effizienz der Datengenerierung und der Verifizierung.
Die zentrale Komponente von SERA ist die "Soft Verified Generation" (SVG). Traditionelle Methoden zur Generierung synthetischer Trainingsdaten für Coding Agents erfordern einen hohen Grad an Verifizierung, oft durch das Ausführen von Unit-Tests. Dies ist zeitaufwendig, ressourcenintensiv und setzt eine umfassende Testinfrastruktur voraus.
SVG vereinfacht diesen Prozess erheblich. Anstatt die Korrektheit von synthetischen Code-Patches durch Unit-Tests zu überprüfen, vergleicht SVG diese lediglich mit einem Referenz-Patch auf Zeilenebene. Wenn ein generierter Patch eine ausreichende Übereinstimmung (z.B. 50% oder mehr) mit dem Referenz-Patch aufweist, wird er als verifiziert betrachtet. Dieses Konzept basiert auf der Beobachtung, dass der Wert einer Trajektorie für das Training nicht unbedingt in der vollkommenen Korrektheit des Patches liegt, sondern in den Fähigkeiten, die sie demonstriert, wie die Interpretation einer Anweisung, die Navigation durch eine Codebasis und die Umsetzung einer Absicht in Code.
Das SVG-Verfahren umfasst zwei Rollouts:
Diese Methode reduziert den Bedarf an Testinfrastruktur und ermöglicht die Datengenerierung aus jeder beliebigen Codebasis, unabhängig von deren Testabdeckung oder -qualität. Dies führt zu einer massiven Reduzierung der Kosten und Komplexität bei der Erstellung von Trainingsdaten.
Die Forschung hinter SERA zeigt, dass diese Methode extrem kosteneffizient ist. Im Vergleich zu Reinforcement Learning ist die Erstellung von SERA-Modellen bis zu 26-mal günstiger, und im Vergleich zu früheren Methoden zur synthetischen Datengenerierung sogar bis zu 57-mal günstiger, um eine gleichwertige Leistung zu erzielen. Ein SERA-Modell kann bereits für etwa 1.300 US-Dollar an eine bestimmte Codebasis spezialisiert werden.
SERA-32B, ein 32 Milliarden Parameter umfassender Coding Agent, erreicht auf dem SWE-bench Verified Benchmark eine Auflösungsrate von 49,5 % bei 32K Kontext und 54,2 % bei 64K Kontext. Dies stellt einen neuen Stand der Technik für vollständig quelloffene Modelle dar und erreicht die Leistung von führenden Open-Weight-Modellen wie Devstral-Small-2 und GLM-4.5-Air.
Ein wesentlicher Vorteil von SERA ist die Fähigkeit zur Spezialisierung auf private Codebasen. Während geschlossene Modelle oft Schwierigkeiten mit weniger verbreiteten Sprachen oder proprietärem Code haben, erlaubt SERA Unternehmen, ein kleines, lokales Modell auf ihre eigene Codebasis zu trainieren, ohne den Code Dritten zugänglich zu machen. Dies ist besonders relevant für Start-ups, regulierte Branchen und Open-Source-Maintainer.
Experimente haben gezeigt, dass ein spezialisiertes SERA-Modell von 32 Milliarden Parametern die Leistung seines 100 Milliarden Parameter umfassenden Teacher-Modells (GLM-4.5-Air) auf Codebasen wie Django und Sympy übertreffen kann, nachdem es mit nur 8.000 Samples trainiert wurde.
Die Entwicklung von SERA umfasste umfangreiche Analysen zu verschiedenen Designentscheidungen. Hier sind einige der wichtigsten Erkenntnisse:
Die Forscher legten großen Wert auf die statistische Robustheit ihrer Ergebnisse. Ihre Analyse von 78 experimentellen Bedingungen mit jeweils drei Zufallssamen (insgesamt 234 Evaluierungsläufe) führte zu wichtigen Empfehlungen für die Evaluierung von Coding Agents:
Diese Empfehlungen sind entscheidend, um die Verlässlichkeit von Forschungsergebnissen in einem Bereich zu gewährleisten, der oft durch hohe Varianz und die Gefahr von zufälligen Verbesserungen gekennzeichnet ist.
SERA ist als Teil der "Ai2 Open Coding Agents"-Serie verfügbar und wird mit allen notwendigen Komponenten veröffentlicht, um die Arbeit zu reproduzieren und zu erweitern: Trainingsdaten, Generierungscode, Modellgewichte und Evaluierungsskripte. Dies soll die Forschung im Bereich Coding Agents demokratisieren und den Zugang für individuelle Forscher und kleine akademische Labore erleichtern.
Die Integration mit Claude Code wird durch einen leichtgewichtigen Proxy-Server ermöglicht, der die Kompatibilität zwischen den SWE-Agent-Toolformaten, auf denen SERA trainiert wurde, und der Anthropic API herstellt. Dies erlaubt eine nahtlose Nutzung von SERA in der Claude Code-Umgebung.
SERA stellt einen wichtigen Schritt in der Entwicklung von Coding Agents dar. Durch die Kombination von Kosteneffizienz, der Fähigkeit zur Spezialisierung auf private Codebasen und der Zugänglichkeit durch Open-Source-Veröffentlichung hat SERA das Potenzial, die Art und Weise, wie Software entwickelt wird, grundlegend zu verändern. Es ermöglicht kleineren Teams und einzelnen Entwicklern, leistungsstarke KI-gestützte Entwicklungstools zu nutzen, ohne dabei Kompromisse bei Datenschutz oder Kosten eingehen zu müssen.
Die Erkenntnisse aus der Forschung zu SERA unterstreichen die Bedeutung einer sorgfältigen und robusten Methodik in der KI-Forschung. Die Konzentration auf Effizienz und die Bereitschaft, traditionelle Annahmen (wie die Notwendigkeit strikter Verifizierung) zu hinterfragen, haben zu einem System geführt, das nicht nur leistungsstark, sondern auch praktisch anwendbar ist.
Mindverse verfolgt diese Entwicklungen genau, um unseren B2B-Kunden stets die aktuellsten und relevantesten Einblicke in die Welt der KI zu bieten. SERA ist ein Beispiel dafür, wie Innovationen in der KI-Forschung greifbare Vorteile für die Geschäftswelt schaffen können, indem sie komplexe Technologien zugänglicher und anpassbarer machen.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen