Für Teams, Einzelnutzer, Kanzleien und Transkription – derselbe Mindverse Look, klar aufgeteilt nach Anwendungsfall.
für Teams und Unternehmen
Die Plattform für Unternehmen, die eigene KI-Workflows, Wissensdatenbanken und Assistenten produktiv einsetzen möchten.
für Einzelnutzer und Creator
Der einfachste Einstieg in das Mindverse-Ökosystem für Content, Recherche, Bilder, Audio und produktives Arbeiten.
für Juristen und Kanzleien
Die spezialisierte KI-Lösung für juristische Recherche, Vertragsarbeit und kanzleispezifische Workflows.
für Audio, Meetings und Transkription
Schnelle KI-Transkription für Audiodateien und Meetings – ideal zum sofortigen Start oder für regelmäßige Nutzung.

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Entwicklung von KI-Agenten schreitet rasant voran, doch eine zentrale Herausforderung bleibt bestehen: die Fähigkeit, über die anfängliche Problemlösung hinaus kontinuierlich zu lernen und sich weiterzuentwickeln. Ein aktuelles Forschungspapier mit dem Titel "SkillOS: Learning Skill Curation for Self-Evolving Agents" stellt einen neuartigen Ansatz vor, der dieses Paradigma durch die Nutzung von Reinforcement Learning (RL) transformiert. Wir beleuchten, wie SkillOS die Kuration von Fähigkeiten revolutioniert und welche Auswirkungen dies auf zukünftige KI-Anwendungen haben könnte.
Herkömmliche Large Language Model (LLM)-basierte Agenten werden zunehmend für die Bewältigung von Streaming-Aufgaben eingesetzt. Oft agieren sie jedoch als "Einmal-Problemlöser", die nicht aus vergangenen Interaktionen lernen. Für eine langfristige Effizienz und Anpassungsfähigkeit in dynamischen Umgebungen ist die Fähigkeit zur Selbstentwicklung von entscheidender Bedeutung. Hierbei spielen wiederverwendbare Fähigkeiten, die aus Erfahrungen destilliert werden, eine zentrale Rolle. Die effektive Kuration dieser Fähigkeiten – also das Extrahieren hochwertiger Lektionen und deren Integration in die Fähigkeitssammlung – stellt dabei einen Engpass dar.
Bisherige Ansätze zur Fähigkeitskuration wiesen Limitationen auf:
SkillOS adressiert diese Herausforderungen, indem es ein erfahrungsbasiertes RL-Trainingsrezept vorschlägt, das die Kuration von Fähigkeiten für sich selbst entwickelnde Agenten erlernt.
Das Kernkonzept von SkillOS basiert auf einem modularen Multi-Agenten-Framework, das in einer Streaming-Umgebung agiert. Es besteht aus zwei Hauptkomponenten:
Der Agent-Executor ist eine "eingefrorene" Komponente, die Aufgaben löst, indem sie relevante Fähigkeiten aus einem externen Fähigkeiten-Repository, dem sogenannten SkillRepo, abruft und anwendet. Die Fähigkeiten selbst werden als Markdown-Dateien im SKILL.md-Format dargestellt, bestehend aus einem YAML-Frontmatter für Metadaten (Name, Beschreibung) und Markdown-Anweisungen für ausführbares Wissen und Workflows.
Der Skill-Curator ist der trainierbare Teil des Systems. Nach Abschluss einer Aufgabe durch den Executor beobachtet der Curator die Ausführungstrajektorie, bewertet die Richtigkeit der Interaktionen und die verwendeten Fähigkeiten. Basierend darauf generiert er eine Sequenz von strukturierten Kurationsoperationen, die das SkillRepo aktualisieren können. Diese Operationen umfassen das insert_skill, update_skill und delete_skill und werden als Funktionsaufrufe implementiert. Dieser geschlossene Kreislauf zwischen Aufgabenausführung und erfahrungsbasierter Fähigkeitenentwicklung ist entscheidend für die Selbstevolution.
Die Optimierung des Skill-Curators erfolgt durch Reinforcement Learning. Eine zentrale Herausforderung dabei ist das indirekte und verzögerte Feedback für Kurationsentscheidungen, das sich erst durch die Leistung des Executors bei zukünftigen Aufgaben offenbart. SkillOS begegnet dem durch zwei Kernkonzepte:
Jede Trainingsinstanz wird als eine Gruppe von miteinander verbundenen Aufgaben konstruiert, die sequenziell gelöst werden. Fähigkeiten, die aus früheren Erfahrungen gewonnen wurden, werden durch ihre Nützlichkeit bei der Lösung späterer, verwandter Aufgaben bewertet. Dies ermöglicht eine langfristige Nutzenbewertung der Fähigkeitskuration und bietet dichtere Lernsignale für komplexe Kurationsoperationen.
Die Belohnungsfunktion kombiniert vier Signale, um das Umweltfeedback besser den Kurationsentscheidungen zuzuordnen:
Durch die Optimierung des Skill-Curator mittels Grouped Reward Policy Optimization (GRPO) wird eine stabile und effiziente Lernweise für die Fähigkeitskuration ermöglicht.
SkillOS wurde auf verschiedenen Benchmarks evaluiert, darunter Multi-Turn-Agentenaufgaben (ALFWorld, WebShop) und Single-Turn-Reasoning-Aufgaben (AIME24, AIME25, GPQA-Diamond). Die Ergebnisse zeigen eine konsistente Überlegenheit gegenüber speicherlosen und starken speicherbasierten Methoden:
Qualitative Analysen der kuratierten Fähigkeiten zeigten, dass SkillOS nicht nur die Korrektheit des Inhalts verbessert, sondern auch dessen Spezifität und Benutzerfreundlichkeit. Der Curator lernt, Meta-Strategien zur Fehlerbehebung für agentische Aufgaben und verzweigtes Denken für Reasoning-Aufgaben zu destillieren, anstatt nur wortwörtliche Trajektorien zu kopieren.
SkillOS stellt einen bedeutenden Schritt in Richtung wirklich selbst-entwickelnder KI-Agenten dar. Die Fähigkeit, hochwertige, wiederverwendbare Fähigkeiten aus Erfahrungen zu lernen und dynamisch zu verwalten, eröffnet neue Möglichkeiten für autonome Systeme. Dennoch gibt es weiterhin Forschungsfelder, die auf diesem Ansatz aufbauen können:
Zusammenfassend lässt sich sagen, dass SkillOS einen praktischen, modularen und erfahrungsbasierten RL-Trainingsansatz für den Aufbau selbst-entwickelnder Agenten etabliert. Durch die effektive Kuration von Fähigkeiten können KI-Systeme ihre Leistung kontinuierlich verbessern und sich an neue Aufgaben und Umgebungen anpassen, was einen wichtigen Schritt in der Evolution der künstlichen Intelligenz darstellt.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen