Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Entwicklung von KI-Agenten, die komplexe Aufgaben autonom ausführen können, schreitet rasant voran. Ein zentraler Engpass für den Fortschritt in der Open-Source-Gemeinschaft ist jedoch der Mangel an hochwertigen, lizenzfreien Trainingsdaten für den agentischen Werkzeugeinsatz. Bestehende Datensätze weisen oft Defizite in Bezug auf Vielfalt, Realismus und die Komplexität von Multi-Tool- und Multi-Turn-Interaktionen auf. Eine neue Forschungsarbeit mit dem Titel "TOUCAN: Synthesizing 1.5M Tool-Agentic Data from Real-World MCP Environments" adressiert diese Herausforderung und stellt einen umfassenden Datensatz sowie eine innovative Methodik zur Datensynthese vor.
Grosse Sprachmodelle (LLMs) entwickeln sich zunehmend zu mächtigen Agenten, die in der Lage sind, Aufgaben über verschiedene Domänen hinweg zu automatisieren. Für die Entwicklung dieser Agenten ist die Fähigkeit, externe Werkzeuge effektiv zu nutzen, von entscheidender Bedeutung. Aktuelle Fortschritte in diesem Bereich werden jedoch durch das Fehlen von umfangreichen und qualitativ hochwertigen Trainingsdaten für den agentischen Werkzeugeinsatz gebremst. Die Erstellung solcher Daten ist aufwendig und ressourcenintensiv.
Bisherige Datensätze weisen oft folgende Limitationen auf:
Diese Mängel behindern die Entwicklung robuster und leistungsfähiger LLM-Agenten, die in der Lage sind, in dynamischen und unvorhersehbaren realen Umgebungen zu agieren.
Um diese Lücke zu schliessen, wurde das TOUCAN-Framework entwickelt. Es präsentiert den bisher grössten öffentlich verfügbaren Datensatz für Tool-Agenten, der beeindruckende 1,5 Millionen Interaktionsverläufe enthält. Der Kern der Innovation liegt in der Art und Weise, wie diese Daten generiert werden.
Im Gegensatz zu früheren Arbeiten, die oft auf synthetischen oder stark vereinfachten Umgebungen basieren, nutzt TOUCAN authentische Model Context Protocols (MCPs). MCPs sind standardisierte Schnittstellen, die es LLMs ermöglichen, mit externen Werkzeugen und Datenquellen zu interagieren. Durch die Einbindung von fast 500 realen MCP-Umgebungen kann TOUCAN vielfältige, realistische und herausfordernde Aufgaben generieren, deren Verläufe die Ausführung echter Werkzeuge umfassen. Dies stellt sicher, dass die Trainingsdaten die Komplexität und Nuancen widerspiegeln, die für den Einsatz von Agenten in der Praxis erforderlich sind.
Die Erstellung des TOUCAN-Datensatzes erfolgt über eine systematische, fünfstufige Pipeline:
Zusätzlich zur Kernpipeline wurden drei Erweiterungsmechanismen implementiert, um die Aufgaben weiter zu diversifizieren und Multi-Turn-Gespräche zu simulieren. Diese Mechanismen sind entscheidend, um die Fähigkeit von Agenten zu trainieren, über längere Dialoge hinweg konsistent und zielführend zu interagieren.
Die Ergebnisse der Forschung zeigen, dass Modelle, die mit dem TOUCAN-Datensatz feinabgestimmt wurden, signifikante Leistungsverbesserungen erzielen. Sie übertreffen beispielsweise grössere proprietäre Modelle auf dem BFCL V3 Benchmark und verschieben die Pareto-Grenze auf dem MCP-Universe Bench. Dies deutet darauf hin, dass die Qualität und Realitätsnähe der Trainingsdaten einen entscheidenden Faktor für die Leistungsfähigkeit von LLM-Agenten darstellt.
Die Einführung von TOUCAN hat mehrere wichtige Implikationen für die zukünftige Entwicklung von KI-Agenten:
Unternehmen wie Mindverse, die sich auf die Bereitstellung von KI-Tools spezialisiert haben, profitieren von solchen Fortschritten, da sie die Grundlage für leistungsfähigere und vielseitigere KI-Lösungen bilden. Die Fähigkeit, Texte, Inhalte, Bilder und Forschungsergebnisse durch KI zu generieren und zu verwalten, wird durch Agenten, die komplexe Werkzeugketten autonom beherrschen, erheblich erweitert.
Die Arbeit an TOUCAN markiert einen wichtigen Schritt in der Entwicklung von KI-Agenten. Sie unterstreicht die Notwendigkeit, Trainingsdaten zu entwickeln, die nicht nur gross, sondern auch repräsentativ für die Komplexität realer Welt sind. Zukünftige Forschung könnte sich auf die weitere Skalierung und Diversifizierung solcher Datensätze konzentrieren, um die Grenzen dessen, was autonome KI-Agenten leisten können, weiter zu verschieben. Die kontinuierliche Verbesserung der Fähigkeit von LLMs, externe Werkzeuge zu nutzen und in komplexen, mehrstufigen Interaktionen zu agieren, ist ein zentraler Pfeiler für die Realisierung fortgeschrittener KI-Systeme.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen