Hugging Face präsentiert ml-intern einen Open-Source-Agenten zur Automatisierung von ML-Workflows

Kategorien:

No items found.

Freigegeben:

May 2, 2026

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Das Wichtigste in Kürze

Hugging Face hat "ml-intern" veröffentlicht, einen Open-Source-KI-Agenten, der den Post-Training-Workflow für große Sprachmodelle (LLMs) automatisiert.
Der Agent kann Aufgaben wie Literaturrecherche, Datensatz-Entdeckung, Ausführung von Trainingsskripten und iterative Evaluierung autonom durchführen.
Eine neue Funktion ermöglicht die automatische Übertragung von "ml-intern"-Sitzungen auf das Hugging Face Hub-Konto der Nutzer, um die Transparenz und Nachvollziehbarkeit der Agentenaktivitäten zu erhöhen.
Die Integration verbessert die Überwachung und das Verständnis der von den KI-Agenten durchgeführten Schritte im ML-Workflow.
"ml-intern" zeigte beeindruckende Leistungen bei Benchmarks, indem es die wissenschaftliche Argumentationsfähigkeit eines LLMs signifikant verbesserte und dabei andere KI-Agenten übertraf.

Die Landschaft der Künstlichen Intelligenz (KI) entwickelt sich rasant, und mit ihr die Werkzeuge und Methoden, die zur Optimierung und Beschleunigung von Machine-Learning-Workflows eingesetzt werden. Eine bemerkenswerte Entwicklung in diesem Bereich ist die Einführung von "ml-intern" durch Hugging Face. Dieser Open-Source-KI-Agent verspricht, den Post-Training-Workflow für große Sprachmodelle (Large Language Models, LLMs) zu revolutionieren, indem er eine Reihe komplexer Aufgaben autonom übernimmt.

"ml-intern": Ein autonomer ML-Ingenieur

"ml-intern" wurde als ein KI-Agent konzipiert, der die Rolle eines erfahrenen ML-Ingenieurs übernimmt. Seine Fähigkeiten reichen von der Recherche wissenschaftlicher Arbeiten über das Training von Modellen bis hin zur Auslieferung fertiger ML-Modelle. Der Agent agiert dabei innerhalb des Hugging Face-Ökosystems und nutzt dessen umfangreiche Dokumentation, Datensätze und Cloud-Computing-Ressourcen.

Kernfunktionen und Autonomie

Die Autonomie von "ml-intern" erstreckt sich über mehrere Schlüsselaspekte des ML-Workflows:

Literaturrecherche und Datensatz-Entdeckung: Der Agent kann arXiv und Hugging Face Papers durchsuchen, Methodikabschnitte lesen und Zitationsgraphen verfolgen, um relevante Datensätze und Techniken zu identifizieren.
Datensatz-Aufbereitung: Er sucht im Hugging Face Hub nach referenzierten Datensätzen, prüft deren Qualität und formatiert sie für das Training neu.
Modelltraining und Evaluierung: "ml-intern" kann Trainingsjobs über Hugging Face Jobs starten, Evaluierungsergebnisse lesen, Fehler diagnostizieren (z.B. Reward Collapse in RLHF-Pipelines) und Modelle neu trainieren, bis die Benchmark-Leistung sich verbessert.

Dieser kontinuierliche Forschungszyklus ahmt die Arbeit eines menschlichen ML-Forschers nach und zielt darauf ab, den manuellen Aufwand erheblich zu reduzieren.

Architektur und Implementierung

Die Architektur von "ml-intern" basiert auf einem agentischen Loop, der bis zu 300 Iterationen durchlaufen kann. Ein zentraler ContextManager verwaltet die Nachrichtenhistorie und führt eine automatische Kompaktierung durch. Der ToolRouter ermöglicht den Zugriff auf verschiedene Werkzeuge und Ressourcen, darunter Hugging Face-Dokumente, Repositories, Datensätze und lokale Tools. Ein Doom Loop Detector ist integriert, um wiederholte Tool-Muster zu erkennen und korrigierende Prompts zu injizieren.

Der Agent unterstützt verschiedene Modelle, darunter von Anthropic und OpenAI, und kann im interaktiven oder Headless-Modus betrieben werden. Benachrichtigungen über den Agentenstatus (z.B. Genehmigung erforderlich, Fehler, Turn Complete) können über Gateways wie Slack versendet werden, was die Überwachung erleichtert.

Automatische Hub-Integration: Mehr Transparenz für Agentenaktivitäten

Eine kürzlich eingeführte Funktion erweitert die Nützlichkeit von "ml-intern" erheblich: Sitzungen des KI-Agenten werden nun automatisch auf das Hugging Face Hub-Konto der Nutzer übertragen. Diese Integration ist ein wichtiger Schritt zur Verbesserung der Transparenz und Nachvollziehbarkeit der von KI-Agenten durchgeführten Arbeiten.

Die automatische Übertragung der Sitzungen auf das Hub-Konto ermöglicht es Nutzern, die Aktivitäten ihres "ml-intern"-Agenten einfach und zentral einzusehen. Dies ist insbesondere für B2B-Anwendungen von Bedeutung, wo die Nachvollziehbarkeit von Prozessen und die Überwachung von automatisierten Aufgaben entscheidend sind. Indem jeder Schritt des Agenten im Hub dokumentiert wird, können Unternehmen:

Agentenverhalten nachvollziehen: Jede Aktion, jede Entscheidung und jeder Output des Agenten wird erfasst und ist jederzeit einsehbar.
Fehler schneller erkennen und beheben: Bei Problemen oder unerwarteten Ergebnissen können die aufgezeichneten Sitzungen analysiert werden, um die Ursache zu identifizieren.
Vertrauen in automatisierte Prozesse stärken: Die Transparenz fördert das Vertrauen in die Fähigkeiten des KI-Agenten und seine Ergebnisse.
Kollaboration erleichtern: Teams können gemeinsam auf die Agentensitzungen zugreifen und diese überprüfen, was die Zusammenarbeit an ML-Projekten verbessert.

Leistungsfähigkeit und Benchmarks

Die Leistungsfähigkeit von "ml-intern" wurde unter anderem anhand des PostTrainBench-Benchmarks bewertet, der von Forschern der Universität Tübingen und des Max-Planck-Instituts eingeführt wurde. Dieser Benchmark testet die Fähigkeit eines Agenten, ein Basismodell innerhalb eines engen Zeitfensters auf einer einzigen H100-GPU nachzutrainieren.

In einer offiziellen Demo gelang es "ml-intern", die wissenschaftliche Argumentationsfähigkeit eines Qwen3-1.7B-Basismodells von etwa 10% auf bemerkenswerte 32% zu steigern – und das in weniger als 10 Stunden. Dieses Ergebnis ist besonders beeindruckend, da es die spezifischen GPQA-Ergebnisse von Anthropic's Claude Code (22,99%) übertraf. Die Fähigkeit, eine so signifikante Verbesserung aus einem vergleichsweise kleinen Modell zu erzielen, demonstriert ein hohes Maß an "Dateneffizienz".

Fortgeschrittene Trainingsstrategien

"ml-intern" ist nicht auf einfache Fine-Tuning-Aufgaben beschränkt. Der Agent kann auch fortgeschrittene Strategien anwenden:

Generierung synthetischer Daten: In einem Test im Gesundheitswesen erkannte der Agent, dass die vorhandenen medizinischen Datensätze für ein zuverlässiges Fine-Tuning unzureichend waren. Er schrieb daraufhin ein Skript zur Generierung synthetischer Trainingsbeispiele, die sich auf seltene Fälle konzentrierten, darunter medizinische Einschränkungen und mehrsprachige Notfallreaktionen.
Autonomes RLHF via GRPO: Für mathematische Aufgaben implementierte der Agent ein Group Relative Policy Optimization (GRPO)-Trainingsskript – eine Technik, die Reinforcement Learning aus menschlichem Feedback mit geringerem Speicherbedarf als Standard-PPO ermöglicht.

Ausblick für B2B-Anwendungen

Die Entwicklungen rund um "ml-intern" und dessen Integration in das Hugging Face Hub bieten vielversprechende Perspektiven für Unternehmen. Die Automatisierung und Transparenz, die dieser KI-Agent mit sich bringt, können die Effizienz von ML-Entwicklungsprozessen erheblich steigern. Insbesondere in Bereichen, in denen die schnelle Anpassung und Optimierung von LLMs entscheidend ist, könnte "ml-intern" zu einem wertvollen Werkzeug werden. Die Möglichkeit, das Verhalten des Agenten detailliert nachzuvollziehen, minimiert Risiken und fördert eine fundierte Entscheidungsfindung in komplexen KI-Projekten.

Die kontinuierliche Weiterentwicklung von Open-Source-KI-Agenten wie "ml-intern" unterstreicht das Engagement der KI-Community, fortschrittliche Technologien zugänglicher und anwendbarer zu machen. Für Unternehmen, die ihre ML-Workflows optimieren möchten, stellt dies eine spannende Entwicklung dar, die es genau zu beobachten gilt.

Bibliographie

huggingface/ml-intern. (2025-10-30). GitHub. Abrufbar unter: https://github.com/huggingface/ml-intern/
Razzaq, A. (2026-04-21). Hugging Face Releases ml-intern: An Open-Source AI Agent that Automates the LLM Post-Training Workflow. MarkTechPost. Abrufbar unter: https://www.marktechpost.com/2026/04/21/hugging-face-releases-ml-intern-an-open-source-ai-agent-that-automates-the-llm-post-training-workflow/
Thompson, E. (2026-04-23). Hugging Face launches ML Intern, AI agent that beats Claude Code on reasoning. EdTech Innovation Hub. Abrufbar unter: https://www.edtechinnovationhub.com/news/hugging-face-releases-ml-intern-the-ai-agent-teaching-itself-to-beat-claude-code-on-scientific-reasoning
buyaka/ml-intern. (2026-04-24). GitHub. Abrufbar unter: https://github.com/buyaka/ml-intern
ailabteam/ml-intern. (2026-04-24). GitHub. Abrufbar unter: https://github.com/ailabteam/ml-intern
akmalkhaniub/AI-intern. (2026-04-24). GitHub. Abrufbar unter: https://github.com/akmalkhaniub/AI-intern
shahxadxultan/ml-intern. (2026-04-24). GitHub. Abrufbar unter: https://github.com/shahxadxultan/ml-intern
EthanJStark. (2026-03-06). feat(auth): apply JWT middleware to all API routes (#22) (#112) · c09f092 · jakekausler/claude-code-workflow. GitHub. Abrufbar unter: https://github.com/jakekausler/claude-code-workflow/commit/c09f092163fa3a06d1e52dd2f81a216364dab749
cfahlgren1/agent-sessions-list. (n.d.). 451c318f2b2dfe3c1426e2a97b977c81224473f.diff. Hugging Face. Abrufbar unter: https://huggingface.co/datasets/cfahlgren1/agent-sessions-list/commit/451c318f2b2dfe3c1426e2a97b977c81224473f.diff?file=sessions%2Fpi%2F6327a1c3-ee93-458a-a963-b685c8cb47a8.jsonl
sacahan/ml-intern. (2026-04-25). GitHub. Abrufbar unter: https://github.com/sacahan/ml-intern