Das auf Open-Source-KI-Modelle spezialisierte Unternehmen Hugging Face hat einen experimentellen KI-Agenten vorgestellt, der grundlegende Computeraufgaben ausführen soll. Der "Open Computer Agent" interagiert über einen Webbrowser mit Anwendungen wie Firefox innerhalb einer virtuellen Linux-Maschine. Dies ermöglicht ihm, im Internet zu surfen und einfache Suchanfragen durchzuführen.
Die Technologie steckt jedoch noch in den Kinderschuhen. Hugging Face selbst räumt erhebliche Einschränkungen ein. Der Agent reagiert langsam, hat Schwierigkeiten mit CAPTCHAs und benötigt häufig einen Neustart, um wieder funktionsfähig zu sein. Standardmäßig protokolliert der Agent Anfragen, um die Technologie zu verbessern, Nutzer können diese Funktion jedoch deaktivieren.
Tests zeigen, dass der Agent selbst bei einfachen Aufgaben scheitert. Ein von Hugging Face vorgegebenes Demo-Szenario, die Suche nach dem Firmensitz auf Google Maps, führte beispielsweise zu der Suche nach einem "3D-Druck-Bedarfsladen". Die tatsächliche Adresse des Hugging Face Headquarters lässt sich über eine herkömmliche Google-Suche problemlos finden: 20 Jay St Suite 620, Brooklyn, New York, USA.
Optisch präsentiert sich der Open Computer Agent in einem modernen, retro-futuristischen Design, das an die Apple-Serie "Severance" erinnert. Ein Schalter mit der Beschriftung "Innie/Outie" aktiviert bzw. deaktiviert diesen Effekt.
Der Agent basiert auf "smolagents", einem minimalistischen Framework für KI-Agenten, das Hugging Face im Dezember 2024 vorgestellt hat. Diese Open-Source-Bibliothek ermöglicht Entwicklern die Erstellung von Agenten mit minimalem Codeaufwand. Die KI kann direkt Python-Code schreiben, anstatt traditionelle JSON-Befehle zu verwenden. Dies soll Arbeitsabläufe optimieren und die Effizienz von Agenten steigern.
Darüber hinaus nutzt der Agent Alibabas Qwen-VL-Vision-Modell, das Elemente in Bildern lokalisieren und mit Benutzeroberflächen interagieren kann. Das im März veröffentlichte Qwen2.5-VL-32B-Modell übertraf in Benchmarks sogar größere Modelle wie Qwen2-VL-72B und zeigte besondere Stärken bei der Analyse komplexer visueller Informationen.
Die Veröffentlichung des Open Computer Agenten, inspiriert von OpenAIs experimentellem ChatGPT Operator, reiht sich ein in eine Serie von Open-Source-Initiativen von Hugging Face, die kommerziellen Lösungen nacheifern. Bereits im Februar stellte das Unternehmen Open Deep Research vor, einen in nur 24 Stunden entwickelten Konkurrenten zu OpenAIs Deep Research.
Obwohl das Interesse von Unternehmen an KI-Agenten steigt, verdeutlicht der aktuelle Stand des Open Computer Agenten, dass die Technologie noch in der Entwicklungsphase steckt. Agenten, die Computer wie Menschen bedienen, sind noch weit von der Alltagstauglichkeit entfernt. Für Entwickler und Forscher bietet der Agent eine interessante Testplattform, für den praktischen Einsatz ist er jedoch noch nicht geeignet.
Quellen: - https://the-decoder.com/hugging-face-unveils-experimental-ai-agent-for-computers/ - https://techcrunch.com/2025/05/06/hugging-face-releases-a-free-operator-like-agentic-ai-tool/ - https://wandb.ai/byyoung3/ml-news/reports/Hugging-Face-launches-Open-Computer-Agent---VmlldzoxMjY1NjIzNQ - https://www.techinasia.com/news/ai-firm-hugging-face-launches-cloud-ai-agent-for-computer-tasks - https://www.perplexity.ai/page/hugging-face-launches-free-ope-bxXGBB9wT7uWbCP7TkzNCg - https://analyticsindiamag.com/ai-news-updates/hugging-face-launches-web-based-ai-agent-similar-to-openais-operator/ - https://www.technology.org/2025/05/07/hugging-face-unveils-free-ai-computer-agent-similar-to-openais-operator/ - https://bitcoinworld.co.in/hugging-face-ai-agent/ - https://yourstory.com/2025/05/hugging-face-ai-agent-open-ai-alternative - https://www.threads.com/@the_ainavigator/post/DJZ7yN7M7M4/hugging-face-has-released-a-new-open-source-ai-agent-designed-to-handle-basic-co