KI für Ihr Unternehmen – Jetzt Demo buchen

Experimenteller KI-Agent von Hugging Face für Computeraufgaben vorgestellt

Kategorien:
No items found.
Freigegeben:
May 12, 2025

Artikel jetzt als Podcast anhören

Inhaltsverzeichnis

    Hugging Face veröffentlicht experimentellen KI-Agenten für Computer

    Das auf Open-Source-KI-Modelle spezialisierte Unternehmen Hugging Face hat einen experimentellen KI-Agenten vorgestellt, der grundlegende Computeraufgaben ausführen soll. Der "Open Computer Agent" interagiert über einen Webbrowser mit Anwendungen wie Firefox innerhalb einer virtuellen Linux-Maschine. Dies ermöglicht ihm, im Internet zu surfen und einfache Suchanfragen durchzuführen.

    Die Technologie steckt jedoch noch in den Kinderschuhen. Hugging Face selbst räumt erhebliche Einschränkungen ein. Der Agent reagiert langsam, hat Schwierigkeiten mit CAPTCHAs und benötigt häufig einen Neustart, um wieder funktionsfähig zu sein. Standardmäßig protokolliert der Agent Anfragen, um die Technologie zu verbessern, Nutzer können diese Funktion jedoch deaktivieren.

    Erste Tests zeigen Schwächen

    Tests zeigen, dass der Agent selbst bei einfachen Aufgaben scheitert. Ein von Hugging Face vorgegebenes Demo-Szenario, die Suche nach dem Firmensitz auf Google Maps, führte beispielsweise zu der Suche nach einem "3D-Druck-Bedarfsladen". Die tatsächliche Adresse des Hugging Face Headquarters lässt sich über eine herkömmliche Google-Suche problemlos finden: 20 Jay St Suite 620, Brooklyn, New York, USA.

    Optisch präsentiert sich der Open Computer Agent in einem modernen, retro-futuristischen Design, das an die Apple-Serie "Severance" erinnert. Ein Schalter mit der Beschriftung "Innie/Outie" aktiviert bzw. deaktiviert diesen Effekt.

    Technische Grundlagen des Open Computer Agents

    Der Agent basiert auf "smolagents", einem minimalistischen Framework für KI-Agenten, das Hugging Face im Dezember 2024 vorgestellt hat. Diese Open-Source-Bibliothek ermöglicht Entwicklern die Erstellung von Agenten mit minimalem Codeaufwand. Die KI kann direkt Python-Code schreiben, anstatt traditionelle JSON-Befehle zu verwenden. Dies soll Arbeitsabläufe optimieren und die Effizienz von Agenten steigern.

    Darüber hinaus nutzt der Agent Alibabas Qwen-VL-Vision-Modell, das Elemente in Bildern lokalisieren und mit Benutzeroberflächen interagieren kann. Das im März veröffentlichte Qwen2.5-VL-32B-Modell übertraf in Benchmarks sogar größere Modelle wie Qwen2-VL-72B und zeigte besondere Stärken bei der Analyse komplexer visueller Informationen.

    Experimentelle Phase und Ausblick

    Die Veröffentlichung des Open Computer Agenten, inspiriert von OpenAIs experimentellem ChatGPT Operator, reiht sich ein in eine Serie von Open-Source-Initiativen von Hugging Face, die kommerziellen Lösungen nacheifern. Bereits im Februar stellte das Unternehmen Open Deep Research vor, einen in nur 24 Stunden entwickelten Konkurrenten zu OpenAIs Deep Research.

    Obwohl das Interesse von Unternehmen an KI-Agenten steigt, verdeutlicht der aktuelle Stand des Open Computer Agenten, dass die Technologie noch in der Entwicklungsphase steckt. Agenten, die Computer wie Menschen bedienen, sind noch weit von der Alltagstauglichkeit entfernt. Für Entwickler und Forscher bietet der Agent eine interessante Testplattform, für den praktischen Einsatz ist er jedoch noch nicht geeignet.

    Quellen: - https://the-decoder.com/hugging-face-unveils-experimental-ai-agent-for-computers/ - https://techcrunch.com/2025/05/06/hugging-face-releases-a-free-operator-like-agentic-ai-tool/ - https://wandb.ai/byyoung3/ml-news/reports/Hugging-Face-launches-Open-Computer-Agent---VmlldzoxMjY1NjIzNQ - https://www.techinasia.com/news/ai-firm-hugging-face-launches-cloud-ai-agent-for-computer-tasks - https://www.perplexity.ai/page/hugging-face-launches-free-ope-bxXGBB9wT7uWbCP7TkzNCg - https://analyticsindiamag.com/ai-news-updates/hugging-face-launches-web-based-ai-agent-similar-to-openais-operator/ - https://www.technology.org/2025/05/07/hugging-face-unveils-free-ai-computer-agent-similar-to-openais-operator/ - https://bitcoinworld.co.in/hugging-face-ai-agent/ - https://yourstory.com/2025/05/hugging-face-ai-agent-open-ai-alternative - https://www.threads.com/@the_ainavigator/post/DJZ7yN7M7M4/hugging-face-has-released-a-new-open-source-ai-agent-designed-to-handle-basic-co
    Mindverse vs ChatGPT Plus Widget

    Warum Mindverse Studio?

    Entdecken Sie die Vorteile gegenüber ChatGPT Plus

    Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

    🚀 Mindverse Studio

    Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

    ChatGPT Plus

    ❌ Kein strukturierter Dokumentenvergleich

    ❌ Keine Bearbeitung im Dokumentkontext

    ❌ Keine Integration von Unternehmenswissen

    VS

    Mindverse Studio

    ✅ Gezielter Dokumentenvergleich mit Custom-Prompts

    ✅ Kontextbewusste Textbearbeitung im Editor

    ✅ Wissensbasierte Analyse & Zusammenfassungen

    📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

    Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

    ChatGPT Plus

    ❌ Nur ein Modellanbieter (OpenAI)

    ❌ Keine Modellauswahl pro Use Case

    ❌ Keine zentrale Modellsteuerung für Teams

    VS

    Mindverse Studio

    ✅ Zugriff auf über 50 verschiedene KI-Modelle

    ✅ Modellauswahl pro Prompt oder Assistent

    ✅ Zentrale Steuerung auf Organisationsebene

    🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

    OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
    Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
    Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
    Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

    ChatGPT Plus

    ❌ Keine echte Teamkollaboration

    ❌ Keine Rechte- oder Rollenverteilung

    ❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

    VS

    Mindverse Studio

    ✅ Teamübergreifende Bearbeitung in Echtzeit

    ✅ Granulare Rechte- und Freigabeverwaltung

    ✅ Zentrale Steuerung & Transparenz auf Organisationsebene

    👥 Kollaborative KI für Ihr gesamtes Unternehmen

    Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

    Bereit für den nächsten Schritt?

    Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

    🎯 Kostenlose Demo buchen

    Wie können wir Ihnen heute helfen?

    Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
    Herzlichen Dank! Deine Nachricht ist eingegangen!
    Oops! Du hast wohl was vergessen, versuche es nochmal.

    🚀 Neugierig auf Mindverse Studio?

    Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

    🚀 Demo jetzt buchen