Jetzt reinschauen – neue Umgebung live

Neuer Open-Source-Agent Fireworks Manus revolutioniert intelligentes Web-Browsing

Kategorien:
No items found.
Freigegeben:
May 27, 2025

Artikel jetzt als Podcast anhören

Fireworks Manus: Ein Open-Source-Agent für intelligentes Web-Browsing

Die Welt der künstlichen Intelligenz entwickelt sich rasant, und ein neuer Open-Source-Agent namens Fireworks Manus steht im Zentrum der Aufmerksamkeit. Entwickelt von Fireworks AI, verspricht Manus eine neue Ära des automatisierten Web-Browsings, die über einfache Textausgabe hinausgeht. Dieser Agent ist in der Lage, komplexe Web-Interaktionen durchzuführen, von der Navigation und dem Ausfüllen von Formularen bis hin zur Extraktion dynamischer Inhalte und der Bewältigung von Authentifizierungsabläufen.

Im Gegensatz zu herkömmlichen, skriptbasierten Automatisierungslösungen, die oft anfällig für Fehler sind, verfolgt Fireworks Manus einen intelligenten, agentenbasierten Ansatz. Der Agent basiert auf einer strukturierten Architektur, die aus drei Hauptkomponenten besteht: einem Visionssystem, einem Denksystem und einem Handlungssystem.

Das Visionssystem ermöglicht es Manus, die Webseiten ähnlich einem menschlichen Benutzer wahrzunehmen. Es analysiert den DOM, verarbeitet Screenshots und nutzt räumliches Bewusstsein, um die Struktur und den Inhalt der Webseite zu verstehen. Das Denksystem ist das Gehirn des Agenten und verantwortlich für die Speicherung von Informationen, die Verfolgung von Zielen und die Planung von Aktionen im JSON-Format. Schließlich steuert das Handlungssystem die Interaktionen mit dem Browser, indem es Klicks, Eingaben und andere Aktionen ausführt.

Diese drei Systeme arbeiten in einem robusten "Observe-Decide-Act"-Zyklus zusammen, der es Manus ermöglicht, sich in Echtzeit an die Benutzeroberfläche anzupassen. Diese Anpassungsfähigkeit ist entscheidend für die Bewältigung der dynamischen und komplexen Natur moderner Webseiten.

Die Grundlage für die beeindruckenden Fähigkeiten von Fireworks Manus bilden zwei leistungsstarke KI-Modelle: DeepSeek V3 für das Reasoning und FireLlava 13B für das visuelle Verständnis. DeepSeek V3 ermöglicht dem Agenten, logische Schlussfolgerungen zu ziehen und komplexe Aufgaben zu lösen, während FireLlava 13B die visuelle Verarbeitung von Webseiteninhalten übernimmt. Die Kombination dieser beiden Modelle in Verbindung mit der schnellen, multimodalen Inferenz-Stack von Fireworks AI ermöglicht es Manus, mit modernen interaktiven Webseiten Schritt zu halten.

Die Open-Source-Natur von Fireworks Manus eröffnet Entwicklern und Forschern die Möglichkeit, den Agenten zu untersuchen, zu modifizieren und zu erweitern. Dies könnte zu weiteren Innovationen im Bereich der agentenbasierten Automatisierung führen und neue Anwendungsmöglichkeiten in verschiedenen Bereichen eröffnen.

Von der Automatisierung von Web-Tests und der Datenerfassung bis hin zur Unterstützung von Benutzern bei komplexen Online-Aufgaben – das Potenzial von Fireworks Manus ist enorm. Die Entwicklung dieses Agenten markiert einen wichtigen Schritt in Richtung einer Zukunft, in der intelligente Agenten eine immer größere Rolle im Umgang mit dem Web spielen werden.

Bibliographie: https://x.com/FireworksAI_HQ/status/1926008883627118776 https://x.com/fireworksai_hq?lang=de https://twitter.com/_akhaliq/with_replies https://www.youtube.com/watch?v=tI5j3EoPD7g https://ai-sdk.dev/playground/deepseek:chat https://github.com/deepseek-ai/DeepSeek-V3 https://www.reddit.com/r/LocalLLaMA/comments/1hofvtw/deepseek_v3_is_absolutely_astonishing/ https://deepseek.ai/blog/deepseek-v31
Was bedeutet das?

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.