Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Navigation im Internet wird zunehmend komplexer. Die schiere Menge an Informationen und die dynamische Natur von Webseiten stellen eine Herausforderung für automatisierte Systeme dar. Ein neues KI-System, entwickelt von Forschern der Yonsei Universität in Korea, setzt auf sogenannte "Weltmodelle", um die Interaktion mit Webseiten zu simulieren und die Erfolgsraten bei Navigationsaufgaben zu verbessern. Dieser Ansatz verspricht, die Grenzen bisheriger KI-basierter Webnavigationssysteme zu überwinden.
Die Forscher untersuchten zunächst die Fähigkeit großer Sprachmodelle (LLMs), Aktionssequenzen auf Webseiten vorherzusagen. Selbst die neuesten Modelle erreichten dabei nur eine Genauigkeit von etwa 54%. GPT-4 Turbo schnitt geringfügig besser ab als GPT-4, während Claude 3.5 Sonnet "so schlecht wie zufälliges Raten" abschnitt. Dies deutet darauf hin, dass LLMs ein Weltmodell fehlt, also die Fähigkeit, die potenziellen Ergebnisse von Aktionen vorherzusehen.
Das neue System verfolgt einen anderen Ansatz: Anstatt Aktionen durch Trial-and-Error auszuführen, simuliert es diese zunächst in einem Weltmodell. Die Forscher entwickelten dazu die sogenannte "transitionsfokussierte Beobachtungsabstraktion", um wichtige Änderungen auf Webseiten zu erfassen. Das System kombiniert zwei Kernkomponenten: ein Weltmodell für das Training und ein Politiksystem für die Entscheidungsfindung.
Der Prozess läuft in drei Schritten ab:
1. Datenerfassung: Mithilfe von GPT-4-mini generierten die Forscher 14.000 Trainingsbeispiele, die die Interaktion von KI mit Webseiten abbilden.
2. Änderungsverfolgung: Der Ungarische Algorithmus wird verwendet, um Aktualisierungen, Löschungen und Ergänzungen auf Webseiten zwischen verschiedenen Aktionen zu identifizieren.
3. Sprachliche Vereinfachung: Die technischen Änderungen werden in einfache Sprache übersetzt, wodurch die Datenmenge von etwa 4.000 Tokens deutlich reduziert wird. Dies senkt die Rechenkosten und steigert die Effizienz.
Die Erfolgsquote des Systems variierte je nach Aufgabentyp. In WebArena-Tests, die gängige Aufgaben wie Online-Shopping und die Nutzung von Reddit umfassen, erreichte das System eine Erfolgsquote von 16,6 Prozent, eine Verbesserung gegenüber dem bisherigen Basiswert von 12,8 Prozent. Die Ergebnisse variierten stark nach Kategorie. Die Navigation auf GitLab-Seiten verbesserte sich um 181 Prozent, während Kartendienste einen Zuwachs von 92 Prozent verzeichneten. Beim Online-Shopping war die Verbesserung mit 3 Prozent am geringsten.
In Mind2Web-Tests mit 2.000 Aufgaben auf 137 Webseiten erreichte das System eine neue Rekord-Erfolgsquote von 25,4 Prozent.
Die Forscher räumen ein, dass weitere Arbeit erforderlich ist, insbesondere bei der Verarbeitung visueller Informationen und der Planung von mehrstufigen Aktionen. Diese Bereiche sollen in zukünftigen Forschungsarbeiten im Fokus stehen. Die Webnavigation könnte ein wichtiger Bestandteil agentenbasierter KI-Systeme werden, die von einigen als der nächste große Schritt für die KI angesehen werden. Sowohl Anthropics "Claude Computer Use" als auch Googles "Project Jarvis" entwickeln ähnliche Funktionen, um KI bei der effektiveren Navigation im Web zu unterstützen.
Quellen: Chae et al. (2021). Pathdreamer: A World Model for Indoor Navigation. In *Proceedings of the IEEE/CVF International Conference on Computer Vision* (ICCV). Hu, Z., & Shu, R. (2023). *LAW: Language-driven Autonomous World Modeling*. arXiv preprint arXiv:2407.07035. Koh et al. (2021). *Pathdreamer: A World Model for Indoor Navigation*. ResearchGate. Manyika, J., et al. (2024). *A new future of work: The race to deploy AI*. McKinsey Global Institute. Maleki Varnosfaderani, S., & Forouzanfar, M. (2024). The Role of AI in Hospitals and Clinics: Transforming Healthcare in the 21st Century. *Bioengineering*, *11*(4), 337. Sarker, I. H. (2021). Machine Learning: Algorithms, Real-World Applications and Research Directions. *SN Computer Science*, *2*(3), 160. Townsend, S. (2024, July 16). *Driving Customer Success Through AI: The Future of Business*. Operations Research Bit.Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen