KI für Ihr Unternehmen – Jetzt Demo buchen

Modellierung menschlicher Interaktionen zur Optimierung autonomer Web-Agenten

Kategorien:
No items found.
Freigegeben:
February 21, 2026

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

1
🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

2
🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

3
⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

4
🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

5
👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Inhaltsverzeichnis

    mindverse studio – Ihre Plattform für digitale Effizienz

    Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.
    Mehr über Mindverse Studio erfahren

    Das Wichtigste in Kürze

    • Menschliche Interaktion ist für die effektive Steuerung autonomer Web-Agenten unerlässlich, da sie Präferenzen formt und Fehlverhalten korrigiert.
    • Ein neues Modell zur Vorhersage menschlicher Interventionen in Web-Agenten verbessert die Genauigkeit der Interventionsvorhersage um 61,4–63,4 %.
    • Das CowCorpus-Datenset mit 400 realen Benutzertrajektorien und über 4.200 Aktionen ermöglicht die Analyse unterschiedlicher Interaktionsmuster.
    • Vier Interaktionsstile – Hands-off-Supervision, Hands-on-Oversight, kollaboratives Task-Solving und vollständige Benutzerübernahme – wurden identifiziert.
    • Der Einsatz dieser Modelle in Live-Web-Agenten führte zu einer Steigerung der Benutzerzufriedenheit um 26,5 %.
    • Die Forschung zeigt einen Paradigmenwechsel von reiner Agentenautonomie hin zu adaptiven, kollaborativen Agenten.

    Die fortschreitende Entwicklung autonomer Agenten für Web-Interaktionen hat das Potenzial, die Art und Weise, wie Unternehmen digitale Aufgaben automatisieren und ausführen, grundlegend zu verändern. Trotz signifikanter Fortschritte in der Autonomie dieser Systeme bleibt die Rolle des Menschen bei der Steuerung und Feinabstimmung dieser Agenten von zentraler Bedeutung. Insbesondere die Fähigkeit, menschliche Eingriffe präzise zu modellieren und vorherzusagen, erweist sich als entscheidend für die Entwicklung adaptiver und kollaborativer KI-Systeme. Dieser Artikel beleuchtet aktuelle Forschungsergebnisse, die sich mit der Modellierung menschlicher Interaktionsmuster in Web-Agenten befassen, und deren Implikationen für B2B-Anwendungen.

    Die Notwendigkeit menschlicher Interaktion in autonomen Web-Agenten

    Autonome Web-Agenten, die auf grossen Sprachmodellen (LLMs) basieren, sind zunehmend in der Lage, komplexe Aufgaben im Web zu bewältigen. Dies reicht von der Navigation auf Websites bis hin zur Ausführung detaillierter Prozesse. Dennoch zeigt sich in der Praxis, dass ein vollständig autonomer Betrieb oft an seine Grenzen stösst. Menschen müssen eingreifen, um Missverständnisse zu korrigieren, die Ausrichtung der Agenten an Benutzerpräferenzen sicherzustellen oder Fehler zu beheben, die der Agent nicht selbstständig lösen kann.

    Aktuelle Agentensysteme verfügen jedoch häufig nicht über ein differenziertes Verständnis dafür, wann und warum menschliche Interventionen erforderlich sind. Dies kann dazu führen, dass Agenten entweder unnötig autonom handeln, kritische Entscheidungspunkte übersehen oder zu häufig um Bestätigung bitten, was die Benutzererfahrung beeinträchtigt und den Überwachungsaufwand erhöht. Die Entwicklung von Agenten, die menschliche Eingriffe proaktiv antizipieren und ihr Verhalten entsprechend anpassen können, ist daher ein zentrales Forschungsfeld.

    CowCorpus: Ein Datenkörper für menschlich-agentische Kollaboration

    Ein wesentlicher Schritt zur Lösung der genannten Herausforderungen ist die Schaffung von Datensätzen, die reale menschliche Interaktionen mit Web-Agenten abbilden. Hierzu wurde das CowCorpus-Datenset entwickelt. Es umfasst 400 reale Benutzertrajektorien bei der Web-Navigation und enthält über 4.200 verschränkte Aktionen von Menschen und Agenten.

    Datenerhebung und -struktur

    Die Daten für CowCorpus wurden in zwei Hauptkategorien gesammelt:

    • Standardaufgaben: Zehn Aufgaben aus dem Mind2Web-Datenset, die häufig besuchte Websites und Subdomains abdecken. Diese standardisierten Aufgaben ermöglichen es, Unterschiede im menschlichen Interaktionsstil unter kontrollierten Bedingungen zu analysieren.
    • Freiformaufgaben: Zehn Aufgaben, die von den Teilnehmern selbst gewählt wurden und ein breites Spektrum an realen Anwendungsfällen abdecken, von Informationsbeschaffung über personalisierte Interessen bis hin zu Produkt- und Dienstleistungsinteraktionen.

    20 menschliche Benutzer führten diese 20 Web-Aufgaben in Zusammenarbeit mit einem KI-Agenten, dem Open-Source-Framework CowPilot, aus. Für jede Aktion wurden der Akteur (Mensch oder Agent), Zeitstempel und Web-Snapshots erfasst. Die Analyse des Datensets offenbarte, dass menschliche Eingriffe hauptsächlich durch drei Bedürfnisse motiviert sind:

    1. Fehlerkorrektur und Wiederherstellung: Interventionen zur Behebung von Agentenfehlern oder zur Umleitung der Ausführung, wenn der Agent feststeckt (z.B. falsche oder verfrühte Aktionen, Endlosschleifen).
    2. Fehlausrichtung der Präferenzen: Eingriffe, wenn Agentenaktionen von den intendierten Benutzerpräferenzen abweichen, oft aufgrund unvollständiger Anweisungen (z.B. übersehene Voraussetzungen, Mehrdeutigkeit in der Aufgabenbeschreibung).
    3. Assistive Intervention für komplexe Umgebungen: Eingriffe, um Einschränkungen des Agenten in komplexen Webumgebungen auszugleichen (z.B. schwierige UI-Elemente, fehlende Ressourcen, manuelle Übernahme zur Fehlervermeidung).

    Identifizierung von Interaktionsmustern

    Basierend auf den gesammelten Daten wurden vier unterschiedliche Interaktionsmuster zwischen Benutzern und Agenten identifiziert:

    • Takeover: Benutzer greifen selten ein und meist spät in der Aufgabe. Wenn sie dies tun, behalten sie tendenziell die Kontrolle, anstatt sie an den Agenten zurückzugeben.
    • Hands-on: Benutzer greifen häufig und intensiv ein. Ihre Interventionen erfolgen tendenziell relativ spät, wechseln aber regelmässig die Kontrolle mit dem Agenten.
    • Hands-off: Benutzer greifen während der gesamten Aufgabe selten ein und lassen den Agenten die meisten Trajektorien autonom ausführen.
    • Collaborative: Benutzer greifen selektiv ein und geben die Kontrolle konsequent an den Agenten zurück. Diese Gruppe zeichnet sich durch frühere, kurzlebige Interventionen aus, die die laufende Zusammenarbeit unterstützen.

    Diese Muster zeigen, dass Benutzer systematische Unterschiede in Bezug auf den Zeitpunkt, das Ausmass und die Art ihrer Interventionen aufweisen.

    Modellierung menschlicher Interventionen

    Die Erkenntnisse aus CowCorpus wurden genutzt, um Sprachmodelle (LMs) zu trainieren, die vorhersagen können, wann Benutzer wahrscheinlich eingreifen werden. Die Modellierung der menschlichen Intervention erfolgt als schrittweise binäre Klassifikationsaufgabe, bei der das Modell die Wahrscheinlichkeit eines Benutzereingriffs basierend auf dem aktuellen Zustand und der vom Agenten vorgeschlagenen Aktion schätzt.

    Experimentelle Ansätze und Ergebnisse

    Zwei Hauptansätze wurden verfolgt:

    1. Ein allgemeines interventionsbewusstes Modell, das über eine rein autonome Ausführung hinausgeht.
    2. Stil-konditionierte Modelle, die an spezifische Kollaborationsstile angepasst sind.

    Die Ergebnisse zeigten, dass die interventionsbewussten Modelle die Genauigkeit der Interventionsvorhersage um 61,4–63,4 % gegenüber den Basis-LMs verbesserten. Insbesondere die Feinabstimmung von Open-Weight-Modellen auf CowCorpus führte zu signifikanten Leistungssteigerungen, die proprietäre Modelle übertrafen. Dies deutet darauf hin, dass spezialisierte Daten effektiver sind als die reine Grösse der Modelle.

    Ein wichtiger Aspekt der Bewertung war der Perfect Timing Score (PTS), der nicht nur die Korrektheit, sondern auch den Zeitpunkt der Vorhersage berücksichtigt. Modelle, die menschliche Interventionen genau vorhersagen konnten, erzielten höhere PTS-Werte, was die Bedeutung der zeitlichen Lokalisierung von Eingriffen unterstreicht.

    Anpassung an individuelle Interaktionsmuster

    Die Forschung untersuchte auch, wie Vorhersagen an die vier identifizierten Benutzerinteraktionsmuster angepasst werden können. Modelle, die auf spezifische Benutzercluster trainiert wurden (z.B. Takeover, Hands-on, Collaborative), übertrafen im Allgemeinen Modelle, die auf anderen Clustern trainiert wurden. Dies unterstreicht die Notwendigkeit personalisierter Agenten, die sich an individuelle Präferenzen anpassen können.

    Einsatz kollaborativer Web-Agenten und Auswirkungen auf die Benutzerzufriedenheit

    Um die praktischen Auswirkungen der verbesserten Interventionsmodellierung zu bewerten, wurden die interventionsbewussten Modelle in einen Web-Navigationsagenten namens PlowPilot integriert. Dieser Agent fordert nur dann zur Intervention auf, wenn das Modell eine hohe Wahrscheinlichkeit eines Benutzereingriffs vorhersagt, anstatt den Benutzer bei jedem Schritt um Bestätigung zu bitten.

    Eine Benutzerstudie mit 20 Annotatoren ergab, dass PlowPilot das bestehende kollaborative Web-Agenten-System um durchschnittlich 26,5 % in der Benutzerzufriedenheit übertraf. Dies zeigt, dass die Antizipation menschlicher Interventionen die Effektivität und Benutzerfreundlichkeit von kollaborativen Agentensystemen erheblich steigern kann. Die Verbesserungen resultierten allein aus dem interventionsbewussten Modul, da der zugrunde liegende Ausführungsagent unverändert blieb.

    Die Studie zeigte auch, dass Benutzer mit PlowPilot zufriedener waren, da sie weniger unnötige Unterbrechungen erlebten. Dies deutet auf einen Paradigmenwechsel hin: weg von der Optimierung der reinen Agentenautonomie, hin zur Entwicklung von Agenten, die sich dynamisch an menschliche Präferenzen und Kollaborationsstile anpassen.

    Verwandte Arbeiten und zukünftige Perspektiven

    Die Entwicklung autonomer Web-Agenten ist ein aktives Forschungsfeld. Benchmarks wie Mind2Web und WebArena treiben die Agentenentwicklung voran, während neue Fähigkeiten wie Computer Use von Modellen wie Claude die Lücke zwischen menschlicher Navigation und maschineller Ausführung schliessen. Die aktuelle Forschung betont jedoch zunehmend die Bedeutung der Mensch-KI-Kollaboration über die reine Agentenautonomie hinaus.

    Frühere interaktive Systeme wie PUMICE und PLOW zeigten bereits den Wert der Endbenutzerprogrammierung und -demonstration. Aktuelle Studien konzentrieren sich auf Sicherheit und Vertrauenswürdigkeit von Agenten. Die hier vorgestellte Arbeit ergänzt diese Ansätze, indem sie die Kommunikationsmuster in der Mensch-Agent-Web-Browsing-Kollaboration in den Vordergrund stellt.

    Die Modellierung menschlicher Interaktionsmuster in Web-Agenten stellt einen strukturierten Verhaltenssignal dar, das unterschiedliche Kollaborationsstile widerspiegelt. Die Einführung von CowCorpus ermöglicht eine detaillierte Untersuchung dieser Muster. Die Ergebnisse zeigen, dass spezialisierte Modelle, die auf kollaborativen Interaktionsspuren feinabgestimmt sind, die Vorhersagegenauigkeit von Interventionen erheblich verbessern können und zu einer höheren Benutzerzufriedenheit führen.

    Zukünftige Arbeiten könnten die Entwicklung von Agenten fördern, die reaktionsfähiger, anpassungsfähiger und als wirklich kollaborative Partner fungieren können. Dies ist besonders relevant für Unternehmen, die KI-Lösungen implementieren, um ihre digitalen Prozesse zu optimieren und die Effizienz ihrer Mitarbeiter zu steigern. Ein besseres Verständnis und eine präzisere Modellierung der Mensch-Agent-Interaktion werden entscheidend sein, um das volle Potenzial dieser Technologien auszuschöpfen.

    Fazit

    Die Integration von KI-Agenten in Web-Umgebungen eröffnet Unternehmen neue Möglichkeiten zur Automatisierung und Effizienzsteigerung. Die vorliegende Forschung unterstreicht jedoch, dass der Erfolg dieser Integration massgeblich von der Fähigkeit der Agenten abhängt, menschliche Interaktionsmuster zu verstehen und sich diesen anzupassen. Die detaillierte Analyse von Interventionsstilen und die Entwicklung spezialisierter Modelle zur Vorhersage menschlicher Eingriffe stellen einen wichtigen Schritt dar, um die Zusammenarbeit zwischen Mensch und KI zu optimieren. Für B2B-Anwendungen bedeutet dies, dass die Entwicklung von KI-Lösungen nicht nur auf die reine Leistungsfähigkeit der Agenten abzielen sollte, sondern auch auf deren Fähigkeit zur adaptiven und kontextsensitiven Interaktion mit menschlichen Nutzern. Dies führt zu einer höheren Akzeptanz, verbesserter Benutzerfreundlichkeit und letztlich zu einem höheren Return on Investment für Unternehmen, die in diese Technologien investieren.

    Bibliography

    • Huq, F., Wang, Z. Z., Guo, Z., Arangarajan, V. A., Ou, T., Xu, F., ... & Bigham, J. P. (2026). Modeling Distinct Human Interaction in Web Agents. arXiv preprint arXiv:2602.17588.
    • Anthropic. (2026). Measuring AI agent autonomy in practice. Latent.Space. Retrieved from https://www.latent.space/p/ainews-anthropics-agent-autonomy
    • Yang, Y., Ma, M., Huang, Y., Chai, H., Gong, C., Geng, H., ... & Wang, J. (2025). Agentic Web: Weaving the Next Web with AI Agents. arXiv preprint arXiv:2507.21206.
    • Zhang, R., Qiu, M., Tan, Z., Zhang, M., Lu, V., Peng, J., ... & Chen, T. (2025). Symbiotic Cooperation for Web Agents: Harnessing Complementary Strengths of Large and Small LLMs. arXiv preprint arXiv:2502.07942.
    • Liu, Y. (2025). A new human-computer interaction paradigm: Agent interaction model based on large models and its prospects. Virtual Reality & Intelligent Hardware, 7(3), 237-266.
    • Park, J. S., O'Brien, J. C., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative Agents: Interactive Simulacra of Human Behavior. arXiv preprint arXiv:2304.03442.
    • Li, C. J., Mo, Z., Tang, Y., Qu, A., Wu, J., Zhao, K. I., ... & Larson, K. (2025). HugAgent: Benchmarking LLMs for Simulation of Individualized Human Reasoning. arXiv preprint arXiv:2510.15144.
    • Yun, H., & Jang, J. (2025). Interaction-Driven Browsing: A Human-in-the-Loop Conceptual Framework Informed by Human Web Browsing for Browser-Using Agents. arXiv preprint arXiv:2509.12049.

    Artikel jetzt als Podcast anhören

    Kunden die uns vertrauen:
    Arise Health logoArise Health logoThe Paak logoThe Paak logoOE logo2020INC logoEphicient logo
    und viele weitere mehr!

    Bereit für den nächsten Schritt?

    Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
    Herzlichen Dank! Deine Nachricht ist eingegangen!
    Oops! Du hast wohl was vergessen, versuche es nochmal.

    🚀 Neugierig auf Mindverse Studio?

    Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

    🚀 Demo jetzt buchen