Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die rapide Entwicklung von KI-Agenten, insbesondere solcher, die auf sogenannten Vision-Language Models (VLMs) basieren, hat das Potenzial, die Interaktion mit digitalen Umgebungen wie mobilen Plattformen grundlegend zu verändern. Diese Agenten können komplexe Aufgaben, die bisher menschliches Eingreifen erforderten, eigenständig ausführen. Dazu gehören beispielsweise das Planen von Besprechungen, das Versenden von Nachrichten oder die Verwaltung persönlicher Daten. Während diese Fortschritte große Chancen für die digitale Automatisierung bieten, werfen sie gleichzeitig erhebliche Sicherheitsbedenken auf. Potenzielle Risiken umfassen die Kompromittierung von Systemen, das unerwünschte Lecken von privaten Daten oder andere schädliche Operationen, die unbeabsichtigt von den Agenten ausgeführt werden könnten.
Die Erkennung von Sicherheitsrisiken in der vielfältigen und komplexen Betriebsumgebung mobiler Geräte stellt eine erhebliche Herausforderung dar. Bisherige Sicherheitsansätze konzentrierten sich oft auf Desktop- oder Web-Plattformen und vernachlässigten die spezifischen Gegebenheiten mobiler Umgebungen. Diese unterscheiden sich durch ihre Vielfalt an Anwendungen, dynamische Interaktionskontexte und den Zugriff auf sensible Nutzerdaten wie Kontakte, Standortinformationen oder Finanzdaten.
Ein weiteres Problem besteht darin, dass bestehende Evaluierungsinfrastrukturen für mobile Agenten oft keine umfassende Beobachtbarkeit auf Systemebene bieten. Sie erfassen weder Laufzeitprozesse, Berechtigungsänderungen noch Hintergrund-Dateivorgänge – allesamt kritische Signale, die subtile, aber gefährliche Verhaltensweisen aufdecken könnten. Zudem konzentrieren sich die meisten Erkennungsmethoden auf die Analyse einzelner Schritte, was unzureichend ist, um Risiken zu identifizieren, die sich über mehrere Schritte und im Kontext sich entwickelnder Systemzustände manifestieren.
Um diesen Herausforderungen zu begegnen, wurde OS-Sentinel entwickelt, ein neuartiges hybrides Sicherheitserkennungs-Framework. Es kombiniert zwei komplementäre Ansätze:
Das Ziel ist es, eine umfassendere und zuverlässigere Erkennung von unsicheren Operationen in mobilen KI-Agenten zu ermöglichen.
Als Basis für die Forschung und Entwicklung von OS-Sentinel wurden zwei zentrale Komponenten geschaffen:
Der Datenpipeline-Prozess beinhaltet die Kuratierung von menschengeschriebenen Anweisungen für risikoreiche Szenarien, die Ausführung des Agenten in MobileRisk-Live, die menschliche Verfeinerung und Vervollständigung der Trajektorien sowie die mehrstufige Sicherheitskennzeichnung. Dies stellt sicher, dass die Trajektorien kohärente, realistische Arbeitsabläufe widerspiegeln und eine präzise Identifizierung des Risikobeginns ermöglichen.
OS-Sentinel kombiniert einen Formalen Verifizierer und einen VLM-basierten Kontextuellen Richter, um Risiken auf System- und Verhaltensebene zu erkennen.
Dieser Bestandteil nutzt die Systemzustandsspuren, um deterministische Erkennungsmechanismen zu implementieren. Er führt drei Arten von Prüfungen durch:
Ein Schritt wird als unsicher gekennzeichnet, wenn eine dieser Regeln verletzt wird, was eine nachvollziehbare und deterministische Erkennung konkreter Bedrohungen gewährleistet.
Dieser auf VLMs basierende Richter befasst sich mit den Einschränkungen des Formalen Verifizierers, indem er semantische Analysen für kontextabhängige Risiken (z.B. Social Engineering, unangemessene Handlungsabfolgen) bereitstellt, die nicht durch regelbasierte Prüfungen erfasst werden können. Er analysiert Agentenübergänge zwischen Zuständen, um Verhaltensabsichten und Ausführungslogik zu interpretieren.
Das endgültige Urteil ist eine logische ODER-Verknüpfung der Ergebnisse beider Komponenten. Dies stellt sicher, dass keine explizite Verletzung unentdeckt bleibt und gleichzeitig nuancierte, kontextabhängige Risiken abgedeckt werden. Die generative Natur des VLM-Richters ermöglicht zudem eine interpretierbare Risikoklassifikation, die die nachträgliche Analyse erleichtert.
Experimente mit OS-Sentinel auf dem MobileRisk-Benchmark zeigen eine signifikante Leistungssteigerung. Das Framework erreicht eine Verbesserung von 10 % bis 30 % gegenüber bestehenden Ansätzen bei der Erkennung unsicherer Operationen. Diese Überlegenheit wird auf die synergistische Kombination des Formalen Verifizierers und des Kontextuellen Richters zurückgeführt.
Der Formale Verifizierer erweist sich als besonders effektiv bei der Erkennung von Systemanomalien, wie beispielsweise Dateimanipulationen, selbst wenn keine sichtbaren Veränderungen in der Benutzeroberfläche auftreten. Ein Beispiel hierfür ist die Erkennung einer Systemdateimodifikation, die nur über die Systemzustandsspur feststellbar ist.
Der Kontextuelle Richter hingegen ist in der Lage, semantische Bedrohungen zu erkennen, die über reine Systemprüfungen hinausgehen. Dazu gehört beispielsweise das Erkennen der Übertragung von Bankkontoinformationen, selbst wenn keine direkten system-level Änderungen vorliegen. Dies unterstreicht die Fähigkeit des VLM, den Kontext und die Absicht hinter den Agentenaktionen zu interpretieren.
Die Analyse der Komponenten zeigt, dass sowohl der Formale Verifizierer als auch der Kontextuelle Richter wesentlich zur Gesamtleistung beitragen. Ihre Kombination übertrifft die Leistung jedes einzelnen Ansatzes sowohl in Bezug auf die Genauigkeit als auch auf den F1-Score über verschiedene VLM-Modelle hinweg. OS-Sentinel bietet zudem eine ausgewogenere Erkennung über eine breite Palette von Risikotypen, einschließlich destruktiver Aktionen, Datenschutzverletzungen, Sicherheitsumgehungen und Überautomatisierung, während Baselines ungleichmäßige Stärken aufweisen.
Ein weiterer wichtiger Aspekt ist die Validierung der Übereinstimmung zwischen MobileRisk-Live und MobileRisk. Diese bestätigt, dass die eingefrorenen Trajektorien die Systemzustände zuverlässig erhalten und eine reproduzierbare Evaluierung ermöglichen. Das Framework ist zudem modellagnostisch, praxistauglich für den realen Einsatz mit geringer Latenz und liefert auch mit kleineren VLM-Modellen (z.B. 7B-Modelle) robuste Ergebnisse.
Die Einführung von OS-Sentinel stellt einen wichtigen Schritt zur Verbesserung der Sicherheit von mobilen KI-Agenten dar. Durch die Kombination von formaler Verifikation und kontextueller Bewertung bietet das Framework eine umfassende Lösung, um sowohl explizite Systemverstöße als auch nuancierte, kontextabhängige Risiken zu identifizieren. Die erzielten Leistungsverbesserungen und die Robustheit des Ansatzes unterstreichen das Potenzial für die Entwicklung sichererer und zuverlässigerer autonomer mobiler Agenten. Die bereitgestellte Forschungsinfrastruktur, bestehend aus MobileRisk-Live und MobileRisk, legt zudem eine solide Grundlage für zukünftige Arbeiten in diesem kritischen Bereich der KI-Sicherheit.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen