Jetzt reinschauen – neue Umgebung live

OpenAI verbessert Browser-Agenten Operator durch neues o3-Modell

Kategorien:
No items found.
Freigegeben:
May 27, 2025

Artikel jetzt als Podcast anhören

OpenAIs Browser-Agent Operator erhält leistungsstarkes Upgrade mit o3-Modell

OpenAI hat seinen KI-gestützten Browser-Agenten „Operator“ einem signifikanten Upgrade unterzogen. Das neue Modell, basierend auf der o3-Architektur, ersetzt die bisherige Version, die auf GPT-4o basierte. Dieses Update verspricht eine deutlich verbesserte Leistung und Präzision bei der Interaktion mit Webseiten und der Automatisierung von Aufgaben.

Operator, von OpenAI als „Computer-Using Agent“ (CUA) bezeichnet, ist in der Lage, Webseiten wie ein Mensch zu bedienen. Er kann scrollen, klicken und Text eingeben, um komplexe Aufgaben zu automatisieren. Das Ziel ist die Automatisierung von Tätigkeiten, die bisher menschliche Eingriffe erforderten, insbesondere im Bereich der Wissensarbeit. Operator wurde erstmals im Januar 2025 als Forschungsprojekt vorgestellt und ist aktuell als Research-Preview in ChatGPT Pro weltweit verfügbar. Die API-Nutzung basiert weiterhin auf GPT-4o.

Verbesserte Struktur, höhere Erfolgsquote

Mit der Umstellung auf das o3-Modell soll Operator robuster und effektiver bei der Erledigung von Aufgaben im Web werden. OpenAI gibt an, dass das neue Modell präziser mit Browsern interagiert und Antworten liefert, die besser strukturiert und umfassender sind. Interne Tests zeigen, dass Operator nun komplexe Arbeitsabläufe häufiger erfolgreich bewältigt.

In Benchmarks zur Browser-Automatisierung, wie OSWorld und WebArena, übertrifft der o3-gestützte Operator die ältere 4o-Version deutlich. Auch Nutzertests zeigen eine verbesserte Antwortqualität im Vergleich zum Vorgängermodell.

Sichere Webautomatisierung im Fokus

Das o3-Operator-Modell basiert auf der gleichen Architektur wie andere o3-Modelle, wurde jedoch speziell für die Bedienung von Computerschnittstellen trainiert. OpenAI betont, dass das Modell mit zusätzlichen Sicherheitsdaten feinabgestimmt wurde, um zu lernen, wann Bestätigungen oder Ablehnungen erforderlich sind. Obwohl o3-Operator die Programmierfähigkeiten von o3 erbt, hat er keinen direkten Zugriff auf Programmierumgebungen oder Terminals.

Die Automatisierung von Browsern birgt Risiken. Die Agenten müssen Webseiteninhalte analysieren und als Anweisungen – im Wesentlichen als Prompts – interpretieren. Dies bedeutet, dass Angreifer bösartige Webseiten erstellen könnten, um den Agenten zu unerwünschten Aktionen zu verleiten, wie z. B. der Eingabe sensibler Daten in gefälschte Anmeldeformulare. OpenAI hat dementsprechend die Sicherheit des Systems priorisiert.

Ausblick und Verfügbarkeit

Die Einführung des o3-Modells für Operator stellt einen wichtigen Schritt in der Entwicklung von KI-gestützten Browser-Agenten dar. Die verbesserte Präzision, Struktur und Erfolgsrate versprechen eine effizientere Automatisierung von Web-basierten Aufgaben. Während die Research-Preview in ChatGPT Pro bereits Einblicke in die neuen Fähigkeiten bietet, bleibt abzuwarten, wann die o3-Funktionalität auch über die API verfügbar sein wird. Die Weiterentwicklung und der Fokus auf Sicherheit unterstreichen das Potenzial von Operator, die Arbeitsweise im digitalen Raum nachhaltig zu verändern.

Bibliographie: - https://the-decoder.com/openais-operator-agent-gets-o3-upgrade-for-more-precise-browser-control/ - https://www.bleepingcomputer.com/news/artificial-intelligence/openai-confirms-operator-agent-is-now-more-accurate-with-o3/ - https://the-decoder.de/openais-operator-agent-erhaelt-o3-upgrade-fuer-praezisere-browser-steuerung/ - https://www.binance.com/en/square/post/24670787044522 - https://ground.news/article/openai-upgrades-operator-ai-for-enhanced-web-automation - https://openai.com/index/introducing-operator/ - https://techcrunch.com/2025/05/23/openai-upgrades-the-ai-model-powering-its-operator-agent/ - https://venturebeat.com/ai/openai-updates-operator-to-o3-making-its-200-monthly-chatgpt-subscription-more-enticing/ - https://help.openai.com/en/articles/10421097-operator - https://www.capacitymedia.com/article/2ebttl4shefb99qcc2nls/news/article-openai-unveils-operator-a-browser-based-ai-agent-to-revolutionise-task-automation
Was bedeutet das?

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.