Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Google DeepMind hat einen neuen KI-Agenten namens SIMA 2 vorgestellt, der eine bemerkenswerte Weiterentwicklung im Bereich der künstlichen Intelligenz darstellt. Dieser Agent wurde entwickelt, um in virtuellen 3D-Umgebungen autonom zu lernen und Aufgaben zu lösen, was einen signifikanten Schritt über die Fähigkeiten seines Vorgängers SIMA 1 hinausgeht. Die Integration des leistungsstarken Gemini-Modells spielt dabei eine zentrale Rolle.
Die erste Version von SIMA, der Scalable Instructable Multiworld Agent, konnte zwar einfache Sprachbefehle ausführen, agierte jedoch primär als Befehlsempfänger. SIMA 2 hingegen wurde konzipiert, um Aufgaben zu verstehen, Schlussfolgerungen zu ziehen und eigenständige Entscheidungen zu treffen. Dies ermöglicht eine Interaktion, die weniger an die Eingabe von Befehlen und mehr an eine Zusammenarbeit mit einem digitalen Partner erinnert.
Der Agent navigiert durch komplexe 3D-Welten, indem er visuelle Informationen auf dem Bildschirm analysiert und Tastatur- sowie Mauseingaben simuliert, ohne direkten Zugriff auf interne Spieldaten. Diese Interaktionsweise, die der eines menschlichen Spielers ähnelt, qualifiziert SIMA 2 als "verkörperten Agenten". DeepMind betont, dass das System seine Absichten erläutern, Zwischenschritte beschreiben und auf weiterführende Fragen reagieren kann, was die Interaktion wesentlich kooperativer gestaltet.
Eine der Hauptziele von SIMA 2 war die Fähigkeit, Aufgaben in Spielen zu lösen, die dem Agenten zuvor unbekannt waren. In Tests mit Spielen wie dem Minecraft-basierten MineDojo und dem neu veröffentlichten ASKA zeigte SIMA 2 deutlich höhere Erfolgsquoten im Vergleich zu SIMA 1. Während SIMA 1 bei solchen Aufgaben Schwierigkeiten hatte und nur 15 bis 30 Prozent erfolgreich abschloss, erreichte SIMA 2 in diesen neuen Umgebungen eine Erfolgsquote von 45 bis 75 Prozent.
SIMA 2 demonstriert zudem die Fähigkeit zur Generalisierung abstrakter Konzepte. Beispielsweise kann das System das in einem Spiel gelernte Konzept des "Erntens" auf das "Abbauen" in einem anderen Spiel übertragen. Diese Form des Transferlernens ist entscheidend für KI-Systeme, die sich an neue und unbekannte Bedingungen anpassen sollen. Darüber hinaus verarbeitet SIMA 2 multimodale Eingaben wie Sprache, Bilder und Emojis und kann komplexere, mehrstufige Anweisungen bewältigen. Die verbesserte Architektur ermöglicht zudem längere Echtzeitinteraktionen bei höheren Auflösungen.
Ein wesentlicher Fortschritt von SIMA 2 ist die Fähigkeit zur Selbstverbesserung. Der Agent kann neue Aufgaben durch Versuch und Irrtum erlernen, ohne auf menschliche Trainingsdaten angewiesen zu sein. Dieser Prozess beginnt mit Beispielen und Feedback, die von Gemini generiert werden. Nach dieser initialen Grundlage erstellt SIMA 2 eigene Trainingsdaten, bewertet seine Leistung und nutzt dieses Feedback, um sein weiteres Lernen autonom zu steuern.
Die Fähigkeiten zur Selbstverbesserung wurden auch in Verbindung mit DeepMinds Projekt Genie 3 getestet, das neue 3D-Welten aus Text- oder Bildprompts generiert. SIMA 2 konnte sich selbst in diesen zuvor unbekannten, prozedural generierten Umgebungen anpassen und Aufgaben erfolgreich ausführen.
Trotz der beeindruckenden Fortschritte weist DeepMind darauf hin, dass SIMA 2 noch Grenzen hat. Der Agent kämpft weiterhin mit Aufgaben, die eine langfristige Planung oder mehrere sequentielle Schritte erfordern. Auch der Arbeitsspeicher ist begrenzt, sodass nur eine begrenzte Menge an Kontextinformationen gleichzeitig verarbeitet werden kann. Die Simulation von Maus- und Tastatureingaben bleibt für präzise Steuerung unzuverlässig, und das visuelle Verständnis in komplexen 3D-Szenen stellt weiterhin eine große Herausforderung dar. Diese Einschränkungen verdeutlichen, wie weit die aktuellen Systeme noch von einer wirklich allgemeinen Intelligenz entfernt sind.
DeepMind sieht SIMA 2 als einen Schritt in Richtung physischer KI-Systeme, die in der realen Welt agieren können. Fähigkeiten wie Navigation, Werkzeuggebrauch und einfache Zusammenarbeit werden als grundlegende Bausteine für zukünftige Roboterassistenten angesehen. Derzeit ist SIMA 2 jedoch ein reines Forschungsprojekt ohne direkte kommerzielle Anwendungen. Der Zugang zu SIMA 2 ist auf eine kleine Gruppe von akademischen und Spieleindustrie-Partnern beschränkt. Ziel ist es, technische Schwächen und potenzielle Risiken besser zu verstehen, bevor eine breitere Erprobung beginnen kann.
Die Entwicklungen rund um SIMA 2 unterstreichen das Potenzial von KI-Agenten, die nicht nur auf spezifische Aufgaben trainiert sind, sondern auch in der Lage sind, in neuen, komplexen Umgebungen zu lernen und sich anzupassen. Dies ist ein entscheidender Schritt auf dem Weg zur Entwicklung einer Allgemeinen Künstlichen Intelligenz (AGI), die in der Lage ist, eine Vielzahl intellektueller Aufgaben zu bewältigen, die typischerweise menschliche Intelligenz erfordern. Die Fähigkeit zur autonomen Generierung von Trainingsdaten und zur Selbstverbesserung könnte die Skalierbarkeit und Effizienz des KI-Trainings erheblich steigern und den Weg für zukünftige Anwendungen in der Robotik und darüber hinaus ebnen.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen