KI für Ihr Unternehmen – Jetzt Demo buchen

KI-Modelle im Test: Super Mario als Beispiel für die Grenzen der künstlichen Intelligenz

Kategorien:
No items found.
Freigegeben:
March 11, 2025

Artikel jetzt als Podcast anhören

Inhaltsverzeichnis

    KI und Gaming: Die Grenzen großer Sprachmodelle am Beispiel von Super Mario

    Künstliche Intelligenz (KI) hat in den letzten Jahren rasante Fortschritte gemacht. Doch wie misst man den tatsächlichen Fortschritt und die "Intelligenz" dieser Systeme? Ein ungewöhnlicher Ansatz nutzt Videospiele als Testumgebung, wie ein kürzlich durchgeführtes Experiment mit dem Klassiker Super Mario Bros. zeigt.

    Super Mario als KI-Prüfstand

    Forscher des Hao AI Lab an der University of California San Diego haben verschiedene große Sprachmodelle (LLMs) an einer Emulator-Version von Super Mario Bros. getestet. Die KI-Modelle, darunter Anthropics Claude und Googles Gemini, erhielten Anweisungen wie "Bei Hindernis oder Gegnern in der Nähe, nach links ausweichen" sowie Screenshots aus dem Spiel. Daraufhin generierten die LLMs Python-Code, um Mario zu steuern.

    Unterschiedliche Leistungen und die Grenzen der "Reflexe"

    Die Ergebnisse des Experiments waren aufschlussreich: Anthropics Claude 3.7 schnitt am besten ab, während andere Modelle wie Gemini und GPT-4o Schwierigkeiten hatten, im Spielverlauf erfolgreich zu sein. Interessanterweise zeigten sogenannte "Reasoning"-Modelle, die Probleme schrittweise analysieren, schlechtere Leistungen als "Non-Reasoning"-Modelle. Dies liegt vermutlich an der längeren Entscheidungszeit der "Reasoning"-Modelle, die im schnellen Spielgeschehen von Super Mario Bros. einen Nachteil darstellt.

    Der Test verdeutlicht, dass die im Experiment gemessenen Fähigkeiten eher die "Reflexe" der KI erfassen und somit nur einen Teilaspekt von dem abbilden, was gemeinhin als "Intelligenz" verstanden wird.

    Spiele als Testumgebung: Chancen und Grenzen

    Die Verwendung von Videospielen zur Evaluierung von KI ist nicht neu. Spiele bieten eine kontrollierte Umgebung mit klaren Regeln und Zielen, die es ermöglichen, die Lern- und Anpassungsfähigkeit von KI-Systemen zu untersuchen. Allerdings wird die Aussagekraft solcher Tests von Experten kritisch diskutiert. Die vereinfachte und abstrakte Natur von Videospielen spiegelt nicht die Komplexität der realen Welt wider. Daher lassen sich die Ergebnisse nur bedingt auf andere Anwendungsbereiche übertragen.

    Die Herausforderung der KI-Evaluation

    Die Schwierigkeit, KI-Systeme umfassend zu bewerten, geht über die Grenzen von Gaming-Tests hinaus. Die Vielzahl unterschiedlicher Benchmarks und Tests erschwert eine klare Aussage über den tatsächlichen Entwicklungsstand der KI. Selbst Experten wie OpenAI-Mitbegründer Andrej Karpathy sprechen von einer "Evaluationskrise" und betonen die Herausforderung, die Intelligenz dieser Systeme präzise zu messen.

    Mindverse: KI-Lösungen für die Herausforderungen der Zukunft

    Mindverse, ein deutsches Unternehmen, spezialisiert sich auf die Entwicklung von KI-Lösungen, die Unternehmen dabei unterstützen, die Potenziale der Künstlichen Intelligenz zu nutzen. Von Chatbots und Voicebots über KI-Suchmaschinen bis hin zu maßgeschneiderten Wissensmanagementsystemen bietet Mindverse ein breites Spektrum an KI-basierten Tools und Dienstleistungen. In einer Zeit, in der die Bewertung und der Einsatz von KI zunehmend komplexer werden, bietet Mindverse Unternehmen die Möglichkeit, die Herausforderungen der Zukunft mit innovativen KI-Lösungen zu meistern.

    Bibliographie: - t3n.de: KI spielt Super Mario: Warum selbst die schlauesten LLMs scheitern - t3n.de: Schlagwort: Künstliche Intelligenz - t3n.de: News - Threads.net: Wie misst man die Intelligenz von KI? - t3n.de: Schlagwort: Gaming - fz-juelich.de: Studie mit hoher JSC-Beteiligung zeigt dramatisches Scheitern von LLMs im logischen Denken
    Mindverse vs ChatGPT Plus Widget

    Warum Mindverse Studio?

    Entdecken Sie die Vorteile gegenüber ChatGPT Plus

    Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

    🚀 Mindverse Studio

    Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

    ChatGPT Plus

    ❌ Kein strukturierter Dokumentenvergleich

    ❌ Keine Bearbeitung im Dokumentkontext

    ❌ Keine Integration von Unternehmenswissen

    VS

    Mindverse Studio

    ✅ Gezielter Dokumentenvergleich mit Custom-Prompts

    ✅ Kontextbewusste Textbearbeitung im Editor

    ✅ Wissensbasierte Analyse & Zusammenfassungen

    📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

    Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

    ChatGPT Plus

    ❌ Nur ein Modellanbieter (OpenAI)

    ❌ Keine Modellauswahl pro Use Case

    ❌ Keine zentrale Modellsteuerung für Teams

    VS

    Mindverse Studio

    ✅ Zugriff auf über 50 verschiedene KI-Modelle

    ✅ Modellauswahl pro Prompt oder Assistent

    ✅ Zentrale Steuerung auf Organisationsebene

    🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

    OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
    Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
    Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
    Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

    ChatGPT Plus

    ❌ Keine echte Teamkollaboration

    ❌ Keine Rechte- oder Rollenverteilung

    ❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

    VS

    Mindverse Studio

    ✅ Teamübergreifende Bearbeitung in Echtzeit

    ✅ Granulare Rechte- und Freigabeverwaltung

    ✅ Zentrale Steuerung & Transparenz auf Organisationsebene

    👥 Kollaborative KI für Ihr gesamtes Unternehmen

    Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

    Bereit für den nächsten Schritt?

    Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

    🎯 Kostenlose Demo buchen

    Wie können wir Ihnen heute helfen?

    Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
    Herzlichen Dank! Deine Nachricht ist eingegangen!
    Oops! Du hast wohl was vergessen, versuche es nochmal.

    🚀 Neugierig auf Mindverse Studio?

    Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

    🚀 Demo jetzt buchen