Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Forschung im Bereich der Künstlichen Intelligenz (KI) schreitet kontinuierlich voran, insbesondere in der Fähigkeit von Systemen, komplexe Strategien zu verstehen und zu formulieren. Ein aktuelles Projekt von Tencent, das sich auf das populäre mobile MOBA-Spiel "Honor of Kings" konzentriert, beleuchtet diese Entwicklung. Die Forscher haben ein innovatives Framework namens "Think in Games" (TiG) entwickelt, das darauf abzielt, KI-Modellen nicht nur das Spielen beizubringen, sondern auch ihre strategischen Entscheidungen zu erklären. Diese Initiative könnte weitreichende Implikationen jenseits der Gaming-Welt haben.
Bestehende KI-Agenten zeigen oft eine hohe Leistungsfähigkeit in Spielen, können aber ihre Entscheidungen selten nachvollziehbar darlegen. Sprachmodelle hingegen sind in der Lage, Strategien zu diskutieren, haben jedoch Schwierigkeiten bei der direkten Anwendung im Spiel. Das TiG-Framework von Tencent wurde konzipiert, um diese Lücke zu schließen. Es kombiniert die Fähigkeit zur Ausführung von Aktionen mit der Generierung von Erklärungen für diese Aktionen, was einen wichtigen Schritt in Richtung verständlicherer und vertrauenswürdigerer KI-Systeme darstellt.
Für die Experimente nutzten die Forscher "Honor of Kings", ein Mobile-MOBA, das komplexe, teambasierte Strategien erfordert. In diesem Spiel treten zwei Teams mit jeweils fünf Spielern an, um Türme zu zerstören und Ressourcen zu kontrollieren. Das Team definierte 40 Makro-Aktionen, wie zum Beispiel "Top-Lane pushen", "Drachen sichern" oder "Basis verteidigen". Die KI musste in einer gegebenen Situation den optimalen Zug auswählen und ihre Begründung dafür liefern.
Die Modelle wurden mit anonymisierten Aufzeichnungen realer Matches trainiert, wobei sowohl gewonnene als auch verlorene Spiele berücksichtigt wurden. Die Daten wurden standardisiert und jede Bewegung mit einer spezifischen Makro-Aktion versehen. Das Training erfolgte in zwei Phasen:
Die Forscher testeten verschiedene Sprachmodelle, darunter Qwen2.5 mit 7, 14 und 32 Milliarden Parametern sowie das neuere Qwen3-14B. Zum Vergleich wurde auch Deepseek-R1, ein wesentlich größeres Modell, einbezogen. Die angewandte Methode umfasste zwei Schritte:
Die Ergebnisse zeigten, dass Qwen3-14B nach 2.000 Trainingsschritten mit überwachtem Lernen und GRPO eine Trefferquote von 90,91 Prozent bei der Auswahl korrekter strategischer Entscheidungen erreichte. Dies übertraf Deepseek-R1, das 86,67 Prozent erzielte. GRPO verbesserte die Modellgenauigkeit erheblich: Qwen-2.5-32B stieg von 66,67 auf 86,84 Prozent, und Qwen-2.5-14B verbesserte sich nach beiden Phasen von 53,25 auf 83,12 Prozent.
Ein wesentlicher Aspekt des TiG-Frameworks ist die Fähigkeit der trainierten Systeme, ihre Entscheidungen zu erklären. Beispielsweise konnte die KI einen schwachen Turm als Ziel identifizieren und vor möglichen Hinterhalten durch gegnerische Spieler warnen. Bemerkenswert ist auch, dass die auf "Honor of Kings" trainierten Modelle ihre Fähigkeiten im Textverständnis, der Lösung mathematischer Probleme und der Beantwortung allgemeiner Fragen beibehielten.
Das Forschungsteam sieht potenzielle Anwendungen dieses Frameworks über Spiele hinaus, in Bereichen, die sowohl strategisches Denken als auch klare Erklärungen erfordern. Es wird jedoch darauf hingewiesen, dass die Ergebnisse von der Qualität der zugrunde liegenden Sprachmodelle abhängen und die Übertragbarkeit des Ansatzes auf andere Domänen noch nicht abschließend geklärt ist.
Die Arbeit von Tencent reiht sich in einen breiteren Trend in der KI-Forschung ein. Projekte wie Googles "Game Arena", eine offene Plattform für den Wettbewerb fortschrittlicher Modelle in Spielen, oder ROCKET-1, ein hierarchischer Agent in Minecraft, der einfache Aufgaben mit hoher Erfolgsquote löst, zeigen die zunehmende Nutzung realer Spieldaten als Trainingsgrundlage und Benchmark für KI-Systeme.
Diese Entwicklungen unterstreichen das Potenzial von Spielen als ideale Testumgebung für die Entwicklung komplexer KI-Fähigkeiten, die weit über das Gaming hinaus Anwendung finden könnten. Die Fähigkeit, strategische Entscheidungen zu treffen und diese verständlich zu machen, ist ein entscheidender Schritt für die Integration von KI in immer anspruchsvollere Geschäftsprozesse und Anwendungen.
Tencents "Think in Games"-Framework demonstriert einen vielversprechenden Ansatz zur Entwicklung von KI-Systemen, die nicht nur leistungsfähig sind, sondern auch ihre strategischen Entscheidungen transparent machen können. Die Fähigkeit, mit kleineren Modellen größere zu übertreffen und gleichzeitig Erklärbarkeit zu gewährleisten, ist ein bedeutender Fortschritt. Diese Erkenntnisse könnten zukünftig dazu beitragen, KI-Anwendungen in verschiedenen Branchen, die strategisches Denken und nachvollziehbare Entscheidungen erfordern, zu verbessern.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen