Künstliche Intelligenz (KI) und insbesondere große Sprachmodelle (LLMs) haben in den letzten Jahren enorme Fortschritte gemacht. Ein Schlüssel zu ihrer Leistungsfähigkeit liegt in der Fähigkeit, komplexe Denkprozesse, sogenannte "Chains-of-Thought" (CoTs), durchzuführen. Doch wie genau diese Denkprozesse ablaufen und wie sie beeinflusst werden können, ist bisher nur unzureichend erforscht. Ein neues Framework, die "CoT-Enzyklopädie", verspricht hier Abhilfe.
Bisherige Versuche, die Denkstrategien von LLMs zu kategorisieren, basierten oft auf vorgegebenen Strategietypen. Diese Ansätze sind jedoch durch die menschliche Intuition begrenzt und können die Vielfalt der tatsächlichen Modellverhalten nicht vollständig erfassen. Sie bieten somit nur ein unvollständiges Bild der komplexen Vorgänge innerhalb der KI.
Die CoT-Enzyklopädie verfolgt einen Bottom-up-Ansatz zur Analyse und Steuerung von KI-Denkprozessen. Das Framework extrahiert automatisch verschiedene Denkkriterien aus den von LLMs generierten CoTs. Diese Kriterien werden in einen semantischen Raum eingebettet und anschließend in repräsentative Kategorien gruppiert. Daraus werden kontrastive Rubriken abgeleitet, die das jeweilige Denkverhalten interpretierbar machen.
Im Vergleich zu bisherigen Methoden bietet die CoT-Enzyklopädie deutlich umfassendere und interpretierbarere Analysen, wie menschliche Evaluationen zeigen. Darüber hinaus ermöglicht das Framework, die von einem Modell wahrscheinlich verwendete Strategie vorherzusagen und es gezielt zu effektiveren Alternativen zu lenken. Dies eröffnet neue Möglichkeiten zur Optimierung und Steuerung von KI-Modellen.
Die Forschung mit der CoT-Enzyklopädie hat bereits zu überraschenden Erkenntnissen geführt. So hat sich gezeigt, dass das Format der Trainingsdaten (z.B. Freitext vs. Multiple-Choice) einen deutlich größeren Einfluss auf das Denkverhalten eines Modells hat als die Domäne der Daten. Diese Erkenntnis unterstreicht die Bedeutung eines formatbewussten Modelldesigns.
Die CoT-Enzyklopädie bietet ein vielversprechendes Werkzeug für die Analyse und Steuerung von KI-Denkprozessen. Durch das bessere Verständnis der zugrundeliegenden Mechanismen können KI-Modelle effizienter trainiert und ihre Leistung gesteigert werden. Dies ist besonders relevant für Unternehmen wie Mindverse, die maßgeschneiderte KI-Lösungen wie Chatbots, Voicebots, KI-Suchmaschinen und Wissenssysteme entwickeln. Die CoT-Enzyklopädie könnte dazu beitragen, die Leistungsfähigkeit und Zuverlässigkeit dieser Systeme weiter zu verbessern.
Bibliographie: Lee, S., Kim, S., Seo, M., Jo, Y., Go, D., Hwang, H., Park, J., Yue, X., Welleck, S., Neubig, G., Lee, M., & Seo, M. (2025). The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a Reasoning Model will Think. arXiv preprint arXiv:2505.10185. Efficient Reasoning Models: A Survey. National University of Singapore (April 2025). [Facebook Post]. DeepNetGroup.