Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Erstellung von Diagrammen für wissenschaftliche Publikationen stellt eine zeitaufwendige und ressourcenintensive Aufgabe dar, die oft spezialisierte Designkenntnisse erfordert. In diesem Kontext hat Google Cloud AI Research in Zusammenarbeit mit der Peking University ein innovatives KI-Framework namens "PaperBanana" vorgestellt. Dieses System zielt darauf ab, den Prozess der Generierung publikationsreifer wissenschaftlicher Illustrationen zu automatisieren und somit eine bedeutende Arbeitserleichterung für Forschende zu schaffen.
PaperBanana unterscheidet sich von herkömmlichen Ansätzen durch sein agentenbasiertes Design, das die Komplexität der Diagrammerstellung in fünf spezialisierte KI-Agenten unterteilt. Diese Agenten arbeiten koordiniert zusammen, um aus textuellen Methodenbeschreibungen visuell ansprechende und inhaltlich präzise Diagramme zu erzeugen:
Die zugrunde liegenden Modelle für PaperBanana sind Googles proprietäre Gemini-3-Pro und Nano-Banana-Pro Modelle, ergänzt durch GPT-Image-1.5 für die Bildgenerierung. Diese Kombination ermöglicht es dem System, die "kommunikative Absicht" der Forschenden zu verstehen und hochwertige visuelle Ergebnisse zu liefern.
Zur rigorosen Evaluierung von PaperBanana wurde ein eigener Benchmark, der "PaperBananaBench", erstellt. Dieser umfasst 292 Testfälle von Methodikdiagrammen aus NeurIPS 2025-Publikationen. Die Diagramme wurden anhand von Kriterien wie Inhaltsgenauigkeit, Prägnanz, Lesbarkeit und Ästhetik bewertet.
In direkten Vergleichen übertraf PaperBanana einfache Bildgenerierungsmodelle in allen Kategorien. Die größte Verbesserung zeigte sich bei der Prägnanz mit einem Anstieg von 37,2 Prozent. Die Lesbarkeit verbesserte sich um 12,9 Prozent und die Ästhetik um 6,6 Prozent. Besonders bemerkenswert ist, dass menschliche Prüfer die von PaperBanana erstellten Diagramme in fast 73 Prozent der Fälle gegenüber anderen Lösungen bevorzugten.
Ein entscheidender Vorteil von PaperBanana bei statistischen Darstellungen ist die Fähigkeit, statt direkter Bilder Python-Code für Bibliotheken wie Matplotlib zu generieren. Dies gewährleistet eine hohe numerische Genauigkeit, die bei reinen Bildgenerierungsmodellen oft eine Herausforderung darstellt. Diese duale Herangehensweise berücksichtigt die unterschiedlichen Anforderungen an konzeptionelle Klarheit bei Methodikdiagrammen und exakte Datenrepräsentation bei statistischen Plots.
Trotz der beeindruckenden Ergebnisse weist PaperBanana noch Limitationen auf. Die Inhaltsgenauigkeit erreichte lediglich einen Wert von 45,8 Prozent, was unterhalb der menschlichen Referenz von 50 Prozent liegt. Häufige Fehler betreffen Details wie falsch ausgerichtete Verbindungslinien oder Pfeile, die in die falsche Richtung zeigen. Diese feingranularen Konnektivitätsprobleme werden vom Kritiker-Agenten, der visuell-sprachliche Modelle nutzt, nicht immer erkannt.
Ein weiteres Problem stellt das Ausgabeformat dar: PaperBanana generiert Rasterbilder anstelle der von Akademikern bevorzugten Vektorgrafiken. Rasterbilder skalieren schlechter und sind nach der Generierung nicht einfach editierbar. Die Forschenden schlagen vor, 4K-Bilder als Behelfslösung für Druckqualität zu generieren und erwägen längerfristig die Entwicklung von KI-Agenten, die Vektorsoftware wie Adobe Illustrator direkt bedienen können.
Zukünftige Entwicklungen könnten die Möglichkeit zur interaktiven Verfeinerung umfassen, bei der Forschende durch konversationelle Eingaben Diagramme präzise anpassen können. Auch die Integration in bestehende Schreib-Workflows, beispielsweise über Plugins für LaTeX-Editoren oder Textverarbeitungsprogramme, wird als wichtiger Schritt zur weiteren Optimierung gesehen.
Google hat PaperBanana als kommerziellen Dienst eingeführt, was die wachsende Bedeutung der Umwandlung von KI-Forschung in marktfähige Produkte unterstreicht. Die Preisgestaltung erfolgt über ein abonnementbasiertes Kreditmodell, das verschiedene Nutzersegmente anspricht, von einzelnen Forschenden bis hin zu großen Forschungseinrichtungen. Ein Basisplan kostet beispielsweise 14,90 USD pro Monat für 10 Credits, wobei jede Diagrammgenerierung einen Credit verbraucht.
Die Automatisierung der wissenschaftlichen Illustration passt in den breiteren Trend der "agentischen KI-Systeme", die zunehmend Aufgaben übernehmen, die Urteilsvermögen, Kreativität und Domänenexpertise erfordern. PaperBanana positioniert sich hier als spezialisiertes Werkzeug, das über die Fähigkeiten generischer Bildgeneratoren hinausgeht und gleichzeitig den manuellen Aufwand traditioneller Designtools reduziert.
Die Zeitersparnis durch PaperBanana könnte erheblich sein. Schätzungen zufolge könnten Forschende, die jährlich mehrere Artikel veröffentlichen, 100 bis 200 Stunden pro Jahr einsparen, die sie stattdessen in die eigentliche Forschung investieren könnten. Dies führt nicht nur zu einer Effizienzsteigerung, sondern auch zu einer Standardisierung der Qualität wissenschaftlicher Abbildungen, was wiederum die Arbeit von Gutachtern und Redakteuren erleichtern könnte.
PaperBanana stellt einen signifikanten Fortschritt in der Automatisierung wissenschaftlicher Arbeitsabläufe dar. Durch den Einsatz eines koordinierten Multi-Agenten-Systems adressiert es eine langjährige Herausforderung in der akademischen Welt. Obwohl noch Verbesserungsbedarf besteht, insbesondere bei der Detailgenauigkeit und den Ausgabeformaten, bietet PaperBanana bereits heute eine vielversprechende Lösung, die das Potenzial hat, die Art und Weise, wie wissenschaftliche Diagramme erstellt und kommuniziert werden, grundlegend zu verändern.
Bibliography: - Kemper, J. (2026, 7. Februar). Google's PaperBanana uses five AI agents to auto-generate scientific diagrams. The Decoder. - Zhu, D., Meng, R., Song, Y., Wei, X., Li, S., Pfister, T., & Yoon, J. (o. D.). PaperBanana: Automating Academic Illustration for AI Scientists. Abrufbar unter https://dwzhu-pku.github.io/PaperBanana/ - Vet AI. (2026, 3. Februar). The Google Agentic AI That Creates Your Scientific Diagrams. YouTube. - Automating Academic Illustration for AI Scientists. (2026, 30. Januar). alphaXiv. - Rijo, L. (2026, 6. Februar). Google’s PaperBanana: AI agent beats PhD experts at scientific diagrams. PPC Land. - Hong, H. (2026, 5. Februar). Why “Paper Banana” is Going Viral in Academic Circles. WeShop AI Blog. - Zhu, D., Meng, R., Song, Y., Wei, X., Li, S., Pfister, T., & Yoon, J. (2026, 30. Januar). PaperBanana: Automating Academic Illustration for AI Scientists. arXiv. - Pachaar, A. (2026, 3. Februar). Google just dropped another banger! PaperBanana: This paper automates academic illustration for AI scientists. The figures in this paper were drawn by the system described in the paper… LinkedIn. - Artificial Intelligence & Deep Learning. (o. D.). Google AI introduces PaperBanana framework for … Facebook. - Pang, W., Lin, K. Q., Jian, X., He, X., & Torr, P. (2025, 27. Mai). Paper2Poster: Towards Multimodal Poster Automation from Scientific Papers. arXiv.Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen