Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Entwicklung effizienter Vision-Language-Action (VLA) Policies ist ein zentraler Aspekt für den praktischen Einsatz von Robotern. Herkömmliche Ansätze erfordern jedoch oft immense Rechenleistungen und Ressourcen. Aktuelle diffusionsbasierte VLA-Modelle benötigen Milliarden von Parametern und riesige Datensätze, um eine zufriedenstellende Performance zu erreichen. Ein kürzlich veröffentlichtes Paper präsentiert FLOWER, eine neue VLA-Policy, die diese Herausforderungen durch einen innovativen Ansatz adressiert.
FLOWER, mit seinen 950 Millionen Parametern, stellt eine signifikante Reduktion gegenüber bestehenden, deutlich größeren Modellen dar. Dieser Fortschritt wird durch zwei wesentliche Beiträge ermöglicht: die intermediäre Modalitätsfusion und die aktionsspezifische Global-AdaLN-Konditionierung. Die intermediäre Modalitätsfusion optimiert die Ressourcennutzung, indem sie bis zu 50% der Schichten des Sprachmodells (LLM) reduziert und die Kapazität auf den Diffusionskopf konzentriert. Die aktionsspezifische Global-AdaLN-Konditionierung ermöglicht eine modulare Anpassung und reduziert die Parameteranzahl um weitere 20%. Diese kombinierten Ansätze führen zu einem deutlich effizienteren Modell ohne Einbußen bei der Leistung.
Das Training von FLOWER benötigte lediglich 200 Stunden auf H100 GPUs – ein bemerkenswert geringer Ressourcenaufwand im Vergleich zu herkömmlichen Trainingsmethoden. Trotz des reduzierten Trainingsaufwands erzielt FLOWER eine wettbewerbsfähige Leistung im Vergleich zu deutlich größeren VLA-Modellen. Getestet wurde das Modell an 190 Aufgaben, verteilt auf zehn Simulations- und Realwelt-Benchmarks. Die Ergebnisse zeigen eine bemerkenswerte Robustheit über diverse Roboter-Implementierungen hinweg. Besonders hervorzuheben ist die Erreichung eines neuen State-of-the-Art (SoTA) von 4.53 auf dem CALVIN ABC Benchmark.
Um die breite Anwendung und Weiterentwicklung zu fördern, stellen die Entwickler von FLOWER Code, vorab trainierte Gewichte und Demos öffentlich zur Verfügung. Dies ermöglicht es der Forschungsgemeinschaft, das Modell weiter zu untersuchen, zu verbessern und in eigene Anwendungen zu integrieren. Die Veröffentlichung von FLOWER repräsentiert einen wichtigen Schritt hin zu einer Demokratisierung von leistungsfähigen, aber gleichzeitig ressourcenschonenden VLA-Policies für die Robotik.
Die Ergebnisse des FLOWER-Projekts sind vielversprechend und zeigen das Potential innovativer Ansätze zur Optimierung von VLA-Policies. Die Reduktion der Parameteranzahl und des Trainingsaufwands ohne signifikante Leistungseinbußen ist ein bedeutender Fortschritt. Dies eröffnet neue Möglichkeiten für die Entwicklung und den Einsatz von Robotern in verschiedenen Anwendungsbereichen, insbesondere dort, wo Ressourcen begrenzt sind oder Echtzeitfähigkeit entscheidend ist. Die Verfügbarkeit des Codes und der vorab trainierten Gewichte ermöglicht es Unternehmen und Forschungseinrichtungen, FLOWER als Grundlage für eigene Entwicklungen zu nutzen und so die Innovation im Bereich der Robotik voranzutreiben. Zukünftige Forschungsarbeiten könnten sich auf die Erweiterung der Fähigkeiten von FLOWER und die Anpassung an noch komplexere Aufgaben konzentrieren.
FLOWER präsentiert einen vielversprechenden Ansatz zur Entwicklung effizienter und leistungsfähiger VLA-Policies. Die Kombination aus intermediärer Modalitätsfusion und aktionsspezifischer Global-AdaLN-Konditionierung führt zu einem Modell, das sowohl ressourceneffizient als auch leistungsstark ist. Die öffentliche Verfügbarkeit des Codes und der vorab trainierten Gewichte unterstreicht das Engagement der Entwickler für Transparenz und kollaborative Forschung. FLOWER ist ein wichtiger Beitrag zur Demokratisierung von fortschrittlichen Technologien in der Robotik und birgt ein hohes Potential für zukünftige Anwendungen.
Bibliography - https://www.arxiv.org/abs/2509.04996 - https://openreview.net/forum?id=ifo8oWSLSq - https://www.researchgate.net/publication/395339427_FLOWER_Democratizing_Generalist_Robot_Policies_with_Efficient_Vision-Language-Action_Flow_Policies - https://huggingface.co/papers/2509.04996 - https://arxiv.org/html/2509.04996v1 - https://papers.cool/arxiv/2509.04996 - https://ui.adsabs.harvard.edu/abs/2025arXiv250904996R/abstract - https://openreview.net/pdf/d097b855210f69fd9654795b0134585a65933cfc.pdf - https://mbreuss.github.io/ - https://github.com/intuitive-robots/flower_vla_calvinLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen