Für Teams, Einzelnutzer, Kanzleien und Transkription – derselbe Mindverse Look, klar aufgeteilt nach Anwendungsfall.
für Teams und Unternehmen
Die Plattform für Unternehmen, die eigene KI-Workflows, Wissensdatenbanken und Assistenten produktiv einsetzen möchten.
für Einzelnutzer und Creator
Der einfachste Einstieg in das Mindverse-Ökosystem für Content, Recherche, Bilder, Audio und produktives Arbeiten.
für Juristen und Kanzleien
Die spezialisierte KI-Lösung für juristische Recherche, Vertragsarbeit und kanzleispezifische Workflows.
für Audio, Meetings und Transkription
Schnelle KI-Transkription für Audiodateien und Meetings – ideal zum sofortigen Start oder für regelmäßige Nutzung.

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Alibabas Qwen-Team hat mit Qwen3.7-Plus ein multimodales Modell veröffentlicht, das auf dem textbasierten Qwen3.7 aufbaut. Es integriert visuelle Wahrnehmung mit klassischen Agentenfunktionen wie Kodierung und Werkzeugnutzung. Dieses Modell wird als "multimodaler interaktiver Hybrid-Agent" positioniert und ist darauf ausgelegt, reale Szenen zu erkennen, Bildschirminhalte zu lesen, grafische Schnittstellen zu bedienen, Code aus visuellen Vorlagen zu generieren und mobile Anwendungen end-to-end zu navigieren. Die Interaktion erfolgt dabei über GUI-Klicks und Befehlszeilenanweisungen innerhalb desselben Agenten-Loops.
Das Qwen-Team demonstrierte die Fähigkeiten von Qwen3.7-Plus, indem es ein hybrides Agentensystem eine englische Vokabel-Lern-App entwickeln ließ. Der Agent agierte über elf Stunden autonom und generierte dabei mehr als 10.000 Zeilen Code über 1.000 Agentenaufrufe hinweg. Dieser Prozess umfasste die Dokumentation der Anforderungen, die automatisierte Codegenerierung, Installation, Erstellung von Testfällen, GUI-basiertes Testen, parallele Testszenarien und unabhängiges Versionsmanagement.
Eine weitere Demonstration zeigte, wie der Agent native macOS-Aktien-Apps nachbildete. Dies geschah durch autonome Bedienung der App, Analyse der UI-Struktur und Generierung von SwiftUI-Code. Anschließend wurde eine externe API für Echtzeit-Aktienkurse angebunden, die App kompiliert und zehn Funktionstests eigenständig durchgeführt, darunter Preissuchen und Suchfilter.
Ein dritter Anwendungsfall betraf einen Browser-Agenten über die "Qwen for Chrome"-Sidebar-Erweiterung. Nach Benutzererlaubnis wechselte das Modell in den Agentenmodus und führte Aufgaben in einer Cloud-Konsole aus, beispielsweise den Kauf der günstigsten verfügbaren virtuellen Serverinstanz, einschließlich der Konfiguration von Image, Speicher und Sicherheitsgruppen. In einer Folgeaufgabe übernahm der Agent auch Skalierung und Wartung.
Die veröffentlichten Benchmarks von Qwen zeigen, dass das Modell besonders gut in der Bedienung grafischer Benutzeroberflächen ist. Auf AndroidWorld und ScreenSpot Pro übertrifft Qwen3.7-Plus Modelle wie GPT-5.4 (xhigh), Opus 4.6 Max und Gemini 3.1 Pro deutlich. Es führt auch bei agentenorientierter Terminalarbeit und der Planung langfristiger Aufgaben.
Bei klassischen multimodalen Denkaufgaben sind die Ergebnisse gemischt. Qwen3.7-Plus erzielt gute Ergebnisse in einigen visuellen Denktests, bleibt jedoch bei anspruchsvolleren wissenschaftlichen Aufgaben wie MedXpertQA-MM hinter Gemini 3.1 Pro und GPT-5.4 zurück. Im Textbereich wird die Leistung als vergleichbar mit Max-Tier-Modellen beschrieben, ohne diese jedoch durchweg zu übertreffen.
Qwen3.7-Plus unterstützt das Anthropic API-Protokoll und ist direkt mit Claude Code, OpenClaw und Alibabas eigenem Qwen Code kompatibel. Die API bietet zudem eine Funktion namens preserve_thinking, die Denkprozesse aus früheren Konversationsrunden beibehält. Diese Einstellung wird vom Qwen-Team explizit für agentische Aufgaben empfohlen.
Neben der Bildverarbeitung deckt das Modell auch das Verständnis von Videos und die Analyse von Fahrszenen ab, was es als Grundlage für eingebettete Systeme und autonomes Fahren positioniert.
Qwen3.7-Plus ist über das Alibaba Cloud Model Studio verfügbar und, ähnlich seinem textbasierten Pendant Qwen3.7-Max, ein proprietäres Angebot ohne offene Gewichte. Alibaba positioniert die Plus-Version preislich deutlich unter der Max-Version: Qwen3.7-Plus kostet 0,40 US-Dollar pro Million Input-Tokens und 2,40 US-Dollar pro Million Output-Tokens, verglichen mit 2,50 US-Dollar und 7,50 US-Dollar für Qwen3.7-Max. Dies macht Plus etwa sechsmal günstiger bei den Input-Kosten und dreimal günstiger bei den Output-Kosten und liegt damit deutlich unter den Listenpreisen westlicher Frontier-Modelle.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen