Für Teams, Einzelnutzer, Kanzleien und Transkription – derselbe Mindverse Look, klar aufgeteilt nach Anwendungsfall.
für Teams und Unternehmen
Die Plattform für Unternehmen, die eigene KI-Workflows, Wissensdatenbanken und Assistenten produktiv einsetzen möchten.
für Einzelnutzer und Creator
Der einfachste Einstieg in das Mindverse-Ökosystem für Content, Recherche, Bilder, Audio und produktives Arbeiten.
für Juristen und Kanzleien
Die spezialisierte KI-Lösung für juristische Recherche, Vertragsarbeit und kanzleispezifische Workflows.
für Audio, Meetings und Transkription
Schnelle KI-Transkription für Audiodateien und Meetings – ideal zum sofortigen Start oder für regelmäßige Nutzung.

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die kontinuierliche Weiterentwicklung von Frameworks zur Bereitstellung von Machine-Learning-Anwendungen ist entscheidend für deren breite Akzeptanz und Leistungsfähigkeit. In diesem Kontext hat Gradio, ein bekanntes Tool für die schnelle Entwicklung und Bereitstellung von interaktiven Demos, eine signifikante architektonische Neuerung vorgestellt: die Einführung eines Node.js-basierten Proxy-Servers in Version 6.15. Diese Änderung verspricht eine verbesserte Performance und Skalierbarkeit, insbesondere für Anwendungen mit Server-Side Rendering (SSR) und einer hohen Anzahl gleichzeitiger Nutzer.
Webanwendungen, die auf Machine-Learning-Modellen basieren, stehen oft vor der Herausforderung, eine hohe Anzahl von Anfragen effizient zu verarbeiten. Traditionelle Architekturen, bei denen ein einzelner Backend-Server alle Arten von Anfragen – von der statischen Asset-Bereitstellung bis zur komplexen ML-Inferenz – handhabt, können schnell an ihre Grenzen stoßen. Dies führt zu Engpässen, längeren Antwortzeiten und einer potenziell schlechteren Benutzererfahrung.
Gradio-Anwendungen nutzen typischerweise FastAPI als Backend-Framework. Während FastAPI für seine Geschwindigkeit und Effizienz bekannt ist, kann die gleichzeitige Verarbeitung von vielen statischen Dateianfragen und rechenintensiven Modellinferenzen den Hauptserver überlasten. Dies ist besonders relevant, wenn Funktionen wie das Server-Side Rendering (SSR) aktiviert sind, da hierbei zusätzliche Rendering-Logik auf dem Server ausgeführt wird.
Mit Gradio 6.15 wird ein Node.js-basierter Proxy-Server eingeführt, der sich vor dem Python-Backend-Server (FastAPI) positioniert. Diese Architekturänderung ist darauf ausgelegt, die Last auf dem FastAPI-Server zu reduzieren und die Gesamtperformance der Anwendung zu steigern. Das Hauptkonzept besteht darin, Anfragen basierend auf ihrem Typ intelligent zu routen:
Diese Trennung der Verantwortlichkeiten wird durch einen "Smart Router" im Node.js-Proxy realisiert. Dieser Router analysiert eingehende Anfragen und entscheidet, ob sie von einem statischen Worker oder dem Haupt-FastAPI-Server bearbeitet werden sollen. Dies geschieht, ohne dass Entwickler Änderungen am Anwendungscode vornehmen müssen.
Die Einführung des Node.js-basierten Proxy-Servers bietet mehrere Vorteile:
Die Implementierung dieser Architektur beinhaltet mehrere Schlüsselkomponenten:
num_workers oder der Umgebungsvariable GRADIO_NUM_WORKERS). Diese Worker sind eigenständige FastAPI-Anwendungen, die auf separaten Ports laufen und für die Bereitstellung von Uploads, Downloads und statischen Assets zuständig sind./svelte/, /static/, /assets/, /favicon.ico, /file=, /upload) werden an die statischen Worker verteilt, oft im Round-Robin-Verfahren. Bei Upload-Anfragen mit einer upload_id wird eine Affinitäts-Hash-Methode verwendet, um sicherzustellen, dass Folgeanfragen für denselben Upload an denselben Worker geleitet werden.x-gradio-server, x-gradio-port und x-gradio-original-url hinzugefügt, um dem Backend Kontext über die ursprüngliche Anfrage zu geben.Für Unternehmen, die Gradio zur Bereitstellung interner Tools, Kunden-Demos oder skalierbarer ML-Anwendungen nutzen, bedeutet diese Neuerung eine direkte Verbesserung der Betriebseffizienz:
Die Umstellung auf diese optimierte Architektur erfordert keine Anpassungen an bestehenden Gradio-Anwendungen, was den Übergang für Unternehmen reibungslos gestaltet.
Die Einführung des Node.js-basierten Proxy-Servers in Gradio 6.15 stellt einen wichtigen Schritt in Richtung einer leistungsfähigeren und skalierbareren Plattform für Machine-Learning-Anwendungen dar. Durch die intelligente Verteilung des Workloads und die Entlastung des Haupt-FastAPI-Servers werden Gradio-Anwendungen, insbesondere unter hoher Last und mit SSR, deutlich schneller und stabiler. Diese architektonische Verbesserung unterstreicht das Engagement von Gradio, Entwicklern und Unternehmen ein robustes und effizientes Werkzeug für die Bereitstellung von KI-Lösungen an die Hand zu geben.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen