Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Tiefenkarten, die von RGB-D-Sensoren oder LiDAR-Systemen erfasst werden, liefern oft unvollständige Daten. Fehlende oder verrauschte Tiefeninformationen erschweren sowohl die menschliche Interpretation als auch die Anwendung in computergestützten Systemen. Die sogenannte Tiefenvervollständigung (Depth Completion) zielt darauf ab, diese lückenhaften Tiefenmessungen mithilfe von Farbbildern in vollständige Tiefenkarten umzuwandeln.
Traditionelle Methoden betrachten Tiefenvervollständigung meist als ein Interpolationsproblem, bei dem fehlende Tiefenwerte anhand des Bildinhalts geschätzt werden. Ein neuer Ansatz, Marigold-DC, stellt dieses Konzept auf den Kopf und interpretiert die Aufgabe als eine bildbedingte Generierung von Tiefenkarten, die durch spärliche Messungen gesteuert wird.
Marigold-DC basiert auf einem vortrainierten latenten Diffusionsmodell für monokulare Tiefenschätzung. Diffusionsmodelle haben sich in der Bildgenerierung bewährt und werden nun zunehmend auch für andere Aufgaben wie die Tiefenschätzung eingesetzt. Im Kern generieren diese Modelle Bilder durch einen iterativen Prozess, der ein verrauschtes Bild schrittweise entrauscht, bis ein klares Bild entsteht.
Die Innovation von Marigold-DC liegt in der Integration der spärlichen Tiefenmessungen als Steuerung während dieses Entrauschungsprozesses. Durch ein Optimierungsverfahren, das parallel zur iterativen Inferenz des Diffusionsmodells läuft, werden die vorhandenen Tiefeninformationen in die Generierung der Tiefenkarte eingespeist. Dieser Ansatz ermöglicht eine effektive Nutzung der vorhandenen Daten und führt zu einer robusteren und genaueren Tiefenvervollständigung.
Ein bemerkenswertes Merkmal von Marigold-DC ist seine Fähigkeit zur Zero-Shot-Generalisierung. Das bedeutet, dass das Modell auf Bildern aus Umgebungen angewendet werden kann, die im Trainingsprozess nicht gesehen wurden. Diese Flexibilität ist ein entscheidender Vorteil gegenüber herkömmlichen Methoden, die oft an spezifische Datensätze gebunden sind und bei der Anwendung auf unbekannte Szenarien an Leistung verlieren.
Die Zero-Shot-Fähigkeit von Marigold-DC resultiert aus der Verwendung des vortrainierten Diffusionsmodells, das bereits ein breites Spektrum an visuellen Informationen erlernt hat. Durch die gezielte Steuerung mit den spärlichen Tiefenmessungen kann dieses Wissen effektiv für die Tiefenvervollständigung genutzt werden, ohne dass ein erneutes Training des Modells erforderlich ist.
Marigold-DC stellt einen Paradigmenwechsel in der Tiefenvervollständigung dar. Anstatt die Aufgabe als Interpolationsproblem zu betrachten, wird sie als Generierungsprozess interpretiert, der durch spärliche Messungen geleitet wird. Dieser Ansatz ermöglicht eine effektivere Nutzung von vortrainierten Modellen und führt zu einer verbesserten Zero-Shot-Generalisierung.
Die Ergebnisse von Marigold-DC deuten darauf hin, dass moderne Prioren für die monokulare Tiefenschätzung die Tiefenvervollständigung deutlich robuster machen. Es könnte daher sinnvoller sein, die Aufgabe als Wiederherstellung dichter Tiefeninformationen aus dichten Bildpixeln zu betrachten, die durch spärliche Tiefenmessungen gesteuert wird, anstatt als Inpainting spärlicher Tiefeninformationen, die durch ein Bild geleitet wird.
Die robuste und flexible Tiefenvervollständigung mit Marigold-DC eröffnet vielfältige Anwendungsmöglichkeiten in Bereichen wie Robotik, autonomes Fahren, 3D-Rekonstruktion und Augmented Reality. Die Fähigkeit, auch mit extrem spärlichen Daten umzugehen, erweitert das Einsatzspektrum und ermöglicht den Einsatz in Szenarien, die für herkömmliche Methoden unzugänglich waren.
Zukünftige Forschung könnte sich auf die weitere Verbesserung der Genauigkeit und Effizienz von Marigold-DC konzentrieren, sowie auf die Integration weiterer Sensordaten und die Entwicklung von spezialisierten Modellen für spezifische Anwendungsfälle.
Bibliographie: https://arxiv.org/html/2409.10202v1 https://github.com/prs-eth/Marigold https://www.research-collection.ethz.ch/handle/20.500.11850/705538 https://github.com/choyingw/Awesome-Monocular-Depth https://www.researchgate.net/publication/384076035_SteeredMarigold_Steering_Diffusion_Towards_Depth_Completion_of_Largely_Incomplete_Depth_Maps https://marigoldmonodepth.github.io/ https://arxiv.org/html/2411.19278v1 https://arxiv-sanity-lite.com/?rank=pid&pid=2406.11711 https://www.researchgate.net/publication/382492510_Diffusion_Models_for_Monocular_Depth_Estimation_Overcoming_Challenging_Conditions https://openaccess.thecvf.com/content/CVPR2024/papers/Ke_Repurposing_Diffusion-Based_Image_Generators_for_Monocular_Depth_Estimation_CVPR_2024_paper.pdfLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen