Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Welt der Künstlichen Intelligenz (KI) entwickelt sich rasant weiter, insbesondere im Bereich der multimodalen KI, die verschiedene Datenmodalitäten wie Text und Bilder kombiniert. In den letzten Tagen wurden zwei bemerkenswerte Fortschritte in diesem Bereich erzielt: Apple hat AIMv2 vorgestellt und Jina AI hat Jina CLIP v2 veröffentlicht. Beide Modelle versprechen, die Interaktion zwischen Text und Bild zu revolutionieren und neue Möglichkeiten für Entwickler und Unternehmen zu eröffnen.
Apple hat mit AIMv2 eine neue Familie von Vision-Modellen vorgestellt, die mit einem multimodalen autoregressiven Ziel vortrainiert wurden. AIMv2 baut auf dem Vorgängermodell AIMv1 auf, erweitert dieses jedoch um gemeinsame visuelle und textuelle Ziele. Das Training von AIMv2 ist laut Apple einfach und skalierbar. Besonders hervorzuheben ist, dass AIMv2-3B eine Genauigkeit von 89,5% auf ImageNet mit einem eingefrorenen Trunk erreicht.
Die wichtigsten Merkmale von AIMv2 sind:
Apple stellt der Community vortrainierte Checkpoints von AIMv2 mit unterschiedlichen Kapazitäten und Trainingsauflösungen zur Verfügung. Diese sind über Hugging Face zugänglich.
Jina AI hat mit Jina CLIP v2 ein neues multilingual-multimodales Einbettungsmodell veröffentlicht. Das Modell mit 0,9 Milliarden Parametern unterstützt 89 Sprachen, eine Bildauflösung von 512x512 und Matrjoschka-Repräsentationen. Jina CLIP v2 baut auf Jina CLIP v1 und den kürzlich veröffentlichten Jina Embeddings v3 auf und bietet mehrere wichtige Verbesserungen:
Jina CLIP v2 kombiniert einen Text-Encoder (Jina XLM-RoBERTa, 561 Millionen Parameter) und einen Bild-Encoder (EVA02-L14, 304 Millionen Parameter). Der Text-Encoder wird auch in Jina Embeddings v3 verwendet. Die beiden Encoder werden gemeinsam trainiert, um ausgerichtete Repräsentationen von Bildern und Text zu erstellen.
Ein besonderes Merkmal von Jina CLIP v2 sind die Matrjoschka-Repräsentationen. Diese ermöglichen eine erhebliche Reduzierung der Dimensionalität der Einbettungen, ohne die Leistung wesentlich zu beeinträchtigen. So führt eine Komprimierung von 1024 auf 64 Dimensionen (94% Reduktion) bei der Bildklassifizierung nur zu einem Rückgang der Top-5-Genauigkeit um 8% und der Top-1-Genauigkeit um 12,5%.
Jina CLIP v2 ist über die Jina AI Embedding API, AWS, Azure und GCP kommerziell verfügbar.
Sowohl Apple AIMv2 als auch Jina CLIP v2 stellen wichtige Fortschritte im Bereich der multimodalen KI dar. AIMv2 beeindruckt mit seiner Leistung bei verschiedenen Benchmarks und seiner Skalierbarkeit. Jina CLIP v2 hingegen überzeugt durch seine Mehrsprachigkeit, die hohe Bildauflösung und die effizienten Matrjoschka-Repräsentationen. Beide Modelle eröffnen spannende neue Möglichkeiten für die Entwicklung innovativer Anwendungen, die Text und Bilder intelligent miteinander verknüpfen.
Bibliographie https://jina.ai/news/jina-clip-v2-multilingual-multimodal-embeddings-for-text-and-images/ https://www.marktechpost.com/2024/11/22/jina-ai-introduces-jina-clip-v2-a-0-9b-multilingual-multimodal-embedding-model-that-connects-image-with-text-in-89-languages/ https://twitter.com/JinaAI_/status/1859659765892411462 https://twitter.com/JinaAI_/status/1859659764281782420 https://huggingface.co/jinaai/jina-clip-v2 https://github.com/apple/ml-aim https://jina.ai/news/ https://www.youtube.com/watch?v=yV9pbFN227MLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen