Fortschritte in der optischen Zeichenerkennung mit Chandra OCR 2

Kategorien:

No items found.

Freigegeben:

March 20, 2026

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Das Wichtigste in Kürze

Chandra OCR 2, ein neues Open-Source-Modell von Datalab, erreicht eine neue Bestmarke von 85,9 % im olmOCR-Benchmark.
Das Modell bietet umfassende Layoutinformationen und unterstützt über 90 Sprachen.
Es zeichnet sich durch seine Fähigkeit aus, handschriftliche Texte, mathematische Formeln, Formulare, Tabellen sowie Bilder und Diagramme präzise zu extrahieren und zu beschriften.
Chandra OCR 2 ist als 4B-Modell verfügbar und kann sowohl lokal als auch über eine gehostete API genutzt werden.
Die Leistung des Modells übertrifft in vielen Bereichen etablierte Lösungen wie GPT-4o und DeepSeek OCR, insbesondere im Hinblick auf Kosten und Geschwindigkeit bei der Selbsthostung.

Die Welt der optischen Zeichenerkennung (OCR) erlebt einen bedeutenden Fortschritt durch die Veröffentlichung von Chandra OCR 2 durch Datalab. Dieses neue Modell hat sich als führend in der Branche etabliert, indem es eine beeindruckende Leistung im olmOCR-Benchmark erzielt und gleichzeitig eine Vielzahl von Funktionen bietet, die für B2B-Anwendungen von hoher Relevanz sind. Als Spezialisten für KI-Technologien auf dem deutschen Markt beobachten wir diese Entwicklungen mit großem Interesse und analysieren die Implikationen für Unternehmen, die auf präzise Dokumentenverarbeitung angewiesen sind.

Ein neuer Maßstab im OCR-Bereich

Chandra OCR 2 hat im unabhängigen olmOCR-Benchmark eine Genauigkeit von 85,9 % erreicht und damit seine Position als führendes Modell in diesem Bereich untermauert. Diese Benchmark, die von AllenAI entwickelt wurde, bewertet OCR-Systeme anhand von über 1.400 PDF-Seiten mit mehr als 7.000 Testfällen aus verschiedenen Dokumenttypen. Die hohe Punktzahl von Chandra OCR 2 unterstreicht seine Fähigkeit, komplexe Dokumente präzise zu verarbeiten.

Im Vergleich zu anderen führenden Modellen zeigt sich die Stärke von Chandra OCR 2:

Chandra OCR 2: 85,9 %
olmOCR 2: 82,4 %
DeepSeek OCR: 75,4 %
GPT-4o (Anchored): 69,9 %

Diese Ergebnisse deuten darauf hin, dass die Architektur von Chandra OCR 2, die auf einem 4B-Modell basiert, besonders effektiv bei der Erkennung und Strukturierung von Texten ist.

Umfassende Funktionen für komplexe Dokumente

Die Fähigkeiten von Chandra OCR 2 gehen weit über die reine Texterkennung hinaus. Das Modell wurde speziell entwickelt, um den Herausforderungen komplexer Dokumente gerecht zu werden, die in Geschäftsumgebungen häufig vorkommen. Zu den herausragenden Merkmalen gehören:

Multilinguale Unterstützung

Chandra OCR 2 unterstützt über 90 Sprachen, was es zu einem vielseitigen Werkzeug für international agierende Unternehmen macht. Diese breite Sprachabdeckung ist entscheidend für die Verarbeitung von Dokumenten in globalen Lieferketten, mehrsprachigen Verträgen oder internationalen Forschungsarbeiten. Bei einem Benchmark über 43 Sprachen erreichte Chandra 2 eine durchschnittliche Genauigkeit von 77,8 %, während es in einem umfassenderen 90-Sprachen-Benchmark noch 72,7 % erzielte.

Layout-Bewusstsein und Strukturerhaltung

Ein zentrales Merkmal ist das Layout-Bewusstsein. Chandra OCR 2 kann nicht nur Text erkennen, sondern auch dessen Position und Struktur auf der Seite verstehen. Dies ermöglicht die präzise Extraktion von Informationen aus:

Tabellen: Selbst komplexe Tabellen mit zusammengeführten Zellen oder schwierigen Layouts werden korrekt erfasst und in strukturierte Formate wie Markdown, HTML oder JSON überführt.
Formulare: Das Modell erkennt und extrahiert Daten aus Formularen, einschließlich Kontrollkästchen und spezifischen Feldern, was die Automatisierung von Dateneingabeprozessen erheblich vereinfacht.
Bilder und Diagramme: Chandra OCR 2 ist in der Lage, Bilder und Diagramme zu identifizieren, zu extrahieren und sogar automatisch zu beschriften, was für die Analyse von technischen Dokumenten oder Berichten von großem Vorteil ist.

Handschrifterkennung und mathematische Formeln

Die Erkennung von Handschrift, ein Bereich, in dem traditionelle OCR-Systeme oft an ihre Grenzen stoßen, ist eine weitere Stärke von Chandra OCR 2. Das Modell zeigt eine hohe Genauigkeit bei der Verarbeitung von handschriftlichen Notizen und Formularen. Ebenso beeindruckend ist die Fähigkeit, mathematische Gleichungen und Formeln präzise zu interpretieren, was für wissenschaftliche oder technische Dokumente unerlässlich ist.

Leistung und Effizienz im praktischen Einsatz

Neben der hohen Genauigkeit sind auch Geschwindigkeit und Ressourceneffizienz entscheidende Faktoren für den B2B-Einsatz. Die von Skywork AI durchgeführten Benchmarks liefern hierzu detaillierte Einblicke:

Geschwindigkeit und Durchsatz

Chandra OCR 2 demonstriert eine bemerkenswerte Verarbeitungsgeschwindigkeit. Bei der Selbsthostung auf einer RTX 4090 GPU erreicht das Modell eine durchschnittliche Latenz von etwa 120 ms pro Seite. Auf einer A100 Server-GPU verkürzt sich diese sogar auf ca. 90 ms. Bei Batch-Verarbeitung von 100 Seiten können auf einer RTX 4090 bis zu 14,5 Seiten pro Sekunde und auf einer A100 sogar 18,0 Seiten pro Sekunde verarbeitet werden. Im Vergleich dazu liegen Cloud-APIs wie GPT-4o bei etwa 1,5 Seiten pro Sekunde.

Diese Zahlen zeigen, dass Chandra OCR 2 bei der Selbsthostung eine deutlich höhere Durchsatzrate als viele Cloud-basierte Lösungen bietet, was für Unternehmen mit großen Dokumentenmengen und hohen Verarbeitungsanforderungen von Vorteil ist.

Ressourcenverbrauch und Skalierbarkeit

Chandra OCR 2 ist darauf ausgelegt, ressourceneffizient zu sein. Auf einer RTX 4090 im FP16-Modus benötigt das Modell bei einer Batch-Größe von 16 Seiten etwa 8,6 GB VRAM. Durch den Einsatz von INT8-Quantisierung kann der VRAM-Bedarf um circa 35 % reduziert werden, bei einem minimalen Genauigkeitsverlust von nur 0,2 % bis 0,4 %. Dies ermöglicht den Betrieb auf GPUs mit geringerem VRAM, wie beispielsweise 8 GB für eine Batch-Größe von 8. Für kleinere Aufgaben ist sogar ein CPU-Modus mit etwa 1,2 Sekunden pro Seite nutzbar.

Die Skalierbarkeit ist ebenfalls ein wichtiger Aspekt. Das Modell zeigt eine nahezu lineare Skalierung bei der Nutzung mehrerer GPUs, was den Aufbau leistungsfähiger Verarbeitungscluster ermöglicht.

Kosten-Nutzen-Verhältnis

Die Selbsthostung von Chandra OCR 2 bietet ein attraktives Kosten-Nutzen-Verhältnis. Während die Nutzung von Cloud-APIs wie GPT-4o zwischen 0,018 und 0,030 US-Dollar pro Seite kosten kann, belaufen sich die effektiven Kosten für die Selbsthostung von Chandra auf einer RTX 4090 auf geschätzte 0,002 US-Dollar pro Seite, inklusive Stromkosten und Hardware-Amortisation. Diese Kosteneffizienz macht Chandra OCR 2 besonders attraktiv für Unternehmen, die täglich große Mengen an Dokumenten verarbeiten.

Anwendungsbereiche und strategische Implikationen

Die Fähigkeiten von Chandra OCR 2 eröffnen Unternehmen neue Möglichkeiten in verschiedenen Bereichen:

Automatisierung von Geschäftsprozessen: Die präzise Extraktion von Daten aus Rechnungen, Verträgen, Formularen und anderen Geschäftsdokumenten kann manuelle Prozesse erheblich reduzieren und die Effizienz steigern.
Dokumentenmanagement: Durch die Umwandlung unstrukturierter Dokumente in suchbare und strukturierte Daten wird das Management großer Dokumentenarchive vereinfacht.
Compliance und Audit: Die Möglichkeit, Informationen aus Dokumenten präzise zu extrahieren und zu protokollieren, kann Unternehmen bei der Einhaltung regulatorischer Anforderungen unterstützen.
Forschung und Entwicklung: Die genaue Erkennung von mathematischen Formeln und komplexen Layouts ist für die Digitalisierung und Analyse wissenschaftlicher Publikationen oder technischer Spezifikationen von großem Wert.

Für Mindverse als KI-Partner, der Unternehmen umfassende Content-Tools anbietet, sind solche Entwicklungen von zentraler Bedeutung. Die Integration fortschrittlicher OCR-Technologien wie Chandra OCR 2 kann die Leistungsfähigkeit von KI-gestützten Content-Erstellungs- und Analysewerkzeugen weiter verbessern und somit einen Mehrwert für B2B-Kunden schaffen.

Fazit

Chandra OCR 2 stellt einen bemerkenswerten Fortschritt in der optischen Zeichenerkennung dar. Mit seiner hohen Genauigkeit, umfassenden Sprachunterstützung und der Fähigkeit, komplexe Dokumentstrukturen zu verstehen, setzt es neue Maßstäbe. Insbesondere die Möglichkeit zur effizienten Selbsthostung und das daraus resultierende attraktive Kosten-Nutzen-Verhältnis machen es zu einer vielversprechenden Option für Unternehmen, die ihre Dokumentenverarbeitung optimieren möchten. Die kontinuierliche Weiterentwicklung in diesem Bereich wird die Potenziale der KI-gestützten Dokumentenanalyse weiter ausschöpfen.

Bibliographie

datalab-to (o. D.). datalab-to/chandra-ocr-2. Hugging Face. Abgerufen von https://huggingface.co/datalab-to/chandra-ocr-2
datalab-to (2025, 8. Oktober). Search code, repositories, users, issues, pull requests... GitHub. Abgerufen von http://github.com/datalab-to/chandra
Hanks (2025, 6. November). Chandra OCR Benchmarks: Speed and Accuracy Tested vs Top OCR Models - Skywork ai. Skywork ai. Abgerufen von https://skywork.ai/blog/sheets/chandra-ocr-benchmark/
Kuehnle, M. (o. D.). Markus Kuehnle's Post. LinkedIn. Abgerufen von https://www.linkedin.com/posts/markuskuehnle_two-new-ocr-models-dropped-i-spent-december-activity-7411367177293045762-cw0h
Md Monsur ali (2026, 2. März). I Tested Chandra OCR: Converting Handwritten & Scanned Documents into Structured, Layout-Aware HTML | by Md Monsur ali | Data Science Collective | Mar, 2026 | Medium. Medium. Abgerufen von https://medium.com/data-science-collective/i-tested-chandra-ocr-converting-handwritten-scanned-documents-into-structured-layout-aware-html-1047b8711c54
Pachaar, A. (2025, 1. November). Everyone is sleeping on this new OCR model! (supports 40+ languages & it's open-source) Datalab's Chandra topped independent benchmarks and beat the previously best dots-ocr. - Supports 40+… | Akshay Pachaar | 35 comments. LinkedIn. Abgerufen von https://www.linkedin.com/posts/akshay-pachaar_everyone-is-sleeping-on-this-new-ocr-model-activity-7390387263471378432-siqf
Paruchuri, V. (o. D.). Introducing our newest model: Chandra. Datalab. Abgerufen von https://landing.datalab.to/blog/introducing-chandra
Sivan, V. (2025, 2. November). 🚀 Big News in OCR Tech! Meet Chandra by Datalab — the new benchmark leader in Optical Character Recognition 🔍💡 🔥 It has topped independent benchmarks and outperformed leading models like… | Vishnu Sivan. LinkedIn. Abgerufen von https://www.linkedin.com/posts/codemaker2015_big-news-in-ocr-tech-meet-chandra-by-activity-7390646840288829440-3gTg
Sung.kim.mw (o. D.). Chandra OCR 2! (Open-weight) - 85.9% (sota) on olmocr ... Threads. Abgerufen von https://www.threads.com/@sung.kim.mw/post/DWCvpkDkpyu/chandra-ocr-open-weight-sota-on-olmocr-bench-language-support-w-benchmarks-b
Why Chandra is the Ultimate OCR Tool for Handwriting and Tables (2026, 11. Februar). Why Chandra is the Ultimate OCR Tool for Handwriting and Tables. converter.brightcoding.dev. Abgerufen von https://converter.brightcoding.dev/blog/why-chandra-is-the-ultimate-ocr-tool-for-handwriting-and-tables