KI für Ihr Unternehmen – Jetzt Demo buchen

Steigerung der Genauigkeit von RAG-Systemen durch kontextbewusste Retrieval-Techniken

Kategorien:
No items found.
Freigegeben:
October 7, 2024

Artikel jetzt als Podcast anhören

Anthropic Steigert die Präzision von RAG-Systemen mit Kontextbewusster Retrieval-Technik

In der sich stetig entwickelnden Welt der künstlichen Intelligenz (KI) ist die Fähigkeit, Informationen präzise und effizient aus großen Datenmengen abzurufen, von entscheidender Bedeutung. Ein vielversprechender Ansatz in diesem Bereich ist die Retrieval-Augmented Generation (RAG), die die Stärken von großen Sprachmodellen (LLMs) mit der Präzision von spezialisierten Wissensdatenbanken kombiniert. Anthropic, ein renommiertes Unternehmen im Bereich der KI-Forschung, hat kürzlich eine neue Technik namens "Contextual Retrieval" vorgestellt, die die Genauigkeit von RAG-Systemen deutlich verbessert, indem sie den Kontext bei der Informationsbeschaffung stärker berücksichtigt.

Die Herausforderung des Kontextverlustes in traditionellen RAG-Systemen

Traditionelle RAG-Systeme zerlegen Dokumente in kleinere Textabschnitte, sogenannte "Chunks", um die Suche zu beschleunigen und die Relevanz zu erhöhen. Diese Chunks werden dann mithilfe von Worteinbettungen, die semantische Informationen erfassen, in einem Vektorraum repräsentiert. Bei der Anfrage eines Benutzers durchsucht das RAG-System diesen Vektorraum nach den ähnlichsten Chunks und verwendet diese, um eine Antwort zu generieren. Ein Problem bei diesem Ansatz ist jedoch der potenzielle Verlust von Kontextinformationen, da die Chunks isoliert voneinander betrachtet werden.

Beispielsweise könnte ein Chunk den Satz "Der Umsatz des Unternehmens stieg im Vergleich zum Vorquartal um 3 %" enthalten. Ohne den Kontext des gesamten Dokuments ist jedoch unklar, auf welches Unternehmen sich der Satz bezieht oder welcher Zeitraum relevant ist. Dieser Kontextverlust kann zu ungenauen oder irreführenden Antworten führen.

Contextual Retrieval: Kontext bewahren für präzisere Antworten

Anthropics Contextual Retrieval-Technik zielt darauf ab, dieses Problem zu lösen, indem den Chunks vor der Einbettung und Indizierung zusätzlicher Kontext hinzugefügt wird. Anstatt die Chunks isoliert zu betrachten, wird jedem Chunk eine kurze Zusammenfassung des gesamten Dokuments vorangestellt, die typischerweise 50 bis 100 Wörter umfasst. Diese Kontextinformationen ermöglichen es dem LLM, die Bedeutung des Chunks im Verhältnis zum gesamten Dokument besser zu verstehen und relevantere Antworten zu generieren.

Um den Prozess der Kontexterstellung zu automatisieren, nutzt Anthropic sein eigenes LLM, Claude. Claude wird mit einem speziellen Prompt trainiert, der es anweist, für jeden Chunk prägnante, chunkspezifische Kontextinformationen bereitzustellen. Dieser Ansatz ermöglicht eine effiziente und skalierbare Kontexterstellung, ohne dass eine manuelle Annotation erforderlich ist.

Beeindruckende Leistungssteigerungen durch Contextual Retrieval

Anthropic hat die Effektivität von Contextual Retrieval in umfangreichen Experimenten mit verschiedenen Wissensdomänen, Einbettungsmodellen und Retrieval-Strategien getestet. Die Ergebnisse zeigen, dass Contextual Retrieval die Fehlerrate bei der Informationsbeschaffung deutlich reduziert. Im Durchschnitt konnten die folgenden Verbesserungen erzielt werden:

  • Contextual Embeddings allein reduzierten die Fehlerrate bei der Abfrage der Top-20-Chunks um 35 %.
  • Die Kombination von Contextual Embeddings und Contextual BM25 reduzierte die Fehlerrate um 49 %.
  • Die Integration eines zusätzlichen Reranking-Schritts, der die Suchergebnisse anhand ihrer Relevanz für die Anfrage neu bewertet, führte zu einer beeindruckenden Reduzierung der Fehlerrate um 67 %.

Praktische Implementierung und zukünftige Möglichkeiten

Anthropic hat eine detaillierte Anleitung zur Implementierung von Contextual Retrieval mit Codebeispielen auf GitHub veröffentlicht, um Entwicklern die Integration dieser Technik in ihre eigenen RAG-Systeme zu erleichtern. Darüber hinaus bietet Anthropic eine Funktion namens "Prompt Caching" an, die die Kosten für die Kontexterstellung durch Zwischenspeichern von Dokument-Chunks und Kontextinformationen reduziert.

Die Einführung von Contextual Retrieval ist ein vielversprechender Schritt in Richtung leistungsstärkerer und zuverlässigerer KI-Systeme. Durch die Verbesserung der Genauigkeit und Relevanz der Informationsbeschaffung hat diese Technik das Potenzial, die Art und Weise, wie wir mit Wissen interagieren, zu revolutionieren. Von Chatbots im Kundenservice bis hin zu fortschrittlichen Forschungstools - die Möglichkeiten sind vielfältig.

Fazit

Anthropics Contextual Retrieval-Technik stellt einen bedeutenden Fortschritt im Bereich der Retrieval-Augmented Generation dar. Durch die Berücksichtigung des Kontexts bei der Informationsbeschaffung ermöglicht diese Technik präzisere und relevantere Antworten und ebnet den Weg für eine neue Generation von KI-Systemen, die in der Lage sind, komplexere Aufgaben zu bewältigen und ein tieferes Verständnis für Informationen zu entwickeln.

Bibliographie

https://www.anthropic.com/news/contextual-retrieval https://the-decoder.com/anthropic-boosts-rag-accuracy-with-context-aware-retrieval/ https://getcoai.com/news/anthropic-introduces-contextual-retrieval-to-boost-accuracy-of-rag-systems/ https://medium.com/@braintitan/revolutionizing-ai-claudes-contextual-retrieval-boosts-rag-accuracy-16fe025036dd https://www.linkedin.com/posts/amirhartman_introducing-contextual-retrieval-activity-7243249143446413312-Tpnr https://blog.getbind.co/2024/09/25/claude-contextual-retrieval-vs-rag-how-is-it-different/ https://www.topview.ai/blog/detail/contextual-retrieval-anthropic-s-new-approach-to-boost-ai-accuracy https://www.infoq.com/news/2024/09/anthropic-contextual-retrieval/ https://www.youtube.com/watch?v=a8xEqyBGjWw https://www.linkedin.com/posts/abhinav-kimothi_anthropic-announced-contextual-retrieval-activity-7243695398182121472-tN-8
Was bedeutet das?
Mindverse vs ChatGPT Plus Widget

Warum Mindverse Studio?

Entdecken Sie die Vorteile gegenüber ChatGPT Plus

Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

🚀 Mindverse Studio

Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

ChatGPT Plus

❌ Kein strukturierter Dokumentenvergleich

❌ Keine Bearbeitung im Dokumentkontext

❌ Keine Integration von Unternehmenswissen

VS

Mindverse Studio

✅ Gezielter Dokumentenvergleich mit Custom-Prompts

✅ Kontextbewusste Textbearbeitung im Editor

✅ Wissensbasierte Analyse & Zusammenfassungen

📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

ChatGPT Plus

❌ Nur ein Modellanbieter (OpenAI)

❌ Keine Modellauswahl pro Use Case

❌ Keine zentrale Modellsteuerung für Teams

VS

Mindverse Studio

✅ Zugriff auf über 50 verschiedene KI-Modelle

✅ Modellauswahl pro Prompt oder Assistent

✅ Zentrale Steuerung auf Organisationsebene

🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

ChatGPT Plus

❌ Keine echte Teamkollaboration

❌ Keine Rechte- oder Rollenverteilung

❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

VS

Mindverse Studio

✅ Teamübergreifende Bearbeitung in Echtzeit

✅ Granulare Rechte- und Freigabeverwaltung

✅ Zentrale Steuerung & Transparenz auf Organisationsebene

👥 Kollaborative KI für Ihr gesamtes Unternehmen

Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

Bereit für den nächsten Schritt?

Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

🎯 Kostenlose Demo buchen

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
Herzlichen Dank! Deine Nachricht ist eingegangen!
Oops! Du hast wohl was vergessen, versuche es nochmal.

🚀 Neugierig auf Mindverse Studio?

Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

🚀 Demo jetzt buchen