Neubewertung der lexikalischen Retrieval-Methoden in der Agentic Search

Kategorien:

No items found.

Freigegeben:

May 12, 2026

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Der schnelle Überblick: Lexikalische Retrieval-Methoden in der Agentic Search

Eine aktuelle Studie untersucht die Effektivität lexikalischer Retrieval-Methoden im Kontext von "Agentic Search" bei Large Language Models (LLMs).
Das Forschungsprojekt "Pi-Serini" zeigt, dass gut konfigurierte lexikalische Retriever in Kombination mit leistungsfähigen LLMs beeindruckende Ergebnisse erzielen können.
Pi-Serini erreicht eine Genauigkeit von 83,1 % bei der Beantwortung von Fragen und eine Abrufrate von 94,7 % der relevanten Beweise auf dem BrowseComp-Plus-Datensatz.
Die Studie stellt fest, dass lexikalische Retriever in vielen Szenarien den sogenannten "dichten Retrievern" überlegen sind, insbesondere bei der tiefgehenden Recherche.
Optimierungen wie BM25-Tuning und eine erhöhte Retrieval-Tiefe können die Leistung signifikant steigern.
Diese Erkenntnisse sind für Unternehmen relevant, die effiziente und präzise KI-gestützte Suchsysteme für B2B-Anwendungen entwickeln oder einsetzen möchten.

Lexikalische Retrieval-Methoden in der Agentic Search: Eine Neubewertung ihrer Relevanz

Die fortschreitende Entwicklung von Künstlicher Intelligenz, insbesondere im Bereich der Large Language Models (LLMs), revolutioniert die Art und Weise, wie Informationen verarbeitet und abgerufen werden. Ein zentraler Forschungsbereich ist dabei die sogenannte "Agentic Search", bei der KI-Agenten in einem iterativen Prozess Informationen suchen, verarbeiten und daraus Schlussfolgerungen ziehen. Im Zentrum dieser Diskussion steht die Frage nach der Effizienz und Effektivität der verwendeten Retrieval-Methoden. Eine aktuelle Studie, die unter dem Titel "Rethinking Agentic Search with Pi-Serini: Is Lexical Retrieval Sufficient?" veröffentlicht wurde, wirft ein neues Licht auf die Leistungsfähigkeit lexikalischer Retrieval-Systeme.

Die Herausforderung der Agentic Search

Agentic Search beschreibt einen Prozess, bei dem ein KI-Agent nicht nur einmalig Informationen abruft, sondern in einem mehrstufigen Denk- und Suchprozess agiert. Dies beinhaltet das Zerlegen komplexer Fragestellungen in Teilfragen, das sequenzielle Abrufen von Informationen und die iterative Verfeinerung der Suchstrategie. Der Erfolg solcher Systeme hängt maßgeblich von der Qualität der Retrieval-Komponente ab. Traditionell wird hier zwischen lexikalischen und dichten Retrievern unterschieden:

Lexikalische Retriever: Diese basieren auf der Übereinstimmung von Schlüsselwörtern und Termen zwischen der Suchanfrage und den Dokumenten. Ein bekanntes Beispiel ist BM25.
Dichte Retriever: Diese nutzen neuronale Netze, um Anfragen und Dokumente in Vektorräume einzubetten und die semantische Ähnlichkeit zu messen.

Die vorherrschende Meinung in der Forschung tendierte dazu, dichte Retriever aufgrund ihrer Fähigkeit, semantische Zusammenhänge besser zu erfassen, als überlegen anzusehen. Die neue Studie stellt diese Annahme jedoch infrage.

Pi-Serini: Ein neuer Ansatz mit traditionellen Wurzeln

Das Forschungsteam um Tz-Huan Hsu, Jheng-Hong Yang und Jimmy Lin hat mit "Pi-Serini" einen minimalistischen, auf BM25 basierenden Suchagenten entwickelt. Dieser Agent ist mit drei grundlegenden Tools ausgestattet: Suchen, Browsen und Lesen von Dokumenten. Die Architektur von Pi-Serini ermöglicht es dem Agenten, abgerufene Rankings lokal zu speichern und selektiv zu entscheiden, welche Inhalte in seinen Kontextbereich aufgenommen werden sollen. Dies simuliert das menschliche Verhalten bei der Websuche, wo Nutzer Suchergebnisse überfliegen und bei Bedarf tiefer in Dokumente eintauchen.

Die zentrale Frage der Studie war, ob ein lexikalischer Retriever ausreicht, wenn der Agent in der Lage ist, seine Suchanfragen kontinuierlich zu verfeinern. Die Ergebnisse auf dem BrowseComp-Plus-Datensatz sind bemerkenswert: Pi-Serini, in Kombination mit dem LLM GPT-5.5, erreichte eine Antwortgenauigkeit von 83,1 % und eine Abrufrate von 94,7 % der relevanten Beweise. Diese Werte übertreffen die Leistung von Suchagenten, die auf dichten Retrievern basieren.

Die Bedeutung von Konfiguration und Retrieval-Tiefe

Die Studie identifizierte zwei Schlüsselfaktoren, die zur überlegenen Leistung von Pi-Serini beitragen:

BM25-Tuning: Eine sorgfältige Konfiguration des BM25-Retrievers führte zu einer Verbesserung der Antwortgenauigkeit um 18,0 % und der Abrufrate relevanter Beweise um 11,1 % im Vergleich zur Standard-BM25-Einstellung. Dies unterstreicht, dass die Leistungsfähigkeit lexikalischer Methoden stark von ihrer Abstimmung auf die jeweilige Aufgabe abhängt.
Erhöhte Retrieval-Tiefe: Die Möglichkeit des Agenten, tiefer in die Suchergebnisse einzutauchen und somit eine höhere Retrieval-Tiefe zu erreichen, verbesserte die Abrufrate relevanter Beweise um weitere 25,3 % gegenüber flacheren Retrieval-Strategien. Dies deutet darauf hin, dass die Fähigkeit, relevante Informationen aus einer größeren Menge von potenziell passenden Dokumenten zu filtern, entscheidend ist.

Ein weiterer Aspekt, der für Unternehmen von Interesse sein dürfte, ist die Kosteneffizienz. Die Implementierung von Pi-Serini soll die Evaluierungskosten um den Faktor 3,3 bis 10 reduzieren, was angesichts der hohen Rechenkosten für tiefe Recherche-Systeme einen erheblichen Vorteil darstellt.

Implikationen für B2B-Anwendungen und KI-Strategien

Diese Forschungsergebnisse haben weitreichende Implikationen für B2B-Unternehmen, die KI-gestützte Such- und Informationssysteme einsetzen oder entwickeln:

Neubewertung lexikalischer Methoden: Es ist nicht immer notwendig, auf die komplexesten und rechenintensivsten Retrieval-Methoden zu setzen. Gut optimierte lexikalische Retriever können in vielen „Agentic Search“-Szenarien eine hochleistungsfähige und kostengünstige Alternative darstellen.
Bedeutung der Konfiguration: Die Studie zeigt, dass die sorgfältige Konfiguration und Anpassung von Retrieval-Systemen an spezifische Anwendungsfälle von entscheidender Bedeutung ist. Ein „Out-of-the-box“-Ansatz mag nicht immer die besten Ergebnisse liefern.
Design von Agenten-Tools: Die Integration von flexiblen Tools zum Suchen, Browsen und Lesen ermöglicht es Agenten, menschliche Suchstrategien zu imitieren und so effektiver zu agieren. Dies sollte bei der Entwicklung von KI-Agenten berücksichtigt werden.
Kosteneffizienz: Die potenziellen Kosteneinsparungen durch den Einsatz optimierter lexikalischer Retriever sind ein starkes Argument für Unternehmen, die ihre Budgets für KI-Infrastruktur optimieren möchten, ohne dabei an Leistung einzubüßen.

Die Erkenntnisse aus der Pi-Serini-Studie legen nahe, dass die Kombination aus leistungsfähigen LLMs und intelligent konfigurierten lexikalischen Retrieval-Methoden eine robuste und effiziente Lösung für komplexe Rechercheaufgaben in der Agentic Search darstellen kann. Für Unternehmen, die ihre KI-Strategien weiterentwickeln, ist dies eine wichtige Orientierungshilfe, um präzise, handlungsorientierte Informationen zu gewinnen und gleichzeitig die betriebliche Effizienz zu wahren.

Fazit

Die Frage, ob lexikalisches Retrieval in der Agentic Search ausreicht, wird von der Pi-Serini-Studie mit einem klaren "Ja" beantwortet, unter der Bedingung, dass der Retriever gut konfiguriert ist und der Suchagent über eine Tool-Schnittstelle verfügt, die eine tiefere Retrieval-Tiefe ermöglicht. Diese Erkenntnisse könnten eine Verschiebung in der Entwicklung von KI-gestützten Suchsystemen anstoßen, weg von der alleinigen Konzentration auf dichte Retriever hin zu einer stärkeren Berücksichtigung des Potenzials optimierter lexikalischer Ansätze. Für B2B-Anwendungen bedeutet dies die Möglichkeit, leistungsstarke und gleichzeitig ressourcenschonende Lösungen zu implementieren.

Bibliography: - Hsu, Tz-Huan, Yang, Jheng-Hong, & Lin, Jimmy. (2026). Rethinking Agentic Search with Pi-Serini: Is Lexical Retrieval Sufficient? arXiv preprint arXiv:2605.10848. - Liu, Wenhan, Ma, Xinyu, Zhu, Yutao, Li, Yuchen, Shi, Daiting, Yin, Dawei, & Dou, Zhicheng. (2026). Agentic-R: Learning to Retrieve for Agentic Search. arXiv preprint arXiv:2601.11888. - Pezzuti, Francesca, Frieder, Ophir, Silvestri, Fabrizio, MacAvaney, Sean, & Tonellotto, Nicola. (2026). A Picture of Agentic Search. arXiv preprint arXiv:2602.17518v1. - Subramanian, Shreyas, Akinfaderin, Adewale, Zhang, Yanyan, Singh, Ishan, Khanuja, Mani, Singh, Sandeep, & Ladeira Tanke, Maira. (2026). Keyword search is all you need: Achieving RAG-Level Performance without vector databases using agentic tool use. arXiv preprint arXiv:2602.23368. - Ferrazzi, Pietro, Cvjeticanin, Milica, Piraccini, Alessio, & Giannuzzi, Davide. (2026). Is Agentic RAG worth it? An experimental comparison of RAG approaches. arXiv preprint arXiv:2601.07711.