Optimierung der Retrieval-Augmented Generation durch Multi-Task-Retriever-Finetuning für Unternehmen

Kategorien:

No items found.

Freigegeben:

January 10, 2025

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Retrieval-Augmented Generation im Unternehmenseinsatz: Multi-Task-Retriever-Finetuning für domainspezifische Anwendungen

Retrieval-Augmented Generation (RAG) hat sich als Standardmethode bei der Nutzung von großen Sprachmodellen (LLMs) etabliert. Durch die Einbindung externer Informationsquellen kann RAG die Genauigkeit und Aktualität der generierten Texte verbessern und Problemen wie Halluzinationen oder veraltetem Wissen entgegenwirken. Doch die Implementierung von RAG in realen Anwendungsszenarien birgt Herausforderungen, insbesondere im Unternehmenskontext.

Ein zentraler Aspekt ist die Domänenspezifität der benötigten Informationen. Da das Finetuning von LLMs aufgrund ihres Umfangs oft rechenintensiv und kostspielig ist, bietet sich das Finetuning des Retrievers als effizientere Alternative an. Dadurch kann die Qualität der dem LLM bereitgestellten Daten verbessert werden, ohne den gesamten LLM neu trainieren zu müssen.

Eine weitere Herausforderung stellt die Skalierbarkeit und Generalisierbarkeit über verschiedene RAG-Anwendungen hinweg dar. In einem Unternehmensumfeld, in dem zahlreiche Anwendungen auf RAG basieren, ist es weder wirtschaftlich noch praktikabel, für jede Anwendung einen separaten Retriever zu entwickeln und zu betreiben. Erschwerend kommt hinzu, dass diese Anwendungen oft auf unterschiedliche Datentypen zugreifen.

Ein vielversprechender Lösungsansatz ist das Instruction-Finetuning eines kleineren Retriever-Encoders auf verschiedene domainspezifische Aufgaben. Dadurch kann ein einzelner Encoder für diverse Anwendungsfälle eingesetzt werden, was Kosten senkt, die Skalierbarkeit erhöht und die Geschwindigkeit verbessert.

Ein Beispiel für die praktische Umsetzung dieses Ansatzes ist die Entwicklung eines Multi-Task-Retrievers für die Generierung von Workflows, Playbooks und Code in einem Unternehmen. Workflows beschreiben schrittweise Prozesse zur Automatisierung von Aufgaben, Playbooks enthalten Workflows und UI-Komponenten, und die Codegenerierung dient der automatisierten Erstellung von Software. Für diese Anwendungen werden unterschiedliche Daten benötigt, beispielsweise Workflow-Schrittnamen, Tabellennamen und Feldnamen.

Für das Training eines solchen Multi-Task-Retrievers können Daten aus internen Datenbanken extrahiert und mit bestehenden Trainingsdaten, beispielsweise aus der Workflow-Generierung, kombiniert werden. Als Basismodell eignet sich ein kompakter multilingualer Encoder mit großer Kontextlänge, der lange Instruktionen verarbeiten kann. Durch das Instruction-Finetuning lernt der Retriever, die relevanten Daten aus verschiedenen Quellen zu extrahieren und dem LLM bereitzustellen.

Die Evaluation eines solchen Multi-Task-Retrievers kann auf verschiedene Weisen erfolgen. Eine Möglichkeit ist die Evaluierung mit Out-of-Domain-Daten (OOD). Hierbei wird der Retriever mit Daten aus anderen Domänen als den Trainingsdaten getestet, um seine Generalisierungsfähigkeit zu überprüfen. Eine weitere Möglichkeit ist die Evaluierung mit verwandten, aber unterschiedlichen Retrieval-Aufgaben. So kann beispielsweise getestet werden, ob ein Retriever, der auf das Abrufen von Schrittnamen trainiert wurde, auch relevante Workflow-Strukturen abrufen kann.

Schließlich kann die mehrsprachige Fähigkeit des Retrievers getestet werden, indem die Eingabe in verschiedenen Sprachen erfolgt, selbst wenn die Trainingsdaten nur in einer Sprache vorliegen. Dies ist besonders relevant für Unternehmen, die in einem internationalen Umfeld agieren.

Der beschriebene Ansatz des Multi-Task-Retriever-Finetunings bietet eine pragmatische Lösung für die Herausforderungen von RAG im Unternehmenseinsatz. Durch die Kombination von domainspezifischem Training und Multi-Task-Fähigkeit kann ein effizienter und skalierbarer Retriever entwickelt werden, der die Grundlage für diverse RAG-Anwendungen bildet.

Bibliographie: - https://arxiv.org/abs/2501.04652 - https://arxiv.org/html/2501.04652v1 - https://x.com/_reachsumit/status/1877195251493781873 - https://aclanthology.org/2024.findings-emnlp.41.pdf - https://www.nature.com/articles/s41598-024-79110-x - https://medium.com/hackerai/fine-tuning-or-retrieval-augmented-generation-rag-that-is-the-question-b5b0226d7ca8 - https://training.continuumlabs.ai/knowledge/retrieval-augmented-generation/raft-adapting-language-model-to-domain-specific-rag - https://www.unite.ai/raft-a-fine-tuning-and-rag-approach-to-domain-specific-question-answering/ - https://www.ijfmr.com/papers/2024/5/22581.pdf - https://www.researchgate.net/publication/367403483_Improving_the_Domain_Adaptation_of_Retrieval_Augmented_Generation_RAG_Models_for_Open_Domain_Question_Answering