KI für Ihr Unternehmen – Jetzt Demo buchen

Optimierung der Retrieval-Augmented Generation durch Multi-Task-Retriever-Finetuning für Unternehmen

Kategorien:
No items found.
Freigegeben:
January 10, 2025

Artikel jetzt als Podcast anhören

Retrieval-Augmented Generation im Unternehmenseinsatz: Multi-Task-Retriever-Finetuning für domainspezifische Anwendungen

Retrieval-Augmented Generation (RAG) hat sich als Standardmethode bei der Nutzung von großen Sprachmodellen (LLMs) etabliert. Durch die Einbindung externer Informationsquellen kann RAG die Genauigkeit und Aktualität der generierten Texte verbessern und Problemen wie Halluzinationen oder veraltetem Wissen entgegenwirken. Doch die Implementierung von RAG in realen Anwendungsszenarien birgt Herausforderungen, insbesondere im Unternehmenskontext.

Ein zentraler Aspekt ist die Domänenspezifität der benötigten Informationen. Da das Finetuning von LLMs aufgrund ihres Umfangs oft rechenintensiv und kostspielig ist, bietet sich das Finetuning des Retrievers als effizientere Alternative an. Dadurch kann die Qualität der dem LLM bereitgestellten Daten verbessert werden, ohne den gesamten LLM neu trainieren zu müssen.

Eine weitere Herausforderung stellt die Skalierbarkeit und Generalisierbarkeit über verschiedene RAG-Anwendungen hinweg dar. In einem Unternehmensumfeld, in dem zahlreiche Anwendungen auf RAG basieren, ist es weder wirtschaftlich noch praktikabel, für jede Anwendung einen separaten Retriever zu entwickeln und zu betreiben. Erschwerend kommt hinzu, dass diese Anwendungen oft auf unterschiedliche Datentypen zugreifen.

Ein vielversprechender Lösungsansatz ist das Instruction-Finetuning eines kleineren Retriever-Encoders auf verschiedene domainspezifische Aufgaben. Dadurch kann ein einzelner Encoder für diverse Anwendungsfälle eingesetzt werden, was Kosten senkt, die Skalierbarkeit erhöht und die Geschwindigkeit verbessert.

Ein Beispiel für die praktische Umsetzung dieses Ansatzes ist die Entwicklung eines Multi-Task-Retrievers für die Generierung von Workflows, Playbooks und Code in einem Unternehmen. Workflows beschreiben schrittweise Prozesse zur Automatisierung von Aufgaben, Playbooks enthalten Workflows und UI-Komponenten, und die Codegenerierung dient der automatisierten Erstellung von Software. Für diese Anwendungen werden unterschiedliche Daten benötigt, beispielsweise Workflow-Schrittnamen, Tabellennamen und Feldnamen.

Für das Training eines solchen Multi-Task-Retrievers können Daten aus internen Datenbanken extrahiert und mit bestehenden Trainingsdaten, beispielsweise aus der Workflow-Generierung, kombiniert werden. Als Basismodell eignet sich ein kompakter multilingualer Encoder mit großer Kontextlänge, der lange Instruktionen verarbeiten kann. Durch das Instruction-Finetuning lernt der Retriever, die relevanten Daten aus verschiedenen Quellen zu extrahieren und dem LLM bereitzustellen.

Die Evaluation eines solchen Multi-Task-Retrievers kann auf verschiedene Weisen erfolgen. Eine Möglichkeit ist die Evaluierung mit Out-of-Domain-Daten (OOD). Hierbei wird der Retriever mit Daten aus anderen Domänen als den Trainingsdaten getestet, um seine Generalisierungsfähigkeit zu überprüfen. Eine weitere Möglichkeit ist die Evaluierung mit verwandten, aber unterschiedlichen Retrieval-Aufgaben. So kann beispielsweise getestet werden, ob ein Retriever, der auf das Abrufen von Schrittnamen trainiert wurde, auch relevante Workflow-Strukturen abrufen kann.

Schließlich kann die mehrsprachige Fähigkeit des Retrievers getestet werden, indem die Eingabe in verschiedenen Sprachen erfolgt, selbst wenn die Trainingsdaten nur in einer Sprache vorliegen. Dies ist besonders relevant für Unternehmen, die in einem internationalen Umfeld agieren.

Der beschriebene Ansatz des Multi-Task-Retriever-Finetunings bietet eine pragmatische Lösung für die Herausforderungen von RAG im Unternehmenseinsatz. Durch die Kombination von domainspezifischem Training und Multi-Task-Fähigkeit kann ein effizienter und skalierbarer Retriever entwickelt werden, der die Grundlage für diverse RAG-Anwendungen bildet.

Bibliographie: - https://arxiv.org/abs/2501.04652 - https://arxiv.org/html/2501.04652v1 - https://x.com/_reachsumit/status/1877195251493781873 - https://aclanthology.org/2024.findings-emnlp.41.pdf - https://www.nature.com/articles/s41598-024-79110-x - https://medium.com/hackerai/fine-tuning-or-retrieval-augmented-generation-rag-that-is-the-question-b5b0226d7ca8 - https://training.continuumlabs.ai/knowledge/retrieval-augmented-generation/raft-adapting-language-model-to-domain-specific-rag - https://www.unite.ai/raft-a-fine-tuning-and-rag-approach-to-domain-specific-question-answering/ - https://www.ijfmr.com/papers/2024/5/22581.pdf - https://www.researchgate.net/publication/367403483_Improving_the_Domain_Adaptation_of_Retrieval_Augmented_Generation_RAG_Models_for_Open_Domain_Question_Answering
Was bedeutet das?
Mindverse vs ChatGPT Plus Widget

Warum Mindverse Studio?

Entdecken Sie die Vorteile gegenüber ChatGPT Plus

Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

🚀 Mindverse Studio

Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

ChatGPT Plus

❌ Kein strukturierter Dokumentenvergleich

❌ Keine Bearbeitung im Dokumentkontext

❌ Keine Integration von Unternehmenswissen

VS

Mindverse Studio

✅ Gezielter Dokumentenvergleich mit Custom-Prompts

✅ Kontextbewusste Textbearbeitung im Editor

✅ Wissensbasierte Analyse & Zusammenfassungen

📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

ChatGPT Plus

❌ Nur ein Modellanbieter (OpenAI)

❌ Keine Modellauswahl pro Use Case

❌ Keine zentrale Modellsteuerung für Teams

VS

Mindverse Studio

✅ Zugriff auf über 50 verschiedene KI-Modelle

✅ Modellauswahl pro Prompt oder Assistent

✅ Zentrale Steuerung auf Organisationsebene

🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

ChatGPT Plus

❌ Keine echte Teamkollaboration

❌ Keine Rechte- oder Rollenverteilung

❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

VS

Mindverse Studio

✅ Teamübergreifende Bearbeitung in Echtzeit

✅ Granulare Rechte- und Freigabeverwaltung

✅ Zentrale Steuerung & Transparenz auf Organisationsebene

👥 Kollaborative KI für Ihr gesamtes Unternehmen

Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

Bereit für den nächsten Schritt?

Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

🎯 Kostenlose Demo buchen

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
Herzlichen Dank! Deine Nachricht ist eingegangen!
Oops! Du hast wohl was vergessen, versuche es nochmal.

🚀 Neugierig auf Mindverse Studio?

Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

🚀 Demo jetzt buchen