Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Retrieval-Augmented Generation (RAG) hat sich als Standardmethode bei der Nutzung von großen Sprachmodellen (LLMs) etabliert. Durch die Einbindung externer Informationsquellen kann RAG die Genauigkeit und Aktualität der generierten Texte verbessern und Problemen wie Halluzinationen oder veraltetem Wissen entgegenwirken. Doch die Implementierung von RAG in realen Anwendungsszenarien birgt Herausforderungen, insbesondere im Unternehmenskontext.
Ein zentraler Aspekt ist die Domänenspezifität der benötigten Informationen. Da das Finetuning von LLMs aufgrund ihres Umfangs oft rechenintensiv und kostspielig ist, bietet sich das Finetuning des Retrievers als effizientere Alternative an. Dadurch kann die Qualität der dem LLM bereitgestellten Daten verbessert werden, ohne den gesamten LLM neu trainieren zu müssen.
Eine weitere Herausforderung stellt die Skalierbarkeit und Generalisierbarkeit über verschiedene RAG-Anwendungen hinweg dar. In einem Unternehmensumfeld, in dem zahlreiche Anwendungen auf RAG basieren, ist es weder wirtschaftlich noch praktikabel, für jede Anwendung einen separaten Retriever zu entwickeln und zu betreiben. Erschwerend kommt hinzu, dass diese Anwendungen oft auf unterschiedliche Datentypen zugreifen.
Ein vielversprechender Lösungsansatz ist das Instruction-Finetuning eines kleineren Retriever-Encoders auf verschiedene domainspezifische Aufgaben. Dadurch kann ein einzelner Encoder für diverse Anwendungsfälle eingesetzt werden, was Kosten senkt, die Skalierbarkeit erhöht und die Geschwindigkeit verbessert.
Ein Beispiel für die praktische Umsetzung dieses Ansatzes ist die Entwicklung eines Multi-Task-Retrievers für die Generierung von Workflows, Playbooks und Code in einem Unternehmen. Workflows beschreiben schrittweise Prozesse zur Automatisierung von Aufgaben, Playbooks enthalten Workflows und UI-Komponenten, und die Codegenerierung dient der automatisierten Erstellung von Software. Für diese Anwendungen werden unterschiedliche Daten benötigt, beispielsweise Workflow-Schrittnamen, Tabellennamen und Feldnamen.
Für das Training eines solchen Multi-Task-Retrievers können Daten aus internen Datenbanken extrahiert und mit bestehenden Trainingsdaten, beispielsweise aus der Workflow-Generierung, kombiniert werden. Als Basismodell eignet sich ein kompakter multilingualer Encoder mit großer Kontextlänge, der lange Instruktionen verarbeiten kann. Durch das Instruction-Finetuning lernt der Retriever, die relevanten Daten aus verschiedenen Quellen zu extrahieren und dem LLM bereitzustellen.
Die Evaluation eines solchen Multi-Task-Retrievers kann auf verschiedene Weisen erfolgen. Eine Möglichkeit ist die Evaluierung mit Out-of-Domain-Daten (OOD). Hierbei wird der Retriever mit Daten aus anderen Domänen als den Trainingsdaten getestet, um seine Generalisierungsfähigkeit zu überprüfen. Eine weitere Möglichkeit ist die Evaluierung mit verwandten, aber unterschiedlichen Retrieval-Aufgaben. So kann beispielsweise getestet werden, ob ein Retriever, der auf das Abrufen von Schrittnamen trainiert wurde, auch relevante Workflow-Strukturen abrufen kann.
Schließlich kann die mehrsprachige Fähigkeit des Retrievers getestet werden, indem die Eingabe in verschiedenen Sprachen erfolgt, selbst wenn die Trainingsdaten nur in einer Sprache vorliegen. Dies ist besonders relevant für Unternehmen, die in einem internationalen Umfeld agieren.
Der beschriebene Ansatz des Multi-Task-Retriever-Finetunings bietet eine pragmatische Lösung für die Herausforderungen von RAG im Unternehmenseinsatz. Durch die Kombination von domainspezifischem Training und Multi-Task-Fähigkeit kann ein effizienter und skalierbarer Retriever entwickelt werden, der die Grundlage für diverse RAG-Anwendungen bildet.
Bibliographie: - https://arxiv.org/abs/2501.04652 - https://arxiv.org/html/2501.04652v1 - https://x.com/_reachsumit/status/1877195251493781873 - https://aclanthology.org/2024.findings-emnlp.41.pdf - https://www.nature.com/articles/s41598-024-79110-x - https://medium.com/hackerai/fine-tuning-or-retrieval-augmented-generation-rag-that-is-the-question-b5b0226d7ca8 - https://training.continuumlabs.ai/knowledge/retrieval-augmented-generation/raft-adapting-language-model-to-domain-specific-rag - https://www.unite.ai/raft-a-fine-tuning-and-rag-approach-to-domain-specific-question-answering/ - https://www.ijfmr.com/papers/2024/5/22581.pdf - https://www.researchgate.net/publication/367403483_Improving_the_Domain_Adaptation_of_Retrieval_Augmented_Generation_RAG_Models_for_Open_Domain_Question_AnsweringEntdecken Sie die Vorteile gegenüber ChatGPT Plus
Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.
Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.
❌ Kein strukturierter Dokumentenvergleich
❌ Keine Bearbeitung im Dokumentkontext
❌ Keine Integration von Unternehmenswissen
✅ Gezielter Dokumentenvergleich mit Custom-Prompts
✅ Kontextbewusste Textbearbeitung im Editor
✅ Wissensbasierte Analyse & Zusammenfassungen
Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.
❌ Nur ein Modellanbieter (OpenAI)
❌ Keine Modellauswahl pro Use Case
❌ Keine zentrale Modellsteuerung für Teams
✅ Zugriff auf über 50 verschiedene KI-Modelle
✅ Modellauswahl pro Prompt oder Assistent
✅ Zentrale Steuerung auf Organisationsebene
❌ Keine echte Teamkollaboration
❌ Keine Rechte- oder Rollenverteilung
❌ Keine zentrale Steuerung oder Nachvollziehbarkeit
✅ Teamübergreifende Bearbeitung in Echtzeit
✅ Granulare Rechte- und Freigabeverwaltung
✅ Zentrale Steuerung & Transparenz auf Organisationsebene
Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.
Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.
🎯 Kostenlose Demo buchenLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen