Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Softwareentwicklung erlebt durch den zunehmenden Einsatz von KI-gestützten Code-Vervollständigungstools einen Wandel. Diese Systeme, die Entwicklern während des Kodierens Vorschläge unterbreiten, haben sich als wertvolle Helfer etabliert. Allerdings bleiben die dabei generierten Benutzerinteraktionsdaten oft im Besitz großer Unternehmen, was die akademische Forschung in diesem Bereich erschwert. Für Wissenschaftler, die menschliche-KI-Interaktion studieren, bedeutet dies häufig, eigene Plattformen entwickeln zu müssen, was die Reproduzierbarkeit und groß angelegte Datenanalysen behindert.
Als Reaktion auf diese Herausforderung wurde Code4MeV2 vorgestellt – eine quelloffene, forschungsorientierte Code-Vervollständigungsplattform. Sie ist als Plugin für JetBrains Integrierte Entwicklungsumgebungen (IDEs) konzipiert und bietet eine Lösung für die genannten Einschränkungen.
Code4MeV2 basiert auf einer Client-Server-Architektur und integriert sowohl die Inline-Code-Vervollständigung als auch einen kontextsensitiven Chat-Assistenten. Das zentrale Element der Plattform ist ein modularer und transparenter Rahmen zur Datenerfassung. Dieser ermöglicht es Forschenden, eine präzise Kontrolle über Telemetrie- und Kontextdaten auszuüben. Zu den Hauptmerkmalen gehören:
Die Plattform erreicht eine durchschnittliche Latenzzeit von 200 ms, was die Leistung mit industriellen Standards vergleichbar macht. Eine Kombination aus Expertenbewertungen und einer Nutzerstudie mit acht Teilnehmenden hat die Informativität und Nützlichkeit des Tools bestätigt.
Ein wesentlicher Aspekt der Forschung rund um Code4MeV2 ist die Untersuchung, wie Code-Suchmechanismen die Leistung von Code-Vervollständigungs- und -Generierungsaufgaben verbessern können. Die Ergebnisse zeigen, dass ein Framework, das Code-Suche integriert, die Leistung von Code-Vervollständigung bei allgemeinen Deep-Learning-Modellen sowie die Code-Generierung bei großen Sprachmodellen (LLMs) deutlich steigert.
Studien haben gezeigt, dass die Integration von Code-Suchfunktionen die Leistung etablierter Deep-Learning-Modelle (wie LSTM, Transformer Decoder, Transformer-XL und CodeGPT) bei der Code-Vervollständigung verbessert. Insbesondere die NL2NL-Suchstrategie, die Textähnlichkeit zur Auffindung ähnlichen Codes nutzt, erzielte die größten Verbesserungen. Dies unterstreicht die Effektivität, ähnliche Modalitäten für Abfrage und Ziel zu verwenden.
Besonders bemerkenswert sind die Verbesserungen bei LLMs wie ChatGPT und GPT-3.5. Das retrieval-augmented Framework führte zu signifikanten Leistungssteigerungen bei der Code-Generierung, teilweise über 100% im BLEU-4-Score. Diese Ergebnisse deuten darauf hin, dass LLMs eine überlegene Fähigkeit besitzen, lange Eingaben zu verarbeiten und aus den abgerufenen Code-Beispielen zu lernen, um logisch korrekten Code zu generieren.
Die Forschung untersuchte auch den Einfluss der Anzahl der bereitgestellten Code-Beispiele (sogenannte "Shots") und der Gestaltung von Prompt-Templates auf die Leistung von retrieval-augmented ChatGPT. Es zeigte sich, dass eine kleine Anzahl hochwertiger Beispiele (1 bis 2 Shots) zu den größten Verbesserungen führt. Eine weitere Erhöhung der Shot-Anzahl brachte keine linearen Verbesserungen und konnte sogar zu Leistungsschwankungen führen, möglicherweise aufgrund abnehmender Relevanz der Beispiele oder erhöhter Komplexität der Prompt-Länge.
ChatGPT zeigte sich robust gegenüber verschiedenen Prompt-Templates. Die Kombination aus "detaillierter, impliziter, zweistufiger" Anweisung erwies sich als besonders effektiv, während andere Templates ebenfalls gute Ergebnisse lieferten.
Die Latenzzeit ist ein entscheidender Faktor für die Benutzererfahrung bei Code-Vervollständigungstools. Die Analyse der zeitlichen Effizienz verschiedener Retriever (IR-basierte und DL-basierte) ergab:
Die Ergebnisse dieser Forschung liefern wichtige Erkenntnisse für die Entwicklung und Optimierung von KI-gestützten Code-Vervollständigungstools:
Code4MeV2 stellt nicht nur eine leistungsstarke Plattform für die Code-Vervollständigung dar, sondern auch ein wertvolles Werkzeug für die akademische Forschung. Es ermöglicht eine transparente Datenerfassung und detaillierte Studien zur Mensch-KI-Interaktion im Kontext der Softwareentwicklung. Zukünftige Arbeiten könnten den tiefgreifenden Einfluss von Retrieval-Ansätzen auf weitere Aufgaben im Software-Engineering untersuchen und so das volle Potenzial dieser Technologien erschließen.
Die quelloffene Natur von Code4MeV2 fördert die Zusammenarbeit und ermöglicht es der Gemeinschaft, das Tool weiterzuentwickeln und zu adaptieren, um die Herausforderungen der modernen Softwareentwicklung gemeinsam zu meistern.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen