Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Stellen Sie sich vor, Sie bitten Ihren virtuellen Assistenten: "Reserviere einen Tisch zum Abendessen und stelle eine Erinnerung für das morgige Meeting ein" – eine einzige Anfrage mit zwei unterschiedlichen Aufgaben. Die meisten heutigen Systeme hätten Schwierigkeiten, diese Anfrage reibungslos zu bearbeiten, da sie für Einzelaufgaben-Befehle wie "Erinnerung einstellen" trainiert sind. Menschen kombinieren jedoch häufig mehrere Anfragen in einem Satz, insbesondere wenn sie natürliche Sprache verwenden.
Eine neue Forschungsarbeit, die auf der EMNLP 2024 Findings (Long Paper) vorgestellt wurde, stellt einen bedeutenden Fortschritt in der sprachbasierten KI dar. Die Forscher haben ein mehrsprachiges, Multi-Intentions-Dataset und ein neuartiges Pointer-Netzwerk-Modell entwickelt, das nicht nur mehrere Intentionen in komplexen Anfragen erkennt, sondern auch genau lokalisiert, wo jede Intention im Text erscheint.
Bisherige Forschung im Bereich der Intentionserkennung konzentrierte sich hauptsächlich auf einfache Anfragen mit einer einzigen Intention. Es fehlte an effektiven Systemen für die Verarbeitung komplexer Anfragen mit mehreren Intentionen und der Extraktion verschiedener Intentionsabschnitte. Darüber hinaus gab es einen Mangel an mehrsprachigen, Multi-Intentions-Datensätzen.
Die vorliegende Studie adressiert drei kritische Aufgaben:
- Die Extraktion mehrerer Intentionsabschnitte aus Anfragen - Die Erkennung mehrerer Intentionen - Die Entwicklung eines mehrsprachigen Multi-Label-IntentionsdatensatzesDie Forscher haben ein neuartiges Multi-Label-Multi-Class-Intentionserkennungs-Dataset (MLMCID-Dataset) aus bestehenden Benchmark-Datensätzen zusammengestellt. Dieses Dataset umfasst sowohl grobe als auch feinkörnige Intentionsbezeichnungen sowie die Kennzeichnung von primären und nicht-primären Intentionen. Ein Beispiel hierfür wäre die Unterscheidung zwischen der groben Intention "Restaurantreservierung" und der feineren Intention "Tisch für zwei Personen reservieren".
Zusätzlich zum Dataset wurde eine auf Pointer-Netzwerken basierende Architektur (MLMCID) entwickelt. Pointer-Netzwerke sind eine spezielle Art von neuronalen Netzen, die besonders gut darin sind, auf bestimmte Teile einer Eingabesequenz zu zeigen. In diesem Fall werden sie verwendet, um die Intentionsabschnitte innerhalb einer Anfrage zu identifizieren. Das MLMCID-Modell extrahiert Intentionsabschnitte und erkennt mehrere Intentionen mit groben und feinkörnigen Bezeichnungen in Form von Sextupeln. Ein Sextupel besteht aus der Anfrage, dem Intentionsabschnitt, der groben Intention, der feinen Intention, der Information ob es sich um eine primäre oder nicht-primäre Intention handelt, und der Sprache der Anfrage.
Umfangreiche Analysen zeigen die Überlegenheit des auf Pointer-Netzwerken basierenden Systems gegenüber herkömmlichen Ansätzen in Bezug auf Genauigkeit und F1-Score über verschiedene Datensätze hinweg. Die Forscher haben auch Experimente mit verschiedenen Large Language Models (LLMs) wie Llama2 und GPT durchgeführt, um deren Wirksamkeit zu bewerten. Der Vergleich zeigt, dass das MLMCID-Modell in vielen Fällen bessere Ergebnisse erzielt.
Durch die Ermöglichung der Erkennung sowohl von breiten als auch von spezifischen Intentionen befähigt dieses Modell digitale Assistenten, komplexe Benutzeranfragen besser zu verstehen, zu jonglieren und darauf zu reagieren – und das mit größerer Genauigkeit und über verschiedene Sprachen hinweg. Dies markiert einen bedeutenden Fortschritt für aufgabenorientierte Dialogsysteme.
Die Forschungsergebnisse legen nahe, dass dieser Ansatz das Potenzial hat, die Interaktion zwischen Mensch und Maschine grundlegend zu verändern und die Entwicklung von robusteren und vielseitigeren Sprachassistenten zu beschleunigen.
Bibliographie: https://arxiv.org/abs/2410.22476 https://www.researchgate.net/publication/385351632_A_Pointer_Network-based_Approach_for_Joint_Extraction_and_Detection_of_Multi-Label_Multi-Class_Intents https://arxiv.org/html/2410.22476v1 https://cse.iitkgp.ac.in/~pawang/Publications.html https://www.linkedin.com/posts/pawan-goyal-08a6001a_emnlp2023-mapg2022-activity-7116685432871956480-HQ2f https://www.sciencedirect.com/science/article/abs/pii/S0927025623006535 https://ijcai24.org/main-track-accepted-papers/ https://www.linkedin.com/posts/iitkgpcnerg_tutorials-activity-7018055008147369984-bCzR https://github.com/kaisugi/entity-related-papers https://www.isca-archive.org/interspeech_2023/Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen