Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Neuronale maschinelle Übersetzung (NMT) hat in den letzten Jahren enorme Fortschritte gemacht. Trotzdem stehen NMT-Modelle, insbesondere im Kontext weniger verbreiteter Sprachen, vor Herausforderungen. Ein Hauptproblem besteht darin, dass Trainingsdatensätze oft nur begrenzt wissenschaftliche, technische und bildungsbezogene Inhalte abdecken. Dies führt dazu, dass Übersetzungen von Texten mit Fachjargon oder komplexen wissenschaftlichen Konzepten oft ungenau oder unverständlich sind. Dieses Problem ist besonders akut bei indischen Sprachen, für die oft nur wenige Ressourcen zur Verfügung stehen.
Das Projekt "Shiksha" adressiert diese Herausforderung, indem es einen neuen, auf den technischen Bereich fokussierten Datensatz und ein darauf trainiertes Übersetzungsmodell für indische Sprachen vorstellt. Der Datensatz umfasst über 2,8 Millionen qualitativ hochwertige Übersetzungseinheiten in acht indischen Sprachen, sowohl für Übersetzungen aus dem Englischen in die jeweiligen Sprachen als auch für Übersetzungen zwischen den indischen Sprachen selbst. Die Daten wurden durch Bitext-Mining aus den menschlichen Übersetzungen von Transkripten von NPTEL-Videolehrveranstaltungen gewonnen. NPTEL (National Programme on Technology Enhanced Learning) ist eine Initiative des indischen Bildungsministeriums, die Online-Kurse in verschiedenen technischen und wissenschaftlichen Bereichen anbietet.
Die auf dem Shiksha-Datensatz trainierten NMT-Modelle zeigen eine deutlich verbesserte Übersetzungsqualität bei technischen Texten im Vergleich zu anderen öffentlich verfügbaren Modellen. Die Evaluation der Modelle erfolgte anhand von In-Domain-Aufgaben, also Übersetzungen von Texten aus dem gleichen technischen Bereich, aus dem auch die Trainingsdaten stammen. Die Ergebnisse zeigen, dass Shiksha eine signifikante Verbesserung im Vergleich zu bestehenden Modellen erreicht.
Darüber hinaus demonstriert Shiksha auch Potenzial für die Generalisierung auf domänenübergreifende Übersetzungsaufgaben. Tests mit dem Flores+ Benchmark, einem weit verbreiteten Datensatz zur Bewertung von NMT-Modellen, zeigen eine durchschnittliche Verbesserung von über 2 BLEU-Punkten für die untersuchten indischen Sprachen. Der BLEU-Score ist ein gängiges Maß zur Bewertung der Qualität maschineller Übersetzungen. Diese Ergebnisse deuten darauf hin, dass der Shiksha-Datensatz und die darauf basierenden Modelle nicht nur für den technischen Bereich, sondern auch für andere Anwendungsgebiete von Nutzen sein können.
Die Entwicklung und Bereitstellung von spezialisierten Datensätzen und KI-Modellen wie Shiksha spielen eine entscheidende Rolle für Unternehmen wie Mindverse, einem deutschen Anbieter von KI-gestützten Content-Lösungen. Mindverse bietet eine All-in-One-Plattform für KI-Text, Content-Erstellung, Bildgenerierung und Recherche. Darüber hinaus entwickelt Mindverse maßgeschneiderte KI-Lösungen für Unternehmen, darunter Chatbots, Voicebots, KI-Suchmaschinen und Wissenssysteme. Die Verfügbarkeit von hochwertigen Sprachdaten und leistungsfähigen Übersetzungsmodellen ist essentiell für die Entwicklung und den Erfolg solcher KI-Anwendungen.
Die Forschung und Entwicklung im Bereich der neuronalen maschinellen Übersetzung schreitet kontinuierlich voran. Projekte wie Shiksha tragen dazu bei, die Grenzen des Möglichen zu erweitern und die Qualität von Übersetzungen in immer mehr Sprachen und Domänen zu verbessern. Dies eröffnet neue Möglichkeiten für die internationale Kommunikation und den Wissensaustausch und ermöglicht es Unternehmen wie Mindverse, innovative KI-Lösungen für die Zukunft zu entwickeln.
Bibliographie https://openreview.net/pdf/026affb5b965b03770702824638a65027602e53f.pdf https://openreview.net/forum?id=5tzlr1IWRN https://arxiv.org/html/2411.04699v1 https://www.linkedin.com/posts/reverie-language-technologies-pvt-ltd_reverie-sets-a-new-benchmark-in-automated-activity-7221390629673607169-z6tS https://arxiv.org/abs/2412.04351 https://aclanthology.org/2022.term-1.4.pdf https://indiaai.gov.in/article/ai4bharat-unveils-bhasaanuvaad-speech-translation-dataset-in-13-languages https://ncert.nic.in/pdf/focus-group/Indian_Languages.pdf https://www.meity.gov.in/writereaddata/files/AR_2022-23_English_24-04-23.pdf https://www.researchgate.net/publication/334759496_A_Baseline_Neural_Machine_Translation_System_for_Indian_LanguagesLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen