Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Hassrede und beleidigende Sprache sind globale Probleme, deren Verständnis, Identifizierung und Moderation soziokulturelles Hintergrundwissen erfordern. In vielen Regionen des Globalen Südens mangelt es jedoch an genau diesem Kontextwissen, was zu unzureichender Moderation oder gar Zensur durch die Anwendung von Keyword-Spotting ohne Berücksichtigung des Kontextes führt. Oftmals stehen prominente Persönlichkeiten im Mittelpunkt der Moderation, während groß angelegte Hasskampagnen gegen Minderheiten übersehen werden. Diese Defizite sind hauptsächlich auf den Mangel an qualitativ hochwertigen Daten in den lokalen Sprachen und die fehlende Einbeziehung der lokalen Gemeinschaften in den Sammel-, Annotations- und Moderationsprozess zurückzuführen.
Um diese Lücke zu schließen, wurde AfriHate entwickelt: eine mehrsprachige Sammlung von Datensätzen zu Hassrede und beleidigender Sprache in 15 afrikanischen Sprachen. AfriHate umfasst Daten für Algerisches Arabisch, Amharisch, Igbo, Kinyarwanda, Hausa, Marokkanisches Arabisch, Nigerianisches Pidgin, Oromo, Somali, Swahili, Tigrinya, Twi, isiXhosa, Yorùbá und isiZulu. Jeder Eintrag in AfriHate wurde von Muttersprachlern annotiert, die mit der lokalen Kultur vertraut sind. Die Datensätze sind in drei Klassen unterteilt: Hass, beleidigend/anstößig oder neutral – weder hasserfüllt noch beleidigend. Die Ziele der Hass-Tweets wurden zusätzlich anhand von sechs häufigen Diskriminierungsmerkmalen kategorisiert: Ethnizität, Politik, Geschlecht, Behinderung, Religion oder Sonstiges.
Die Erstellung von Datensätzen zu Hassrede und beleidigender Sprache ist komplex und zeitaufwendig. Forscher greifen in der Regel auf Keywords, Hashtags oder Benutzerkonten zurück, um Datensätze zu erstellen. Oftmals sind zusätzliche Einblicke von Moderatoren und betroffenen Gemeinschaften erforderlich. Besonders in Sprachen, die nicht Englisch sind, und insbesondere bei ressourcenarmen Sprachen, sind entsprechende Ressourcen knapp.
AfriHate begegnet diesen Herausforderungen durch die Einbeziehung von Muttersprachlern in den Annotationsprozess. Dies gewährleistet, dass der kulturelle Kontext berücksichtigt wird und die Nuancen der Sprache korrekt interpretiert werden. Die detaillierte Annotation der Daten, einschließlich der Identifizierung der Ziele von Hassreden, ermöglicht eine differenzierte Analyse und ein tieferes Verständnis der Phänomene.
Erste Klassifizierungsergebnisse mit und ohne Large Language Models (LLMs) zeigen, dass die Leistung stark von der jeweiligen Sprache abhängt. Multilinguale Modelle können dazu beitragen, die Leistung in ressourcenarmen Umgebungen zu verbessern. Die öffentlich zugänglichen Datensätze, individuellen Annotationen und manuell kuratierten Lexika für Hassrede und beleidigende Sprache bilden eine wertvolle Grundlage für die Forschungsgemeinschaft, die sich mit Hassrede und beleidigender Sprache, afrikanischen Sprachen und der Untersuchung von Meinungsverschiedenheiten befasst.
AfriHate unterstreicht die Bedeutung von Initiativen wie Mindverse, die darauf abzielen, KI-gestützte Tools für afrikanische Sprachen zu entwickeln. Die Verfügbarkeit von qualitativ hochwertigen Datensätzen ist entscheidend für den Erfolg solcher Projekte. Mindverse, als deutsche All-in-One-Content-Plattform für KI-Text, -Inhalte, -Bilder und -Recherche, kann von Projekten wie AfriHate profitieren und dazu beitragen, die Entwicklung von maßgeschneiderten Lösungen wie Chatbots, Voicebots, KI-Suchmaschinen und Wissenssystemen für afrikanische Sprachen voranzutreiben.
Durch die Kombination von AfriHates Datensätzen mit den Fähigkeiten von Mindverse können innovative Anwendungen entstehen, die zur Moderation von Online-Inhalten, zur Überwachung sozialer Medien und zur Bewertung von Bedrohungen eingesetzt werden können. Dies trägt dazu bei, ein sichereres Online-Umfeld zu schaffen und die Meinungsfreiheit in afrikanischen Sprachen zu fördern.
Bibliographie Muhammad, S. H., et al. (2025). AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages. arXiv preprint arXiv:2501.08284v1. IRCAI. (n.d.). AfriHate: Hate and Offensive Speech Detection for African Languages. IRCAI Global Top 100 List. Aliyu, S. M., Wajiga, G. M., & Murtala, M. (2024). A multilingual dataset for offensive language and hate speech detection for hausa, yoruba and igbo languages. arXiv preprint arXiv:2406.02169. Lacuna Fund. (2022). Announcing Awards for African Language Datasets — 2021 NLP Awardees. ChatPaper. (2025). AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages. EqualyzAI. (2024, August 7). [LinkedIn post]. Muhammad, S. H., et al. (2023). Multilingual Hate Speech and Offensive Language Detection. ResearchGate.Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen