Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
Hassrede und beleidigende Sprache sind globale Probleme, deren Verständnis, Identifizierung und Moderation soziokulturelles Hintergrundwissen erfordern. In vielen Regionen des Globalen Südens mangelt es jedoch an genau diesem Kontextwissen, was zu unzureichender Moderation oder gar Zensur durch die Anwendung von Keyword-Spotting ohne Berücksichtigung des Kontextes führt. Oftmals stehen prominente Persönlichkeiten im Mittelpunkt der Moderation, während groß angelegte Hasskampagnen gegen Minderheiten übersehen werden. Diese Defizite sind hauptsächlich auf den Mangel an qualitativ hochwertigen Daten in den lokalen Sprachen und die fehlende Einbeziehung der lokalen Gemeinschaften in den Sammel-, Annotations- und Moderationsprozess zurückzuführen.
Um diese Lücke zu schließen, wurde AfriHate entwickelt: eine mehrsprachige Sammlung von Datensätzen zu Hassrede und beleidigender Sprache in 15 afrikanischen Sprachen. AfriHate umfasst Daten für Algerisches Arabisch, Amharisch, Igbo, Kinyarwanda, Hausa, Marokkanisches Arabisch, Nigerianisches Pidgin, Oromo, Somali, Swahili, Tigrinya, Twi, isiXhosa, Yorùbá und isiZulu. Jeder Eintrag in AfriHate wurde von Muttersprachlern annotiert, die mit der lokalen Kultur vertraut sind. Die Datensätze sind in drei Klassen unterteilt: Hass, beleidigend/anstößig oder neutral – weder hasserfüllt noch beleidigend. Die Ziele der Hass-Tweets wurden zusätzlich anhand von sechs häufigen Diskriminierungsmerkmalen kategorisiert: Ethnizität, Politik, Geschlecht, Behinderung, Religion oder Sonstiges.
Die Erstellung von Datensätzen zu Hassrede und beleidigender Sprache ist komplex und zeitaufwendig. Forscher greifen in der Regel auf Keywords, Hashtags oder Benutzerkonten zurück, um Datensätze zu erstellen. Oftmals sind zusätzliche Einblicke von Moderatoren und betroffenen Gemeinschaften erforderlich. Besonders in Sprachen, die nicht Englisch sind, und insbesondere bei ressourcenarmen Sprachen, sind entsprechende Ressourcen knapp.
AfriHate begegnet diesen Herausforderungen durch die Einbeziehung von Muttersprachlern in den Annotationsprozess. Dies gewährleistet, dass der kulturelle Kontext berücksichtigt wird und die Nuancen der Sprache korrekt interpretiert werden. Die detaillierte Annotation der Daten, einschließlich der Identifizierung der Ziele von Hassreden, ermöglicht eine differenzierte Analyse und ein tieferes Verständnis der Phänomene.
Erste Klassifizierungsergebnisse mit und ohne Large Language Models (LLMs) zeigen, dass die Leistung stark von der jeweiligen Sprache abhängt. Multilinguale Modelle können dazu beitragen, die Leistung in ressourcenarmen Umgebungen zu verbessern. Die öffentlich zugänglichen Datensätze, individuellen Annotationen und manuell kuratierten Lexika für Hassrede und beleidigende Sprache bilden eine wertvolle Grundlage für die Forschungsgemeinschaft, die sich mit Hassrede und beleidigender Sprache, afrikanischen Sprachen und der Untersuchung von Meinungsverschiedenheiten befasst.
AfriHate unterstreicht die Bedeutung von Initiativen wie Mindverse, die darauf abzielen, KI-gestützte Tools für afrikanische Sprachen zu entwickeln. Die Verfügbarkeit von qualitativ hochwertigen Datensätzen ist entscheidend für den Erfolg solcher Projekte. Mindverse, als deutsche All-in-One-Content-Plattform für KI-Text, -Inhalte, -Bilder und -Recherche, kann von Projekten wie AfriHate profitieren und dazu beitragen, die Entwicklung von maßgeschneiderten Lösungen wie Chatbots, Voicebots, KI-Suchmaschinen und Wissenssystemen für afrikanische Sprachen voranzutreiben.
Durch die Kombination von AfriHates Datensätzen mit den Fähigkeiten von Mindverse können innovative Anwendungen entstehen, die zur Moderation von Online-Inhalten, zur Überwachung sozialer Medien und zur Bewertung von Bedrohungen eingesetzt werden können. Dies trägt dazu bei, ein sichereres Online-Umfeld zu schaffen und die Meinungsfreiheit in afrikanischen Sprachen zu fördern.
Bibliographie Muhammad, S. H., et al. (2025). AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages. arXiv preprint arXiv:2501.08284v1. IRCAI. (n.d.). AfriHate: Hate and Offensive Speech Detection for African Languages. IRCAI Global Top 100 List. Aliyu, S. M., Wajiga, G. M., & Murtala, M. (2024). A multilingual dataset for offensive language and hate speech detection for hausa, yoruba and igbo languages. arXiv preprint arXiv:2406.02169. Lacuna Fund. (2022). Announcing Awards for African Language Datasets — 2021 NLP Awardees. ChatPaper. (2025). AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages. EqualyzAI. (2024, August 7). [LinkedIn post]. Muhammad, S. H., et al. (2023). Multilingual Hate Speech and Offensive Language Detection. ResearchGate.Entdecken Sie die Vorteile gegenüber ChatGPT Plus
Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.
Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.
❌ Kein strukturierter Dokumentenvergleich
❌ Keine Bearbeitung im Dokumentkontext
❌ Keine Integration von Unternehmenswissen
✅ Gezielter Dokumentenvergleich mit Custom-Prompts
✅ Kontextbewusste Textbearbeitung im Editor
✅ Wissensbasierte Analyse & Zusammenfassungen
Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.
❌ Nur ein Modellanbieter (OpenAI)
❌ Keine Modellauswahl pro Use Case
❌ Keine zentrale Modellsteuerung für Teams
✅ Zugriff auf über 50 verschiedene KI-Modelle
✅ Modellauswahl pro Prompt oder Assistent
✅ Zentrale Steuerung auf Organisationsebene
❌ Keine echte Teamkollaboration
❌ Keine Rechte- oder Rollenverteilung
❌ Keine zentrale Steuerung oder Nachvollziehbarkeit
✅ Teamübergreifende Bearbeitung in Echtzeit
✅ Granulare Rechte- und Freigabeverwaltung
✅ Zentrale Steuerung & Transparenz auf Organisationsebene
Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.
Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.
🎯 Kostenlose Demo buchenLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen