Künstliche Intelligenz (KI) durchdringt immer mehr Bereiche unseres Lebens. Besonders Sprachmodelle, die menschenähnliche Texte generieren, erleben einen rasanten Aufstieg. Doch diese Modelle bergen auch Risiken, insbesondere die Reproduktion von gesellschaftlichen Stereotypen. Ein neues Tool namens SHADES soll helfen, diese problematischen Tendenzen in KI-Chatbots aufzudecken und zu bekämpfen.
Bisherige Tools zur Erkennung von Bias in KI-Modellen konzentrierten sich hauptsächlich auf Englisch. SHADES hingegen unterstützt 16 Sprachen aus 37 geopolitischen Regionen. Dies ist ein wichtiger Fortschritt, da die Übersetzung von Stereotypen aus anderen Sprachen ins Englische zu Ungenauigkeiten und dem Übersehen von kulturspezifischen Vorurteilen führen kann.
SHADES analysiert die Reaktionen von KI-Modellen auf verschiedene Aussagen, die potenziell Stereotype enthalten. Durch automatisierte Prompts und die Berechnung von Bias-Scores können Entwickler:innen die Anfälligkeit eines Modells für die Reproduktion von Vorurteilen bewerten. In Tests zeigte sich, dass einige Modelle Stereotype nicht nur wiedergaben, sondern sogar verstärkten und mit weiteren problematischen Inhalten ergänzten.
Besonders auffällig war die Tendenz der Modelle, Stereotype durch Pseudo-wissenschaftliche Erklärungen oder erfundene historische Belege zu rechtfertigen, insbesondere wenn sie aufgefordert wurden, Texte im Stil von Schul- oder Universitätsaufsätzen zu verfassen. Diese Pseudo-Begründungen können die Gefahr bergen, dass problematische Ansichten als wissenschaftlich fundiert wahrgenommen werden.
Die Entwicklung von SHADES umfasste die Zusammenarbeit mit Muttersprachler:innen verschiedener Sprachen. Diese dokumentierten Stereotype in ihrer jeweiligen Sprache, die anschließend übersetzt, getaggt und von anderen Muttersprachlern überprüft wurden. Dieser Prozess ermöglichte die Erstellung eines Datensatzes mit 304 verschiedenen Stereotypen, die sich auf Aussehen, Herkunft, Identität und soziale Faktoren beziehen.
SHADES soll als Diagnoseinstrument dienen, um problematische Tendenzen in KI-Modellen zu identifizieren und deren Verbesserung zu fördern. Das Tool ist öffentlich zugänglich und soll die Entwicklung von Sprachmodellen unterstützen, die frei von Stereotypen sind. Es wird erwartet, dass weitere Sprachen und Stereotype in Zukunft hinzugefügt werden, um die Abdeckung und den Nutzen des Tools weiter zu erhöhen.
Die Entwicklung von SHADES unterstreicht die Bedeutung der Berücksichtigung ethischer Aspekte bei der Entwicklung von KI. Durch die Identifizierung und Bekämpfung von Stereotypen in Sprachmodellen kann dazu beigetragen werden, dass KI-Systeme fair, inklusiv und verantwortungsvoll eingesetzt werden.
Für Mindverse, das Unternehmen, das maßgeschneiderte KI-Lösungen wie Chatbots, Voicebots und KI-Suchmaschinen entwickelt, bietet SHADES wertvolle Einblicke in die Herausforderungen und Potenziale von KI-Sprachmodellen. Die Erkenntnisse aus der Forschung mit SHADES können dazu beitragen, die eigenen KI-Lösungen von Mindverse kontinuierlich zu verbessern und an ethische Standards anzupassen.
Bibliographie: - t3n.de: Neues Tool zeigt problematische Stereotypen in KI-Sprachmodellen auf - t3n.de: Tag: Künstliche Intelligenz - newstral.com: Neues Tool zeigt problematische Stereotypen in KI-Sprachmodellen auf - t3n.de - threads.com: @technologyreview_de - social.heise.de: @techreview_de - all-ai.de: Newsfeed DE - t3n.de: News