Das französische KI-Unternehmen Mistral AI hat sein neues Sprachmodell Small 3 vorgestellt. Mit nur 24 Milliarden Parametern erreicht es laut Mistral eine Leistung, die mit deutlich größeren Modellen von Konkurrenten wie Meta und OpenAI vergleichbar ist. Besonders bemerkenswert ist die Umstellung auf die permissive Apache 2.0 Lizenz, die eine kommerzielle Nutzung des Modells erlaubt.
Small 3 zeichnet sich durch seine Effizienz aus. Laut Mistral erreicht das Modell eine ähnliche Performance wie Modelle, die dreimal so groß sind. In Benchmarks konnte Small 3 mit deutlich größeren Modellen wie Metas Llama-3.3-70B, Qwen2.5-32B und GPT-4o-mini mithalten. Im MMLU-Benchmark erzielte das Modell eine Genauigkeit von 81 Prozent und verarbeitete dabei 150 Token pro Sekunde. Damit positioniert sich Small 3 als eines der effizientesten Modelle seiner Klasse.
Die Optimierung auf geringe Latenzzeiten ermöglicht schnelle Reaktionszeiten, was Small 3 ideal für Echtzeitanwendungen macht. Die Möglichkeit der lokalen Bereitstellung, auch auf einzelnen GPUs, reduziert die Abhängigkeit von teurer Cloud-Infrastruktur.
Mistral AI sieht vielfältige Einsatzmöglichkeiten für Small 3. Das Modell eignet sich für schnelle Chat-Antworten, Funktionsaufrufe, die Feinabstimmung auf spezifische Bereiche und lokale Inferenz auf einzelnen GPUs. Erste Unternehmen aus verschiedenen Branchen testen das Modell bereits. Banken prüfen den Einsatz zur Betrugserkennung, während Gesundheitsdienstleister und Hersteller Small 3 für Kundenservice und die Analyse von Kundenfeedback einsetzen. Auch Robotik-Unternehmen erforschen die Möglichkeiten des Modells.
Ein wichtiger Schritt ist die Umstellung von der proprietären MRL (Mistral Research License) auf die Apache 2.0 Lizenz. Diese Änderung erlaubt Nutzern die freie Verwendung, Modifikation und Weiterverbreitung des Modells, auch für kommerzielle Zwecke. Mistral AI wird weiterhin spezialisierte kommerzielle Modelle für spezifische Bedürfnisse anbieten.
Mistral AI plant in den kommenden Wochen die Veröffentlichung weiterer Modelle mit verbesserten Fähigkeiten im Bereich des logischen Schlussfolgerns. Small 3 wird als Ergänzung zu größeren Open-Source-Reasoning-Modellen positioniert, mit dem Ziel, ähnliche Fähigkeiten bei geringerem Rechenaufwand zu erreichen.
Mit Small 3 festigt Mistral AI seine Position in der europäischen KI-Landschaft. Das Unternehmen bietet eine wachsende Palette an KI-Modellen an, von spezialisierten Lösungen bis hin zu allgemein zugänglichen Modellen wie Small 3. Die Veröffentlichung unter der Apache 2.0 Lizenz unterstreicht das Engagement von Mistral AI für Open Source und ermöglicht eine breite Nutzung des Modells in Forschung und Industrie.
Quellen: - https://the-decoder.com/new-mistral-small-3-does-more-with-less-under-apache-license/ - https://mistral.ai/news/mistral-small-3/ - https://www.reddit.com/r/LocalLLaMA/comments/1idny3w/mistral_small_3/ - https://venturebeat.com/ai/mistral-small-3-brings-open-source-ai-to-the-masses-smaller-faster-and-cheaper/ - https://www.techzine.eu/blogs/applications/128285/mistral-unveils-how-small-ai-models-are-starting-to-think-big/ - https://www.neowin.net/news/new-mistral-small-3-is-faster-and-better-than-similar-openai-and-google-models/ - https://news.ycombinator.com/item?id=42877860 - https://www.youtube.com/watch?v=NIdrv3d895o - https://www.together.ai/blog/mistral-small-3-api-now-available-on-together-ai-a-new-category-leader-in-small-models - https://mistral.ai/news/september-24-release/