Google hat mit Gemini 2.0 die nächste Generation seines multimodalen KI-Modells vorgestellt. Gemini 2.0 ist nicht nur eine Weiterentwicklung des Vorgängermodells, sondern bildet die Basis für eine neue Klasse von KI-Agenten, die komplexe Aufgaben autonom ausführen können. Diese Agenten sollen Nutzern im Alltag und bei der Arbeit unterstützen, indem sie Informationen verarbeiten, Schlussfolgerungen ziehen und selbstständig Aktionen durchführen.
Während Gemini 1.0 auf die Organisation und das Verständnis von Informationen fokussiert war, zielt Gemini 2.0 darauf ab, diese Informationen nutzbar zu machen. Die Fähigkeit, über mehrere Schritte hinweg zu denken und im Auftrag des Nutzers zu handeln, steht im Vordergrund. Die neuen Funktionen umfassen native Bild- und Audioausgabe sowie die Möglichkeit, Tools wie die Google-Suche direkt zu nutzen.
Mit Gemini 2.0 Flash steht Entwicklern eine experimentelle Version des Modells zur Verfügung. Diese Version bietet eine verbesserte Leistung bei gleichzeitig niedrigen Latenzzeiten. Neben multimodalen Eingaben wie Bildern, Videos und Audio unterstützt 2.0 Flash auch multimodale Ausgaben, beispielsweise die Generierung von Bildern in Kombination mit Text oder die Steuerung von mehrsprachiger Text-to-Speech-Audioausgabe. Darüber hinaus kann 2.0 Flash Tools wie die Google-Suche, Codeausführung und benutzerdefinierte Funktionen von Drittanbietern nutzen.
Gemini 2.0 wird in verschiedene Google-Produkte integriert, beginnend mit der Gemini App und der Google-Suche. Die erweiterten Funktionen des Modells ermöglichen es der Suche, komplexere Anfragen zu bearbeiten, darunter mathematische Gleichungen, multimodale Suchanfragen und Code. Die Integration in weitere Produkte ist für die Zukunft geplant.
Projekt Astra ist ein Forschungsprototyp, der die Möglichkeiten eines universellen KI-Assistenten auf Android-Smartphones auslotet. Gemini 2.0 ermöglicht Astra verbesserte Dialogfähigkeiten, die Nutzung von Google-Tools wie Suche, Lens und Maps, ein besseres Gedächtnis und eine geringere Latenz. Zukünftig soll Astra auch auf anderen Geräten wie Datenbrillen verfügbar sein.
Projekt Mariner ist ein weiterer Forschungsprototyp, der die Interaktion zwischen Mensch und KI im Webbrowser erforscht. Mariner kann Informationen auf dem Bildschirm, einschließlich Pixeln und Webelementen, verstehen und verarbeiten. Über eine experimentelle Chrome-Erweiterung kann Mariner dann Aufgaben für den Nutzer ausführen, beispielsweise Formulare ausfüllen oder Online-Einkäufe tätigen.
Mit Jules präsentiert Google einen KI-gestützten Code-Agenten, der Entwicklern bei ihrer Arbeit helfen soll. Details zu den Funktionen von Jules wurden bisher noch nicht veröffentlicht, es ist jedoch davon auszugehen, dass der Agent auf den Fähigkeiten von Gemini 2.0 aufbaut.
Die Entwicklung von KI-Agenten wie Mariner und Astra steht noch am Anfang. Google betont die Wichtigkeit von Sicherheit und ethischen Überlegungen bei der Entwicklung dieser Technologien. Die aktuellen Prototypen zeigen jedoch das Potenzial von KI-Agenten, die Nutzer im Alltag und bei der Arbeit unterstützen können. Die weitere Entwicklung und Integration in bestehende Produkte wird zeigen, wie sich diese Technologie auf die Interaktion mit Computern und das Internet auswirkt.
Bibliographie: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/ https://www.youtube.com/watch?v=ir3T4Zcfu4A https://medium.com/google-cloud/responsibleai-in-gemini-2-87adc5a9b1b2 https://www.fastcompany.com/91243722/google-deepmind-project-astra-project-mariner https://www.youtube.com/watch?v=8LGYM2tiIX0 https://www.fanaticalfuturist.com/2024/12/google-launches-gemini-2-0-its-new-model-for-everything/ https://www.forbes.com/sites/chriswestfall/2024/12/12/google-launches-mariner-a-new-ai-agent-based-on-updated-gemini-20/ https://www.yahoo.com/tech/googles-latest-ai-model-gemini-183016231.html https://www.linkedin.com/posts/mbonye-vicent-573a3879_googles-gemini-20-just-shocked-the-entire-activity-7276527500707430400-PT-q https://www.nytimes.com/2024/12/11/technology/google-ai-agent-gemini.html