Gemini Live: Googles KI-Chatbot im Alltagstest
Google integriert die neuesten Funktionen von Gemini 2.0 in ausgewählte Android-Smartphones. Nutzer können nun mit dem KI-Chatbot über Bilder, PDF-Dokumente und YouTube-Videos kommunizieren. Dieser Artikel beleuchtet die praktische Anwendung und Funktionalität dieser neuen Technologie.
Die neuen Gemini-Funktionen wurden im Rahmen des Galaxy-S25-Events von Google vorgestellt. Während der Launch der neuen Galaxy-Modelle noch aussteht, können Besitzer eines Galaxy S24, Pixel 9 und offenbar weiterer Geräte bereits auf die neuen Features zugreifen.
Die erweiterte Funktionalität ermöglicht es Nutzern, mit Gemini Live über verschiedene Medien wie Bilder, Dateien und YouTube-Videos in natürlicher Sprache zu interagieren. Bisher beschränkten sich die Konversationen mit dem Google-Chatbot auf allgemeines Wissen.
Gemini Live im Praxistest
Um den neuen Gesprächsmodus zu starten, wird das Gemini-Overlay – nicht die App – entweder durch Drücken des Powerbuttons oder durch eine Wischgeste von einer unteren Bildschirmecke aktiviert, während der gewünschte Inhalt angezeigt wird. Bei YouTube-Videos bietet Gemini an, über das Video zu sprechen oder Fragen dazu zu stellen. Ähnliche Optionen erscheinen bei PDF-Dateien und Bildern. Bei Bildern muss zusätzlich das Plus-Symbol betätigt werden, um die Datei auszuwählen. Anschließend erscheint – zumindest auf den ersten Testgeräten – die Schaltfläche "Mit Gemini Live darüber sprechen".
Die Funktion erweist sich je nach Inhalt als äußerst nützlich. So kann Gemini beispielsweise YouTube-Videos zusammenfassen und detaillierte Fragen dazu beantworten. In einem Test mit einem Video von MKBHD zu Samsungs „Project Moohan“, einem XR-Headset mit Android XR, erklärte Gemini die Vorzüge und Nachteile des Produkts aus Sicht des YouTubers. Auch spezifische Fragen zur Hard- oder Software können gestellt werden, jedoch nur im Rahmen der Informationen, die im Video selbst erwähnt werden.
Auch PDF-Dokumente kann die KI zusammenfassen, Fragen beantworten und sogar Quizze erstellen, um das Verständnis des Nutzers zu überprüfen. Bei umfangreichen PDF-Dateien kann die Verarbeitung durch Gemini allerdings einige Minuten dauern.
Die Möglichkeit, mit Gemini Live über Artikel auf Webseiten zu diskutieren, ist aktuell noch nicht verfügbar. Es besteht lediglich die Option, Fragen zum Bildschirminhalt zu stellen, woraufhin Gemini den Artikelinhalt grob zusammenfasst. Wie bei allen KI-Modellen kann es auch bei Gemini Live zu Fehlern kommen. Im Test antwortete die KI beispielsweise auf die Frage, welche von zwei Abbildungen von Elefanten korrekter sei, mit Abbildung 1, was offensichtlich falsch ist.
Datenschutz und Kontrolle
Um dem Nutzer mehr Kontrolle über seine Daten zu geben, kann per Langdruck auf eine beliebige Gemini-Eingabeaufforderung festgelegt werden, ob die automatische Übermittlung von Bildschirminhalten aktiviert oder deaktiviert ist. Ist die automatische Übermittlung deaktiviert, erscheint die Schaltfläche "Live sprechen" erst nach manueller Übermittlung des Inhalts.
Bei aktivierter Funktion werden alle Bildschirmaktionen automatisch an Gemini übertragen. Um die automatische Übermittlung wieder zu aktivieren, muss der "Fragen nach…"-Chip gedrückt gehalten und anschließend "Automatische Übermittlung einschalten" ausgewählt werden.
Ausblick: Project Astra
Die neuen Gemini-Funktionen sind ein weiterer Schritt in Richtung Project Astra, das Google erstmals im Rahmen der I/O 2024 präsentierte und im Dezember 2024 als Teil von Gemini 2.0 ankündigte.
In den kommenden Monaten sollen weitere Komponenten von Project Astra, wie die Bildschirmfreigabe und das Live-Streaming von Videos in der Gemini-App, verfügbar werden. Langfristig sollen diese Funktionen auch in XR-Headsets und AR-Brillen integriert werden. Sowohl Google als auch Samsung haben entsprechende Pläne angekündigt, und weitere Hardwarepartner wie Sony, Lynx und Xreal sind ebenfalls involviert.
Bibliographie:
- https://t3n.de/news/gemini-live-die-naechste-generation-von-ki-chstbots-fuer-android-smartphones-im-test-1670374/
- https://t3n.de/news/google-chatbot-gemini-live-kostenlos-android-smartphones-1646334/
- https://praxistipps.chip.de/gemini-live-das-kann-die-neue-google-ki_184770
- https://t3n.de/news/gemini-live-google-ki-upgrade-chatgpt-1640622/
- https://de.linkedin.com/posts/t3n-magazin-yeebase-media-gmbh_google-macht-chatbot-gemini-live-kostenlos-activity-7240409011009826816-D5_r
- https://t3n.de/news/google-gemini-2-1669561/
- https://www.nextpit.de/google-gemini-live-mondlandung-moment-fuer-ki-smartphones
- https://www.mind-verse.de/news/gemini-2-0-neueste-entwicklung-googles-multimodaler-ki
- https://t3n.de/news/nicht-nur-im-smartphone-googles-gemini-sierung-schreitet-voran-1668955/