KI für Ihr Unternehmen – Jetzt Demo buchen

Google stellt Gemini Live vor: Echtzeitkommunikation durch künstliche Intelligenz

Kategorien:
No items found.
Freigegeben:
October 3, 2024

Artikel jetzt als Podcast anhören

Google hat eine neue Funktion für seinen KI-gestützten Sprachassistenten Gemini vorgestellt: Gemini Live. Diese Funktion ermöglicht es Nutzern, in Echtzeit mit Gemini zu kommunizieren, und stellt damit eine direkte Antwort auf den kürzlich von OpenAI vorgestellten „Advanced Voice Mode“ für ChatGPT dar. Gemini Live ist zunächst für Android-Nutzer verfügbar, die ein Abonnement des Dienstes Gemini Advanced besitzen. Die Nutzung ist derzeit auf Englisch beschränkt, die Unterstützung weiterer Sprachen sowie die Verfügbarkeit für iOS sollen in den kommenden Wochen folgen. Mit Gemini Live können Nutzer über ihre Smartphones umfassende Sprachkonversationen mit dem Google-Sprachmodell führen. Die optimierte Spracherkennung ermöglicht einen natürlicheren Gesprächsfluss. Nutzer können Gemini unterbrechen, um beispielsweise Rückfragen zu stellen, und der Chatbot passt sich in Echtzeit an die Sprachmuster des Nutzers an. Google beschreibt die Funktion in einem Blogbeitrag wie folgt: „Mit Gemini Live [über die Gemini-App] können Sie mit Gemini sprechen und aus [10 neuen] natürlich klingenden Stimmen wählen, mit denen es antworten kann. Sie können sogar in Ihrem eigenen Tempo sprechen oder die Antwort mit klärenden Fragen unterbrechen, genau wie in einem normalen Gespräch." Ein Vorteil, den Gemini Live gegenüber dem „Advanced Voice Mode“ von ChatGPT haben könnte, ist ein besseres Gedächtnis. Die Architektur des generativen KI-Modells, das Live, Gemini 1.5 Pro und Gemini 1.5 Flash zugrunde liegt, verfügt über ein überdurchschnittlich großes „Kontextfenster“. Dies bedeutet, dass die Modelle eine große Datenmenge - theoretisch stundenlange Gespräche - verarbeiten und einbeziehen können, bevor sie eine Antwort generieren. „Live verwendet unsere fortschrittlichen Gemini-Modelle, die wir für eine bessere Gesprächsführung angepasst haben", erklärte ein Google-Sprecher gegenüber TechCrunch. „Das große Kontextfenster des Modells wird genutzt, wenn Nutzer lange Gespräche mit Live führen." Obwohl die Echtzeit-Sprachverarbeitung von Gemini Live bereits jetzt verfügbar ist, wird eine weitere, auf der Google I/O angekündigte Funktion erst später im Jahr eingeführt: die multimodale Eingabe. Im Mai veröffentlichte Google Videos, die zeigten, wie Gemini Live die Umgebung des Nutzers über Fotos und Videos der Smartphone-Kamera wahrnimmt und darauf reagiert. So konnte der Chatbot beispielsweise ein Teil an einem kaputten Fahrrad benennen oder den Code auf einem Computerbildschirm erklären. Neben Gemini Live hat Google weitere Neuerungen für seinen Chatbot angekündigt. So wird es Android-Nutzern bald möglich sein, Gemini als Overlay über jeder beliebigen App aufzurufen. Durch Gedrückthalten der Ein-/Aus-Taste oder den Sprachbefehl „Hey Google“ können Nutzer Fragen zu den Inhalten auf dem Bildschirm stellen, beispielsweise zu einem YouTube-Video. Gemini wird dann in der Lage sein, Bilder direkt aus dem Overlay heraus zu generieren - allerdings (noch) keine Bilder von Personen. Diese Bilder können anschließend in andere Apps wie Gmail oder Google Messages gezogen werden. Darüber hinaus erhält Gemini neue Integrationen mit anderen Google-Diensten (oder „Erweiterungen", wie Google sie nennt), sowohl auf Mobilgeräten als auch im Web. In den kommenden Wochen wird Gemini in der Lage sein, Aktionen mit Google Kalender, Keep, Tasks, YouTube Music und den sogenannten „Utilities" durchzuführen. Letztere umfassen Apps, die Funktionen wie Timer, Wecker, Medienwiedergabe, Taschenlampe, Lautstärke, WLAN, Bluetooth usw. steuern. In einem Blogbeitrag nennt Google einige Beispiele, wie Nutzer diese Integrationen nutzen könnten: - Nutzer können Gemini bitten, „eine Playlist mit Songs zu erstellen, die mich an die späten 90er erinnern". - Nutzer können ein Foto eines Konzertflyers aufnehmen und Gemini fragen, ob sie an diesem Tag Zeit haben - und sich sogar eine Erinnerung zum Kauf von Tickets einrichten lassen. - Nutzer können Gemini bitten, ein Rezept aus Gmail herauszusuchen und die Zutaten zu ihrer Einkaufsliste in Keep hinzuzufügen. Schließlich wird Gemini ab Ende dieser Woche auch auf Android-Tablets verfügbar sein. ## Bibliographie - https://the-decoder.com/googles-answer-to-chatgpts-advanced-voice-mode-now-freely-available/ - https://techcrunch.com/2024/08/13/gemini-live-googles-answer-to-chatgpts-advanced-voice-mode-launches/ - https://www.reddit.com/r/OpenAI/comments/1erdir3/gemini_live_googles_answer_to_chatgpts_advanced/ - https://bgr.com/tech/chatgpt-free-advanced-voice-mode/ - https://help.openai.com/en/articles/8400625-voice-mode-faq - https://www.cnbc.com/2024/09/24/how-to-use-chatgpt-advanced-voice-mode-from-openai.html - https://timesofindia.indiatimes.com/technology/tech-news/google-rolling-out-geminis-answer-to-chatgpts-advanced-voice-mode/articleshow/112504547.cms - https://innovation-village.com/gemini-live-googles-answer-to-chatgpts-advanced-voice-mode-is-now-available/ - https://uk.news.yahoo.com/chatgpt-advanced-voice-mode-how-to-use-165223131.html - https://www.youtube.com/watch?v=c7tOIKAgQ2M
Was bedeutet das?
Mindverse vs ChatGPT Plus Widget

Warum Mindverse Studio?

Entdecken Sie die Vorteile gegenüber ChatGPT Plus

Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

🚀 Mindverse Studio

Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

ChatGPT Plus

❌ Kein strukturierter Dokumentenvergleich

❌ Keine Bearbeitung im Dokumentkontext

❌ Keine Integration von Unternehmenswissen

VS

Mindverse Studio

✅ Gezielter Dokumentenvergleich mit Custom-Prompts

✅ Kontextbewusste Textbearbeitung im Editor

✅ Wissensbasierte Analyse & Zusammenfassungen

📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

ChatGPT Plus

❌ Nur ein Modellanbieter (OpenAI)

❌ Keine Modellauswahl pro Use Case

❌ Keine zentrale Modellsteuerung für Teams

VS

Mindverse Studio

✅ Zugriff auf über 50 verschiedene KI-Modelle

✅ Modellauswahl pro Prompt oder Assistent

✅ Zentrale Steuerung auf Organisationsebene

🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

ChatGPT Plus

❌ Keine echte Teamkollaboration

❌ Keine Rechte- oder Rollenverteilung

❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

VS

Mindverse Studio

✅ Teamübergreifende Bearbeitung in Echtzeit

✅ Granulare Rechte- und Freigabeverwaltung

✅ Zentrale Steuerung & Transparenz auf Organisationsebene

👥 Kollaborative KI für Ihr gesamtes Unternehmen

Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

Bereit für den nächsten Schritt?

Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

🎯 Kostenlose Demo buchen

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
Herzlichen Dank! Deine Nachricht ist eingegangen!
Oops! Du hast wohl was vergessen, versuche es nochmal.

🚀 Neugierig auf Mindverse Studio?

Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

🚀 Demo jetzt buchen