Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen
OpenAI hat seine fortschrittliche Sprachfunktion für ChatGPT um visuelle Fähigkeiten erweitert. Nutzer können nun Objekte über die Smartphone-Kamera oder den Bildschirm ihres Geräts präsentieren, die ChatGPT dann erkennt und in seiner erweiterten Sprachmodus-Funktion verarbeitet. Diese mit Spannung erwartete Funktion, die bereits im Mai mit der Vorstellung des GPT-4o-Modells angedeutet wurde, eröffnet neue Möglichkeiten für die Interaktion mit dem Chatbot.
Die Video- und Screensharing-Funktion wird in den kommenden Tagen für die meisten ChatGPT Plus- und Pro-Nutzer sowie alle Team-Nutzer über die mobile ChatGPT-App verfügbar sein. Nutzer in der Europäischen Union, der Schweiz, Island, Norwegen und Liechtenstein sollen die Funktion ebenfalls bald erhalten. Für ChatGPT Enterprise- und Edu-Nutzer ist die Funktion ab Januar geplant.
Die erweiterte Sprachfunktion basiert auf OpenAIs nativem multimodalen 4o-Modell, das Audioeingaben verarbeiten und in natürlicher Konversation antworten kann. Durch die Integration der visuellen Komponente kann ChatGPT nun ein noch umfassenderes Verständnis von Anfragen entwickeln und kontextbezogenere Antworten liefern.
Neben der visuellen Erweiterung hat OpenAI auch eine temporäre „Santa-Stimme“ als voreingestellte Stimme im erweiterten Sprachmodus hinzugefügt. Diese Funktion ist weltweit bis Anfang Januar für alle mobilen, Web- und Desktop-App-Nutzer verfügbar und über ein Schneeflocken-Symbol in ChatGPT zugänglich.
Die Ankündigung erfolgte im Rahmen des „12 Days of OpenAI“-Events, bei dem das Unternehmen neue Produkte und Funktionen vorstellte, darunter das o1-Modell und ein neues Abonnementmodell für ChatGPT. Der Chatbot ist nun auch über Apples Siri-Sprachassistenten zugänglich.
OpenAI räumte während der Ankündigung auch einen stundenlangen Ausfall von ChatGPT und seinem neuen Videogenerator Sora ein, der am Vortag aufgetreten war. Das Unternehmen hatte die Nachfrage nach Sora unterschätzt und arbeitet daran, den Zugang für alle Nutzer zu ermöglichen.
Die Integration der visuellen Wahrnehmung in ChatGPTs erweiterte Sprachfunktion stellt einen bedeutenden Fortschritt in der Entwicklung von Chatbots dar. Sie ermöglicht eine natürlichere und intuitivere Interaktion und eröffnet neue Anwendungsbereiche für den Chatbot, von der Unterstützung bei alltäglichen Aufgaben bis hin zu komplexeren Problemlösungen.
Die Reaktionen der Nutzergemeinschaft auf die neuen Funktionen sind überwiegend positiv. Die Möglichkeit, mit ChatGPT über visuelle Eingaben zu kommunizieren, wird als großer Vorteil gesehen und könnte die Nutzung des Chatbots weiter verbreiten. Gleichzeitig werden aber auch Bedenken hinsichtlich des Datenschutzes und der möglichen Missbrauchspotenziale geäußert, die OpenAI adressieren muss.
Die weitere Entwicklung von ChatGPT und ähnlichen KI-Modellen wird zeigen, wie sich die Integration visueller und auditiver Fähigkeiten auf die Interaktion zwischen Mensch und Maschine auswirkt und welche neuen Möglichkeiten sich daraus ergeben.
Bibliographie: - https://www.yahoo.com/tech/openai-advanced-voice-mode-now-205225877.html - https://help.openai.com/en/articles/8400625-voice-mode-faq - https://community.openai.com/t/advanced-voice-mode-released-09252024/956738 - https://www.ainews.com/p/openai-rolls-advanced-voice-mode-select-chatgpt-plus-users - https://qz.com/openai-chatgpt-advanced-voice-mode-screenshare-video-ai-1851720007 - https://mashable.com/article/openai-brings-video-to-chatgpt-advanced-voice-mode - https://openai.com/index/chatgpt-can-now-see-hear-and-speak/ - https://www.reddit.com/r/OpenAI/comments/1f2m4ev/does_anyone_still_have_access_to_the_advanced/ - https://www.youtube.com/watch?v=wwFlq72xsvo - https://www.euronews.com/next/2024/10/22/openais-advanced-voice-mode-is-now-available-in-europe-heres-what-you-can-do-with-itEntdecken Sie die Vorteile gegenüber ChatGPT Plus
Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.
Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.
❌ Kein strukturierter Dokumentenvergleich
❌ Keine Bearbeitung im Dokumentkontext
❌ Keine Integration von Unternehmenswissen
✅ Gezielter Dokumentenvergleich mit Custom-Prompts
✅ Kontextbewusste Textbearbeitung im Editor
✅ Wissensbasierte Analyse & Zusammenfassungen
Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.
❌ Nur ein Modellanbieter (OpenAI)
❌ Keine Modellauswahl pro Use Case
❌ Keine zentrale Modellsteuerung für Teams
✅ Zugriff auf über 50 verschiedene KI-Modelle
✅ Modellauswahl pro Prompt oder Assistent
✅ Zentrale Steuerung auf Organisationsebene
❌ Keine echte Teamkollaboration
❌ Keine Rechte- oder Rollenverteilung
❌ Keine zentrale Steuerung oder Nachvollziehbarkeit
✅ Teamübergreifende Bearbeitung in Echtzeit
✅ Granulare Rechte- und Freigabeverwaltung
✅ Zentrale Steuerung & Transparenz auf Organisationsebene
Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.
Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.
🎯 Kostenlose Demo buchenLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen