KI für Ihr Unternehmen – Jetzt Demo buchen

Token-Verbrauch und Monetarisierung: Ein Blick auf Googles generative KI-Strategie

Kategorien:
No items found.
Freigegeben:
November 9, 2025

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

1
🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

2
🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

3
⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

4
🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

5
👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Inhaltsverzeichnis

    mindverse studio – Ihre Plattform für digitale Effizienz

    Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.
    Mehr über Mindverse Studio erfahren

    Das Wichtigste in Kürze

    • Google betont das Wachstum seiner generativen KI durch die Angabe von Token-Verbrauchszahlen seiner grössten Kunden, anstatt konkrete Umsatzzahlen zu nennen.
    • Obwohl Google von einem Verbrauch von 1,3 Billiarden Tokens pro Monat spricht, ist das Wachstum der hinzugefügten Tokens im Vergleich zu früheren Perioden rückläufig.
    • Die Monetarisierung generativer KI-Dienste bei Google scheint noch nicht im grossen Massstab erfolgt zu sein, mit geschätzten Einnahmen pro Grosskunden im niedrigen einstelligen Millionenbereich pro Jahr.
    • Experten äussern Bedenken, dass die aktuelle Investitionseuphorie im KI-Sektor Merkmale einer Blase aufweisen könnte, ähnlich der Dotcom-Blase der späten 90er Jahre.
    • Die hohen Infrastrukturkosten, der sinkende Token-Preis und die Herausforderungen bei der Integration generativer KI in bestehende Arbeitsabläufe stellen Hürden für eine breite Skalierung dar.

    Die Metrik der Tokens: Ein Blick hinter die Kulissen von Googles KI-Wachstum

    In den jüngsten Berichten und öffentlichen Äusserungen von Google wird das Wachstum im Bereich der generativen Künstlichen Intelligenz (KI) häufig durch die Angabe beeindruckender Zahlen zum Token-Verbrauch untermauert. Anstatt sich auf traditionelle Umsatzkennzahlen zu konzentrieren, hebt das Unternehmen hervor, dass seine 150 grössten Kunden im vergangenen Jahr jeweils rund eine Billion Tokens verbraucht haben. Diese Darstellung wirft Fragen auf und trägt zur Diskussion bei, ob die aktuelle Entwicklung im KI-Sektor Anzeichen einer Überhitzung zeigt.

    Token-Verbrauch und seine Aussagekraft

    Google berichtet von einem monatlichen Token-Verbrauch von 1,3 Billiarden Tokens. Diese enorme Zahl soll die weitreichende Akzeptanz und Nutzung der KI-Angebote des Unternehmens unterstreichen. Bei genauerer Betrachtung der Daten zeigt sich jedoch, dass das Wachstum der monatlich hinzugefügten Tokens seit Juli von 250 Billionen auf etwa 107 Billionen gesunken ist. Dies deutet auf eine Verlangsamung des prozentualen Wachstums hin, auch wenn die absoluten Zahlen weiterhin hoch sind.

    Die Messung des Erfolgs anhand von Token-Verbrauch anstelle von Umsatz birgt inhärente Herausforderungen. Der reine Token-Verbrauch gibt wenig Aufschluss über den tatsächlichen Wert, den Unternehmen aus der KI ziehen. Es bleibt unklar, welche Modelle verwendet wurden, ob es sich um Eingabe- oder Ausgabetokens handelte und wie hoch die Kosten pro Token tatsächlich waren. Eine einfache Berechnung illustriert das Problem: Selbst bei Googles höchstem Satz von 15 US-Dollar pro Million Tokens für Gemini 2.5 Pro und unter der Annahme, dass alle Ausgabetokens waren, würden sich die Einnahmen pro Kunde auf etwa 15 Millionen US-Dollar pro Jahr belaufen. Realistischere Szenarien, die eine Mischung aus Eingabe- und Ausgabetokens, kürzere Prompts und günstigere Modelle berücksichtigen, reduzieren diese Zahl auf einen niedrigen einstelligen Millionenbetrag, typischerweise zwischen 2,5 und 4,5 Millionen US-Dollar pro Kunde. Über 150 Kunden hinweg würde dies einen Gesamtumsatz von 450 bis 600 Millionen US-Dollar bedeuten, was lediglich 0,75 bis 1 Prozent der für 2025 prognostizierten 60 Milliarden US-Dollar Jahresumsatz von Google Cloud entspricht.

    Herausforderungen bei der Skalierung und Monetarisierung

    Die verhältnismässig geringen Umsätze aus generativer KI deuten darauf hin, dass Googles Kunden diese Technologie noch nicht im grossen Stil einsetzen. Die Integration dieser Systeme in bestehende Arbeitsabläufe ist komplex und erfordert die Berücksichtigung von Datenschutz, Regulierung, Qualitätskontrolle und Kosten. Zuverlässigkeit und Cybersicherheit sind weitere Faktoren, die Unternehmen zögern lassen, da grosse Sprachmodelle (LLMs) noch unvorhersehbar sein und Sicherheitsrisiken bergen können. Gleichzeitig führt der zunehmende Wettbewerb im KI-Bereich zu sinkenden Token-Preisen, was die potenziellen Einnahmen begrenzt.

    Derzeit profitieren Googles Cloud- und KI-Chip-Geschäfte vom Hype um generative KI. Die Nachfrage nach Infrastruktur und spezialisierten Chips wird massgeblich von der Erwartung getragen, dass generative KI zu einem wichtigen Wirtschaftsfaktor wird. Sollten Unternehmen jedoch nicht in der Lage sein, diese frühen Experimente in skalierbare, profitable Produkte umzusetzen, könnte diese Dynamik nachlassen, was sich wiederum auf die Ausgaben für Cloud-Dienste und Hardware auswirken würde.

    Anzeichen einer Blase?

    Die Diskrepanz zwischen immensen Investitionen und noch nicht erwiesenen, substanziellen Erträgen im Bereich der generativen KI lässt einige Beobachter von einer möglichen Blase sprechen. Ähnliche Muster wurden bereits während der Dotcom-Blase der späten 1990er Jahre beobachtet, wo massive Investitionen in noch unbewiesene Geschäftsmodelle mündeten. Hochrangige Persönlichkeiten wie Jeff Bezos, Bret Taylor (Vorsitzender von OpenAI) und David Solomon (CEO von Goldman Sachs) haben öffentlich Bedenken geäussert, dass der KI-Sektor Anzeichen einer Blase aufweisen könnte.

    Die Investitionen in die KI-Infrastruktur sind enorm. Schätzungen gehen davon aus, dass in diesem Jahrzehnt Billionen von Dollar in den Aufbau von KI-Infrastruktur fliessen werden. Ein Beispiel ist der Bericht über einen möglichen Deal zwischen Oracle und OpenAI im Wert von Hunderten von Milliarden Dollar, bei dem Oracle die Finanzierung nicht aus dem Cashflow bestreiten könnte, sondern auf Schulden angewiesen wäre. Diese Art von "zirkulärer Finanzierung", bei der KI-Unternehmen Milliarden in die Infrastruktur des jeweils anderen investieren, während die Rentabilität hinterherhinkt, erinnert an die Telekommunikationsbranche während der Dotcom-Ära.

    Ein weiteres Indiz ist das Kapitalausgaben-Umsatz-Verhältnis. Während die jährlichen Ausgaben für KI-bezogene Rechenzentren im Jahr 2025 auf rund 400 Milliarden US-Dollar geschätzt werden, belaufen sich die KI-Umsätze im selben Zeitraum auf etwa 60 Milliarden US-Dollar. Dieses 6- bis 7-fache Verhältnis ist deutlich höher als das der Telekommunikationsunternehmen während der Dotcom-Blase (ca. 4x) oder der Eisenbahngesellschaften im 19. Jahrhundert (ca. 2x), was die These der Überhitzung stützt.

    Die Rolle von Tokens in der KI-Ökonomie

    Tokens sind die grundlegenden Einheiten der LLM-Berechnung, vergleichbar mit Wortfragmenten oder Silben. Wenn Google 1,3 Billiarden Tokens pro Monat verarbeitet, misst es den Rechenaufwand, nicht den Nutzerwert. Moderne Modelle wie Gemini 2.5 Flash verbrauchen pro Abfrage wesentlich mehr Tokens als ihre Vorgänger, selbst bei einfachen Eingaben. Dies führt dazu, dass der Token-Verbrauch steigt, selbst wenn die Benutzerakzeptanz stagniert oder sich verlangsamt. Dies hat direkte Auswirkungen auf die Preisgestaltung für Unternehmen, die auf Googles KI-Infrastruktur aufbauen. Wenn Gemini 2.5 Flash für Denkaufgaben 150-mal mehr kostet als frühere Modelle und das Token-Wachstum sich verlangsamt, könnte Google mit einem Umsatzproblem konfrontiert sein.

    Ausblick und Implikationen für B2B-Kunden

    Für B2B-Kunden, insbesondere solche, die generative KI in ihre Geschäftsmodelle integrieren möchten, ergeben sich aus dieser Analyse mehrere Handlungsempfehlungen:

    • Kostenprognosen anpassen: Kalkulieren Sie mit potenziellen Preiserhöhungen für KI-Dienste, insbesondere für rechenintensive Aufgaben und multimodale Inferenzen.
    • Token-Effizienz optimieren: Überprüfen Sie Ihre Prompt-Strategien, nutzen Sie Kontext-Caching und wählen Sie Modelle, die für die jeweilige Aufgabe am effizientesten sind.
    • Anbieter diversifizieren: Vermeiden Sie eine zu starke Abhängigkeit von einem einzigen KI-Anbieter, um flexibel auf Preisänderungen und technologische Entwicklungen reagieren zu können.
    • Nachhaltigkeitsberichte beobachten: Achten Sie auf transparente Informationen zum Energieverbrauch der KI-Modelle, da diese langfristig die Kostenstrukturen beeinflussen können.
    • Transparenz einfordern: Als Unternehmenskunde haben Sie die Möglichkeit, von den Anbietern mehr Transparenz bei Energieverbräuchen, Preisstabilität und vertraglichen Schutzmassnahmen gegen abrupte Kostensteigerungen zu fordern.

    Die aktuelle Phase der KI-Entwicklung ist von hohen Investitionen und schnellen technologischen Fortschritten geprägt. Es bleibt abzuwarten, wie sich die Beziehung zwischen Token-Verbrauch, tatsächlichem Geschäftswert und Umsatzentwicklung in der generativen KI langfristig gestalten wird. Eine präzise Analyse der Kosten und des Nutzens ist für Unternehmen von entscheidender Bedeutung, um fundierte Entscheidungen in diesem dynamischen Umfeld zu treffen.

    Bibliographie

    • Bastian, Matthias. "Google leans on token metrics, not revenue, adding to bubble talk about AI growth." The Decoder, 31. Oktober 2025.
    • Brown, Robert. "Google’s ‘quadrillion tokens’ brag hides a slower story." Implicator.ai, 10. Oktober 2025.
    • Tangalakis-Lippert, Katherine. "Alphabet's earnings show investors are impatient for the data on AI returns. No one has the answer yet." Business Insider, 24. Juli 2024.
    • Teare, Keith. "Come to Daddy: OpenAI Wants Your Attention." That Was The Week, 12. Oktober 2025.
    • Thompson, Derek. "Why AI Is Not a Bubble*." Derek Thompson, 15. Oktober 2025.
    • Tunguz, Tomasz. "Is Token Consumption Growth Slowing Down?" Tomtunguz.com, 9. Oktober 2025.
    • Writing Team. "Google's 1.3 Quadrillion Token Boast." Winsome Marketing, 13. Oktober 2025.
    • Czarnecki, Michael. "AI adoption slows down, but it's not a bust." LinkedIn, 22. Oktober 2025.
    • Eberly, David. "Big Tech Faces Earnings Test as AI Bubble Concerns Mount." National CIO Review, 27. Oktober 2025.

    Artikel jetzt als Podcast anhören

    Kunden die uns vertrauen:
    Arise Health logoArise Health logoThe Paak logoThe Paak logoOE logo2020INC logoEphicient logo
    und viele weitere mehr!

    Bereit für den nächsten Schritt?

    Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
    Herzlichen Dank! Deine Nachricht ist eingegangen!
    Oops! Du hast wohl was vergessen, versuche es nochmal.

    🚀 Neugierig auf Mindverse Studio?

    Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

    🚀 Demo jetzt buchen