OpenAI und Broadcom präsentieren den neuen Jalapeño-Chip für effiziente KI-Inferenz

Kategorien:

No items found.

Freigegeben:

June 26, 2026

kostenlos testen Termin buchen

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Lassen Sie uns Ihren ersten Schritt planen

Inhaltsverzeichnis

mindverse studio – Ihre Plattform für digitale Effizienz

‍Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.

Mehr über Mindverse Studio erfahren

Das Wichtigste in Kürze

OpenAI und Broadcom haben den "Jalapeño"-Chip vorgestellt, einen speziell für die Inferenz von großen Sprachmodellen (LLMs) entwickelten Prozessor.
Dieser Chip zielt darauf ab, die hohen Infrastrukturkosten von OpenAI zu senken und die Abhängigkeit von externer Hardware zu reduzieren.
Die Entwicklung des Jalapeño-Chips erfolgte in nur neun Monaten, unterstützt durch den Einsatz von OpenAIs eigenen KI-Modellen im Designprozess.
Der Chip soll eine deutlich verbesserte Leistung pro Watt im Vergleich zu aktuellen Lösungen bieten und ist für den Einsatz im Gigawatt-Maßstab konzipiert.
Mit dieser Entwicklung verfolgt OpenAI eine Strategie der vertikalen Integration, um die gesamte Wertschöpfungskette von der Hardware bis zur Anwendung zu kontrollieren und zu optimieren.

OpenAIs strategischer Vorstoß in die Hardware-Entwicklung: Eine Analyse des "Jalapeño"-Chips

Die Kostenstruktur des Betriebs von Künstlicher Intelligenz, insbesondere von großen Sprachmodellen (LLMs), stellt für Unternehmen wie OpenAI eine signifikante Herausforderung dar. Die Infrastrukturkosten haben einen erheblichen Einfluss auf die finanzielle Rentabilität und die Skalierbarkeit von KI-Diensten. In diesem Kontext haben OpenAI und Broadcom einen maßgeschneiderten Chip namens "Jalapeño" vorgestellt, der darauf abzielt, diese Herausforderungen durch eine optimierte Hardware-Architektur zu adressieren. Dieser Schritt markiert einen strategischen Wandel für OpenAI hin zu einer stärker vertikal integrierten Unternehmensstruktur.

Wirtschaftliche Notwendigkeit und strategische Ausrichtung

Die finanzielle Belastung durch den Betrieb von LLMs in großem Maßstab ist beträchtlich. Berichten zufolge beliefen sich die Kosten für den Betrieb der ChatGPT-Server im vergangenen Jahr auf rund 8,4 Milliarden US-Dollar. Angesichts von 900 Millionen wöchentlichen Nutzern wird erwartet, dass diese Betriebskosten in diesem Jahr auf etwa 14 Milliarden US-Dollar ansteigen könnten. Über die nächsten acht Jahre hat OpenAI zudem Verpflichtungen in Höhe von rund 1,4 Billionen US-Dollar für Rechenleistung eingegangen, was eine enorme Investition für ein Unternehmen mit einem Jahresumsatz von 25 Milliarden US-Dollar darstellt. Diese Zahlen verdeutlichen die Notwendigkeit, die Effizienz der zugrunde liegenden Hardware zu maximieren und die Abhängigkeit von Dritten zu verringern.

Der "Jalapeño"-Chip, ein anwendungsspezifischer integrierter Schaltkreis (ASIC), wurde in Zusammenarbeit mit Broadcom entwickelt. Er repräsentiert einen direkten Versuch, die hohen Investitionsausgaben (Capex) zu mindern, die mit der Nutzung von Hardware Dritter verbunden sind. Während Unternehmen wie Nvidia auf ihre High-End-Prozessoren hohe Gewinnmargen erzielen, arbeitet OpenAI mit geringeren Margen. Eine Reduzierung der Infrastrukturkosten könnte somit die Rentabilität erheblich steigern.

Architektur und technische Spezifikationen des "Jalapeño"-Chips

Der "Jalapeño"-Chip ist OpenAIs erster "Intelligence Processor" und wurde speziell für die Inferenz von LLMs konzipiert, nicht für allgemeine KI-Workloads. OpenAI lieferte das Kernarchitekturdesign, das auf den spezifischen Modell-Roadmaps und Bereitstellungssystemen des Unternehmens basiert. Broadcom übernahm die Siliziumentwicklung und die Integration der Hochleistungsnetzwerkinfrastruktur.

Die physische Fertigung erfolgt bei TSMC in Taiwan, während Celestica für den Bau der Platinen- und Racksysteme verantwortlich ist. Erste Tests in den Laboren von OpenAI zeigen, dass der Chip bereits mit anspruchsvollen Workloads, einschließlich eines noch unveröffentlichten GPT-5.3-Codex-Spark-Modells, bei den angestrebten Produktionsfrequenzen und Leistungsniveaus läuft. Richard Ho, Leiter des Hardware-Programms von OpenAI, betonte, dass die Architektur darauf ausgelegt ist, die Datenbewegung zu minimieren, um die tatsächliche Auslastung näher an die theoretische Spitzenleistung heranzuführen. Im Gegensatz zu Allzweck-Beschleunigern, die oft an ältere KI-Workloads angepasst wurden, balanciert diese Architektur Rechen-, Speicher- und Netzwerkressourcen spezifisch aus, um Engpässe bei der Datenbewegung zu lösen, die beim interaktiven Betrieb von LLMs auftreten.

Für die Skalierbarkeit integriert die Plattform Broadcoms Tomahawk-Netzwerksilizium direkt in das Design, was eine Kommunikation der kundenspezifischen Prozessoren in massiven, geclusterten Rechenzentrumsumgebungen ermöglicht.

Die Strategie der vertikalen Integration

Durch die Entwicklung eigener Siliziumchips wandelt sich OpenAI von einem reinen Softwareunternehmen zu einem vertikal integrierten Infrastrukturanbieter. Diese Full-Stack-Strategie umfasst die gesamte Pipeline: Chip-Architektur, Software-Kernel, Speichersysteme, Netzwerkplanung und die finale Anwendungsebene. Ähnlich wie Apple seine proprietäre Hardware und iOS eng miteinander verzahnt, kann OpenAI nun seine Infrastruktur optimal an seine internen Modell-Roadmaps anpassen.

Diese Integration fördert einen kontinuierlichen operativen Kreislauf. Eine verbesserte Infrastruktureffizienz senkt die Kosten für das Training und den Betrieb von Modellen. Ein kostengünstigerer Betrieb führt zu besseren, reaktionsschnelleren Produkten, was wiederum die Nutzerzahlen und Einnahmen steigert, die dann in die nächste Generation der kundenspezifischen Infrastruktur reinvestiert werden können.

Überwindung des "Late-Mover"-Nachteils

Mit der Einführung eigener Siliziumchips betritt OpenAI ein Feld, in dem Wettbewerber wie Google seit fast einem Jahrzehnt proprietäre Hardware entwickeln. Google begann 2015 mit der Einführung seiner Tensor Processing Units (TPUs) und kontrolliert heute etwa ein Viertel der globalen KI-Rechenkapazität außerhalb der Nvidia-Lieferkette. Amazon hat über eine Million seiner kundenspezifischen Chips ausgeliefert, während Meta und Microsoft ebenfalls ihre eigenen Infrastrukturen skalieren. Greg Brockman, Präsident und Mitbegründer von OpenAI, erklärte dazu: "Jalapeño ist Teil unserer langfristigen Full-Stack-Infrastrukturstrategie, um Rechenleistung reichlicher verfügbar zu machen. Durch die eigenständige Entwicklung eines größeren Teils des Stacks können wir mehr Intelligenz mit größerer Effizienz bereitstellen."

Um diesen Zeitversatz aufzuholen, hat OpenAI die Entwicklungsphase beschleunigt. Der "Jalapeño"-Chip wurde innerhalb von nur neun Monaten von einem leeren Blatt Papier bis zum Manufacturing Tape-Out gebracht – dem letzten Schritt vor der physischen Produktion. Die Ingenieurteams erreichten diese Zeitspanne, indem sie OpenAIs eigene Sprachmodelle nutzten, um Teile des Hardware-Designprozesses zu automatisieren und zu optimieren. Dies erzeugt eine einzigartige Rückkopplungsschleife, bei der die für Nutzer bereitgestellten Modelle aktiv genutzt werden, um die physische Infrastruktur für zukünftige Iterationen zu entwickeln.

Die erste Bereitstellung der Hardware in Rechenzentren ist für Ende 2026 geplant. Hock Tan, CEO von Broadcom, bestätigte, dass die Einführung zusammen mit Infrastrukturpartnern, einschließlich Microsoft, in den Gigawatt-Maßstab skaliert werden soll.

Fazit

Die Einführung des "Jalapeño"-Chips stellt einen bedeutenden Schritt für OpenAI dar, um die Kontrolle über seine Infrastruktur zu stärken und die wirtschaftlichen Herausforderungen des Betriebs großer Sprachmodelle zu meistern. Die vertikale Integration und der Fokus auf spezialisierte Hardware könnten OpenAI einen Wettbewerbsvorteil verschaffen, indem sie die Effizienz steigern und die Kosten senken. Die schnelle Entwicklungszeit, unterstützt durch den Einsatz eigener KI-Modelle, unterstreicht das innovative Potenzial von OpenAI.

Bibliographie

OpenAI. (2026, 24. Juni). OpenAI and Broadcom unveil LLM-optimized inference chip. Abgerufen von https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
Kaur, D. (2026, 25. Juni). The math behind the OpenAI Jalapeño chip. Artificial Intelligence News. Abgerufen von https://www.artificialintelligence-news.com/news/openai-jalapeno-chip-inference-economics/
Zhang, S. (2026, 24. Juni). OpenAI Ships Jalapeño - Its First Custom AI Chip. Awesome Agents. Abgerufen von https://awesomeagents.ai/news/openai-jalapeno-chip-broadcom-inference/
Leswing, K. (2026, 24. Juni). OpenAI and Broadcom reveal Jalapeno, first AI chip in partnership. CNBC. Abgerufen von https://www.cnbc.com/2026/06/24/openai-and-broadcom-reveal-jalapeno-first-ai-chip-in-partnership.html
Banerjee, A. (2026, 24. Juni). OpenAI and Broadcom Launch Jalapeño, a Custom AI Inference Chip Built in Nine Months and Targeting 2026 Deployment. Fortune India. Abgerufen von https://www.fortuneindia.com/technology/openai-broadcom-unveil-first-custom-ai-inference-chip-target-deployment-by-end-2026-after-nine-month-development-cycle/144876
Broadcom Inc. (2026, 24. Juni). OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor. Yahoo Finance. Abgerufen von https://ca.finance.yahoo.com/news/openai-broadcom-unveil-llm-optimized-130000020.html