
Letzte Woche hat Uber seinen CTO öffentlich sprechen lassen. Sein Unternehmen hatte das gesamte KI-Budget 2026 in vier Monaten verbraucht. Nicht wegen schlechter Planung. Sondern weil die Kalkulation auf Preisen basierte, die nicht für die Welt von morgen gelten.
Das ist kein Ausreißer. Das ist das Muster.
Was du zahlst — und was es wirklich kostet
Jedes Mal, wenn du heute eine Anfrage an ChatGPT, Claude oder Gemini schickst, verliert das Unternehmen dahinter Geld. OpenAI hat 2025 für jeden verdienten Dollar 1,69 Dollar ausgegeben. Ein Power-User des $200/Monat Claude Max-Plans erzeugt bis zu $90.000 an echten Rechenkosten pro Jahr — gegen $2.400 Abo-Einnahmen. Subventionsrate: 25:1.
In der Praxis kann es noch extremer sein. Ein Entwickler hat seinen eigenen Verbrauch gemessen: 57 Milliarden Tokens in zwei Monaten — Listenwert über $45.000, gezahlt: $400. Verhältnis: 112:1.
Das ist kein Geschäftsmodell. Das ist Markteroberung auf Investorenkosten. Und diese Phase endet.
GitHub hat es bereits vorgemacht: kostenlose Modelle still aus den Copilot-Tarifen gestrichen, gleicher Preis, weniger Leistung. Adobe hat die Abo-Preise angezogen — offiziell wegen KI-Kontingenten. Die €18 von heute sind nicht der Preis. Sie sind die Einstiegsdroge.
Was die Zahlen sagen
Die durchschnittlichen monatlichen KI-Ausgaben pro Unternehmen sind von $63.000 (2024) auf $85.500 (2025) gestiegen — plus 36 % in einem Jahr. Das war noch bevor Agenten-Workflows Standard wurden.
Goldman Sachs schätzt, dass der globale Token-Verbrauch bis 2030 auf das 24-Fache steigt — weil KI-Agenten nicht einmal antworten, sondern dauerhaft laufen: lesen, planen, schreiben, prüfen, korrigieren, in Schleifen. Das erzeugt ein vielfach höheres Volumen als ein klassischer Chatbot.
Allerdings ist das 24-Fache kein Naturgesetz — es ist das Ergebnis schlechter Architektur. Wer jeden Agenten auf dem teuersten Modell laufen lässt, weil die Demo beeindruckend war, zahlt 2030 entsprechend. Wer sauber routet — leichte Modelle für den Alltag, schwere nur für die Tiefe — bei dem wächst die Rechnung nicht mit dem Volumen mit.
Der aktuelle Stand bei Anthropic
Eine berechtigte Frage aus der Diskussion zu diesem Post: Stimmt das alles noch — Anthropic macht doch gerade Gewinn?
Ja und Nein. Anthropic projiziert für Q2 2026 erstmals ein operatives Plus: $559 Millionen bei $10,9 Milliarden Umsatz. Von −94 % Bruttomarge in 2024 auf rund 40 % in 2025 — das ist ein echter Turnaround.
Der Haken: Zeitgleich wurde durch das SpaceX-Börsenprospekt bekannt, dass Anthropic ab Mai/Juni 2026 $1,25 Milliarden pro Monat für Rechenkapazität zahlt — mit reduzierten Gebühren genau in den Anlaufmonaten, also genau in dem Quartal, das für den Gewinnausweis genutzt wird. Anthropic selbst warnt Investoren ausdrücklich, dass Profitabilität für das Gesamtjahr nicht garantiert ist.
Das ändert nichts am Kernargument: Profitabilität und stabile Preise für Endkunden sind zwei verschiedene Dinge. Der Weg zur gesunden Marge führt über die Preise — nicht daran vorbei.
Was das für Unternehmen bedeutet
Das eigentliche Risiko ist nicht die Technologie. Das Risiko ist die Kalkulation: Wer heute Strukturen, Prozesse und Abhängigkeiten auf Basis aktueller Preise aufbaut, plant mit einem Fundament, das er nicht kennt.
Multi-Provider statt Mono-Abhängigkeit. Nie 100 % an einen Anbieter gebunden. Heute Claude, morgen Llama, übermorgen was auch immer besser oder günstiger ist. Austauschbarkeit ist keine technische Frage — sie ist Verhandlungsmacht.
Open-Weight-Modelle und eigene Infrastruktur ernst nehmen. Hetzner GPU-Server, Ollama drauf, passendes Modell — fertig ist die echte Flatrate. DSGVO inklusive, Rechnung absehbar, kein amerikanischer Anbieter der morgens die Preise anpasst.
Use Cases bewerten, bevor man rollt. Nicht jeder Prozess braucht das teuerste Modell. Für strukturierte Aufgaben reichen kleine Modelle — der Preisunterschied beträgt bis zu 85 %. Ein Model Router ist keine exotische Technik. Es ist 2026 einfach gutes Engineering.
Szenarien für 3× und 10× höhere Preise einrechnen. Nicht als Angstübung. Als normale Führungsarbeit. Wer seinen Energieprovider nicht auf zehn Jahre festschreibt ohne Preisklausel, sollte seine KI-Infrastruktur genauso behandeln.
Das Subventionsfenster ist dabei keine Bedrohung — es ist eine Einladung. Solange Investoren die Differenz tragen, war Rechenleistung gemessen am echten Preis nie günstiger. Der Vorteil liegt nicht darin, heute am günstigsten einzukaufen. Er liegt darin, in zwei Jahren noch handlungsfähig zu sein.
Quellen
- Goldman Sachs: „Decoding the Agentic Economy“ (Mai 2026) — goldmansachs.com
- DeSight Studio: „Claude Costs – The True AI Bill“ (2026) — desightstudio.com
- CloudZero: State of AI Costs 2025 — cloudzero.com
- Uber CTO via The Information (Mai 2026)
- Anthropic Q2 2026 Projektionen via Wall Street Journal / CNBC (Mai 2026)
- SpaceX S-1 Prospekt (Mai 2026) — Anthropic Compute-Vertrag
- GitHub Copilot Modell-Änderungen via Heise.de
- IEA: Energy and AI Report 2025 — iea.org
