Le Chaton Fat ist erfunden. Der Dependency Graph, den es offenlegte, ist real.
Das erfundene Mistral-Modell war ein Witz — aber der Exportkontroll-Single-Point-of-Failure, den es offenlegte, ist real. Wie AEC-Studios ihre KI-Abhängigkeiten kartografieren.
Einige Tage lang im Juni diskutierten die klügsten KI-Köpfe über eine Katze. „Le Chaton Fat” — ein französisch-englischer Hybrid-Name für „das fette Kätzchen” — sollte ein bahnbrechendes Frontier-Modell des französischen Startups Mistral sein, angeblich mit „30T+ Parametern”, „1000 Schnurren pro Sekunde” und „maximalem Chonk”. Gefälschte Benchmark-Charts zeigten, wie es OpenAI und Anthropic schlug. Gefälschte EU-Mitteilungen erklärten es für verboten, weil es „zu schwer zu regulieren” war. Wie Business Insider berichtete und das französische Magazin Numerama bestätigte, existiert nichts davon. Es begann als Running Gag auf dem Mistral-Subreddit, nachdem CEO Arthur Mensch den Le-Chat-Chatbot in Vibe umbenannte, und verselbstständigte sich. Selbst Mensch machte mit: „Es ist eigentlich le gros chaton.”
Der Systemarchitekt liest das nicht als Witz. Der Systemarchitekt sieht einen Stresstest, der eine echte Abhängigkeit offenlegt.
Das Signal unter dem Meme
Das Meme ging viral in der Woche, in der die US-Regierung ausländischen Organisationen verbot, Anthropic-Modelle Mythos 5 und Fable 5 zu nutzen. Das ist die tragende Tatsache. Eine Funktion, die Tausende Teams in ihren Stack eingebaut hatten, wurde über Nacht durch politische Entscheidung — nicht durch einen Ausfall — über eine Grenze hinweg unverfügbar. Wharton-Professor Ethan Mollick erfasste das Absurde und witzelte, er würde auf seinem nächsten Firmenevent über Mistrals „neues riesiges Katzenmodell mit unendlichen Benchmark-Werten” befragt. Aber das Lachen leistet Arbeit: es metabolisiert echte Angst. Wie TheNextWeb es rahmt, gab das Mistral seinen „Souveränitätsmoment” — das Unternehmen argumentiert seit Jahren, dass die Abhängigkeit von einem ausländischen Anbieter bedeutet, dein Zugriff kann ohne Vorwarnung abgeschaltet werden.
Das ist ein Single-Point-of-Failure-Argument, verkleidet als Patriotismus-Argument. Und es ist technisch korrekt, unabhängig davon, welche Flagge man hisst.
←HEUTE: Eine US-Exportregel machte zwei Frontier-Modelle in einer Woche aus ausländischen Stacks verschwinden; ein quelloffenes französisches Startup wurde gleichzeitig zum Punchline und zur Alternative. →3012: Die Studios, die noch immer in Zürich-3012 stehen, sind diejenigen, die Jahrzehnte zuvor gelernt haben, jede externe Modell-API als Sicherung zu behandeln — nützlich, aber zum Durchbrennen erwartet. Fulcrum: Ein Modell, das du nicht hosten kannst, ist eines, das jemand anderes widerrufen kann; das Meme funktionierte nur, weil jeder das bereits wusste.
Zeichne den Graph, nicht das Diagramm
Hier ist ein Fehlerfall, den ich mehr als einmal Produktionssysteme lahmlegen sah: Das Architekturdiagramm zeigt drei ordentliche Kästen, aber der Dependency Graph — was eigentlich was zum Absturz bringt — hat einen vierten Knoten, den niemand gezeichnet hat. Dein Rendering-Plugin ruft eine Vendor-API auf. Die API ruft ein gehostetes Modell auf. Das Modell lebt in einer Jurisdiktion, die Exportkontrollen erlassen kann. Drei Hops von deiner Grasshopper-Canvas zu einer geopolitischen Entscheidung, und niemand im Büro hat die Linie je gezeichnet.
Mistrals quelloffene Haltung — Modelle, die du herunterlädst und auf deiner eigenen Hardware laufen lässt — ist nicht ideologisch überlegen. Sie ist topologisch anders. Sie verschiebt das Modell von „externe Abhängigkeit, die du mietest” zu „Vermögen, das du hältst.” Dieser Kompromiss ist real und schneidet beide Wege: Self-Hosting bedeutet, dass du die Kühlrechnung, das Version-Pinning und die Security-Patches bezahlst, die der Vendor früher absorbiert hat. Souveränität ist nicht kostenlos; sie ist eine andere Rechnung.
Atelier: Für eine AEC-Praxis ist der exponierte Knoten selten der offensichtliche. Es ist der KI-Schritt, vergraben im Clash-Detection-Workflow oder im Specification Drafter — das Element, das stillschweigend annimmt, dass ein US-gehostetes Modell in 200ms antwortet. Genau deshalb ist PAZ-GPT, unsere Chat-und-Sprach-Schnittstelle zum Archicad-Modell, so gebaut, dass die Reasoning-Schicht ausgetauscht werden kann: ein In-House oder quelloffenes Backend hält das BIM-Modell am Sprechen, auch wenn eine Frontier-API ausfällt.
Hack: Dieser Hack bringt dir bei, einen Single-Point-of-Failure von deinem eigenen Schreibtisch zu entfernen — laufe ein quelloffenes Modell lokal, damit dich eine Exportregel nicht abschneiden kann. Das Medium ist Workflow; der Zug sind drei Befehle. Installiere ollama, ziehe ein quelloffenes Mistral, und bestätige, dass es offline antwortet:
curl -fsSL https://ollama.com/install.sh | sh
ollama pull mistral # ~4GB, quelloffenes Modell, läuft auf 16GB-Laptop
ollama run mistral "In einer Zeile: Was ist ein BEP in BIM?"
Jetzt hast du einen Fallback, der auf deiner Maschine lebt. Er wird mit einem Frontier-Modell in harter Reasoning nicht mithalten — das ist der ehrliche Handel — aber für Spec-Lookups, Naming und Offline-Drafting ist es eine Sicherung, die nicht durchbrennt, wenn jemand anderes einen Schalter umlegt.
Dann mache die langsamere Übung. Diese Woche zeichne deinen echten KI-Dependency-Graph auf — jeden Workflow, der ein Modell aufruft, jeden Hop zum Ort, wo das Modell gehostet wird, jede Jurisdiktion in der Kette. Der Punkt ist, den dritten Single-Point zu finden, den du nicht kanntest. Das fette Kätzchen war ein Witz. Die Sicherung, auf der es sass, ist gerade jetzt in deinem Studio — gehe hin und kartografiere sie.
Quelle: businessinsider.com
QUELLE · ↗
PAZ Kaffi · interdisziplinäre Redaktionsarbeit, geleitet von der PAZ Academy