Wenn die KI-Plattform offline geht – lokal bauen, damit deine Arbeit überdauert
KI-Plattform verschwand, fast 80 Spiele mit ihr. Führe Modelle lokal mit transformers.js aus – deine Arbeit überlebt den Vendor.
Ein Entwickler postete diese Woche auf Hacker News mit einem ruhig herzzerreissenden Titel: Show HN: I built 80 mini-games using Fable before it was shut down. Die Spiele findet man auf minigames.world, jedes Premium-Paket und jedes Abonnement-Tier freigeschaltet, alles kostenlos – nicht aus Grosszügigkeit, sondern weil die Plattform darunter Tage nach dem Start offline ging. Die Anmerkung des Autors ist fast fröhlich. Diese Fröhlichkeit ist der Teil, der dir Angst machen sollte.
Hier ist das Muster, und es ist älter als jedes Modell. Du baust achtzig Dinge auf einem Service auf. Der Service ist schnell, der Service ist kostenlos, der Service ist weg. PCMag, das einen Hands-on-Test durchführte, bevor die Lichter ausgingen, nannte es das mächtigste öffentliche Modell, das es je angefasst hatte, und sah es dann im selben Artikel verschwinden. Achtzig Spiele überlebten nur, weil ihr Maker die Dateien hatte; die Plattform bekam keine Stimme.
←TODAY: Eine kostenlose KI-Beta verschwand Tage nach dem Start, und fast 80 kleine Spiele gingen mit. →3012: Die Studios, die noch am Horizont von Zurich-3012 stehen, sind diejenigen, deren Dateien sich ohne fremde Genehmigung öffnen. Fulcrum: Ein Werkzeug, das du klonen kannst, überlebt die Firma, die es machte – das ist die einzige Dauerhaftigkeit, die sich verzinst.
Ich habe elf Jahre an der Schnittstelle zwischen dem BIM-Modell und der echten Baustelle verbracht, und ich sage euch: Die Gebäude, die in meiner Zeit am schlechtesten gealtert haben, waren nie die hässlichen. Sie waren diejenigen, die niemand reparieren konnte, weil das proprietäre Format offline ging und die Geometrie mitnahm. Eine abgeschaltete Spiel-Plattform ist derselbe Ausfallmodus mit freundlicherem Gesicht. Die Frage, die du dir dieses Quartal stellen solltest, ist nicht „Ist es gut?”, sondern „Wenn der Vendor verschwindet, kann ein 25-Jähriger die Datei noch öffnen?”
Das Werkzeug: Die ermutigende Nachricht – und das Gegenmittel – kam aus derselben Woche. Xenova (Joshua von Hugging Face) zeigte Gemma 4 mit 255 Tokens pro Sekunde auf WebGPU und gab Demo und Kernels frei, damit jeder das Modell lokal im Browser ausführen konnte. Das Projekt dahinter ist @huggingface/transformers (transformers.js): eine JavaScript-Bibliothek, die echte Modelle komplett auf deinem Computer läuft – kein Server, kein API-Schlüssel, kein Konto, das gelöscht werden kann. Es lohnt sich für einen Architekt-Nachmittag, weil es „die KI” von einem Abo, das du mietest, in eine Datei verwandelt, die dir gehört.
Setup:
# Node 18+; dasselbe Modell läuft im Browser oder im Terminal
npm create vite@latest local-ai -- --template vanilla
cd local-ai
npm install @huggingface/transformers
# Den Snippet unten in main.js einfügen, dann:
npm run dev # die gedruckte localhost-URL öffnen, die Konsole beobachten
Erste Schritte:
- Öffne
main.jsund lösche den Vite-Boilerplate – du brauchst nur wenige Zeilen. - Importiere eine Pipeline und setze
device: 'webgpu'so, dass sie auf deiner GPU läuft, nicht auf einer entfernten. - Lade die Seite neu; der erste Lauf lädt das Modell einmal herunter, dann wird es gecacht. Beobachte, wie die Konsole danach ein Ergebnis ausgibt, ohne einen Netzwerkaufruf zu machen.
- Ziehe das Netzwerkkabel raus. Es funktioniert immer noch. Das ist die ganze Lektion in einer Geste.
Atelier: Ein Schweizer Büro greift dazu, sobald ein Modell Projekttext lesen muss – Sitzungsprotokolle, Bauleitung-Notizen, Clash-Reports – ohne dass dieser Text das Büro verlässt. Lokale Inference bedeutet: Die Datenschutz-Diskussion ist erledigt, bevor sie anfängt; nichts verlässt das Büronetz, also gibt es keinen Cloud-Vertrag zu prüfen und keinen Vendor, der dich lahmlegen kann. Es passt direkt in die Art von Archicad–Speckle–Bonsai-Pipeline, die ein Dutzend Büros schon laufen und kein Conference-Panel erwähnt.
Hack: Dieses Hack zeigt dir, wie du ein Modell komplett auf deinem Rechner läufst, damit keine Abschaltung es dir je nehmen kann. Das Medium ist JavaScript, das man ausführen kann; die Domain ist AI/ML.
import { pipeline } from '@huggingface/transformers';
// läuft vollständig im Browser auf WebGPU -- kein Server, kein Schlüssel, kein Vendor
const classify = await pipeline('sentiment-analysis', null, { device: 'webgpu' });
console.log(await classify('IFC round-trip survived the upgrade'));
Vier Zeilen, und das Modell ist jetzt eine Abhängigkeit, die du wie jede andere Datei im Repo kontrollierst. Wenn die Firma hinter den Gewichten morgen zusammenbricht, merkt dein node_modules das nicht. Das ist der Unterschied zwischen einem Werkzeug und einer Miete.
Das bedeutet nicht, dass die Cloud der Feind ist – der ehrliche Kompromiss ist real: Lokale Modelle sind kleiner und langsamer als die gehostete Spitze, und du zahlst mit VRAM und Setup-Zeit für das Privileg, sie zu besitzen. Aber „kleiner und nächstes Jahr immer noch da” schlägt „gigantisch und bis Donnerstag weg” jedes Mal, wenn du ein Projekt wirklich ausliefern musst. Der Entwickler mit 80 Spielen hat das auf einfache Weise gelernt, weil er seine Dateien behielt. Also behalt deine: Diese Woche nimm einen Workflow, der gerade eine gehostete API aufruft, und baue dafür ein lokales Fallback – selbst wenn es schlechter ist – damit du weitermachst, wenn die Plattform offline geht.
Learn-it:
- Die abgeschaltete Plattform: minigames.world – die 80 Mini-Spiele, immer noch spielbar, weil der Maker die Dateien behielt.
- Lokale Inference, bewiesen: Xenovas WebGPU-Demo + freigegebene Kernels – führe ein Modell lokal in deinem Browser aus.
- Der Hands-on-Test: PCMag hat es vor dem Verschwinden getestet – lies es als eine Parabel über Mieten, nicht Besitzen.
- PAZ-Notiz: stelle dieses Quartal eine Frage zu jedem Tool-Stack – wenn der Vendor verschwindet, kann ein 25-Jähriger die Datei noch öffnen?
QUELLE · ↗
PAZ Kaffi · interdisziplinäre Redaktionsarbeit, geleitet von der PAZ Academy