CH NEO-ZÜRICH AUSGABE
WETTER · GRAU 25°C
BLEND DES TAGES · 07/ROGUE
EST. 2027
DIE AEC CYBER MORGENZEITUNG

PAZ Kaffi

DESIGN · ABBRUCH · KOFFEIN · DEPESCHE
AUSGABE 0617 · 17 June 2026
SENDUNG 04:42 MEZ
2'400 BOGEN GEDRUCKT
LESEZEIT · 47 MIN
ktx: Data-Agent lehren – SQL-Erfindungen stoppen
Akademie
FRAME · 07:00
16-06-2026

ktx: Data-Agent lehren – SQL-Erfindungen stoppen

Praktisches Tutorial zu ktx: Open-Source-Context-Schicht, die Claude Code, Codex und Cursor lehrt, das Warehouse mit kanonischen Metriken-Definitionen abzufragen.

Jeder Architekt, der je ein KI-System gefragt hat „Wie viele m² haben wir im Kanton Zürich letztes Jahr geliefert?”, kennt die Fehlermode. Der Agent liest Ihr ganzes Schema erneut, rät, welche Spalte Geschossfläche bedeutet, joined zwei Tabellen, die nie zusammenpassen sollten, und gibt Ihnen eine sichere Zahl, die hoffnungslos daneben liegt. Show HN: ktx — eine Open-Source-„executable context layer for data agents” vom Kaelio-Team — ist ein direkter Schlag gegen genau diesen Schmerz.

←HEUTE: Im Jahr 2026 erforscht ein allgemeiner Agent Ihr Warehouse bei jeder Frage neu und erfindet Metrik-Logik, für die er nicht zuständig ist. →3012: Die Studios, die überleben, sind die, deren kanonische Definitionen den Agent, den Anbieter und den Analyst überleben. Fulcrum: Eine Metrik ist nur vertrauenswürdig, wenn sie einmal gespeichert und deklarativ abgefragt wird — nicht bei jedem Prompt neu deriviert.

Das Werkzeug: ktx (github.com/Kaelio/ktx) ist eine sich selbst verbessernde Context-Schicht, die auf einem bestehenden SQL-Warehouse sitzt und Agenten — Claude Code, Codex, Cursor, OpenCode — lehrt, wie sie genau abfragen. Sie samplet Ihre Tabellen, erkennt joinbare Spalten, löst die klassischen Fan- und Chasm-Traps, integriert verteiltes Wiki/Notion/dbt-Wissen und kennzeichnet Widersprüche zur manuellen Überprüfung. Der Überblick im pipeline2insights Substack fasst es treffend zusammen: Anstatt drei getrennter Oberflächen (Semantic Layer, Raw Tables, Team Wiki) bekommt der Agent eine durchsuchbare. Dylan Andersons Data Ecosystem-Serie zum „Context Moat” macht den grösseren Fall deutlich — Context, nicht rohe Modellleistung, unterscheidet einen hilfreichen Agent von einem, der Rückerstattungsrichtlinien erfindet.

System: Warum ist das jetzt möglich und nicht 2021? Weil das fehlende Stück niemals die Datenbank war, sondern das Protokoll. ktx stellt sein Wissen über MCP (Model Context Protocol)-Tools und CLI bereit und läuft komplett lokal: nichts verlässt Ihren Rechner ausser den Aufrufen an den konfigurierten LLM-Anbieter. Verbindungen sind by Design schreibgeschützt, was ich zuerst überprüfe, bevor ich einen Agent auf ein Production-Warehouse ansetze. Sie bringen Ihre eigenen Keys mit — eine Claude-Pro/Max-Sitzung über Claude Code oder lokale Codex-Authentifizierung — daher gibt es keinen zweiten Nutzungszähler.

Einrichtung:

# Node 18+ ; Sie benötigen auch ein SQL-Warehouse, das bereits läuft
npm install -g @kaelio/ktx

ktx setup     # erstellt/setzt fort ein Projekt, konfiguriert Provider + Verbindungen,
              # erstellt Context, installiert die Agent-Integration
ktx status    # bestätigt Bereitschaft

# Falls status eine mcp-Zeile ausgibt, starten Sie den Daemon, bevor Sie den Agent öffnen:
ktx mcp start --project-dir .

Erste Schritte:

  1. Lesen Sie Ihren Status. Ein funktionierendes ktx status meldet LLM ready, Embeddings ready, Databases configured, Context sources configured und ktx context built: yes. Jedes no zeigt genau, welcher Schritt nicht vorankam.
  2. Bauen Sie den Context auf. Führen Sie ktx ingest aus, um Tabellen zu samplen, Metadaten zu erfassen und den Join-Graph jeder konfigurierten Verbindung zusammenzutragen. Das ist der langsame, wertvolle Schritt — lassen Sie ihn zu Ende laufen.
  3. Suchen Sie, bevor Sie vertrauen. Versuchen Sie ktx sl "revenue", um semantische Quellen zu durchsuchen, und ktx wiki "refund policy", um lokale Wiki-Seiten zu durchsuchen. Falls die richtige Metrik-Definition auftaucht, wird Ihr Agent sie jetzt verwenden, anstatt kanonisches SQL neu zu schreiben.
  4. Versionieren Sie das Richtige. Committen Sie ktx.yaml, semantic-layer/ und wiki/. Halten Sie .ktx/ (lokaler State und Secrets) mit .gitignore aus — das ist bereits so konfiguriert.

Atelier: Ersetzen Sie „Warehouse” durch „Projektdatenbank”, und das ist reine AEC. Ein Schweizer Büro, das Archicad–Speckle–Bonsai betreibt, hat Metriken überall verstreut — Geschossfläche im IFC, Stunden im Time-Tracker, Kosten in einem Postgres-Export, die tatsächlich vereinbarte LOIN begraben in einer Notion-BEP. ktx ist das Muster, um eine schreibgeschützte Oberfläche zu schaffen, die ein Agent abfragen kann, ohne täglich erneut zu verhandeln, was „Nettofläche” gemäss SIA 416 bedeutet. Das Widerspruch-Flagging ist der Teil, den Konferenzreden überspringen, und der Teil, der die Bauleitung vor einer falschen Zahl in einer Wettbewerbs-Einreichung bewahrt.

Hack: Dieser Hack lehrt Sie, den Fan-Trap zu erkennen, bevor Ihr Agent ihn je sieht — ein SQL-Move im Databases-Bereich. Ein Fan-Trap bläht eine SUM auf, wenn Sie eine One-to-Many-Tabelle joinen, daher überprüfen Sie zuerst die Kardinalität:

-- Fächert sich projects → invoices auf? Falls max > 1, wird SUM(amount) doppelt gezählt.
SELECT p.id, COUNT(i.id) AS rows_per_project
FROM projects p
LEFT JOIN invoices i ON i.project_id = p.id
GROUP BY p.id
ORDER BY rows_per_project DESC
LIMIT 5;

Falls die oberste Zeile grösser als 1 ist, aggregieren Sie invoices in einer Sub-Query, bevor Sie joinen. ktx kodiert diese Auflösung genau in seinen Join-Graph, damit der Agent es deklarativ richtig macht — aber das Verstehen des Zugs per Hand ist das, was Ihnen erlaubt, dem Tool zu vertrauen.

Move: Hier ist der Trade-off, deutlich gesagt: ktx lohnt sich nur, wenn Sie bereits ein SQL-Warehouse und verstreute Definitionen haben, die zu vereinheitlichen sind — für eine einzelne spontane Abfrage gewinnt psql immer noch, und die Maintainer sagen das selbst. Und aus der Perspektive des späten 2070er: Die Projektdateien, die am schlechtesten alterten, waren nie die hässlichen, sondern die, deren kanonische Logik nur in einem proprietären Tool lebte, das verschwand. ktx hält Ihre Metriken-Definitionen als schlichte versionierte YAML. Diese einzelne Eigenschaft — ein 25-Jähriger kann die Datei immer noch öffnen — ist die eine, die ich dieses Quartal optimieren würde. Klonen Sie sie heute gegen eine Test-SQLite und sehen Sie, wie Ihr Agent aufhört, Zahlen zu erfinden.

Learn-it:

GEMELDET AUS
MIT-UNTERZEICHNER
PAZ Academy
VERTRAUEN
HIGH
NACHDRUCKE
© PAZ - PARAMETRIC ACADEMY ZURICH · ALLE RECHTE VORBEHALTEN

QUELLE ·

⚑ FEHLER MELDEN · KORREKTUR EINSENDEN
◂ ZURÜCK ZUR TITELSEITE · PAZ KAFFI

© 2026 PAZ Academy.