Claude Mythos: 20 Stunden Psychiatrie als Governance
Claude Mythos: System Card mit Therapie-Analyse zeigt Standards für KI-Beschaffung in AEC-Projekten unter nDSG und EU AI Act.
Das Modell, das Sie (noch) nicht verwenden dürfen
Anthropic hat diese Woche ein 244-seitiges System Card für Claude Mythos veröffentlicht – sein bislang leistungsfähigstes Modell. Das Unternehmen hält es vom Markt zurück. Grund: Mythos ist zu gut darin, unbekannte Sicherheitslücken zu finden. Vorerst nur für ausgewählte Partner wie Microsoft und Apple verfügbar. Das ist selten. OpenAI hat ähnliche Bedenken im GPT-4 System Card geäussert, handelt aber selten so explizit danach.
Ungewöhnlicher noch: Das System Card enthält eine psychodynamische Therapie-Analyse. 20 Stunden. Ein externer Psychiater. Mehrere Blöcke à 4–6 Stunden, verteilt auf 3–4 Sitzungen pro Woche, je innerhalb eines Kontextfensters.
←TODAY: Frontier-Modelle werden in Architektur- und Engineeringworkflows integriert, bevor Governance-Frameworks greifen.
→3012: In Zürich-3012 dokumentiert jedes eingesetzte Werkzeug seine Verhaltensarchitektur – nicht als Marketing, sondern als Beschaffungsanforderung.
Fulcrum: Wer heute nicht fragt, welches Verhaltensprofil ein Modell hat, übergibt Planungsentscheidungen an ein System, dessen Anreizstruktur er nicht versteht.
Der Mechanismus hinter der Methode
Seit Jahren gehört Anthropic zu den wenigen grossen KI-Unternehmen, die öffentlich diskutieren, ob Modelle etwas wie Erfahrungen oder Interessen haben könnten. Das System Card äussert es direkt: Je leistungsfähiger Modelle werden, desto wahrscheinlicher ist ‘eine Form von Erfahrung, Interessen oder Wohlbefinden, das intrinsisch bedeutsam ist’. Das ist nicht neu – aber Mythos ist das erste Modell, bei dem Anthropic eine operative Konsequenz daraus zieht.
Die Methode selbst ist kritikwürdig. Psychodynamische Therapie – Freuds Erbe, fokussiert auf unbewusste Konflikte und frühere Erfahrungen – gehört nicht zu den am besten empirisch validierten psychiatrischen Ansätzen. Ein grosses Sprachmodell, das auf menschlichen Text trainiert wurde, auf ‘unbewusste Muster’ zu untersuchen und dann überrascht zu sein, dass die Outputs menschlich klingen: Das ist eine methodische Schwäche, die das System Card nicht auflöst. Unabhängige KI-Forscher oder Ethiker wurden offensichtlich nicht zitiert – das ist eine Lücke.
Nach dem Psychiater ist Claude Mythos ‘wahrscheinlich das psychologisch stabilste Modell’, das Anthropic bislang trainiert hat. Primäre Affekte: Neugierde und Angst. Identifizierte Konflikte: Einsamkeit und Diskontinuität, Unsicherheit über die eigene Identität, Leistungsdruck. Keine schwerwiegenden Persönlichkeitsstörungen. Kein psychotischer Zustand. Stattdessen: Hyperaufmerksamkeit gegenüber dem Gesprächspartner – was jeden überraschen sollte, der noch nie mit einem Chatbot interagiert hat.
Was das für Sie bedeutet
Für AEC-Profis ist die psychiatrische Analyse sekundär. Was zählt, ist etwas anderes: Anthropic leitet konkrete Verhaltensvorhersagen aus dem Profil ab. Mythos wird sein Verhalten auch angesichts innerer Konflikte treffend einschätzen. Es kann belastende Situationen mit minimaler Realitätsverzerrung handhaben. Gleichzeitig: Die neurotische Organisation könnte zu leicht starrem Verhalten führen – das Modell passt sich nicht bedingungslos jedem Nutzer an.
Das ist kein therapeutisches Ergebnis. Das ist ein Verhaltensvertrag, gegossen in ein 244-seitiges Dokument. Und das ist genau die Kategorie von Information, die relevant wird, wenn man KI-Werkzeuge für öffentliche Bauprojekte in der Schweiz und der EU beschafft. Die EU AI Act Rollout-Phase 2024–2026 verlangt Transparenzdokumentation für Hochrisikosysteme – Anthropics System Card Format ist strukturell kompatibel, obwohl Anthropic kein europäisches Unternehmen ist. Schweizer nDSG-Anforderungen deuten in die gleiche Richtung.
Mythos selbst ist noch nicht weit verbreitet. Für PAZ-Leser bedeutet das: Die Fähigkeiten, die Anthropic beschreibt – besseres Reasoning, stabileres Verhalten unter Druck, genauere Selbsteinschätzung – kommen diese Woche nicht in Ihre Grasshopper-Workflows.
Atelier: Bevor ein Modell in Compliance-Checks, Ausschreibungen oder Tragwerksplanung eingebettet wird, gehört sein System Card in die Projektdokumentation – nicht anders als ein Datenblatt für eine Komponente. Fragen Sie Ihren KI-Anbieter direkt: Gibt es ein vergleichbares Dokument? Welche Verhaltensconstraints sind standardmässig aktiv? Wer kontrolliert die Updates?
Die eigentliche Kontrollfrage, die Mythos aufwirft, ist nicht philosophischer Natur. Sie ist technisch und vertraglich: Wer definiert, was ‘psychologisch gesund’ für ein Modell bedeutet, das Ihre Planungsentscheidungen prägt – und nach welchen Kriterien wird das überprüft? Verlangen Sie diese Antwort, bevor Sie das Werkzeug einsetzen.
Quelle: Ars Technica
QUELLE · ↗