Roadmap

Zeitachse

Heute (2026-05-17)
├── Phase 1 — Discover      (1h, nur lesen)
├── Phase 2 — Baseline      (2h, nur messen)
└── Phase 3 — Gate + Skill  (2h, schreiben: Budget, Caps, Skill-Scaffold)

Heute spaet / Mo 2026-05-18
└── Phase 4 — Profile-Setup (1.5h, AIPs in Caller-Code einbauen)
    └── 3 Tage messen lassen

Do 2026-05-21 — So 2026-05-31
└── Phase 5 — Optimize      (datengetrieben, 1-2 Slots pro Hebel)

So 2026-05-31 — Mi 2026-06-07
└── Phase 6 — Compound      (Vault + Skills verankern)

Abhaengigkeiten

  • Phase 3 hat keine Abhaengigkeit auf Phase 1/2 — Notbremsen koennen parallel zu Discover laufen. Sie sollen ja gerade ohne Daten Schutz bieten.
  • Phase 4 setzt Phase 1+2 voraus — wir brauchen die Caller-Liste aus Phase 1 und die Baseline-Werte aus Phase 2, sonst wissen wir nicht welche AIPs anlegen.
  • Phase 5 setzt Phase 4 + 3-Tage-Daten voraus — sonst optimieren wir blind.
  • Phase 6 ist final — kommt erst wenn echter Impact in Cost Explorer messbar ist, damit das Compounding mit Zahlen unterlegt ist (nicht “wir glauben das spart”).

Phase-Uebersicht (Kurzform)

PhaseTitelOutputAufwandHebel die hier umgesetzt werden
1DiscoverCaller-Liste in caller-inventar.md mit Mai-Aktivitaet1h— (nur lesen)
2BaselineToken-Counts pro Caller in caller-inventar.md2h— (nur messen)
3Gate + SkillBudget+Action live, max_tokens in allen Callern, Skill-Scaffold mit SKILL.md+playbook.md+templates2h2, 3, 10
4ProfileAIP pro Caller, Cost-Allocation-Tags aktiviert, AIP-Refs im Caller-Code1.5h Setup + 3 Tage Messung1
5OptimizeTop-3-Caller datengetrieben optimiertje 1-2h pro Hebel4, 5, 6, 7, 8, 9 (Hebel 6+8 koordiniert mit parallel-Session)
6Compoundmcp-best-practices erweitert, mcp-eigenbau + routine-anlegen mit Pflicht-Token-Audit2h(kein neuer Hebel, Wissens-Verankerung)

Koordinierungspunkte mit Parallel-Session

  • Hebel 6 (Prompt-Caching) + Hebel 8 (Modell-Routing) werden in anderer Claude-Session umgesetzt, parallel zu diesem Projekt.
  • Beruehrungspunkt: Phase 5 (Optimize) — wir muessen wissen bevor wir Tool-Description-Cutdown machen, ob die Caller dann Caching benutzen (sonst optimieren wir den falschen Layer).
  • Aktion: Vor Start Phase 5 kurzer Status-Sync mit parallel-Session. Wenn Caching schon eingebaut → Tool-Description-Cutdown lohnt sich besonders (statischer Teil wird gecached, dynamischer Teil wird kuerzer). Wenn noch nicht → Reihenfolge anders priorisieren.

Nicht-Zwischenschritte ueberspringen

Versuchung: “wir wissen ja eh dass mcp-papierkram die 70 Tools hat, lass uns direkt Tool-Descriptions kuerzen”. Nein — ohne AIP-Daten wissen wir nicht ob mcp-papierkram in dem Sonnet-Burst ueberhaupt der Caller war. Reihenfolge halten.

Einzige Ausnahme: Phase 3 (Notbremsen) parallel laufen lassen, weil die kein Daten brauchen.