Roadmap
Zeitachse
Heute (2026-05-17)
├── Phase 1 — Discover (1h, nur lesen)
├── Phase 2 — Baseline (2h, nur messen)
└── Phase 3 — Gate + Skill (2h, schreiben: Budget, Caps, Skill-Scaffold)
Heute spaet / Mo 2026-05-18
└── Phase 4 — Profile-Setup (1.5h, AIPs in Caller-Code einbauen)
└── 3 Tage messen lassen
Do 2026-05-21 — So 2026-05-31
└── Phase 5 — Optimize (datengetrieben, 1-2 Slots pro Hebel)
So 2026-05-31 — Mi 2026-06-07
└── Phase 6 — Compound (Vault + Skills verankern)
Abhaengigkeiten
- Phase 3 hat keine Abhaengigkeit auf Phase 1/2 — Notbremsen koennen parallel zu Discover laufen. Sie sollen ja gerade ohne Daten Schutz bieten.
- Phase 4 setzt Phase 1+2 voraus — wir brauchen die Caller-Liste aus Phase 1 und die Baseline-Werte aus Phase 2, sonst wissen wir nicht welche AIPs anlegen.
- Phase 5 setzt Phase 4 + 3-Tage-Daten voraus — sonst optimieren wir blind.
- Phase 6 ist final — kommt erst wenn echter Impact in Cost Explorer messbar ist, damit das Compounding mit Zahlen unterlegt ist (nicht “wir glauben das spart”).
Phase-Uebersicht (Kurzform)
| Phase | Titel | Output | Aufwand | Hebel die hier umgesetzt werden |
|---|---|---|---|---|
| 1 | Discover | Caller-Liste in caller-inventar.md mit Mai-Aktivitaet | 1h | — (nur lesen) |
| 2 | Baseline | Token-Counts pro Caller in caller-inventar.md | 2h | — (nur messen) |
| 3 | Gate + Skill | Budget+Action live, max_tokens in allen Callern, Skill-Scaffold mit SKILL.md+playbook.md+templates | 2h | 2, 3, 10 |
| 4 | Profile | AIP pro Caller, Cost-Allocation-Tags aktiviert, AIP-Refs im Caller-Code | 1.5h Setup + 3 Tage Messung | 1 |
| 5 | Optimize | Top-3-Caller datengetrieben optimiert | je 1-2h pro Hebel | 4, 5, 6, 7, 8, 9 (Hebel 6+8 koordiniert mit parallel-Session) |
| 6 | Compound | mcp-best-practices erweitert, mcp-eigenbau + routine-anlegen mit Pflicht-Token-Audit | 2h | (kein neuer Hebel, Wissens-Verankerung) |
Koordinierungspunkte mit Parallel-Session
- Hebel 6 (Prompt-Caching) + Hebel 8 (Modell-Routing) werden in anderer Claude-Session umgesetzt, parallel zu diesem Projekt.
- Beruehrungspunkt: Phase 5 (Optimize) — wir muessen wissen bevor wir Tool-Description-Cutdown machen, ob die Caller dann Caching benutzen (sonst optimieren wir den falschen Layer).
- Aktion: Vor Start Phase 5 kurzer Status-Sync mit parallel-Session. Wenn Caching schon eingebaut → Tool-Description-Cutdown lohnt sich besonders (statischer Teil wird gecached, dynamischer Teil wird kuerzer). Wenn noch nicht → Reihenfolge anders priorisieren.
Nicht-Zwischenschritte ueberspringen
Versuchung: “wir wissen ja eh dass mcp-papierkram die 70 Tools hat, lass uns direkt Tool-Descriptions kuerzen”. Nein — ohne AIP-Daten wissen wir nicht ob mcp-papierkram in dem Sonnet-Burst ueberhaupt der Caller war. Reihenfolge halten.
Einzige Ausnahme: Phase 3 (Notbremsen) parallel laufen lassen, weil die kein Daten brauchen.