Phase 6 — Compound
Ziel: Was wir gelernt haben darf nicht in diesem Projekt-Ordner versauern. Es muss in die Stellen rein die ein zukuenftiger Agent (oder Marvin selbst in 3 Monaten) sowieso liest.
Aufwand: ~2h, am Ende des Projekts.
Vorbedingung: Phase 5 fertig, messbarer Impact in Cost Explorer.
Nachbedingung: Token-Audit ist Pflicht-Check fuer jeden neuen MCP/Lambda, Vault hat die Patterns als nachschlagbares Wissen.
Touchpoints
6.1 mcp-best-practices erweitern
Neue Sektion „Token-Footprint + Cost-Hygiene”:
- Zielwerte (Tool-Descriptions < 3000 Tokens, System-Prompt < 2000 Tokens fuer Brain-MCPs)
count_tokens()-Pattern als Pflicht-Audit vor Live-Gangmax_tokens-Hard-Cap als Pflicht-Parameter- AIP-ARN als Default-Modell-Referenz (statt direkter Modell-ID)
- Prompt-Caching-Block-Pattern (kanonischer System-Prompt-Aufbau)
Plus konkrete Zahlen aus diesem Projekt als Beleg: „mcp-papierkram hatte vor Cutdown X Tokens an Tool-Descriptions, nachher Y, gespart ~Z%“.
6.2 SKILL um Pflicht-Audit erweitern
Vor dem „MCP live deployen”-Schritt: Pflicht-Check „Token-Audit bestanden?” mit Link auf den bedrock-cost-optimize-Skill. Bei rotem Flag: Cutdown bevor Deploy.
Implementierungs-Detail im SKILL.md ergaenzen.
6.3 SKILL um Pflicht-Parameter erweitern
Im 6-Fragen-Brief der Skill ein neuer Pflicht-Punkt: „max_tokens-Cap fuer den Bedrock-Call” + „AIP-ARN (Default: pro Routine eine eigene)“. Damit kann der Skill keinen Code generieren der max_tokens weglaesst.
6.4 _index um Spalte „Token-Cost-Tier”
Neue Spalte in der „Aktive MCPs”-Tabelle:
| Tier | Bedeutung |
|---|---|
| ⭐ A | Token-Audit bestanden, AIP konfiguriert, max_tokens-Cap gesetzt |
| ⭐ B | Manche Hebel angewandt, weitere offen |
| ⭐ C | Nicht auditiert / vor Phase 6 erstellt |
Ziel: jeder neue MCP startet als C, muss auf A bevor produktiv eingesetzt.
6.5 lokale-source-repos — Hinweis pro Repo
Pro Eigenbau-MCP-Repo (~/source/mcps/mcp-*) ein Hinweis-Block in dessen README + im Vault-Eintrag:
**Bedrock-AIP**: `arn:aws:bedrock:eu-central-1:ACCT:application-inference-profile/<slug>`
**Token-Audit**: zuletzt 2026-MM-DD — Tools <N> Tokens, System-Prompt <M> Tokens
**max_tokens-Default**: <N>6.6 CLAUDE.md Routing-Tabelle
Neuer Routing-Eintrag in der CLAUDE.md unter „Routing — wo finde ich was”:
| **Bedrock-Kosten optimieren (10-Hebel-Skill + Caller-Inventar)** | "[[intern/projekte/bedrock-cost-optimize/_index]]" + "[[intern/capabilities/skills/bedrock-cost-optimize/SKILL]]" |6.7 intern/firma/active-work.md aktualisieren
Projekt-Status auf done setzen + 1-Satz-Lesson: was war der Top-Hebel rueckwirkend gesehen.
6.8 Run-Log
In intern/runs/2026-05.md einen Eintrag mit Projektabschluss, Vorher-Nachher-Cost-Snapshot und Top-3-Insights die andere Cases brauchen koennten.
Lessons-Vorlage (am Ende ausfuellen)
| Lesson | Source-Phase | Wo verankert |
|---|---|---|
| <z.B. „Open-WebUI Default Top-K=10 ist Verschwendung”> | Phase 5 | mcp-best-practices §Token-Footprint |
Definition of Done
- mcp-best-practices Sektion „Token-Footprint” geschrieben mit Zahlen
- mcp-eigenbau-Skill um Pflicht-Audit erweitert
- routine-anlegen-Skill um Pflicht-
max_tokens+AIP-Param erweitert - mcps/_index.md Spalte „Token-Cost-Tier” eingefuehrt, alle MCPs eingeordnet
- CLAUDE.md Routing-Eintrag gesetzt
- active-work.md auf done, Lesson dokumentiert
- Run-Log-Eintrag in
intern/runs/2026-05.mdoder spaeter - Projekt-Status in _index.md auf
done, target_done auf tatsaechliches Datum
Erfolgs-Test
Ein anderer Agent (oder Marvin in 3 Monaten) wird gebeten einen neuen MCP zu bauen. Schaut er von selbst auf den Token-Footprint, weil mcp-eigenbau ihn dazu zwingt? Wenn ja: Compounding-Loop hat funktioniert. Wenn nein: in mcp-best-practices sichtbarer machen.