Phase 6 — Compound

Ziel: Was wir gelernt haben darf nicht in diesem Projekt-Ordner versauern. Es muss in die Stellen rein die ein zukuenftiger Agent (oder Marvin selbst in 3 Monaten) sowieso liest.

Aufwand: ~2h, am Ende des Projekts.

Vorbedingung: Phase 5 fertig, messbarer Impact in Cost Explorer.

Nachbedingung: Token-Audit ist Pflicht-Check fuer jeden neuen MCP/Lambda, Vault hat die Patterns als nachschlagbares Wissen.

Touchpoints

6.1 mcp-best-practices erweitern

Neue Sektion „Token-Footprint + Cost-Hygiene”:

  • Zielwerte (Tool-Descriptions < 3000 Tokens, System-Prompt < 2000 Tokens fuer Brain-MCPs)
  • count_tokens()-Pattern als Pflicht-Audit vor Live-Gang
  • max_tokens-Hard-Cap als Pflicht-Parameter
  • AIP-ARN als Default-Modell-Referenz (statt direkter Modell-ID)
  • Prompt-Caching-Block-Pattern (kanonischer System-Prompt-Aufbau)

Plus konkrete Zahlen aus diesem Projekt als Beleg: „mcp-papierkram hatte vor Cutdown X Tokens an Tool-Descriptions, nachher Y, gespart ~Z%“.

6.2 SKILL um Pflicht-Audit erweitern

Vor dem „MCP live deployen”-Schritt: Pflicht-Check „Token-Audit bestanden?” mit Link auf den bedrock-cost-optimize-Skill. Bei rotem Flag: Cutdown bevor Deploy.

Implementierungs-Detail im SKILL.md ergaenzen.

6.3 SKILL um Pflicht-Parameter erweitern

Im 6-Fragen-Brief der Skill ein neuer Pflicht-Punkt: „max_tokens-Cap fuer den Bedrock-Call” + „AIP-ARN (Default: pro Routine eine eigene)“. Damit kann der Skill keinen Code generieren der max_tokens weglaesst.

6.4 _index um Spalte „Token-Cost-Tier”

Neue Spalte in der „Aktive MCPs”-Tabelle:

TierBedeutung
⭐ AToken-Audit bestanden, AIP konfiguriert, max_tokens-Cap gesetzt
⭐ BManche Hebel angewandt, weitere offen
⭐ CNicht auditiert / vor Phase 6 erstellt

Ziel: jeder neue MCP startet als C, muss auf A bevor produktiv eingesetzt.

6.5 lokale-source-repos — Hinweis pro Repo

Pro Eigenbau-MCP-Repo (~/source/mcps/mcp-*) ein Hinweis-Block in dessen README + im Vault-Eintrag:

**Bedrock-AIP**: `arn:aws:bedrock:eu-central-1:ACCT:application-inference-profile/<slug>`
**Token-Audit**: zuletzt 2026-MM-DD — Tools <N> Tokens, System-Prompt <M> Tokens
**max_tokens-Default**: <N>

6.6 CLAUDE.md Routing-Tabelle

Neuer Routing-Eintrag in der CLAUDE.md unter „Routing — wo finde ich was”:

| **Bedrock-Kosten optimieren (10-Hebel-Skill + Caller-Inventar)** | "[[intern/projekte/bedrock-cost-optimize/_index]]" + "[[intern/capabilities/skills/bedrock-cost-optimize/SKILL]]" |

6.7 intern/firma/active-work.md aktualisieren

Projekt-Status auf done setzen + 1-Satz-Lesson: was war der Top-Hebel rueckwirkend gesehen.

6.8 Run-Log

In intern/runs/2026-05.md einen Eintrag mit Projektabschluss, Vorher-Nachher-Cost-Snapshot und Top-3-Insights die andere Cases brauchen koennten.

Lessons-Vorlage (am Ende ausfuellen)

LessonSource-PhaseWo verankert
<z.B. „Open-WebUI Default Top-K=10 ist Verschwendung”>Phase 5mcp-best-practices §Token-Footprint

Definition of Done

  • mcp-best-practices Sektion „Token-Footprint” geschrieben mit Zahlen
  • mcp-eigenbau-Skill um Pflicht-Audit erweitert
  • routine-anlegen-Skill um Pflicht-max_tokens+AIP-Param erweitert
  • mcps/_index.md Spalte „Token-Cost-Tier” eingefuehrt, alle MCPs eingeordnet
  • CLAUDE.md Routing-Eintrag gesetzt
  • active-work.md auf done, Lesson dokumentiert
  • Run-Log-Eintrag in intern/runs/2026-05.md oder spaeter
  • Projekt-Status in _index.md auf done, target_done auf tatsaechliches Datum

Erfolgs-Test

Ein anderer Agent (oder Marvin in 3 Monaten) wird gebeten einen neuen MCP zu bauen. Schaut er von selbst auf den Token-Footprint, weil mcp-eigenbau ihn dazu zwingt? Wenn ja: Compounding-Loop hat funktioniert. Wenn nein: in mcp-best-practices sichtbarer machen.