Session-Prompt — Phase 2 starten

Copy/Paste in die naechste Claude-Code-Session am Anfang. Gibt dem Agent vollen Kontext um Phase 2 ohne Reorientierung anzufangen.


Was bisher geschah (aus der Session 2026-05-19)

Phase 1 vom Design-Stack-Upgrade fuer Julian / VF ist abgeschlossen:

  • vf-nova System Prompt v3.0 live (43969 chars, +3427 Delta) mit Anti-Slop-Block. Sieben Cardinal Sins gegen AI-Slop hart definiert: Tailwind-Indigo-Hex-Blocklist (#6366f1 etc.), Forbidden-Gradients, Emoji-Feature-Icon-Verbot, Filler-Copy, Invented-Metrics, Sans-on-Serif-Mismatch, Rounded-Card-with-Left-Border. Source-of-Truth: ~/source/apps/open-webui-vf/prompts/vf-nova.txt (commit bf8cdde im Branch feat/welle1-tag4-backend-routing).
  • Plan-File: 2026-05-19-design-stack-julian mit kompletter Phase-1+2-Doku, Phase-1.2-SKIP-Begruendung (Native Image-Gen via Replicate geht nicht, OWUI 0.9.5 supportet nur openai/automatic1111/comfyui/gemini), Decision-Forks, Anti-Scope.
  • Capability-File open-webui-vf hat Phase-1-Update-Section + system_prompt_version bumped.
  • Vault-Commit: 83e376d auf main.

Was Julian jetzt merken sollte: Indigo + AI-Gradients + Emoji-Icons sind aus seinen Designs raus, Anti-Slop-Negativ-Prompt landet automatisch in Replicate-Tool-Calls.

Ziel dieser Session

Phase 2 aus phase-2 umsetzen:

  1. mcp-replicate-hosted als zweiten hosted MCP analog mcp-vf-hosted bauen + deployen. Sprint-2-Plan liegt in sprint-2-replicate-hosted mit allen Phasen (Repo + FastMCP-Wrapper, AWS-Deploy, OWUI-Integration, Doku + AVV).
  2. Modell-Whitelist erweitert (Flux 2 Pro Default, Nano Banana 2 fuer Brand-Asset mit Logo, Recraft V4 SVG fuer Vektor, Ideogram V3 Quality fuer Text-im-Bild, Flux Kontext Pro fuer Varianten, Seedream 4.5 fuer Volumen-Mockups).
  3. Brand-Lock-Direktive in jeder Tool-Docstring + Few-Shot-Hints zur Modell-Wahl, damit Nova das richtige Modell pro Use-Case selber waehlt.
  4. Video-Gen-Eval als Phase 2.2: Live-Check ob Replicate aktuell Kling 2.6 Pro / Wan 2.5 / Veo 3 hostet. Wenn ja → in die Whitelist. Wenn nein → ADR schreiben + Sub-Plan fuer Phase 2b (fal.ai oder Vertex EU).
  5. vf-nova Tool-Whitelist erweitern im OWUI Admin-UI.

Pre-Conditions check (vor dem Start)

# 1. Pattern-Repo + Vorbild liegen
ls ~/source/mcps/mcp-vf-hosted/         # muss da sein
ls ~/source/mcps/mcp-replicate/         # lokales mcp-replicate als Source
ls ~/source/apps/open-webui-vf/infra/   # CDK-Stack-Vorbild
 
# 2. AWS-Profile aktiv
aws sts get-caller-identity --profile av-production --region eu-central-1
 
# 3. Replicate-API-Token vorhanden
grep REPLICATE_API_TOKEN ~/source/mcps/mcp-replicate/.env.local
 
# 4. Cloudflare-Zugriff via mcp__cloudflare__* tools
# 5. Scalekit-EU-Account erreichbar (analog mcp-vf-hosted)

Erster konkreter Schritt

Skill /plan ist schon angewendet (Plan-File liegt). Direkt mit /work starten:

/work Phase 2.1 aus intern/projekte/openwebui-vf/plans/2026-05-19-design-stack-julian.md.
Lies zuerst den Sprint-2-Plan [[sprint-2-replicate-hosted]] vollstaendig, dann
mcp-vf-hosted als Vorbild-Stack. Erst dann den Bau starten.

Start-Step: Repo-Skeleton `~/source/mcps/mcp-replicate-hosted/` analog
mcp-vf-hosted anlegen — pyproject.toml, src/mcp_replicate_hosted/main.py,
Dockerfile, infra/lib/mcp-replicate-hosted-stack.ts.

Nicht alles auf einmal — schrittweise, mit Phase-Check vor jedem groesseren
Edit.

Decision-Forks die schon entschieden sind

FrageEntscheidung
Native Image-Gen-Provider (OpenAI/Gemini/ComfyUI)?SKIP — alles via Tool-Use, sauberer
Replicate-Token: VF-eigener oder Sammel?VF-eigener mit Spending-Cap $100/Mo (siehe Plan §Cost-Cap-Strategie)
Spending-Cap-Hoehe initial$100/Mo
Modell-WhitelistFlux 2 Pro Default + Nano Banana 2, Recraft V4, Recraft V4 SVG, Ideogram V3 Quality, Ideogram V3 Turbo, Flux 1.1 Pro Ultra, Flux Kontext Pro, Seedream 4.5. Hidden: alles >$0.20/Bild
FastMCP Slash-Prompts (/speaker_card, /save_the_date, /social_post)in Phase 2 nur wenn Zeit, sonst Phase 3
open-design ausser Anti-Slop noch was uebernehmenNEIN in Phase 2

Decision-Forks die zu treffen sind

FrageWann
Video-Gen: Replicate erweitern oder separater fal.ai-Sub-Plan?Phase 2.2 nach Live-Check
Multi-Tenant-Replicate-MCP oder pro Kunde?Phase 2.4 Doku, default „pro Kunde” wie mcp-vf-hosted
Tool-Whitelist-Cap fuer Nova (max 12 Tools wegen Bedrock-ListTools-Bug)?Phase 2.3 — wenn Replicate-Tools >12 dann search_tools-Meta-Tool analog mcp-vf-hosted exposen

Anti-Scope-Reminder

Nicht in dieser Session:

  • Vertex AI / Google AI Studio Provider (Phase 3)
  • fal.ai als neuer Provider (Phase 3 oder spaeter)
  • Self-Host Flux 2 Klein / Wan 2.6 auf Hetzner (fuer Industriekunden, nicht VF)
  • Skill-spezifische Custom Models vf-nova-speaker-card etc. (Phase 3)
  • Brand-Kit-Discovery-Wizard (_index)
  • Cherry-Pick weiterer open-design Files (typography.md, directions.ts, design-brief Mapping) — Phase 3

Wenn Phase 2.1 schneller fertig ist als geplant

Optional dranziehen (in dieser Reihenfolge):

  1. FastMCP Slash-Prompts /speaker_card, /save_the_date, /social_post ergaenzen (~1-2h, FastMCP v2 Pattern)
  2. Live-Test mit Julian organisieren (Email-Draft via /email, mit 5-Minuten-Call-Vorschlag)
  3. Capability-File SKILL um Hosted-Pattern erweitern

Phase 3 NICHT vorziehen — separater Plan-Cycle.

Was schiefgehen kann + Fallbacks

  • Scalekit-EU-Resource-Creation fehlerhaft: Analog mcp-vf-hosted geloest, dort liegt die funktionierende Config als Referenz. Bei Hang: Scalekit-Support EU-Region.
  • Cloudflare-Tunnel-Token in falschen Account: vor cdk deploy aws configure list-profiles checken, --profile av-production immer mitgeben.
  • vf-nova Tool-Bloat wenn neue Tools sichtbar: dann ListTools-Bug bei Bedrock — search_tools Meta-Tool aus mcp-replicate-hosted exposen, Whitelist auf 10-12 Tools begrenzen analog mcp-vf-hosted (mcp-tool-konfiguration).
  • AVV mit Replicate noch nicht da: Phase 2 trotzdem bauen, AVV parallel anstossen. Live-Schaltung an Julian erst nach AVV-Sign.
  • Replicate-Spending-Cap nicht setzbar via API: manuell im Replicate-Dashboard, CloudWatch-Alarm bei $50/Mo (50% Cap) als Hilfslinie.

Files die ich gleich brauchen werde

FileZweck
2026-05-19-design-stack-julianMaster-Plan, alle Details
sprint-2-replicate-hostedOriginal Sprint-2-Phasenplan
~/source/mcps/mcp-vf-hosted/Code-Vorbild fuer alle Files
~/source/apps/open-webui-vf/infra/lib/open-webui-vf-stack.tsCDK-Pattern (Fargate + cloudflared-Sidecar)
mcp-hosting-fargate-tunnelPattern-Doku
mcp-best-practicesTool-Design + Error-Hints + Audit-Checkliste
modelsModell-Katalog mit Preisen + API-Patterns
image-gen-provider-vergleichProvider-Vergleich, DSGVO-Status
open-webui-vfOWUI Tool-Whitelist-Pattern

Erfolgs-Kriterien Ende der Session

Phase 2.1-Definition-of-Done aus dem Plan:

  • mcp-replicate-hosted Repo komplett, FastMCP v2 + ScalekitProvider + GuardMiddleware, Modell-Whitelist konfiguriert
  • AWS Fargate Stack deployed in av-production mit Cloudflare-Tunnel
  • Domain replicate.agenticventures.de live, OAuth-Flow durchgespielt
  • Smoke-Tests grun: Flux 2 Pro + Ideogram V3 Quality + Recraft V4 SVG je ein Bild generiert mit VF-Brand-Lock-Prompt
  • GuardMiddleware-Tests: 403 bei Modell ausserhalb Whitelist, 429 bei Rate-Limit
  • Replicate-Spending-Cap $100/Mo aktiv
  • vf-nova Tool-Whitelist erweitert um die 7-10 neuen Replicate-Tools (max 12 total, sonst search_tools-Meta)
  • Capability-Files mcp-replicate-hosted + mcp-replicate-hosted neu angelegt
  • sprint-2-replicate-hosted und welle-4-capability-rollout Items 4.10+4.12 als done markiert
  • VF-AVV: Replicate Inc. als Subprozessor eingetragen, AVV-Briefing-File fuer Andre in extern/shared/vibe-factory/avv-replicate.md

Falls 2.2 (Video) auch durchgeht:

  • ADR intern/wissen/entscheidungen/vf-video-gen-provider.md mit Replicate-Live-Check-Ergebnis
  • Wenn Replicate Kling/Wan hostet: in Whitelist + Smoke-Test
  • Wenn nicht: Sub-Plan fuer Phase 2b angelegt, NICHT umgesetzt

Letzter Hinweis

Marvin’s Rule 21: phasenbewusst arbeiten. Diese Session ist /work, nicht /plan oder /brainstorm — Plan liegt fertig. Wenn beim Bauen substantielle Architektur-Fragen aufkommen die nicht im Plan stehen: kurz STOP, Plan ergaenzen, dann weiter bauen. Nicht heimlich aus dem Scope drift.

Marvin’s Rule 22: Kunden-Namen niemals in Drittpartei-Kommunikation. Bei AVV-Texten + Test-Mails: VF-Name in Drafts nutzen ist OK (interne Doku + an VF selbst), aber bei eventuellen Logs / Smoke-Test-Outputs / Screenshots: keine VF-Brand sichtbar im Output falls die irgendwo extern landen.