Session-Prompt — Phase 2 starten
Copy/Paste in die naechste Claude-Code-Session am Anfang. Gibt dem Agent vollen Kontext um Phase 2 ohne Reorientierung anzufangen.
Was bisher geschah (aus der Session 2026-05-19)
Phase 1 vom Design-Stack-Upgrade fuer Julian / VF ist abgeschlossen:
- vf-nova System Prompt v3.0 live (43969 chars, +3427 Delta) mit Anti-Slop-Block. Sieben Cardinal Sins gegen AI-Slop hart definiert: Tailwind-Indigo-Hex-Blocklist (
#6366f1etc.), Forbidden-Gradients, Emoji-Feature-Icon-Verbot, Filler-Copy, Invented-Metrics, Sans-on-Serif-Mismatch, Rounded-Card-with-Left-Border. Source-of-Truth:~/source/apps/open-webui-vf/prompts/vf-nova.txt(commitbf8cddeim Branchfeat/welle1-tag4-backend-routing). - Plan-File: 2026-05-19-design-stack-julian mit kompletter Phase-1+2-Doku, Phase-1.2-SKIP-Begruendung (Native Image-Gen via Replicate geht nicht, OWUI 0.9.5 supportet nur openai/automatic1111/comfyui/gemini), Decision-Forks, Anti-Scope.
- Capability-File open-webui-vf hat Phase-1-Update-Section +
system_prompt_versionbumped. - Vault-Commit:
83e376daufmain.
Was Julian jetzt merken sollte: Indigo + AI-Gradients + Emoji-Icons sind aus seinen Designs raus, Anti-Slop-Negativ-Prompt landet automatisch in Replicate-Tool-Calls.
Ziel dieser Session
Phase 2 aus phase-2 umsetzen:
mcp-replicate-hostedals zweiten hosted MCP analogmcp-vf-hostedbauen + deployen. Sprint-2-Plan liegt in sprint-2-replicate-hosted mit allen Phasen (Repo + FastMCP-Wrapper, AWS-Deploy, OWUI-Integration, Doku + AVV).- Modell-Whitelist erweitert (Flux 2 Pro Default, Nano Banana 2 fuer Brand-Asset mit Logo, Recraft V4 SVG fuer Vektor, Ideogram V3 Quality fuer Text-im-Bild, Flux Kontext Pro fuer Varianten, Seedream 4.5 fuer Volumen-Mockups).
- Brand-Lock-Direktive in jeder Tool-Docstring + Few-Shot-Hints zur Modell-Wahl, damit Nova das richtige Modell pro Use-Case selber waehlt.
- Video-Gen-Eval als Phase 2.2: Live-Check ob Replicate aktuell Kling 2.6 Pro / Wan 2.5 / Veo 3 hostet. Wenn ja → in die Whitelist. Wenn nein → ADR schreiben + Sub-Plan fuer Phase 2b (fal.ai oder Vertex EU).
- vf-nova Tool-Whitelist erweitern im OWUI Admin-UI.
Pre-Conditions check (vor dem Start)
# 1. Pattern-Repo + Vorbild liegen
ls ~/source/mcps/mcp-vf-hosted/ # muss da sein
ls ~/source/mcps/mcp-replicate/ # lokales mcp-replicate als Source
ls ~/source/apps/open-webui-vf/infra/ # CDK-Stack-Vorbild
# 2. AWS-Profile aktiv
aws sts get-caller-identity --profile av-production --region eu-central-1
# 3. Replicate-API-Token vorhanden
grep REPLICATE_API_TOKEN ~/source/mcps/mcp-replicate/.env.local
# 4. Cloudflare-Zugriff via mcp__cloudflare__* tools
# 5. Scalekit-EU-Account erreichbar (analog mcp-vf-hosted)Erster konkreter Schritt
Skill /plan ist schon angewendet (Plan-File liegt). Direkt mit /work starten:
/work Phase 2.1 aus intern/projekte/openwebui-vf/plans/2026-05-19-design-stack-julian.md.
Lies zuerst den Sprint-2-Plan [[sprint-2-replicate-hosted]] vollstaendig, dann
mcp-vf-hosted als Vorbild-Stack. Erst dann den Bau starten.
Start-Step: Repo-Skeleton `~/source/mcps/mcp-replicate-hosted/` analog
mcp-vf-hosted anlegen — pyproject.toml, src/mcp_replicate_hosted/main.py,
Dockerfile, infra/lib/mcp-replicate-hosted-stack.ts.
Nicht alles auf einmal — schrittweise, mit Phase-Check vor jedem groesseren
Edit.
Decision-Forks die schon entschieden sind
| Frage | Entscheidung |
|---|---|
| Native Image-Gen-Provider (OpenAI/Gemini/ComfyUI)? | SKIP — alles via Tool-Use, sauberer |
| Replicate-Token: VF-eigener oder Sammel? | VF-eigener mit Spending-Cap $100/Mo (siehe Plan §Cost-Cap-Strategie) |
| Spending-Cap-Hoehe initial | $100/Mo |
| Modell-Whitelist | Flux 2 Pro Default + Nano Banana 2, Recraft V4, Recraft V4 SVG, Ideogram V3 Quality, Ideogram V3 Turbo, Flux 1.1 Pro Ultra, Flux Kontext Pro, Seedream 4.5. Hidden: alles >$0.20/Bild |
FastMCP Slash-Prompts (/speaker_card, /save_the_date, /social_post) | in Phase 2 nur wenn Zeit, sonst Phase 3 |
| open-design ausser Anti-Slop noch was uebernehmen | NEIN in Phase 2 |
Decision-Forks die zu treffen sind
| Frage | Wann |
|---|---|
| Video-Gen: Replicate erweitern oder separater fal.ai-Sub-Plan? | Phase 2.2 nach Live-Check |
| Multi-Tenant-Replicate-MCP oder pro Kunde? | Phase 2.4 Doku, default „pro Kunde” wie mcp-vf-hosted |
| Tool-Whitelist-Cap fuer Nova (max 12 Tools wegen Bedrock-ListTools-Bug)? | Phase 2.3 — wenn Replicate-Tools >12 dann search_tools-Meta-Tool analog mcp-vf-hosted exposen |
Anti-Scope-Reminder
Nicht in dieser Session:
- Vertex AI / Google AI Studio Provider (Phase 3)
- fal.ai als neuer Provider (Phase 3 oder spaeter)
- Self-Host Flux 2 Klein / Wan 2.6 auf Hetzner (fuer Industriekunden, nicht VF)
- Skill-spezifische Custom Models
vf-nova-speaker-cardetc. (Phase 3) - Brand-Kit-Discovery-Wizard (_index)
- Cherry-Pick weiterer open-design Files (typography.md, directions.ts, design-brief Mapping) — Phase 3
Wenn Phase 2.1 schneller fertig ist als geplant
Optional dranziehen (in dieser Reihenfolge):
- FastMCP Slash-Prompts
/speaker_card,/save_the_date,/social_postergaenzen (~1-2h, FastMCP v2 Pattern) - Live-Test mit Julian organisieren (Email-Draft via
/email, mit 5-Minuten-Call-Vorschlag) - Capability-File SKILL um Hosted-Pattern erweitern
Phase 3 NICHT vorziehen — separater Plan-Cycle.
Was schiefgehen kann + Fallbacks
- Scalekit-EU-Resource-Creation fehlerhaft: Analog mcp-vf-hosted geloest, dort liegt die funktionierende Config als Referenz. Bei Hang: Scalekit-Support EU-Region.
- Cloudflare-Tunnel-Token in falschen Account: vor
cdk deployaws configure list-profileschecken,--profile av-productionimmer mitgeben. - vf-nova Tool-Bloat wenn neue Tools sichtbar: dann ListTools-Bug bei Bedrock —
search_toolsMeta-Tool aus mcp-replicate-hosted exposen, Whitelist auf 10-12 Tools begrenzen analog mcp-vf-hosted (mcp-tool-konfiguration). - AVV mit Replicate noch nicht da: Phase 2 trotzdem bauen, AVV parallel anstossen. Live-Schaltung an Julian erst nach AVV-Sign.
- Replicate-Spending-Cap nicht setzbar via API: manuell im Replicate-Dashboard, CloudWatch-Alarm bei $50/Mo (50% Cap) als Hilfslinie.
Files die ich gleich brauchen werde
| File | Zweck |
|---|---|
| 2026-05-19-design-stack-julian | Master-Plan, alle Details |
| sprint-2-replicate-hosted | Original Sprint-2-Phasenplan |
~/source/mcps/mcp-vf-hosted/ | Code-Vorbild fuer alle Files |
~/source/apps/open-webui-vf/infra/lib/open-webui-vf-stack.ts | CDK-Pattern (Fargate + cloudflared-Sidecar) |
| mcp-hosting-fargate-tunnel | Pattern-Doku |
| mcp-best-practices | Tool-Design + Error-Hints + Audit-Checkliste |
| models | Modell-Katalog mit Preisen + API-Patterns |
| image-gen-provider-vergleich | Provider-Vergleich, DSGVO-Status |
| open-webui-vf | OWUI Tool-Whitelist-Pattern |
Erfolgs-Kriterien Ende der Session
Phase 2.1-Definition-of-Done aus dem Plan:
-
mcp-replicate-hostedRepo komplett, FastMCP v2 + ScalekitProvider + GuardMiddleware, Modell-Whitelist konfiguriert - AWS Fargate Stack deployed in
av-productionmit Cloudflare-Tunnel - Domain
replicate.agenticventures.delive, OAuth-Flow durchgespielt - Smoke-Tests grun: Flux 2 Pro + Ideogram V3 Quality + Recraft V4 SVG je ein Bild generiert mit VF-Brand-Lock-Prompt
- GuardMiddleware-Tests: 403 bei Modell ausserhalb Whitelist, 429 bei Rate-Limit
- Replicate-Spending-Cap $100/Mo aktiv
- vf-nova Tool-Whitelist erweitert um die 7-10 neuen Replicate-Tools (max 12 total, sonst search_tools-Meta)
- Capability-Files mcp-replicate-hosted + mcp-replicate-hosted neu angelegt
- sprint-2-replicate-hosted und welle-4-capability-rollout Items 4.10+4.12 als done markiert
- VF-AVV: Replicate Inc. als Subprozessor eingetragen, AVV-Briefing-File fuer Andre in
extern/shared/vibe-factory/avv-replicate.md
Falls 2.2 (Video) auch durchgeht:
- ADR
intern/wissen/entscheidungen/vf-video-gen-provider.mdmit Replicate-Live-Check-Ergebnis - Wenn Replicate Kling/Wan hostet: in Whitelist + Smoke-Test
- Wenn nicht: Sub-Plan fuer Phase 2b angelegt, NICHT umgesetzt
Letzter Hinweis
Marvin’s Rule 21: phasenbewusst arbeiten. Diese Session ist /work, nicht /plan oder /brainstorm — Plan liegt fertig. Wenn beim Bauen substantielle Architektur-Fragen aufkommen die nicht im Plan stehen: kurz STOP, Plan ergaenzen, dann weiter bauen. Nicht heimlich aus dem Scope drift.
Marvin’s Rule 22: Kunden-Namen niemals in Drittpartei-Kommunikation. Bei AVV-Texten + Test-Mails: VF-Name in Drafts nutzen ist OK (interne Doku + an VF selbst), aber bei eventuellen Logs / Smoke-Test-Outputs / Screenshots: keine VF-Brand sichtbar im Output falls die irgendwo extern landen.