Welle 3 — Excellence (9.2 → 9.5)

10-15 Bautage verteilt. Nicht als Sprint ausfuehren — jedes Item hat einen eigenen Trigger (User-Pain, Sales-Pitch, Industriekunde). Wenn kein Trigger: nicht bauen.

Backlog

B3.1 — Per-Sub-MCP-Health-Check + Circuit-Breaker (1-2 Tage)

Trigger: Sub-MCP-Hang ist mehrfach passiert (CloudWatch-Alarm getriggert).

  • /health in mcp-vf-hosted erweitern: pro Sub-MCP einen Health-Probe-Call, Status zurueck
  • Wenn Sub-MCP unhealthy: andere Tools sollen weiterhin funktionieren (Circuit-Breaker)

B3.2 — Per-User-Preferences-Memory (1-2 Tage)

Trigger: Andre und Christoph haben merklich verschiedene Praeferenzen (z.B. Andre will Tabellen, Christoph Fliesstext).

  • JSONB-Spalte user_preferences in Open-WebUI-Users-Table
  • System-Prompt-Pre-Hook injiziert {{USER_PREFERENCES}} als Sektion
  • Open-WebUI-UI: User kann Praeferenzen setzen (Tabellen-vs-Fliesstext, ausfuehrlich-vs-knapp, formelle-vs-Du-Form)

B3.3 — Open-WebUI-Knowledge-Base pro User aktivieren (1 Tag)

Trigger: User fragt explizit nach Custom-RAG („kannst du dir merken dass …”).

  • ENABLE_RAG_HYBRID_SEARCH=true, embedding model setzen
  • Per-User-KB: Andre laedt seine Sales-Templates hoch, vf-sonnet kann darauf zugreifen
  • Cost: Embeddings via Bedrock Titan (in EU verfuegbar)

B3.4 — Customer-facing Quickstart-Doku (0.5 Tag)

Trigger: 4. User wird onboarded oder Andre/Christoph fragen „wo finde ich die Hilfe?“.

  • extern/shared/vf/quickstart.md mit Top-5-Use-Cases
  • Optional: Inline-Tooltips in Open-WebUI auf erste Login

B3.5 — Multi-Tenant-Template-System (3-5 Tage)

Trigger: Kunde 2 hat unterschrieben. Vorher null ROI.

  • vf-sonnet → <customer>-sonnet Template
  • Per-Tenant-MCP-Token-Vaults (eigener Papierkram-Token pro Kunde)
  • Per-Tenant-Custom-Domain (chat.<kunde>.de)
  • Onboarding-Skill: „neuen Kunden in 2 Tagen aufsetzen”

B3.6 — VPC-Endpoints + Network-Segmentation (1 Tag)

Trigger: Industriekunde verlangt es vertraglich (Becker-Style).

  • VPC-Endpoints fuer Bedrock + Secrets-Manager — kein Internet-Egress fuer LLM-Traffic
  • Private Subnets fuer Compute, NAT-Gateway nur fuer Sub-MCP-Egress

B3.7 — Bug-Report → Eval-Case-Auto-Generator (1 Tag)

Trigger: 5+ Bug-Reports im Backlog, davon < 50% als Eval-Cases erfasst.

  • Skill bug-to-eval der ein Bug-Report-Markdown nimmt und einen Eval-Case-Vorschlag generiert
  • Marvin reviewt, approved, Pull-Request

B3.8 — System-Prompt-Versionierung mit Diff-Logs (0.5 Tag)

Trigger: System-Prompt-Iteration ist Painful — 9 Versionen aber kein klarer Changelog.

  • vf-sonnet.txt Header-Sektion mit changelog-Block pro Version
  • Diff-Tool das v2.9 vs v3.0 lesbar darstellt

B3.9 — Public-Lesson-Sharing (variabel)

Trigger: Marketing-Bedarf fuer Lead-Gen.

  • Blog-Post „Was wir aus dem VF-Build gelernt haben”
  • Open-Source: Eval-Runner als Reference-Implementation
  • Talk auf Meetup / Konferenz

Was bewusst NICHT in Welle 3

Diese Items habe ich aus dem Audit klar als „nicht lohnenswert” markiert:

  • BSI C5 oder ISO 27001 Zertifizierung (50k EUR, 12 Monate)
  • Multi-Region-Deployment fuer Latency (Frankfurt reicht)
  • pgvector + Vault-Retrieval (unklare User-Need)
  • Event-Sourcing-Architektur (Engineering-Eitelkeit)
  • Eval-Tool-Stack einkaufen (Promptfoo, Braintrust)
  • Video-Onboarding-Tutorial (schaut niemand)
  • Approval-Workflow-UI (Tool-Schemas billiger)
  • DLP-Layer fuer PII-Filtering (aktueller Use-Case braucht das nicht)
  • Anomaly-Detection User-Behavior-Spike (over-engineering bei 3 Usern)
  • Multi-Judge-Consensus fuer Evals (relevant bei 100+ Cases)
  • Distributed-Cost-Allocation (premature)

Diese 11 Punkte sind die letzten 5/100. Sie kosten zusammen ~80-120k EUR plus 6-12 Monate Engineering. Fuer 10k-MRR-Ziel reine Kapital-Verbrennung.

Wenn ein neuer Trigger ein Item aus dieser Liste relevant macht (z.B. Industriekunde verlangt BSI C5): einzeln evaluieren, nicht als Block.

Cross-Refs