Welle 3 — Excellence (9.2 → 9.5)
10-15 Bautage verteilt. Nicht als Sprint ausfuehren — jedes Item hat einen eigenen Trigger (User-Pain, Sales-Pitch, Industriekunde). Wenn kein Trigger: nicht bauen.
Backlog
B3.1 — Per-Sub-MCP-Health-Check + Circuit-Breaker (1-2 Tage)
Trigger: Sub-MCP-Hang ist mehrfach passiert (CloudWatch-Alarm getriggert).
/healthin mcp-vf-hosted erweitern: pro Sub-MCP einen Health-Probe-Call, Status zurueck- Wenn Sub-MCP unhealthy: andere Tools sollen weiterhin funktionieren (Circuit-Breaker)
B3.2 — Per-User-Preferences-Memory (1-2 Tage)
Trigger: Andre und Christoph haben merklich verschiedene Praeferenzen (z.B. Andre will Tabellen, Christoph Fliesstext).
- JSONB-Spalte
user_preferencesin Open-WebUI-Users-Table - System-Prompt-Pre-Hook injiziert
{{USER_PREFERENCES}}als Sektion - Open-WebUI-UI: User kann Praeferenzen setzen (Tabellen-vs-Fliesstext, ausfuehrlich-vs-knapp, formelle-vs-Du-Form)
B3.3 — Open-WebUI-Knowledge-Base pro User aktivieren (1 Tag)
Trigger: User fragt explizit nach Custom-RAG („kannst du dir merken dass …”).
ENABLE_RAG_HYBRID_SEARCH=true, embedding model setzen- Per-User-KB: Andre laedt seine Sales-Templates hoch, vf-sonnet kann darauf zugreifen
- Cost: Embeddings via Bedrock Titan (in EU verfuegbar)
B3.4 — Customer-facing Quickstart-Doku (0.5 Tag)
Trigger: 4. User wird onboarded oder Andre/Christoph fragen „wo finde ich die Hilfe?“.
extern/shared/vf/quickstart.mdmit Top-5-Use-Cases- Optional: Inline-Tooltips in Open-WebUI auf erste Login
B3.5 — Multi-Tenant-Template-System (3-5 Tage)
Trigger: Kunde 2 hat unterschrieben. Vorher null ROI.
- vf-sonnet →
<customer>-sonnetTemplate - Per-Tenant-MCP-Token-Vaults (eigener Papierkram-Token pro Kunde)
- Per-Tenant-Custom-Domain (
chat.<kunde>.de) - Onboarding-Skill: „neuen Kunden in 2 Tagen aufsetzen”
B3.6 — VPC-Endpoints + Network-Segmentation (1 Tag)
Trigger: Industriekunde verlangt es vertraglich (Becker-Style).
- VPC-Endpoints fuer Bedrock + Secrets-Manager — kein Internet-Egress fuer LLM-Traffic
- Private Subnets fuer Compute, NAT-Gateway nur fuer Sub-MCP-Egress
B3.7 — Bug-Report → Eval-Case-Auto-Generator (1 Tag)
Trigger: 5+ Bug-Reports im Backlog, davon < 50% als Eval-Cases erfasst.
- Skill
bug-to-evalder ein Bug-Report-Markdown nimmt und einen Eval-Case-Vorschlag generiert - Marvin reviewt, approved, Pull-Request
B3.8 — System-Prompt-Versionierung mit Diff-Logs (0.5 Tag)
Trigger: System-Prompt-Iteration ist Painful — 9 Versionen aber kein klarer Changelog.
vf-sonnet.txtHeader-Sektion mit changelog-Block pro Version- Diff-Tool das v2.9 vs v3.0 lesbar darstellt
B3.9 — Public-Lesson-Sharing (variabel)
Trigger: Marketing-Bedarf fuer Lead-Gen.
- Blog-Post „Was wir aus dem VF-Build gelernt haben”
- Open-Source: Eval-Runner als Reference-Implementation
- Talk auf Meetup / Konferenz
Was bewusst NICHT in Welle 3
Diese Items habe ich aus dem Audit klar als „nicht lohnenswert” markiert:
- BSI C5 oder ISO 27001 Zertifizierung (50k EUR, 12 Monate)
- Multi-Region-Deployment fuer Latency (Frankfurt reicht)
- pgvector + Vault-Retrieval (unklare User-Need)
- Event-Sourcing-Architektur (Engineering-Eitelkeit)
- Eval-Tool-Stack einkaufen (Promptfoo, Braintrust)
- Video-Onboarding-Tutorial (schaut niemand)
- Approval-Workflow-UI (Tool-Schemas billiger)
- DLP-Layer fuer PII-Filtering (aktueller Use-Case braucht das nicht)
- Anomaly-Detection User-Behavior-Spike (over-engineering bei 3 Usern)
- Multi-Judge-Consensus fuer Evals (relevant bei 100+ Cases)
- Distributed-Cost-Allocation (premature)
Diese 11 Punkte sind die letzten 5/100. Sie kosten zusammen ~80-120k EUR plus 6-12 Monate Engineering. Fuer 10k-MRR-Ziel reine Kapital-Verbrennung.
Wenn ein neuer Trigger ein Item aus dieser Liste relevant macht (z.B. Industriekunde verlangt BSI C5): einzeln evaluieren, nicht als Block.
Cross-Refs
- welle-2-reife — Vorgaenger
- _index — Audit-Quelle
- agent-system-best-practices — Ziel-Pattern