Session-Handover — Brainstorm MCP-Hosting

Stand Ende Session 2026-05-19. Naechste Session kann hier anknuepfen.

Was wurde erledigt

A. Bedrock-Cost-Fix Step 1 (Cache-Killer raus)

  • CDK-Stack-Aenderungen waren bereits live deployed (LogGroup 14d, TASK_MODEL=vf-haiku-backend, LITELLM_LOG, Klassifikator-Logger, TTS Supertonic, Favicon) — Verifikation via Task-Definition OpenWebUiVfTaskDef2DC830C3 in av-prod. Git-Working-Tree in ~/source/apps/open-webui-vf hat die Aenderungen aber noch nicht committed (Branch feat/welle1-tag4-backend-routing).
  • OWUI-System-Prompt vf-sonnet via API gepusht. {{CURRENT_TIME}} entfernt, <session>-Block ans Ende verschoben. Zwei Pushes notwendig: erster Push hatte noch das Literal {{CURRENT_TIME}} im HTML-Kommentar (OWUI macht naive String-Replacement auch in Kommentaren) — korrigierte Version v2 mit CURRENT_TIME ohne Braces erfolgreich gepusht. HTTP 200 verifiziert, s.rstrip().endswith('</session>') = True, kein {{CURRENT_TIME}} mehr im aktiven Prompt.
  • Backup alter Prompt-State: /tmp/vf-sonnet-backup-2026-05-19.json (lokal — sollte ggf. in den Vault persistiert werden falls Rollback noetig)
  • Measurement in 24-48h via AWS Cost Explorer. Erwartet: Cache-Read 17% → 70%+, Plain-Input 83% → ~20%. Sparpotenzial allein dadurch: ~$215/Mo Bedrock.

B. Brainstorm „MCP-Hosting als Produkt + EDI-Netzwerk”

Skill compound-engineering:ce-brainstorm durchlaufen:

  • EDI-Frage geklaert: Marvin hat bereits ein detailliertes Konzept KI-Netzwerk als EDI-Nachfolger (run-2026-05-14, 3.000+ Zeilen). Im 2026-05-19-Brainstorm bewusst als 2027-Vision geparkt, NICHT Teil dieses Hosting-Produkts. Becker-Pilot laeuft separat.
  • Markt-Research 1 (Zielsegment): Tech-Builder verworfen (Smithery/Composio/Cloudflare-Free dichten Markt), KMU-DACH als Anker (leerer Subscription-Markt + DSGVO als echter Differenzierer), SaaS-Whitelabel als Q1/2027-Sequel
  • Markt-Research 2 (Pricing): Hybrid Bundle + Tier + Add-On gewinnt vs Pure-Tier oder Pure-Modular. Per-Workspace statt Per-User. Setup-Workshop-Fee in DACH-KMU akzeptiert. Hard Call-Limits Pflicht.
  • Produkt-Frame: Zwei Pakete — MCP-Only (Welle 1) + AV-Stack-Voll (Welle 2). Spaeter im Review als problematisch markiert (siehe unten).

Brainstorm-Output-Doc: requirements.md (in diesem Ordner)

C. AV-Stack-Voll als Vision-Doc ausgelagert

av-stack-voll-vision.md angelegt. Enthaelt Idee, Komponenten-Hypothese, Gate-Bedingungen fuer Aktivierung. Reviewer-Konsens war: AV-Stack-Voll raus aus Welle 1.

D. Document-Review durchgelaufen

Skill compound-engineering:document-review mit 6 Personas drueber:

  • coherence-reviewer, feasibility-reviewer (always-on)
  • product-lens, security-lens, scope-guardian, adversarial (conditional, alle activated)

50 Findings synthesiert in 12 Konsens-Cluster. Wichtigste:

PrioClusterKonsens-StaerkeAktion
P0AV-Stack-Voll raus aus Welle 14 Reviewer✅ erledigt (ausgelagert)
P010k-MRR-Math nicht plausibel3 Revieweroffen — Tier-Mix durchrechnen oder Datumsverschiebung
P0LLM-Cost-Ownership-Frage unklar (Kunde-Abo oder Marvin?)adversarialoffen — load-bearing fuer ganzes Pricing
P1Security-Fundament VOR Planning (Credentials, Multi-Tenant, OAuth-Scope, Bedrock-Data)security 5 findingsoffen — 4 Decisions aus Deferred ins Brainstorm holen
P1Self-Service-Light = verkappter White-Glove + ueber-engineered4 Revieweroffen — Welle 1.0 White-Glove, Self-Service-Light auf Welle 1.5
P1KMU-Bedarfs-Annahme unbelegt + Anthropic Claude SMB als Threat3 Revieweroffen — Discovery-Calls + Claude-SMB-Research
P1Auth-Provider-Migration verfrueht2 Revieweroffen — Scalekit bleibt, R6 umkehren
P1mcp-vf-hosted noch nicht generalisierbar2 Revieweroffen — DNS-Cutover + zweite Tenant-Provisioning mit Stoppuhr
P1BAFA-Hebel ungenutzt — Hybrid-Pricing fehlt2 Revieweroffen — Setup-Workshop als foerderfaehig framen
P2OSS-Funnel zieht Tech-Builder3 Revieweroffen — minimieren auf GitHub-Public + Smithery-Listing, kein Demo-Video
P26 SKUs zu komplexscope-guardianoffen — auf 2 Tiers reduzieren
P3Editorial: Lexware-Status, R2/R3-Trennung, Becker-Cross-RefcoherenceAuto-Fix-Kandidaten, beim Refine ergaenzen

Volle Findings-Liste im Chat-Verlauf der Session 2026-05-19.

Was offen ist (naechste Session)

1. Brainstorm-Doc refinen (Marvin’s Wahl: „Refine — ich passe das Doc an die Konsens-Findings an”)

Konkret im requirements.md:

  • AV-Stack-Voll vollstaendig rausschneiden — R1 umformulieren (nur MCP-Only), R3 + R5 streichen, R11 vereinfachen (nur AWS-Spur, Hetzner-App-Layer raus), S2 reformulieren (kein „erster AV-Stack-Voll-Pilot live”)
  • Resolve-Before-Planning von 4 Items auf weniger reduzieren (3 davon waren AV-Stack-Voll-spezifisch)
  • Pricing-Tiers: Welle 1 mit 2 Tiers starten (Team 249 + Custom ab 1.500), Starter und Add-Ons deferred bis nach S1
  • R6 (Auth) umkehren: „Scalekit bleibt bis konkreter Blocker”
  • R9 (Onboarding) umschreiben: Welle 1.0 = White-Glove, Welle 1.5 = Self-Service-Light nach 5 Tenants live
  • R10 (Marketing-Site) reduzieren auf „Discovery-Call buchen” via Cal.com-Link statt Signup-Form
  • R14 (OSS-Funnel) minimieren: GitHub-Public + Smithery-Listing OK, kein Demo-Video, kein UTM-Tracking-Aufwand
  • Security-Decisions ins Doc holen (raus aus Deferred): Credential-Storage (Secrets Manager mit Tenant-Namespace), Multi-Tenant-Default (Postgres-RLS + Cross-Tenant-CI-Test), OAuth-Scope (Read/Write getrennt, MFA-Pflicht), Bedrock-Data-Klassifikation
  • LLM-Cost-Ownership-Frage als neue P0-Resolve-Before-Planning aufnehmen: „Wer hat das LLM-Abo — Kunde mit claude.ai Pro oder AV via OpenWebUI+Bedrock?”
  • MRR-Math realistisch durchrechnen oder Datumsverschiebung (S1 Q4, S2 Q2/2027)
  • BAFA-Hybrid-Pricing andeuten: Setup-Workshop als foerderfaehiges Beratungspaket
  • Editorial: Lexware-Status klar (nur bei API-Key da), R2/R3-Trennung, Becker-Cross-Ref praezisieren
  • Finanzaussicht 3 Jahre ergaenzen (Marvin’s Bitte am Session-Ende): Y1/Y2/Y3 mit realistischer Tenant-Anzahl, Tier-Mix, Setup-Fee-Anteil, Bedrock-Cost-Anteil, Hetzner-vs-AWS-Anteil, Margin

2. Pre-Planning-Pflichtarbeit (vor /ce:plan)

Diese sind nicht Doc-Refine sondern echte Marvin-Arbeit zwischen Sessions:

  • Discovery-Calls: 5-10 mit Nicht-Bestand-KMU 10-200 MA. Frage: „Wuerdet ihr 99-249 EUR/Mo zahlen damit eure Buchhaltung mit ChatGPT/Claude redet?” Wenn weniger als 30% klares Ja: Use-Case-Framing neu denken (Outcome statt Tool)
  • Claude SMB Research: 1-Tages-Research zu Anthropic’s „Claude for Small Business” (seit 2026-05-13) — EU-Coverage, Connectoren, AVV-Stand, Multi-Tenant-Story. Wenn klar deckt AV-Use-Case mit: Welle 1 neu denken
  • mcp-vf-hosted-Generalisierung validieren: DNS-Cutover finishen (1B.9 in mcp-pipeline-aws), zweiter Tenant per Hand provisionieren mit Stoppuhr — wie lange dauert das wirklich?
  • BAFA-Beraterzulassung beantragen (laut Foerder-Status nicht beantragt, 2-6 Monate Bearbeitung)

3. Cache-Fix-Follow-up

  • AWS Cost Explorer in 24-48h pruefen (also Mi 21.05. oder Do 22.05.): Cache-Read-Rate, Plain-Input-Anteil
  • Git-Commit der Working-Tree-Aenderungen in ~/source/apps/open-webui-vf (Branch feat/welle1-tag4-backend-routing): infra/lib/open-webui-vf-stack.ts + prompts/vf-sonnet.md + prompts/vf-sonnet.txt. Plus Untracked: branding/, evals/, prompts/vf-nova.txt — Marvin entscheiden was committed werden soll
  • Vault-Doku intern/capabilities/apps/open-webui-vf.md aktualisieren — Prompt-Version v2.16 (war v2.15)

Konkrete naechste Aktion fuer naechste Session

Update 2026-05-19 Abend: Refine-Punkt 1 erledigt — requirements.md ist v2. Offen sind 3 [DECISION PENDING]-Marker im Doc:

  1. R8d LLM-Cost-Ownership: Default-Vorschlag (Team Pass-Through, Custom Wahl) bestaetigen oder Alternative waehlen
  2. Success Criteria MRR-Math: Datumsverschiebung (10k auf Q1/Q2 2027) ODER Tier-Mix-Aenderung (Custom-Heavy) als offizielles Ziel
  3. R10 Marketing-Site: Wer baut wann? Default-Vorschlag — Marvin via frontend-design auf Hugo bis 2026-07-15

Wenn diese 3 entschieden sind: optional zweite Document-Review-Runde, dann Phase-4-Handoff zu /ce:plan (sobald Discovery-Calls + Claude-SMB-Research durch sind).

Discovery-Calls + Claude-SMB-Research koennen parallel laufen (Marvin async), brauchen keine Session-Zeit.

Pfade