MCP-Hosting fuer KMU-DACH — Requirements (Brainstorm-Output v2)

Arbeitstitel: „MCP-Hosting”. Finaler Produktname offen. AV-Stack-Voll als zweites Paket geparkt — siehe av-stack-voll-vision.

Refine-Run 2026-05-19 Abend: Diese Version arbeitet die 12 Konsens-Cluster aus der Document-Review ein. Aenderungen ggue. v1 in jedem Abschnitt mit [REFINED v2]-Marker. Offene Entscheidungen mit [DECISION PENDING] markiert — Marvin bestaetigen vor /ce:plan.

Problem Frame

Agentic Ventures betreibt heute mcp-vf-hosted als ein-Kunden-Pilot fuer Vibe Factory plus einen Friseur-Pilot. Setup-Wissen existiert, aber kein Produkt das zweiten bis zwanzigsten Kunden ohne Marvin-Engpass annimmt. 10k EUR MRR ist Kernziel 2026 — [REFINED v2] Ziel-Datum nach hinten verschoben (siehe S2 unten), Welle 1 zielt realistisch auf 4-5k MRR Q4 2026, 10k MRR auf Q1/Q2 2027.

[REFINED v2.1] Doppel-Linien-Strategie: Dieses Doc beschreibt die MCP-Hosting-Linie (Subscription, KMU-DACH) als skalierbares Standbein. Parallel laeuft eine Industriekunden-Linie (Festpreis-Projekte, Becker-Level) als Haupt-Revenue-Traeger fuer Y2/Y3 — siehe Section „Parallele Revenue-Linie” unten und becker als Referenz-Pattern. Beide zusammen tragen das 2027-Jahresumsatz-Ziel von 1 Mio EUR (nicht MRR — Jahresumsatz).

Parallel sind US-Konkurrenten (Smithery, Composio, Pipedream, Cloudflare Workers Remote MCP) im Tech-Builder-Segment so dicht gepackt dass Solo-Agency nicht reinkommt — Cloudflare-Free killt jedes Pricing. KMU-DACH-Segment ist als Subscription-Produkt fast leer; existierende DACH-Spieler (SeSoft, Workflow-Agentur Hamburg, Codana) beraten und integrieren, hosten aber nicht als Subscription.

Anthropic Claude SMB als Threat ([REFINED v2], aus security/adversarial-Review): seit 2026-05-13 verfuegbar. Wenn Anthropic Multi-Tenant-Mailbox-Isolation + DACH-Connectoren + EU-AVV liefert, schrumpft AV-Differenzierung auf „Custom-MCPs + lokales Hand-Holding”. Pre-Planning-Pflicht: 1-Tages-Research-Run wieviel Claude SMB heute deckt. Siehe Pre-Planning-Liste unten.

Pain-Points beim KMU-Kunden:

  1. „MCP” ist abstraktes Begriff — Kunde will nicht „Connector hosten” kaufen, sondern „Buchhaltung-Daten in Claude/ChatGPT verfuegbar machen”.
  2. DSGVO + EU AI Act sind echte Anforderungen, US-Player erfuellen sie nicht durchgehend.
  3. Manche KMU haben schon Software-Stack (M365, lexware), andere noch nicht — fuer Letztere existiert die AV-Stack-Voll-Vision, gehoert aber NICHT in Welle 1.

Anker des Produkts: DACH-KMU 10-200 MA mit AI-Affinitaet. Differenzierer: EU-hosted End-to-End, BAFA-Foerderfaehig (Beratungsanteil), Hand-Holding-Onboarding statt Self-Service-Hell.

Architecture — Single-Paket-Modell ([REFINED v2])

KMU mit bestehendem Stack ──→ MCP-Hosting (Welle 1, Q3-Q4 2026)
                                  - Verbindet bestehende Tools an Claude/ChatGPT
                                  - 2 Tiers: Team 249, Custom ab 1.500 EUR/Mo
                                  - Setup als Workshop (BAFA-foerderfaehig framen)
                                  - AWS Fargate + Cloudflare-Tunnel
                                  - Welle 1.0 (bis 5 Tenants): White-Glove
                                  - Welle 1.5 (ab Tenant 6): Self-Service-Light
                                  - Zielsetzung: 4-5k MRR Q4 2026

AV-Stack-Voll ──→ geparkt als Vision, separates Doc, Q4 2026 fruehestens
                  Gate: 5 zahlende Tenants + 80% Bedrock-Cost-Margin-Target erreicht

[REFINED v2] Welle 1 ist NUR MCP-Only. AV-Stack-Voll (Twenty, Plane, Hetzner-App-Layer) ist ausgelagert nach av-stack-voll-vision und kommt zurueck wenn Gate-Bedingungen erreicht.

Requirements

Produkt-Form + Pakete

  • R1. [REFINED v2] Ein Paket in Welle 1: „MCP-Hosting”. Zwei Tiers (siehe R2). AV-Stack-Voll geparkt.

  • R2. [REFINED v2] MCP-Hosting-Tiers (Welle 1, reduziert von 3 auf 2 plus deferred Starter):

    • Team 249 EUR/Mo netto, 6 MCPs nach Wahl aus Katalog, 10 User, 50k Tool-Calls/Mo, Setup 990 EUR (Workshop + 6 Connect)
    • Custom ab 1.500 EUR/Mo, beliebige Standard-MCPs + 1-2 Custom-MCPs, 25 User, 200k Calls/Mo, SLA, Setup 5-25k EUR
    • Starter (deferred bis nach S1): 99 EUR/Mo netto, 3 MCPs, 3 User, 10k Calls/Mo, Setup 490 EUR — erst aktivieren wenn Self-Service-Light funktioniert (Welle 1.5)
    • Add-Ons (deferred bis nach S1): zusaetzlicher Standard-MCP +39 EUR/Mo, User-Pack (+5) +25 EUR/Mo, Call-Pack +50k +19 EUR/Mo
    • Jahres-Rabatt: 15% bei Jahresvorauszahlung (gilt fuer alle Tiers ab Tag 1)
  • R3. [REFINED v2] AV-Stack-Voll-Tier wird geparkt. Komplett raus aus Welle 1 — siehe av-stack-voll-vision fuer Vision + Gate-Bedingungen.

  • R4. Standard-MCP-Katalog (Welle 1, production-tauglich bis Q3 2026):

    • Office-Suite (Wahl): gsuite (Gmail/Calendar) ODER m365 (SharePoint/Outlook/Excel) — beide live, multi-tenant-tauglich pruefen
    • Buchhaltung (Wahl): [REFINED v2] sevdesk ODER papierkram ab Tag 1; lexware kommt SOBALD API-Key da ist (aktuell configured-pending-key, kein verlaesslicher Welle-1-Slot)
    • Termin: calcom
    • Messaging: whatsapp (via 360dialog oder Meta Direct)
    • Bild-Gen: replicate (hosted-Variante, siehe mcp-replicate-hosted)
    • Voice/TTS: elevenlabs (active stdio)
    • POS (optional): zettle (configured-pending-key — gleiches Caveat wie lexware)
    • CRM (optional): odoo
  • R4a. [REFINED v2.4 — Marvin 2026-05-19] Standard-MCP-Katalog Welle 1.5 Erweiterungen (Eigenbau noetig, priorisiert nach Marvin):

    • Email-Marketing: Brevo (EU/DSGVO Default) ODER CleverReach — fast jeder KMU hat Newsletter-Tool, beide offene APIs, MCP-Eigenbau via mcp-eigenbau-Skill 5-10 Tage
    • CRM: HubSpot (Free-Tier verbreitet) ODER Pipedrive — Odoo allein zu spezifisch fuer KMU-Mainstream, HubSpot-MCP koennte 2026er-Standard-Connector werden
    • DATEV / Steuerberater-Schnittstelle: Knock-Out-Argument fuer deutsche KMUs — Buchhaltung muss in DATEV-Format raus zum StB. Aktuell nur export_datev_csv im lexware-MCP geplant, kein direkter DATEV-Connect. Pruefen: gibt es offizielle DATEV-API oder muss ueber Lexware/Sevdesk-Export laufen
    • Trigger fuer Bau: parallel zu Welle 1.0 Tenant-Onboarding, sobald 2-3 Tenants konkret nach diesen Tools fragen. NICHT auf Verdacht bauen
  • R5. [REFINED v2] AV-Stack-Voll-Komponenten ausgelagert in av-stack-voll-vision. Welle 1 baut KEIN Twenty-CRM oder Plane.so MCP.

Auth + Multi-Tenant + Security ([REFINED v2] — Security-Decisions aus Deferred ins Doc geholt)

  • R6. [REFINED v2] Auth-Provider: Scalekit bleibt (heute bei mcp-vf-hosted live, EU-Region, claude.ai-Connector funktioniert). WorkOS/Auth0-Evaluation deferred bis konkreter Blocker auftritt (z.B. Scalekit-Pricing-Cliff bei Tenant 20+, oder fehlendes Feature). Begruendung Review: Migration verbrennt 2-4 Wochen Solo-GF-Zeit ohne nachweisbaren Kundennutzen.

  • R7. [REFINED v2] Multi-Tenant-Default: Postgres-RLS in shared Container + dedicated Container nur fuer Custom-Tier mit Compliance-Anforderung. Pflicht: Cross-Tenant-Isolation-Test in CI (jede Migration laeuft gegen 2 Test-Tenants, Test failt wenn Tenant A Tenant-B-Daten sieht). Dedicated-Container bleibt als Eskalations-Pfad, ist nicht Default.

  • R8. Hard Call-Limits pro Tier sind Pflicht zum Bedrock-Cost-Schutz. Implementierung als Pre-Hook in LiteLLM oder als eigene Middleware, Pattern aus bedrock-cost-optimize-Skill. [REFINED v2] Plus: Tier-Limit-Hit triggert Email an Marvin + Kunde (kein Silent-Throttle), Custom-Tier hat Burst-Buffer von +20% mit Folge-Email „upgrade-Vorschlag”.

  • R8a. [REFINED v2] (neu, aus Security-Review) Credential-Storage: AWS Secrets Manager mit Tenant-Namespace-Konvention mcp-hosting/<tenant-slug>/<service>. Secret-Rotation in intern/projekte/secret-konsolidierung/-Pattern. Pflicht: Tenant-Isolation auf IAM-Policy-Ebene (jeder Container-Task-Role darf nur eigenen Tenant-Namespace lesen).

  • R8b. [REFINED v2] (neu, aus Security-Review) OAuth-Scope: Read und Write getrennte Scopes per MCP. Default ist Read. Write-Scope erfordert MFA-Bestaetigung beim ersten Setup pro Tenant. Audit-Log fuer jede Write-Operation (Pattern aus mcp-best-practices).

  • R8c. [REFINED v2] (neu, aus Security-Review) Bedrock-Data-Klassifikation: Standard-Annahme „internal” (Cross-Account Bedrock EU mit AVV deckt). Kunden-spezifische „confidential”-Klassifikation (z.B. Becker-Niveau) eskaliert zu Custom-Tier mit dediziertem Bedrock-Account oder PrivateLink. Klassifikation im Onboarding-Workshop abfragen.

LLM-Cost-Ownership ([REFINED v2], neuer P0)

  • R8d. [CONFIRMED v2.3 — Marvin 2026-05-19] LLM-Kosten-Modell:
    • Team-Tier: AV bezahlt Bedrock, Kosten in 249 EUR/Mo eingepreist (~30-40 EUR Bedrock-Anteil bei avg Workload, Hard-Limit deckt Margin)
    • Custom-Tier: Wahl pro Kunde — entweder AV-Pass-Through (transparente Bedrock-Bills + 15% Marge) ODER Kunden-eigenes Anthropic/Bedrock-Konto via Bring-Your-Own-Key
    • Begruendung: Team-Kunden wollen einen Preis, Custom-Kunden wollen Transparenz und haben oft schon AWS-Konto

Onboarding + Customer-Journey ([REFINED v2])

  • R9. [REFINED v2] Welle 1.0 = White-Glove (Tenant 1-5):

    • Marvin macht 100% des Onboardings als Workshop-Call (~2h pro Tenant)
    • Tenant-Provisioning per Skill tenant-anlegen (neu zu bauen, ist Marvin-Tool, kein Kunden-Self-Service)
    • Lernschleife: jeder Tenant fuettert Self-Service-Light-Spec mit echten Anforderungen
  • Welle 1.5 = Self-Service-Light (ab Tenant 6, wenn White-Glove-Pattern stabil):

    • Marketing-Site mit Discovery-Call-Buchung (R10)
    • Nach Vertrag: Self-Service-Form fuer MCP-Auswahl + Auto-Provisioning
    • Marvin bleibt als „Concierge” fuer Edge-Cases in der Loop
    • Trigger fuer Welle 1.5: 5 Tenants live UND durchschnittliches Onboarding <90min
  • R10. [REFINED v2] Marketing-Site reduziert auf Discovery-Call-Buchung:

    • Sub-Domain mcp.agenticventures.de (oder agenticventures.de/mcp-hosting)
    • Wert-Versprechen + 2 Tiers transparent
    • Kein Signup-Form in Welle 1.0 — stattdessen Cal.com-Link „30min Erst-Call buchen”
    • Erst Welle 1.5: Signup-Form + Stripe-Checkout
    • Begruendung Review: Signup ohne Discovery in DACH-KMU funktioniert nicht, Call ist gleichzeitig BAFA-foerderfaehiges Beratungs-Asset

Tech-Stack

  • R11. [REFINED v2] Hosting-Spuren (vereinfacht, Hetzner-App-Layer raus):

    • MCP-Layer (Welle 1): AWS Fargate + Cloudflare-Tunnel-Sidecar in av-production — Pattern aus mcp-hosting-fargate-tunnel
    • LLM: Bedrock EU eu-central-1, AVV mit AWS
    • Auth: Scalekit EU (R6 refined)
    • Hetzner-App-Layer geparkt mit AV-Stack-Voll-Vision
  • R12. DSGVO + EU AI Act: AVV-Template pro Tenant standardisiert, EU-Region durchgehend, Audit-Trail je MCP-Call (siehe MCP-Best-Practices). Klassifikation als „limited risk” unter EU AI Act ist Default-Annahme, „high risk” Use-Cases gehen in Custom-Tier mit zusaetzlicher Compliance-Arbeit.

Marketing + Akquise

  • R13. [REFINED v2] Akquise-Pfad fuer erste 5-10 Kunden (Welle 1) — BAFA-Hebel explizit:

    • Spur A (sofort): Bestand expandieren — VF, Friseur, Wohrle auf Team/Custom-Tier umstellen. [REFINED v2] Kunden-Namen-Verbot beachten (Rule 22): in keiner externen Akquise als Referenz nennen vor Marketing-Freigabe pro Kunde
    • Spur B (Monat 1-3): Lokale Akquise NRW + IHK + BAFA-Beraterzulassung-Hebel: Setup-Workshop (990 EUR Team, 5-25k Custom) wird gegenueber Kunde als „BAFA-foerderfaehiges Beratungspaket” angeboten — bis 50% Zuschuss fuer Kunde wenn Marvin BAFA-zugelassen ist. Praesentationspflicht im Erst-Call.
    • Spur C (begleitend): OSS-Funnel + Content-Marketing (siehe R14 refined)
    • Spur A liefert schnellste Konversion (warmer Pfad), Spur B baut Pipeline mit BAFA-Hebel als Differenzierer, Spur C baut Reputation
  • R14. [REFINED v2] OSS-Marketing-Funnel minimiert:

    • mcp-papierkram und mcp-lexware (sobald lauffaehig) auf GitHub Public + Smithery-Listing
    • KEIN Demo-Video, KEIN UTM-Tracking-Aufwand in Welle 1 — Reviewer-Konsens: Demo-Video zieht Tech-Builder die nicht zahlen, UTM-Aufwand lohnt nicht bei <100 Leads/Mo
    • README als einziges Marketing-Asset, mit Link auf agenticventures.de/mcp-hosting
    • Goal: passive Lead-Generierung fuer DACH-Suchen wie „lexware MCP”, nicht aktive Funnel-Pflege

Success Criteria ([REFINED v2] — MRR-Math realistisch)

  • S1 (2026-09-30): 5 zahlende Tenants live (Mix Team + Custom), ~1.500-2.500 EUR MRR (war: 4k — realistischer bei 1 Custom + 4 Team), Marketing-Site mit Discovery-Call-Link live, Welle-1.0-White-Glove-Pattern dokumentiert, durchschnittliches Onboarding <2h
  • S2 (2026-12-31): 12-18 zahlende Tenants, ~4-5k EUR MRR (war: 10k — Datumsverschiebung), Welle-1.5-Self-Service-Light-Trigger erreicht (5+ Tenants, <90min Onboarding), OSS-Funnel-Reichweite messbar (Smithery-Downloads, GitHub-Stars)
  • S2b ([REFINED v2], neu) (2027-03-31): ~10k EUR MRR erreicht durch Welle-1.5-Scaling + erste Custom-Tier-Upgrades. Trigger fuer AV-Stack-Voll-Reaktivierung (siehe Vision-Doc Gate)
  • S3 (laufend): Bedrock-Cost-Anteil max. 30% des MRR (sonst Pricing-Anpassung), Customer-Churn unter 5% pro Quartal
  • S4 (Q2/2027 Outlook): Erste SaaS-Whitelabel-Sondierung (lexware, sevdesk, DATEV) — Bridge zum Whitelabel-Segment, nicht Welle-1-Goal

Parallele Revenue-Linie: Industriekunden-Festpreis ([REFINED v2.1], neu — [CONFIRMED v2.2])

Diese Linie laeuft parallel zum MCP-Hosting-Standbein und ist Haupt-Revenue-Traeger Y2/Y3. Sie hat eigenes Sales-Motion, eigene Pricing-Logik und eigene Tech-Anforderungen. Verdient eigenes Brainstorm-Doc (siehe Next Steps), wird hier nur als Eckpunkte angerissen damit die 1-Mio-Aussicht traegt.

[CONFIRMED v2.2] Generalisierungs-Strategie (Marvin-Bestaetigung 2026-05-19):

  • BAS-Twin-Engagement (siehe _index) liefert wiederverwendbares Pattern fuer Stahl-Servicecenter, Aluminium-Servicecenter und Industrieunternehmen generell
  • Standard-Stack-Layer-Bausteine als Mini-Produktlinie: vermutlich Brain-Agent-Pattern, MCP-Set fuer ERP/PPS/Disposition, Document-Pipeline, Brand-Kit (_index), SEPA (_index)
  • Im Folge-Brainstorm zu klaeren: welche Komponenten generalisierbar, welche bleiben Kunden-spezifisch
  • Live-Evidenz fuer Linie: Nils (Produktions-/Betriebsleiter Becker) hat ueber Alex zwei Angebote a 9.500 EUR angefordert — TODO gehoert in ~/source/bas-twin/projekt/steuerung/kanban.md (Source of Truth fuer BAS-Twin, nicht dieses Doc), inkl. Klaerung mit Alex was im MVP-Scope ist. Bestaetigt: Bestand-Industriekunden expandieren ist niedrig haengende Frucht parallel zu Neukunden-Akquise.

Pattern (Anker-Referenz: bestehender Industriekunden-Pilot, siehe becker — interne Notiz, Rule 22 strikt: in keiner externen Kommunikation Namen nennen vor Marketing-Freigabe):

  • Format: Festpreis-Projekt 60-200k EUR pro Engagement, Laufzeit 3-9 Monate, NDA-Schutz, hochintegriertes Hand-Holding statt Plattform
  • Inhalt: Eigene MCPs (kunden-spezifische Datenquellen, ERP/PPS-Anbindung), Custom-Brain-Agent (vermutlich auf av-Stack), Industrie-Compliance (mehr als KMU — DSGVO + branchenspezifisch), oft Hetzner statt AWS wegen DSGVO-Striktheit
  • Sales-Pfad: Warmes Netzwerk → Workshop-Tag → Phase-1-Festpreis-Notausgang (Pattern aus festpreis-phase1-notausgang) → Hauptprojekt
  • Hebel: BAFA-Beratungsfoerderung 50% fuer Beratungsanteil, IHK + lokale Wirtschaftsfoerderung, Branchen-Netzwerk (Aluminium, Stahl, Maschinenbau, Lebensmittel)
  • Akquise-Frequenz Y2 Ziel: 4-6 neue Industriekunden pro Jahr (1 alle 2 Monate als Working-Annahme)
  • Wiederholungs-Geschaeft: Nach Hauptprojekt typischerweise Wartungs-Retainer 2-8k EUR/Mo (laeuft in Subscription-Linie ueber)

Anker-Frage fuer Industriekunden-Pipeline (offen, in separates Brainstorm):

  • Wie kommt der zweite Industriekunde rein ohne Becker-Glueck (Marvin’s Netzwerk-Kontakt)? Outbound, Vergabeplattformen (vergabe-plattformen-de), BAFA-Referenz-Listing, Branchen-Events?
  • Welche MCPs/Komponenten aus Becker-Engagement sind generalisierbar als wiederverwendbarer Standard-Stack (siehe _index als Beispiel-Pattern)?
  • Skill-/Pricing-Mechanik fuer Phase-1-Notausgang als Default (jeder neue Industriekunde startet mit 5-15k Discovery-Phase)

3-Jahres-Finanzaussicht ([REFINED v2.1], neu gerechnet mit beiden Linien)

Ziel 2027: 1 Mio EUR Jahresumsatz (nicht MRR, sondern Gesamt-Jahresumsatz aus beiden Linien). Industriekunden-Linie traegt 75-85% davon, MCP-Hosting traegt 10-20% plus Reputations-Asset.

MCP-Hosting-Linie (Subscription):

Metrik2026 (Q3-Q4)20272028
Tenants Ende Jahr12-1835-5070-100
Tier-Mix Team:Custom5:14:13:1
MRR Ende Jahr4-5k12-16k25-35k
Subscription-ARR Run-Rate50-60k145-190k300-420k
Setup-Fee-Umsatz (jaehrlich)8-12k25-35k40-60k
Subscription-Linie Jahresumsatz~25-35k (Halbjahr)~170-225k~340-480k

Industriekunden-Linie (Festpreis + Retainer):

Metrik2026 (Q3-Q4)20272028
Neue Industriekunden1 (Becker laeuft)4-65-8
avg Projekt-Festpreis100-150k120-180k150-220k
Festpreis-Umsatz (jaehrlich)80-120k (Becker-Anteil)600-900k800-1.500k
Retainer-MRR Ende Jahr2-4k12-20k30-50k
Retainer-Umsatz (jaehrlich)6-12k80-150k250-450k
Industriekunden-Linie Jahresumsatz~85-130k~680-1.050k~1.050-1.950k

Beide Linien zusammen:

Metrik202620272028
Gesamt-Jahresumsatz~110-165k~850-1.275k~1.390-2.430k
Bedrock + Hosting-Cost (geschaetzt)15-25k60-100k140-220k
AWS-Infra + Scalekit + Hetzner fix5-7k12-18k20-30k
Fremdleistungen (Branchen-Experten, Spez-Dev)0-10k80-150k (bei 4-6 Industriekunden)150-300k
Deckungsbeitrag (vor GF-Lohn)~70-130k~700-1.000k~1.100-1.900k

1-Mio-Ziel 2027 ist erreichbar wenn:

  • 4-5 Industriekunden im Jahr durchlaufen mit avg 130k Festpreis = 520-650k Festpreis-Umsatz
  • Plus 80-150k Retainer-Umsatz aus Bestand + neuen Industriekunden
  • Plus 170-225k MCP-Hosting-Linie
  • Summe: 770-1.025k — Mittelwert trifft 1 Mio EUR

Hebel die nach oben drehen:

  • BAFA-Beraterzulassung kommt durch → Industriekunden-Conversion +30% durch foerderfaehigen Beratungsanteil
  • Bestands-Industriekunde (Becker-Anker) erweitert zu Folge-Engagement
  • Zweiter Industriekunde kommt H2 2026 statt Q1 2027 → Y2 Festpreis-Volumen +25%
  • MCP-Hosting-Custom-Tier mit Industriekunden-Cross-Sell (Industriekunde nutzt nach Projekt MCP-Hosting fuer Office-Anbindung)
  • Standard-Stack-Layer (_index, _index) reduzieren Custom-Aufwand pro Industriekunde → mehr parallele Projekte machbar

Hebel die nach unten ziehen:

  • Industriekunden-Akquise scheitert ueber Bestands-Netzwerk hinaus → kein zweiter Becker → Y2 Festpreis-Umsatz halbiert sich
  • Solo-GF-Kapazitaet wird Bottleneck bei 3+ parallelen Industriekunden → entweder Fremdleistungs-Budget hochsetzen oder Linie cappen
  • Anthropic Claude SMB deckt KMU-DACH-Use-Case → MCP-Hosting-Linie verliert Differenzierung → -50% Subscription-ARR Y2/Y3
  • Bedrock-Cost-Anteil eskaliert ueber 40% in MCP-Hosting → Pricing-Anpassung noetig

Implikation fuer Welle 1 (dieses Doc): MCP-Hosting darf NICHT alleinige Strategie sein. Die operative Welle-1-Arbeit (S1/S2-Targets) bleibt wie unten definiert, aber Marvin reserviert bewusst 30-40% Kapazitaet fuer Industriekunden-Spur (Akquise, Becker-Wartung, zweiter Industriekunde) — sonst verbrennt die MCP-Hosting-Linie die Zeit die fuer die 1-Mio-Linie noetig ist.

[CONFIRMED v2.3 — Marvin 2026-05-19] 1-Mio-EUR-Jahresumsatz-Ziel 2027 als offizielle Strategie-Aussage bestaetigt. Kapazitaets-Split 70/30 (70% MCP-Hosting Welle-1, 30% Industriekunden-Spur) bestaetigt. Folge-Updates fahrplan und active-work sind Next-Steps.

Scope Boundaries

  • Tech-Builder-Segment ist NICHT Ziel. Smithery, Composio, Cloudflare-Workers-Free machen Solo-Pricing unmoeglich.
  • SaaS-Whitelabel-Segment ist Q2/2027-Sequel, kein Welle-1-Ziel.
  • Agent-Netzwerk (KI-EDI-Nachfolger) bleibt 2027-Vision, separates Produkt — siehe requirements. Becker-Pilot laeuft separat unter NDA-Schutz (Rule 22 — Kunden-Namen nicht in externer Kommunikation, gilt auch fuer dieses Doc bei Export).
  • Voll-Self-Service-Wizard-UI ist NICHT Welle-1-Scope. Welle 1.0 White-Glove, Welle 1.5 Self-Service-Light.
  • Multi-Region-Hosting (US, APAC) ist NICHT Scope. EU-only.
  • [REFINED v2] AV-Stack-Voll (Twenty CRM, Plane PM, Hetzner-App-Layer) ausgelagert — siehe av-stack-voll-vision.

Key Decisions ([REFINED v2] — refined nach Review)

  • KMU-DACH als MVP-Anker: leerer Subscription-Markt, DSGVO + BAFA als echte Differenzierer
  • Tech-Builder verworfen: Konkurrenz dicht, Cloudflare-Free killt Pricing, nicht solo-tragbar
  • Hybrid Bundle + Tier + Add-On als Pricing-Modell — aber [REFINED v2] nur 2 Tiers + Setup-Fee in Welle 1.0, Starter/Add-Ons deferred
  • Per-Workspace-Pricing statt Per-User (KMU haben 1-3 Power-User, Per-User schreckt ab)
  • Hard Call-Limits pro Tier zum Bedrock-Margenschutz + Tier-Hit-Notify
  • [REFINED v2] Ein Paket in Welle 1 (MCP-Only). AV-Stack-Voll geparkt mit Gate-Bedingungen
  • [REFINED v2] Scalekit bleibt als Auth-Provider. WorkOS/Auth0 deferred
  • [REFINED v2] Welle 1.0 = White-Glove, Welle 1.5 = Self-Service-Light mit klarem Trigger (5 Tenants, <90min Onboarding)
  • [REFINED v2] Marketing-Site reduziert auf Discovery-Call-Buchung in Welle 1.0
  • OSS-Funnel via papierkram + lexware auf GitHub-Public + Smithery — [REFINED v2] minimiert, kein Demo-Video
  • [REFINED v2] Postgres-RLS in shared Container als Multi-Tenant-Default, dedicated nur fuer Custom mit Compliance
  • [REFINED v2] Secrets Manager mit Tenant-Namespace + IAM-Isolation als Credential-Standard
  • [REFINED v2] OAuth-Scope Read/Write getrennt, MFA-Pflicht fuer Write-Setup
  • [REFINED v2] Bedrock-Data-Klassifikation internal Default, confidential eskaliert zu Custom-Tier
  • [REFINED v2] BAFA-Hebel im Setup-Workshop explizit (foerderfaehiges Beratungspaket)
  • EDI / Agent-Netzwerk wird 2027-Vision, nicht Welle 1 — Becker-Pilot laeuft separat

Dependencies / Assumptions

  • mcp-vf-hosted bleibt funktionsfaehig und ist generalisierbar als Welle-1-Basis ([REFINED v2] Validierung: Pre-Planning-Item, zweiter Tenant per Hand mit Stoppuhr)
  • AWS av-production-Account + Multi-MCP-Hosting-Setup (Fargate + Cloudflare-Tunnel) traegt 20-30 Tenants ohne Re-Architektur
  • Bedrock EU + EU AI Act-Compliance bleiben gueltige Differenzierungs-Argumente Y1 ([REFINED v2] Threat: Anthropic Claude SMB — Pre-Planning-Item)
  • Smithery + MCP.so als Marketplaces sind in Q3 2026 noch aktiv
  • Bestandskunden Vibe Factory + Friseur + Wohrle sind bereit auf neue Tier-Struktur zu wechseln
  • BAFA-Beraterzulassung kommt durch (Marvins Foerder-Antrag laeuft, 2-6 Monate Bearbeitung)
  • Scalekit-Pricing trägt Tenant 1-25 ohne Cliff (Pre-Planning: bei Scalekit nachfragen)

Outstanding Questions

Resolve Before Planning ([REFINED v2] — auf load-bearing reduziert)

Alle 5 von Marvin am 2026-05-19 als Defaults bestaetigt:

  • [CONFIRMED v2.3] LLM-Cost-Ownership (R8d): Team-Tier eingepreist, Custom-Tier Wahl (Pass-Through mit 15% Marge ODER BYO)
  • [CONFIRMED v2.3] MRR-Math: Variante A — Datumsverschiebung, Welle 1 zielt offiziell auf 4-5k MRR Q4 2026, 10k MRR auf Q1/Q2 2027 (= S2b)
  • [CONFIRMED v2.2] 1-Mio-EUR-Jahresumsatz-Ziel 2027 als offizielle Strategie
  • [CONFIRMED v2.3] Kapazitaets-Split 70/30 (70% MCP-Hosting Welle-1, 30% Industriekunden-Spur)
  • [CONFIRMED v2.3] Marketing-Site (R10): Marvin baut selbst via frontend-design-Skill auf Hugo-Basis, bis 2026-07-15 live als Single-Page mit Cal.com-Embed

Deferred to Planning

  • [Affects R7][Technical] Multi-Tenant-Default ist Postgres-RLS — Implementierungs-Detail (Schema, RLS-Policies, CI-Test) in Planning-Phase
  • [Affects R8][Technical] Call-Limit-Implementierung: LiteLLM Pre-Hook vs Cloudflare Worker Rate-Limit vs eigene Middleware
  • [Affects R9 Welle 1.5][Needs research] Self-Service-Signup-Form-Tech: Tally/Typeform + Webhook + Stripe-Checkout, oder eigene Next.js-Form mit Stripe-Customer-Portal — entscheiden wenn Welle 1.5 aktiviert wird
  • [Affects R4][Needs research] Lexware-MCP API-Key-Beschaffung — wann ist API-Zugang da? Bis dahin lexware NICHT im Welle-1-Katalog
  • [Affects Tenant-Provisioning][Technical] Skill tenant-anlegen Design — Brief in 6 Fragen, Output: Scalekit-Tenant + RLS-Schema-Init + MCP-Selection-Bootstrap

Pre-Planning-Arbeit (async, parallel zu Doc-Refine)

Diese laufen Marvin-async, brauchen keine weitere Brainstorm-Session:

  • Discovery-Calls: 5-10 mit Nicht-Bestand-KMU 10-200 MA. Frage: „Wuerdet ihr 249 EUR/Mo zahlen damit eure Buchhaltung mit ChatGPT/Claude redet?” Wenn weniger als 30% klares Ja: Use-Case-Framing neu denken (Outcome statt Tool, z.B. „automatisierte Rechnungsfreigabe per Chat” statt „MCP-Hosting”). Frist: vor /ce:plan
  • Claude SMB Research: 1-Tages-Run zu Anthropic „Claude for Small Business” (seit 2026-05-13). EU-Coverage, Connectoren, AVV-Stand, Multi-Tenant-Story. Wenn klar deckt AV-Use-Case mit: Welle 1 neu denken oder Differenzierung schaerfen (Custom-MCPs + lokales Hand-Holding + BAFA als Bundle). Frist: vor /ce:plan
  • mcp-vf-hosted-Generalisierung validieren: DNS-Cutover finishen (siehe _index 1B.9), zweiter Tenant per Hand provisionieren mit Stoppuhr — wie lange dauert das wirklich? Ergebnis fuettert tenant-anlegen-Skill-Spec
  • BAFA-Beraterzulassung beantragen (laut Foerder-Status nicht beantragt, 2-6 Monate Bearbeitung). Frist: 2026-06-30
  • Scalekit-Pricing-Cliff klaeren beim Vertriebskontakt: Tenant-Anzahl wo Tier-Aufstieg noetig wird

Next Steps

[REFINED v2.1] Fuenf [DECISION PENDING] mit Marvin klaeren (LLM-Cost, MRR-Math, 1-Mio-Strategie, Kapazitaets-Split, Marketing-Site-Owner) — kann in 45min-Working-Session laufen

[REFINED v2.1] Separates Brainstorm fuer Industriekunden-Pipeline anlegen (Vorschlag: intern/runs/<YYYY-MM-DD>-brainstorm-industriekunden-pipeline/). Fragen die dort gehoeren: zweiter Industriekunde ohne Becker-Glueck akquirieren, Standard-Stack-Layer aus Becker-Engagement generalisieren, Phase-1-Notausgang-Pricing-Mechanik formalisieren, Branchen-Fokus (Aluminium/Stahl/Maschinenbau/Lebensmittel) waehlen oder breit fahren. Trigger: nach Bestaetigung der [DECISION PENDING] zur 1-Mio-Strategie

[REFINED v2.1] Folge-Updates wenn 1-Mio-Strategie bestaetigt: fahrplan (Strategie-Aussage), active-work (Kapazitaets-Split sichtbar), ggf. Memory project_10k_madeira deprecaten und auf neues Strategie-Doc verweisen

→ Optional: zweite Document-Review-Runde mit refinedem Doc (lohnt sich nur wenn Marvin oder ich Restzweifel haben)

Pre-Planning-Arbeit async starten parallel — Discovery-Calls + Claude-SMB-Research + DNS-Cutover laufen ohne weitere Brainstorm-Sessions

→ Wenn Discovery-Calls und Claude-SMB-Research durch sind: /ce:plan fuer strukturierte Implementierungsplanung Welle 1.0 (5 Tenants White-Glove bis Q3 2026 live) — MIT Industriekunden-Spur-Plan parallel

Changelog

  • v2.4 (2026-05-19 Abend, +90min) — Standard-MCP-Katalog Welle 1.5 Erweiterungen:
    • R4a neu: drei priorisierte MCP-Luecken fuer Welle 1.5 (Brevo Email-Marketing, HubSpot CRM, DATEV-Schnittstelle) — Eigenbau via mcp-eigenbau-Skill, Trigger ist Kunden-Nachfrage nicht Verdachts-Bau
    • elevenlabs als Voice/TTS in Standard-Katalog aufgenommen
  • v2.3 (2026-05-19 Abend, +60min) — alle 5 Decisions bestaetigt:
    • Marvin bestaetigt alle 5 Default-Vorschlaege: LLM-Cost-Modell (Team eingepreist, Custom Wahl), MRR-Math Variante A (Datum schieben), Kapazitaets-Split 70/30, Marketing-Site Marvin baut bis 2026-07-15. (1-Mio-Ziel war bereits v2.2 bestaetigt.)
    • Status ready-for-pre-planning. Doc ist bereit fuer async Pre-Planning-Arbeit (Discovery-Calls, Claude-SMB-Research, DNS-Cutover) plus parallel /brainstorm fuer Industriekunden-Pipeline.
  • v2.2 (2026-05-19 Abend, +45min) — Marvin-Bestaetigungen:
    • 1-Mio-EUR-Jahresumsatz-Ziel 2027 als offizielle Strategie bestaetigt — [CONFIRMED v2.2] Marker am Decision
    • Becker-Generalisierungs-Strategie bestaetigt: BAS-Twin-Pattern auf Stahl-/Aluminium-Servicecenter + Industrieunternehmen generell uebertragen, im Folge-Brainstorm Komponenten ausarbeiten
    • Live-Evidenz notiert: Nils (Becker Produktions-/Betriebsleiter) hat zwei Angebote a 9.500 EUR ueber Alex angefordert — TODO gehoert in ~/source/bas-twin/projekt/steuerung/kanban.md, nicht hier
  • v2.1 (2026-05-19 Abend, +30min) — Industriekunden-Spur + 1-Mio-Ziel:
    • Doppel-Linien-Strategie eingefuehrt (MCP-Hosting Subscription + Industriekunden-Festpreis)
    • Neue Section „Parallele Revenue-Linie: Industriekunden-Festpreis” mit Pattern, Sales-Pfad, Akquise-Frequenz, offenen Fragen fuer Folge-Brainstorm
    • 3-Jahres-Aussicht komplett neu gerechnet — getrennte Tabellen pro Linie + Gesamt-Sicht, 2027-Jahresumsatz-Ziel 1 Mio EUR plausibilisiert
    • Welle-1-Kapazitaets-Reservierung 30-40% fuer Industriekunden-Spur als Implikation aufgenommen
    • Zwei neue [DECISION PENDING] (1-Mio-Strategie, Kapazitaets-Split)
    • Next-Steps um Industriekunden-Brainstorm + Fahrplan-Update erweitert
  • v2 (2026-05-19 Abend) — Refine nach Document-Review:
    • AV-Stack-Voll komplett rausgeschnitten (R1, R3, R5, R11 vereinfacht, S2 reformuliert)
    • R2 reduziert auf 2 Tiers (Starter + Add-Ons deferred)
    • R6 umgekehrt: Scalekit bleibt, WorkOS/Auth0 deferred
    • R9 in Welle 1.0 (White-Glove) + Welle 1.5 (Self-Service-Light) gesplittet mit klarem Trigger
    • R10 auf Discovery-Call-Buchung reduziert (kein Signup-Form Welle 1.0)
    • R14 OSS-Funnel minimiert (kein Demo-Video, kein UTM)
    • Security-Decisions R8a/R8b/R8c neu im Doc (waren in Deferred)
    • R8d (LLM-Cost-Ownership) als neuer load-bearing [DECISION PENDING]
    • MRR-Math realistisch durchgerechnet, 10k auf Q1/Q2 2027 verschoben, S2b neu
    • 3-Jahres-Finanzaussicht ergaenzt (auf Marvins Bitte)
    • BAFA-Hebel in R13 + Setup-Workshop explizit
    • Editorial: Lexware-Status klar (configured-pending-key), Becker-Cross-Ref mit Rule-22-Hinweis
    • Resolve-Before-Planning von 4 auf 3 Items reduziert (3 AV-Stack-Voll-Items entfallen)
  • v1 (2026-05-19 Mittag): Initial-Brainstorm via ce:brainstorm, danach Document-Review mit 6 Personas → 50 Findings → 12 Konsens-Cluster