Zielversion — Pass 2 (2026-05-18, Feierabend-Session)

Diese Datei ist der Konsolidierte-Ausgang einer langen Brainstorm-Session am Abend des 18. Mai 2026. Sie ergaenzt + ueberschreibt teilweise die synthese vom selben Tag, weil sich die Erkenntnisse waehrend der Session noch verschoben haben (Customer-Lens-Reframe, 2 neue Piloten Sebastian + Thorsten, Stufen-Compound-Logik, WhatsApp-First-Strategie).

Visualisiertes Companion-Artefakt: assets/prototypen/2026-05-18-mcp-defensibility/index.html (Claude-Style HTML mit Personas, Stack, Defensibility, Graph in 4 Bildern, Finanz-Sektion).

Was sich gegenueber Pass 1 + Pass 2 (synthese.md) veraendert hat

Pass 1 (2026-05-14): „KI-Netzwerk als EDI-Nachfolger” — Standalone-Produkt, Becker als Hub 1.

Pass 2 vormittags (synthese.md): Schicht-Umkehrung — MCP-Hosting wird eigene Saeule, EDI-Netzwerk wird Vertikal-App darauf. Wix-Analogie. Defensibility gegen Anthropic/Cloudflare in 6 Mauern.

Pass 2 abends (diese Datei): Customer-Lens-Reframe. Drei wichtige Umstellungen:

  1. Wir verkaufen NIE „MCP-Hosting”. Wir verkaufen pro Branche ein konkretes Versprechen mit ROI-Anker. MCP-Hosting ist die langweilige Implementation darunter, der Kunde sieht das nie. Wix-Analogie war irrefuehrend — passend ist eher Squarespace/Shopify: fertige App in Branchen-Farbe, Tools dazu klickbar.
  2. Zwei Bereitstellungs-Modelle, nicht eins. Modell A („Wir sind Frontend”) fuer KMU/Handwerk/Salon — eigene Web-App + WhatsApp + Email. Modell B („Wir sind Backend”) fuer Industrie-Hubs + tech-affine Solos — MCP-URL die in claude.ai/ChatGPT eingehaengt wird. Sehr unterschiedliche Produkte mit gemeinsamem Unterbau.
  3. Service-Schmiede statt Agency-Modell. Die 5 Piloten zahlen den Bau der Bausteine, die wir dann als Produkt 10-100x weiterverkaufen. Das ist nicht Custom-Bau pro Kunde — das ist Compound-Build (siehe Stufen-Logik unten).

Customer-Lens — Die 5 Piloten als Pricing-Matrix

PilotBrancheModellPricingSetupBauzeit ab CoreDACH-MultiplikatorStatus
Tanja Berger (Friseur-Im-Sueden)SalonA49 €/Mo0 €4 Wo (Core)~50.000 SalonsBestandskundin, „nimmt sowieso alles von uns”
Sebastian KollasLVM-Versicherungs-VermittlerA + Voice299 €/Mo990 €+4-6 Wo~80.000 Vermittler DACHwarmer Lead via Andre Kollas
Thorsten BaerMittelstaendischer Dachdecker (~20-50 MA)A + Cluster1.299 €/Mo4.900 €+8-12 Wo~5.000 mittelstaendische Handwerks-HubsLead, will „ganzen Betrieb digitalisieren”
Klaus (hypothetisch)Solo-DachdeckerA (Stripped-Down von Thorsten)89 €/Mo0 €Y2-Skalierung~600.000 Handwerks-BetriebePersona, nicht real
Ralf BeckerIndustrie-Servicecenter AluminiumB + Review-UI9.900 €/Mo30.000 €8-10 Wo (eigener Track)~600 Industrie-Hubs DACHNDA-Pilot, EDI-Cluster-Anker

Pricing-Logik fuer Becker korrigiert gegenueber Pass-1: 9.900 €/Mo sitzt richtig, aber Verkaufs-Story ist ROI-Rechnung, nicht Preis-Anker. Pain-Wert bei Becker monatlich 40-60k € (3 Disponenten-Aequivalente + verlorene Anfragen). 15-25% des realisierten Pains als Preis = 8-12k €/Mo. Volumen-Check (A1 aus Pass 1) bleibt Resolve-Before-Planning-Punkt.

Was der Kunde tatsaechlich in die Hand bekommt — Modell A vs Modell B

Modell A — Wir sind das Frontend (Tanja, Sebastian, Klaus, Thorsten)

Kunde bekommt von uns:

  • Eine Web-App unter firma.av.network (Next.js, mobile-first): Login, Dashboard, Inbox aller Anfragen, Termin-Kalender, Angebots-Editor, Kunden-Liste, Belege-Uebersicht
  • Eine WhatsApp-Business-Nummer (eigene oder neue) — antwortet automatisch
  • Eine Email-Adresse als Schaltzentrale fuer Lieferanten/Steuerberater/Kunden
  • Automatischer Datenfluss zum Steuerberater (Lexware/Datev/SevDesk)

Was er NICHT sieht: kein claude.ai, kein MCP-irgendwas, kein Tool-Setup. App, WhatsApp, Email — fertig.

Was wir technisch bauen (Marvin-Brille):

KomponenteStackBauzeit Core
Next.js Web-AppNext.js 15 + shadcn/ui + Drizzle + Postgres + Auth.js6-8 Wo
WhatsApp-Webhook + Klassifizierer + Auto-ReplyFastAPI + bestehender mcp-whatsapp + Bedrock EU2-3 Wo (mcp-whatsapp laeuft schon)
Email-Bridge (IMAP, Klassifizierer, Draft-Vorschlag)FastAPI + Bedrock + Email-Parsing2 Wo
Lexware/Datev-Connectormcp-lexware (im Bau) + neuer Datev-Connector1-2 Wo
KI-Agent-OrchestrierungClaude Agent SDK oder Bedrock direkt + selbst-gebaute Tool-Router2 Wo
Branchen-Template (Setup-Wizard, Default-Prompts, Spezial-Features)Backend-Config + Prompt-Library1 Wo pro Branche

Insgesamt 14-18 Wo fuer Branche 1, danach jede weitere Branche 4-5 Wo weil Core wiederverwendet wird.

Modell B — Wir sind nur Backend (Becker, tech-affine Solos)

Kunde bekommt:

  • Eine MCP-URL becker.mcp.av.network/mcp die in claude.ai Custom Connector eingehaengt wird
  • Eine separate Review-UI (Next.js, klein) fuer Disponenten — Anfragen sehen, freigeben
  • Audit-Trail-Dashboard fuer GoBD-Pflicht

Was wir bauen:

KomponenteStack
MCP-Endpoint mit Becker-Tools (parse_rfq, check_inventory, generate_quote)Python FastMCP + Bedrock + ERP-Adapter
Disponenten-Review-UI (klein, fokussiert)Next.js + Postgres fuer Pending-Reviews
ERP-Connector zu Becker (read-only)Custom-Adapter, Tag 60+
PDF-Generator (Becker-Layout)Python + WeasyPrint o.ae.
Audit-Service mit Hash-ChainPostgres + taeglicher externer Anchor

Insgesamt 8-12 Wo fuer Becker-Pilot. Schneller als Modell A, aber niedrigere Skalierbarkeit auf KMU.

Compound-Trick — Service baut Produkt (Stufen-Logik)

Die 5 Piloten sind nicht Custom-Dienstleistung. Sie sind Stufe 1 eines 4-stufigen Compound-Builds. Jeder Pilot produziert Bausteine, die wir dann ohne Mehraufwand weiterverkaufen.

StufeWas es istWann
1 — Service5 Piloten zahlen den Bau der Branchen-CoresWochen 1-22
2 — Branchen-TemplatesSalon-Template, Versicherungs-Template, Handwerks-Hub-Template werden re-saleable. Salon Nr. 2-10 in 2 Tagen statt 4 WoAb Wo 8 parallel
3 — Horizontale Toolsav-voice (KI-Telefon-Agent), av-audit (GoBD-Audit-Trail-Lib + Hosted), „Mein KI-Stabschef” (Solo-GF-OS) — als Standalone-Produkte verkauftAb Wo 8 parallel
4 — Plattform-MarketplaceDrittanbieter-Templates, 30% Take-Rate, Wix-App-Store-PatternY3+

Dogfood-Punkt: „Mein KI-Stabschef” ist Marvins eigenes Vault-Setup verallgemeinert. Agentic Ventures ist Pilot Nr. 0 fuer seine eigene Plattform. Sein Audit-Trail (Vault-Git + RemoteTrigger-Logs) ist av-audit in Prototyp-Form.

Konkrete Stufe-3-Produkte mit Dogfood-Faktor:

ProduktAus welchem PilotWer nutzt es selbstPricingDogfood
av-voice — KI-Telefon-Agent (Solo-Professionals)Sebastian-Pilot Voice-ModulMarvin (Erstkontakt-Annahme)99-249 €/MoHoch
av-audit — GoBD-Audit-Trail (OSS + Hosted)Compliance-Pflicht aller PilotenMarvin (eigene MCPs auditen)49-249 €/Mo + 990 € WP-BriefHoch
„Mein KI-Stabschef” — Solo-GF-OSMarvin’s eigenes SetupMarvin + Alex taeglich99-199 €/Mo + 290 € SetupMaximal

WhatsApp-First-Strategie (zentrale Erkenntnis dieser Session)

Strategischer Satz: „Die Leute werden lieber WhatsApp schreiben als anzurufen. Das koennen wir perfekt verkaufen.”

Begruendung:

  • DACH-KMU-Realitaet: Anfragen kommen ueber WhatsApp (Text + Voice-Note), klassisches Festnetz-Telefon-Anrufen ist Versicherungs- und Boomer-Nische
  • Tanja-Kunden, Klaus-Anfragen, Thorsten-Privatkunden — alle WhatsApp
  • Telefon-Provider-Pain (Twilio-KYC, SIP-Trunking, Caller-ID-Trust) ist Dealbreaker fuer Solo-Dev
  • WhatsApp Business Cloud API ueber 360dialog ist DACH-DSGVO-Stack, eh geplant (_index)

Implikation fuer Architektur:

  • av-voice startet als WhatsApp-Voice-Pattern (Async-Voice-Note-Round-Trip), nicht als klassischer Telefon-Agent
  • Klassisches Telefon-Klingeln bleibt Track 2 mit sipgate (DE-Provider, weniger Pain als Twilio) — fuer Sebastian-LVM-Use-Case wo Bestandskunden anrufen
  • Web-Widget mit Click-to-Talk bleibt Track 3 fuer Marketing-Sites-Erstkontakt

4-Wellen-Bauplan (korrigiert mit Produkt-Ausgliederung)

WelleWochenService-LieferungProdukt-Nebenprodukt
11-8Tanja-Salon (4 Wo Core) + Sebastian-Voice-Modul (4-6 Wo ab Wo 4)„Mein KI-Stabschef” Launch (parallel mit Salon-Core), av-audit OSS-Release
26-16Thorsten-Handwerks-Hub mit Cluster-LayerSalon-Template re-saleable (Salon Nr. 2-10), av-voice Standalone
312-22Becker-Industrie-Connector (EDI-Cluster)Handwerks-Template re-saleable, av-audit Hosted-Service
418-30Klaus-Solo + 2 weitere Tanjasav-voice + Stabschef + av-audit voll im Vertrieb

Cash-Flow nach 22 Wochen: ~12k €/Mo Recurring (Tanja + Sebastian + Thorsten + Becker) + ~35k € Setup-Fees + Stufe-3-Produkt-MRR.

Korrigierte Finanz-Projektion (mit Stufe-3-Produkten)

Y1Y2Y3
Stufe 1+2 (Service + Templates)€152k€840k€2,7M
Stufe 3 — av-voice (300/1500/4000 Kunden × ø 150 €)€54k€270k€720k
Stufe 3 — av-audit Hosted (100/600/2000 × ø 99 €)€12k€71k€238k
Stufe 3 — „Mein KI-Stabschef” (200/1000/3500 × ø 149 €)€36k€179k€625k
Total ARR€254k€1,36M€4,28M

Y5 mit voller Stufe-3-Skalierung: konservativ €30-40M ARR. Exit Y5 bei 15-25x ARR = €450M-1Md €.

Annahmen die wackeln (Risiko-Liste):

  • Self-Service-Conversion 3% Free→Paid (B2B-SaaS-Norm) — kann scheitern wenn Marketing-Hebel fehlt
  • OEM-Partner (Datev/Lexware) kommen Y2 — muss verhandelt werden
  • A1 aus Pass 1: Becker-RFQ-Volumen 50/Tag — noch nicht validiert
  • WhatsApp-First-These braucht 2-3 Pilot-Datenpunkte zur Bestaetigung

Was wir in dieser Session GEBAUT haben (Stand 19.05 morgens)

Sprint: av-voice v0.1 — WhatsApp-Voice-Pattern. Status: laeuft End-to-End.

Detail-Uebergabe: session-uebergabe. Plan fuer naechste Session: ~/source/av-voice/docs/stufe-2-latenz-plan.md.

Repo: ~/source/av-voice/ — komplettes Skeleton mit FastAPI + Provider-Switch (Bedrock + Mistral) + Cal.com-Tool-Use + Supertonic-TTS-Anbindung.

Stack-Entscheidung umgesetzt:

SchichtDefault-ProviderStrict-DSGVO-Variante
ASRVoxtral Mini via Mistral La Plateforme (FR)gleicher Provider — DSGVO eh sauber
LLMBedrock Claude Haiku 4.5 EUMistral Medium/Large via La Plateforme (FR)
TTSSupertonic auf av-tools-shared-01 (Hetzner DE)gleicher Service — DSGVO eh sauber
Tool-UseCal.com API v2 direktidentisch

Provider-Switch via LLM_PROVIDER=bedrock|mistral env-var. Tool-Schicht ist provider-agnostisch.

mcp-whatsapp erweitert um 3 neue Tools (send_audio, upload_media, download_media) + Webhook-Audio-Routing an AV_VOICE_WEBHOOK_URL (fire-and-forget POST).

Gemessene Latenz: 9,4s end-to-end mit Test-Voice-Note (8 Sek deutsches Audio → 4 Sek Antwort-Voice-Note).

Aufschluesselung:

  • ASR Voxtral: 0,7s
  • LLM Hop 1 (Cal.com Tool-Call): 2,7s
  • Cal.com slots-API: 1,4s (variabel)
  • LLM Hop 2 (Final-Text mit Streaming): 1,9s
  • TTS Supertonic: 2,6s

Ziel naechste Session: unter 5 Sek via Single-Hop-Routing + Supertonic-Migration auf CAX21.

Demo-Material: /tmp/customer-question.ogg (Test-Voice-Note via Supertonic generiert) + /tmp/av-voice-reply.ogg (echte KI-Antwort).

Geparkt fuer eigene Folge-Brainstorms (Pass 3)

Die folgenden zwei Ideen sind in dieser Session aufgekommen, brauchen aber eigene tiefere Brainstorms — bewusst nicht heute Abend angefangen:

av-platform Core (Multi-Tenant-MCP-Hosting-Skeleton)

  • Multi-Tenant-Container-Orchestrierung (Postgres-RLS oder dedicated Container)
  • OAuth-Foederation (Scalekit/Better-Auth)
  • Cloudflare-Tunnel-Automation per API (pro Tenant ein Tunnel)
  • Connector-Registry + Wizard-UI fuer Self-Service-Setup
  • Strategisch das tiefste Asset, aber 5-6h fuer ein Demo-Tenant, 8-12 Wo fuer Production-ready
  • Folge-Brainstorm: wann starten? Wie verhaeltnis zu mcp-vf-hosted (existierender Hub)? Generalisierung oder Aufbau daneben?

av-audit Library + Hosted-Service

  • OSS-Repo auf GitHub: Hash-Chain-Lib in Python, GoBD-Pflichtfelder, Pydantic-Schema, Verify-Funktion
  • Hosted-Tier 49-249 €/Mo, Enterprise 990 € WP-Brief
  • Dogfood durch existierende MCPs (papierkram, m365, gsuite, hetzner, mcp-vf-hosted)
  • 3-4h heute Abend waere lauffaehig gewesen, aber av-voice hat Vorrang weil sichtbarere Demo
  • Folge-Brainstorm: OSS-Release-Pacing, Hash-Anchor-Mechanismus (transparency-Log? Bitcoin? zweiter Provider?), Wirtschaftspruefer-Brief-Beschaffung

Beide Folge-Brainstorms sollten in eigenen Sessions stattfinden, am besten wenn av-voice Phase 1 + 2 durchgelaufen ist (Wo 3-4).

Pointer auf die anderen Artefakte dieser Session

  • Recherche-File (US-Markt + Agent-Payments + DACH): recherche-us-markt
  • Synthese (Vormittags-Stand, Wix-These): synthese
  • HTML-Visualisierung (Claude-Style, 4-Bilder-Graph, Personas, Defensibility, Finanz): assets/prototypen/2026-05-18-mcp-defensibility/index.html
  • Pass-1-Brainstorm (EDI-Netzwerk): requirements

Status

  • Heute Abend: av-voice Phase 1 (WhatsApp-Voice-Pattern) starten
  • Diese Woche: av-voice Phase 1 fertig + Tanja-Pilot Core-Start
  • Nach 4 Wo: Salon-Pilot live + Sebastian-Voice-Modul integriert
  • Nach 8-12 Wo: Thorsten-Pilot-Start + Stufe-3-Produkte launchen
  • Pass-3-Brainstorms: av-platform + av-audit getrennt einplanen