Zielversion — Pass 2 (2026-05-18, Feierabend-Session)
Diese Datei ist der Konsolidierte-Ausgang einer langen Brainstorm-Session am Abend des 18. Mai 2026. Sie ergaenzt + ueberschreibt teilweise die synthese vom selben Tag, weil sich die Erkenntnisse waehrend der Session noch verschoben haben (Customer-Lens-Reframe, 2 neue Piloten Sebastian + Thorsten, Stufen-Compound-Logik, WhatsApp-First-Strategie).
Visualisiertes Companion-Artefakt: assets/prototypen/2026-05-18-mcp-defensibility/index.html (Claude-Style HTML mit Personas, Stack, Defensibility, Graph in 4 Bildern, Finanz-Sektion).
Was sich gegenueber Pass 1 + Pass 2 (synthese.md) veraendert hat
Pass 1 (2026-05-14): „KI-Netzwerk als EDI-Nachfolger” — Standalone-Produkt, Becker als Hub 1.
Pass 2 vormittags (synthese.md): Schicht-Umkehrung — MCP-Hosting wird eigene Saeule, EDI-Netzwerk wird Vertikal-App darauf. Wix-Analogie. Defensibility gegen Anthropic/Cloudflare in 6 Mauern.
Pass 2 abends (diese Datei): Customer-Lens-Reframe. Drei wichtige Umstellungen:
- Wir verkaufen NIE „MCP-Hosting”. Wir verkaufen pro Branche ein konkretes Versprechen mit ROI-Anker. MCP-Hosting ist die langweilige Implementation darunter, der Kunde sieht das nie. Wix-Analogie war irrefuehrend — passend ist eher Squarespace/Shopify: fertige App in Branchen-Farbe, Tools dazu klickbar.
- Zwei Bereitstellungs-Modelle, nicht eins. Modell A („Wir sind Frontend”) fuer KMU/Handwerk/Salon — eigene Web-App + WhatsApp + Email. Modell B („Wir sind Backend”) fuer Industrie-Hubs + tech-affine Solos — MCP-URL die in claude.ai/ChatGPT eingehaengt wird. Sehr unterschiedliche Produkte mit gemeinsamem Unterbau.
- Service-Schmiede statt Agency-Modell. Die 5 Piloten zahlen den Bau der Bausteine, die wir dann als Produkt 10-100x weiterverkaufen. Das ist nicht Custom-Bau pro Kunde — das ist Compound-Build (siehe Stufen-Logik unten).
Customer-Lens — Die 5 Piloten als Pricing-Matrix
| Pilot | Branche | Modell | Pricing | Setup | Bauzeit ab Core | DACH-Multiplikator | Status |
|---|---|---|---|---|---|---|---|
| Tanja Berger (Friseur-Im-Sueden) | Salon | A | 49 €/Mo | 0 € | 4 Wo (Core) | ~50.000 Salons | Bestandskundin, „nimmt sowieso alles von uns” |
| Sebastian Kollas | LVM-Versicherungs-Vermittler | A + Voice | 299 €/Mo | 990 € | +4-6 Wo | ~80.000 Vermittler DACH | warmer Lead via Andre Kollas |
| Thorsten Baer | Mittelstaendischer Dachdecker (~20-50 MA) | A + Cluster | 1.299 €/Mo | 4.900 € | +8-12 Wo | ~5.000 mittelstaendische Handwerks-Hubs | Lead, will „ganzen Betrieb digitalisieren” |
| Klaus (hypothetisch) | Solo-Dachdecker | A (Stripped-Down von Thorsten) | 89 €/Mo | 0 € | Y2-Skalierung | ~600.000 Handwerks-Betriebe | Persona, nicht real |
| Ralf Becker | Industrie-Servicecenter Aluminium | B + Review-UI | 9.900 €/Mo | 30.000 € | 8-10 Wo (eigener Track) | ~600 Industrie-Hubs DACH | NDA-Pilot, EDI-Cluster-Anker |
Pricing-Logik fuer Becker korrigiert gegenueber Pass-1: 9.900 €/Mo sitzt richtig, aber Verkaufs-Story ist ROI-Rechnung, nicht Preis-Anker. Pain-Wert bei Becker monatlich 40-60k € (3 Disponenten-Aequivalente + verlorene Anfragen). 15-25% des realisierten Pains als Preis = 8-12k €/Mo. Volumen-Check (A1 aus Pass 1) bleibt Resolve-Before-Planning-Punkt.
Was der Kunde tatsaechlich in die Hand bekommt — Modell A vs Modell B
Modell A — Wir sind das Frontend (Tanja, Sebastian, Klaus, Thorsten)
Kunde bekommt von uns:
- Eine Web-App unter
firma.av.network(Next.js, mobile-first): Login, Dashboard, Inbox aller Anfragen, Termin-Kalender, Angebots-Editor, Kunden-Liste, Belege-Uebersicht - Eine WhatsApp-Business-Nummer (eigene oder neue) — antwortet automatisch
- Eine Email-Adresse als Schaltzentrale fuer Lieferanten/Steuerberater/Kunden
- Automatischer Datenfluss zum Steuerberater (Lexware/Datev/SevDesk)
Was er NICHT sieht: kein claude.ai, kein MCP-irgendwas, kein Tool-Setup. App, WhatsApp, Email — fertig.
Was wir technisch bauen (Marvin-Brille):
| Komponente | Stack | Bauzeit Core |
|---|---|---|
| Next.js Web-App | Next.js 15 + shadcn/ui + Drizzle + Postgres + Auth.js | 6-8 Wo |
| WhatsApp-Webhook + Klassifizierer + Auto-Reply | FastAPI + bestehender mcp-whatsapp + Bedrock EU | 2-3 Wo (mcp-whatsapp laeuft schon) |
| Email-Bridge (IMAP, Klassifizierer, Draft-Vorschlag) | FastAPI + Bedrock + Email-Parsing | 2 Wo |
| Lexware/Datev-Connector | mcp-lexware (im Bau) + neuer Datev-Connector | 1-2 Wo |
| KI-Agent-Orchestrierung | Claude Agent SDK oder Bedrock direkt + selbst-gebaute Tool-Router | 2 Wo |
| Branchen-Template (Setup-Wizard, Default-Prompts, Spezial-Features) | Backend-Config + Prompt-Library | 1 Wo pro Branche |
Insgesamt 14-18 Wo fuer Branche 1, danach jede weitere Branche 4-5 Wo weil Core wiederverwendet wird.
Modell B — Wir sind nur Backend (Becker, tech-affine Solos)
Kunde bekommt:
- Eine MCP-URL
becker.mcp.av.network/mcpdie in claude.ai Custom Connector eingehaengt wird - Eine separate Review-UI (Next.js, klein) fuer Disponenten — Anfragen sehen, freigeben
- Audit-Trail-Dashboard fuer GoBD-Pflicht
Was wir bauen:
| Komponente | Stack |
|---|---|
| MCP-Endpoint mit Becker-Tools (parse_rfq, check_inventory, generate_quote) | Python FastMCP + Bedrock + ERP-Adapter |
| Disponenten-Review-UI (klein, fokussiert) | Next.js + Postgres fuer Pending-Reviews |
| ERP-Connector zu Becker (read-only) | Custom-Adapter, Tag 60+ |
| PDF-Generator (Becker-Layout) | Python + WeasyPrint o.ae. |
| Audit-Service mit Hash-Chain | Postgres + taeglicher externer Anchor |
Insgesamt 8-12 Wo fuer Becker-Pilot. Schneller als Modell A, aber niedrigere Skalierbarkeit auf KMU.
Compound-Trick — Service baut Produkt (Stufen-Logik)
Die 5 Piloten sind nicht Custom-Dienstleistung. Sie sind Stufe 1 eines 4-stufigen Compound-Builds. Jeder Pilot produziert Bausteine, die wir dann ohne Mehraufwand weiterverkaufen.
| Stufe | Was es ist | Wann |
|---|---|---|
| 1 — Service | 5 Piloten zahlen den Bau der Branchen-Cores | Wochen 1-22 |
| 2 — Branchen-Templates | Salon-Template, Versicherungs-Template, Handwerks-Hub-Template werden re-saleable. Salon Nr. 2-10 in 2 Tagen statt 4 Wo | Ab Wo 8 parallel |
| 3 — Horizontale Tools | av-voice (KI-Telefon-Agent), av-audit (GoBD-Audit-Trail-Lib + Hosted), „Mein KI-Stabschef” (Solo-GF-OS) — als Standalone-Produkte verkauft | Ab Wo 8 parallel |
| 4 — Plattform-Marketplace | Drittanbieter-Templates, 30% Take-Rate, Wix-App-Store-Pattern | Y3+ |
Dogfood-Punkt: „Mein KI-Stabschef” ist Marvins eigenes Vault-Setup verallgemeinert. Agentic Ventures ist Pilot Nr. 0 fuer seine eigene Plattform. Sein Audit-Trail (Vault-Git + RemoteTrigger-Logs) ist av-audit in Prototyp-Form.
Konkrete Stufe-3-Produkte mit Dogfood-Faktor:
| Produkt | Aus welchem Pilot | Wer nutzt es selbst | Pricing | Dogfood |
|---|---|---|---|---|
av-voice — KI-Telefon-Agent (Solo-Professionals) | Sebastian-Pilot Voice-Modul | Marvin (Erstkontakt-Annahme) | 99-249 €/Mo | Hoch |
av-audit — GoBD-Audit-Trail (OSS + Hosted) | Compliance-Pflicht aller Piloten | Marvin (eigene MCPs auditen) | 49-249 €/Mo + 990 € WP-Brief | Hoch |
| „Mein KI-Stabschef” — Solo-GF-OS | Marvin’s eigenes Setup | Marvin + Alex taeglich | 99-199 €/Mo + 290 € Setup | Maximal |
WhatsApp-First-Strategie (zentrale Erkenntnis dieser Session)
Strategischer Satz: „Die Leute werden lieber WhatsApp schreiben als anzurufen. Das koennen wir perfekt verkaufen.”
Begruendung:
- DACH-KMU-Realitaet: Anfragen kommen ueber WhatsApp (Text + Voice-Note), klassisches Festnetz-Telefon-Anrufen ist Versicherungs- und Boomer-Nische
- Tanja-Kunden, Klaus-Anfragen, Thorsten-Privatkunden — alle WhatsApp
- Telefon-Provider-Pain (Twilio-KYC, SIP-Trunking, Caller-ID-Trust) ist Dealbreaker fuer Solo-Dev
- WhatsApp Business Cloud API ueber 360dialog ist DACH-DSGVO-Stack, eh geplant (_index)
Implikation fuer Architektur:
- av-voice startet als WhatsApp-Voice-Pattern (Async-Voice-Note-Round-Trip), nicht als klassischer Telefon-Agent
- Klassisches Telefon-Klingeln bleibt Track 2 mit sipgate (DE-Provider, weniger Pain als Twilio) — fuer Sebastian-LVM-Use-Case wo Bestandskunden anrufen
- Web-Widget mit Click-to-Talk bleibt Track 3 fuer Marketing-Sites-Erstkontakt
4-Wellen-Bauplan (korrigiert mit Produkt-Ausgliederung)
| Welle | Wochen | Service-Lieferung | Produkt-Nebenprodukt |
|---|---|---|---|
| 1 | 1-8 | Tanja-Salon (4 Wo Core) + Sebastian-Voice-Modul (4-6 Wo ab Wo 4) | „Mein KI-Stabschef” Launch (parallel mit Salon-Core), av-audit OSS-Release |
| 2 | 6-16 | Thorsten-Handwerks-Hub mit Cluster-Layer | Salon-Template re-saleable (Salon Nr. 2-10), av-voice Standalone |
| 3 | 12-22 | Becker-Industrie-Connector (EDI-Cluster) | Handwerks-Template re-saleable, av-audit Hosted-Service |
| 4 | 18-30 | Klaus-Solo + 2 weitere Tanjas | av-voice + Stabschef + av-audit voll im Vertrieb |
Cash-Flow nach 22 Wochen: ~12k €/Mo Recurring (Tanja + Sebastian + Thorsten + Becker) + ~35k € Setup-Fees + Stufe-3-Produkt-MRR.
Korrigierte Finanz-Projektion (mit Stufe-3-Produkten)
| Y1 | Y2 | Y3 | |
|---|---|---|---|
| Stufe 1+2 (Service + Templates) | €152k | €840k | €2,7M |
| Stufe 3 — av-voice (300/1500/4000 Kunden × ø 150 €) | €54k | €270k | €720k |
| Stufe 3 — av-audit Hosted (100/600/2000 × ø 99 €) | €12k | €71k | €238k |
| Stufe 3 — „Mein KI-Stabschef” (200/1000/3500 × ø 149 €) | €36k | €179k | €625k |
| Total ARR | €254k | €1,36M | €4,28M |
Y5 mit voller Stufe-3-Skalierung: konservativ €30-40M ARR. Exit Y5 bei 15-25x ARR = €450M-1Md €.
Annahmen die wackeln (Risiko-Liste):
- Self-Service-Conversion 3% Free→Paid (B2B-SaaS-Norm) — kann scheitern wenn Marketing-Hebel fehlt
- OEM-Partner (Datev/Lexware) kommen Y2 — muss verhandelt werden
- A1 aus Pass 1: Becker-RFQ-Volumen 50/Tag — noch nicht validiert
- WhatsApp-First-These braucht 2-3 Pilot-Datenpunkte zur Bestaetigung
Was wir in dieser Session GEBAUT haben (Stand 19.05 morgens)
Sprint: av-voice v0.1 — WhatsApp-Voice-Pattern. Status: laeuft End-to-End.
Detail-Uebergabe: session-uebergabe. Plan fuer naechste Session: ~/source/av-voice/docs/stufe-2-latenz-plan.md.
Repo: ~/source/av-voice/ — komplettes Skeleton mit FastAPI + Provider-Switch (Bedrock + Mistral) + Cal.com-Tool-Use + Supertonic-TTS-Anbindung.
Stack-Entscheidung umgesetzt:
| Schicht | Default-Provider | Strict-DSGVO-Variante |
|---|---|---|
| ASR | Voxtral Mini via Mistral La Plateforme (FR) | gleicher Provider — DSGVO eh sauber |
| LLM | Bedrock Claude Haiku 4.5 EU | Mistral Medium/Large via La Plateforme (FR) |
| TTS | Supertonic auf av-tools-shared-01 (Hetzner DE) | gleicher Service — DSGVO eh sauber |
| Tool-Use | Cal.com API v2 direkt | identisch |
Provider-Switch via LLM_PROVIDER=bedrock|mistral env-var. Tool-Schicht ist provider-agnostisch.
mcp-whatsapp erweitert um 3 neue Tools (send_audio, upload_media, download_media) + Webhook-Audio-Routing an AV_VOICE_WEBHOOK_URL (fire-and-forget POST).
Gemessene Latenz: 9,4s end-to-end mit Test-Voice-Note (8 Sek deutsches Audio → 4 Sek Antwort-Voice-Note).
Aufschluesselung:
- ASR Voxtral: 0,7s
- LLM Hop 1 (Cal.com Tool-Call): 2,7s
- Cal.com slots-API: 1,4s (variabel)
- LLM Hop 2 (Final-Text mit Streaming): 1,9s
- TTS Supertonic: 2,6s
Ziel naechste Session: unter 5 Sek via Single-Hop-Routing + Supertonic-Migration auf CAX21.
Demo-Material: /tmp/customer-question.ogg (Test-Voice-Note via Supertonic generiert) + /tmp/av-voice-reply.ogg (echte KI-Antwort).
Geparkt fuer eigene Folge-Brainstorms (Pass 3)
Die folgenden zwei Ideen sind in dieser Session aufgekommen, brauchen aber eigene tiefere Brainstorms — bewusst nicht heute Abend angefangen:
av-platform Core (Multi-Tenant-MCP-Hosting-Skeleton)
- Multi-Tenant-Container-Orchestrierung (Postgres-RLS oder dedicated Container)
- OAuth-Foederation (Scalekit/Better-Auth)
- Cloudflare-Tunnel-Automation per API (pro Tenant ein Tunnel)
- Connector-Registry + Wizard-UI fuer Self-Service-Setup
- Strategisch das tiefste Asset, aber 5-6h fuer ein Demo-Tenant, 8-12 Wo fuer Production-ready
- Folge-Brainstorm: wann starten? Wie verhaeltnis zu mcp-vf-hosted (existierender Hub)? Generalisierung oder Aufbau daneben?
av-audit Library + Hosted-Service
- OSS-Repo auf GitHub: Hash-Chain-Lib in Python, GoBD-Pflichtfelder, Pydantic-Schema, Verify-Funktion
- Hosted-Tier 49-249 €/Mo, Enterprise 990 € WP-Brief
- Dogfood durch existierende MCPs (papierkram, m365, gsuite, hetzner, mcp-vf-hosted)
- 3-4h heute Abend waere lauffaehig gewesen, aber av-voice hat Vorrang weil sichtbarere Demo
- Folge-Brainstorm: OSS-Release-Pacing, Hash-Anchor-Mechanismus (transparency-Log? Bitcoin? zweiter Provider?), Wirtschaftspruefer-Brief-Beschaffung
Beide Folge-Brainstorms sollten in eigenen Sessions stattfinden, am besten wenn av-voice Phase 1 + 2 durchgelaufen ist (Wo 3-4).
Pointer auf die anderen Artefakte dieser Session
- Recherche-File (US-Markt + Agent-Payments + DACH): recherche-us-markt
- Synthese (Vormittags-Stand, Wix-These): synthese
- HTML-Visualisierung (Claude-Style, 4-Bilder-Graph, Personas, Defensibility, Finanz):
assets/prototypen/2026-05-18-mcp-defensibility/index.html - Pass-1-Brainstorm (EDI-Netzwerk): requirements
Status
- Heute Abend: av-voice Phase 1 (WhatsApp-Voice-Pattern) starten
- Diese Woche: av-voice Phase 1 fertig + Tanja-Pilot Core-Start
- Nach 4 Wo: Salon-Pilot live + Sebastian-Voice-Modul integriert
- Nach 8-12 Wo: Thorsten-Pilot-Start + Stufe-3-Produkte launchen
- Pass-3-Brainstorms: av-platform + av-audit getrennt einplanen