Zielversion — Pass 2 (2026-05-18, Feierabend-Session)

Diese Datei ist der Konsolidierte-Ausgang einer langen Brainstorm-Session am Abend des 18. Mai 2026. Sie ergaenzt + ueberschreibt teilweise die synthese vom selben Tag, weil sich die Erkenntnisse waehrend der Session noch verschoben haben (Customer-Lens-Reframe, 2 neue Piloten Sebastian + Thorsten, Stufen-Compound-Logik, WhatsApp-First-Strategie).

Visualisiertes Companion-Artefakt: assets/prototypen/2026-05-18-mcp-defensibility/index.html (Claude-Style HTML mit Personas, Stack, Defensibility, Graph in 4 Bildern, Finanz-Sektion).

Was sich gegenueber Pass 1 + Pass 2 (synthese.md) veraendert hat

Pass 1 (2026-05-14): „KI-Netzwerk als EDI-Nachfolger” — Standalone-Produkt, Becker als Hub 1.

Pass 2 vormittags (synthese.md): Schicht-Umkehrung — MCP-Hosting wird eigene Saeule, EDI-Netzwerk wird Vertikal-App darauf. Wix-Analogie. Defensibility gegen Anthropic/Cloudflare in 6 Mauern.

Pass 2 abends (diese Datei): Customer-Lens-Reframe. Drei wichtige Umstellungen:

Wir verkaufen NIE „MCP-Hosting”. Wir verkaufen pro Branche ein konkretes Versprechen mit ROI-Anker. MCP-Hosting ist die langweilige Implementation darunter, der Kunde sieht das nie. Wix-Analogie war irrefuehrend — passend ist eher Squarespace/Shopify: fertige App in Branchen-Farbe, Tools dazu klickbar.
Zwei Bereitstellungs-Modelle, nicht eins. Modell A („Wir sind Frontend”) fuer KMU/Handwerk/Salon — eigene Web-App + WhatsApp + Email. Modell B („Wir sind Backend”) fuer Industrie-Hubs + tech-affine Solos — MCP-URL die in claude.ai/ChatGPT eingehaengt wird. Sehr unterschiedliche Produkte mit gemeinsamem Unterbau.
Service-Schmiede statt Agency-Modell. Die 5 Piloten zahlen den Bau der Bausteine, die wir dann als Produkt 10-100x weiterverkaufen. Das ist nicht Custom-Bau pro Kunde — das ist Compound-Build (siehe Stufen-Logik unten).

Customer-Lens — Die 5 Piloten als Pricing-Matrix

Pilot	Branche	Modell	Pricing	Setup	Bauzeit ab Core	DACH-Multiplikator	Status
Tanja Berger (Friseur-Im-Sueden)	Salon	A	49 €/Mo	0 €	4 Wo (Core)	~50.000 Salons	Bestandskundin, „nimmt sowieso alles von uns”
Sebastian Kollas	LVM-Versicherungs-Vermittler	A + Voice	299 €/Mo	990 €	+4-6 Wo	~80.000 Vermittler DACH	warmer Lead via Andre Kollas
Thorsten Baer	Mittelstaendischer Dachdecker (~20-50 MA)	A + Cluster	1.299 €/Mo	4.900 €	+8-12 Wo	~5.000 mittelstaendische Handwerks-Hubs	Lead, will „ganzen Betrieb digitalisieren”
Klaus (hypothetisch)	Solo-Dachdecker	A (Stripped-Down von Thorsten)	89 €/Mo	0 €	Y2-Skalierung	~600.000 Handwerks-Betriebe	Persona, nicht real
Ralf Becker	Industrie-Servicecenter Aluminium	B + Review-UI	9.900 €/Mo	30.000 €	8-10 Wo (eigener Track)	~600 Industrie-Hubs DACH	NDA-Pilot, EDI-Cluster-Anker

Pricing-Logik fuer Becker korrigiert gegenueber Pass-1: 9.900 €/Mo sitzt richtig, aber Verkaufs-Story ist ROI-Rechnung, nicht Preis-Anker. Pain-Wert bei Becker monatlich 40-60k € (3 Disponenten-Aequivalente + verlorene Anfragen). 15-25% des realisierten Pains als Preis = 8-12k €/Mo. Volumen-Check (A1 aus Pass 1) bleibt Resolve-Before-Planning-Punkt.

Was der Kunde tatsaechlich in die Hand bekommt — Modell A vs Modell B

Modell A — Wir sind das Frontend (Tanja, Sebastian, Klaus, Thorsten)

Kunde bekommt von uns:

Eine Web-App unter firma.av.network (Next.js, mobile-first): Login, Dashboard, Inbox aller Anfragen, Termin-Kalender, Angebots-Editor, Kunden-Liste, Belege-Uebersicht
Eine WhatsApp-Business-Nummer (eigene oder neue) — antwortet automatisch
Eine Email-Adresse als Schaltzentrale fuer Lieferanten/Steuerberater/Kunden
Automatischer Datenfluss zum Steuerberater (Lexware/Datev/SevDesk)

Was er NICHT sieht: kein claude.ai, kein MCP-irgendwas, kein Tool-Setup. App, WhatsApp, Email — fertig.

Was wir technisch bauen (Marvin-Brille):

Komponente	Stack	Bauzeit Core
Next.js Web-App	Next.js 15 + shadcn/ui + Drizzle + Postgres + Auth.js	6-8 Wo
WhatsApp-Webhook + Klassifizierer + Auto-Reply	FastAPI + bestehender mcp-whatsapp + Bedrock EU	2-3 Wo (mcp-whatsapp laeuft schon)
Email-Bridge (IMAP, Klassifizierer, Draft-Vorschlag)	FastAPI + Bedrock + Email-Parsing	2 Wo
Lexware/Datev-Connector	mcp-lexware (im Bau) + neuer Datev-Connector	1-2 Wo
KI-Agent-Orchestrierung	Claude Agent SDK oder Bedrock direkt + selbst-gebaute Tool-Router	2 Wo
Branchen-Template (Setup-Wizard, Default-Prompts, Spezial-Features)	Backend-Config + Prompt-Library	1 Wo pro Branche

Insgesamt 14-18 Wo fuer Branche 1, danach jede weitere Branche 4-5 Wo weil Core wiederverwendet wird.

Modell B — Wir sind nur Backend (Becker, tech-affine Solos)

Kunde bekommt:

Eine MCP-URL becker.mcp.av.network/mcp die in claude.ai Custom Connector eingehaengt wird
Eine separate Review-UI (Next.js, klein) fuer Disponenten — Anfragen sehen, freigeben
Audit-Trail-Dashboard fuer GoBD-Pflicht

Was wir bauen:

Komponente	Stack
MCP-Endpoint mit Becker-Tools (parse_rfq, check_inventory, generate_quote)	Python FastMCP + Bedrock + ERP-Adapter
Disponenten-Review-UI (klein, fokussiert)	Next.js + Postgres fuer Pending-Reviews
ERP-Connector zu Becker (read-only)	Custom-Adapter, Tag 60+
PDF-Generator (Becker-Layout)	Python + WeasyPrint o.ae.
Audit-Service mit Hash-Chain	Postgres + taeglicher externer Anchor

Insgesamt 8-12 Wo fuer Becker-Pilot. Schneller als Modell A, aber niedrigere Skalierbarkeit auf KMU.

Compound-Trick — Service baut Produkt (Stufen-Logik)

Die 5 Piloten sind nicht Custom-Dienstleistung. Sie sind Stufe 1 eines 4-stufigen Compound-Builds. Jeder Pilot produziert Bausteine, die wir dann ohne Mehraufwand weiterverkaufen.

Stufe	Was es ist	Wann
1 — Service	5 Piloten zahlen den Bau der Branchen-Cores	Wochen 1-22
2 — Branchen-Templates	Salon-Template, Versicherungs-Template, Handwerks-Hub-Template werden re-saleable. Salon Nr. 2-10 in 2 Tagen statt 4 Wo	Ab Wo 8 parallel
3 — Horizontale Tools	`av-voice` (KI-Telefon-Agent), `av-audit` (GoBD-Audit-Trail-Lib + Hosted), „Mein KI-Stabschef” (Solo-GF-OS) — als Standalone-Produkte verkauft	Ab Wo 8 parallel
4 — Plattform-Marketplace	Drittanbieter-Templates, 30% Take-Rate, Wix-App-Store-Pattern	Y3+

Dogfood-Punkt: „Mein KI-Stabschef” ist Marvins eigenes Vault-Setup verallgemeinert. Agentic Ventures ist Pilot Nr. 0 fuer seine eigene Plattform. Sein Audit-Trail (Vault-Git + RemoteTrigger-Logs) ist av-audit in Prototyp-Form.

Konkrete Stufe-3-Produkte mit Dogfood-Faktor:

Produkt	Aus welchem Pilot	Wer nutzt es selbst	Pricing	Dogfood
`av-voice` — KI-Telefon-Agent (Solo-Professionals)	Sebastian-Pilot Voice-Modul	Marvin (Erstkontakt-Annahme)	99-249 €/Mo	Hoch
`av-audit` — GoBD-Audit-Trail (OSS + Hosted)	Compliance-Pflicht aller Piloten	Marvin (eigene MCPs auditen)	49-249 €/Mo + 990 € WP-Brief	Hoch
„Mein KI-Stabschef” — Solo-GF-OS	Marvin’s eigenes Setup	Marvin + Alex taeglich	99-199 €/Mo + 290 € Setup	Maximal

WhatsApp-First-Strategie (zentrale Erkenntnis dieser Session)

Strategischer Satz: „Die Leute werden lieber WhatsApp schreiben als anzurufen. Das koennen wir perfekt verkaufen.”

Begruendung:

DACH-KMU-Realitaet: Anfragen kommen ueber WhatsApp (Text + Voice-Note), klassisches Festnetz-Telefon-Anrufen ist Versicherungs- und Boomer-Nische
Tanja-Kunden, Klaus-Anfragen, Thorsten-Privatkunden — alle WhatsApp
Telefon-Provider-Pain (Twilio-KYC, SIP-Trunking, Caller-ID-Trust) ist Dealbreaker fuer Solo-Dev
WhatsApp Business Cloud API ueber 360dialog ist DACH-DSGVO-Stack, eh geplant (_index)

Implikation fuer Architektur:

av-voice startet als WhatsApp-Voice-Pattern (Async-Voice-Note-Round-Trip), nicht als klassischer Telefon-Agent
Klassisches Telefon-Klingeln bleibt Track 2 mit sipgate (DE-Provider, weniger Pain als Twilio) — fuer Sebastian-LVM-Use-Case wo Bestandskunden anrufen
Web-Widget mit Click-to-Talk bleibt Track 3 fuer Marketing-Sites-Erstkontakt

4-Wellen-Bauplan (korrigiert mit Produkt-Ausgliederung)

Welle	Wochen	Service-Lieferung	Produkt-Nebenprodukt
1	1-8	Tanja-Salon (4 Wo Core) + Sebastian-Voice-Modul (4-6 Wo ab Wo 4)	„Mein KI-Stabschef” Launch (parallel mit Salon-Core), av-audit OSS-Release
2	6-16	Thorsten-Handwerks-Hub mit Cluster-Layer	Salon-Template re-saleable (Salon Nr. 2-10), av-voice Standalone
3	12-22	Becker-Industrie-Connector (EDI-Cluster)	Handwerks-Template re-saleable, av-audit Hosted-Service
4	18-30	Klaus-Solo + 2 weitere Tanjas	av-voice + Stabschef + av-audit voll im Vertrieb

Cash-Flow nach 22 Wochen: ~12k €/Mo Recurring (Tanja + Sebastian + Thorsten + Becker) + ~35k € Setup-Fees + Stufe-3-Produkt-MRR.

Korrigierte Finanz-Projektion (mit Stufe-3-Produkten)

	Y1	Y2	Y3
Stufe 1+2 (Service + Templates)	€152k	€840k	€2,7M
Stufe 3 — av-voice (300/1500/4000 Kunden × ø 150 €)	€54k	€270k	€720k
Stufe 3 — av-audit Hosted (100/600/2000 × ø 99 €)	€12k	€71k	€238k
Stufe 3 — „Mein KI-Stabschef” (200/1000/3500 × ø 149 €)	€36k	€179k	€625k
Total ARR	€254k	€1,36M	€4,28M

Y5 mit voller Stufe-3-Skalierung: konservativ €30-40M ARR. Exit Y5 bei 15-25x ARR = €450M-1Md €.

Annahmen die wackeln (Risiko-Liste):

Self-Service-Conversion 3% Free→Paid (B2B-SaaS-Norm) — kann scheitern wenn Marketing-Hebel fehlt
OEM-Partner (Datev/Lexware) kommen Y2 — muss verhandelt werden
A1 aus Pass 1: Becker-RFQ-Volumen 50/Tag — noch nicht validiert
WhatsApp-First-These braucht 2-3 Pilot-Datenpunkte zur Bestaetigung

Was wir in dieser Session GEBAUT haben (Stand 19.05 morgens)

Sprint: av-voice v0.1 — WhatsApp-Voice-Pattern. Status: laeuft End-to-End.

Detail-Uebergabe: session-uebergabe. Plan fuer naechste Session: ~/source/av-voice/docs/stufe-2-latenz-plan.md.

Repo: ~/source/av-voice/ — komplettes Skeleton mit FastAPI + Provider-Switch (Bedrock + Mistral) + Cal.com-Tool-Use + Supertonic-TTS-Anbindung.

Stack-Entscheidung umgesetzt:

Schicht	Default-Provider	Strict-DSGVO-Variante
ASR	Voxtral Mini via Mistral La Plateforme (FR)	gleicher Provider — DSGVO eh sauber
LLM	Bedrock Claude Haiku 4.5 EU	Mistral Medium/Large via La Plateforme (FR)
TTS	Supertonic auf av-tools-shared-01 (Hetzner DE)	gleicher Service — DSGVO eh sauber
Tool-Use	Cal.com API v2 direkt	identisch

Provider-Switch via LLM_PROVIDER=bedrock|mistral env-var. Tool-Schicht ist provider-agnostisch.

mcp-whatsapp erweitert um 3 neue Tools (send_audio, upload_media, download_media) + Webhook-Audio-Routing an AV_VOICE_WEBHOOK_URL (fire-and-forget POST).

Gemessene Latenz: 9,4s end-to-end mit Test-Voice-Note (8 Sek deutsches Audio → 4 Sek Antwort-Voice-Note).

Aufschluesselung:

ASR Voxtral: 0,7s
LLM Hop 1 (Cal.com Tool-Call): 2,7s
Cal.com slots-API: 1,4s (variabel)
LLM Hop 2 (Final-Text mit Streaming): 1,9s
TTS Supertonic: 2,6s

Ziel naechste Session: unter 5 Sek via Single-Hop-Routing + Supertonic-Migration auf CAX21.

Demo-Material: /tmp/customer-question.ogg (Test-Voice-Note via Supertonic generiert) + /tmp/av-voice-reply.ogg (echte KI-Antwort).

Geparkt fuer eigene Folge-Brainstorms (Pass 3)

Die folgenden zwei Ideen sind in dieser Session aufgekommen, brauchen aber eigene tiefere Brainstorms — bewusst nicht heute Abend angefangen:

`av-platform` Core (Multi-Tenant-MCP-Hosting-Skeleton)

Multi-Tenant-Container-Orchestrierung (Postgres-RLS oder dedicated Container)
OAuth-Foederation (Scalekit/Better-Auth)
Cloudflare-Tunnel-Automation per API (pro Tenant ein Tunnel)
Connector-Registry + Wizard-UI fuer Self-Service-Setup
Strategisch das tiefste Asset, aber 5-6h fuer ein Demo-Tenant, 8-12 Wo fuer Production-ready
Folge-Brainstorm: wann starten? Wie verhaeltnis zu mcp-vf-hosted (existierender Hub)? Generalisierung oder Aufbau daneben?

`av-audit` Library + Hosted-Service

OSS-Repo auf GitHub: Hash-Chain-Lib in Python, GoBD-Pflichtfelder, Pydantic-Schema, Verify-Funktion
Hosted-Tier 49-249 €/Mo, Enterprise 990 € WP-Brief
Dogfood durch existierende MCPs (papierkram, m365, gsuite, hetzner, mcp-vf-hosted)
3-4h heute Abend waere lauffaehig gewesen, aber av-voice hat Vorrang weil sichtbarere Demo
Folge-Brainstorm: OSS-Release-Pacing, Hash-Anchor-Mechanismus (transparency-Log? Bitcoin? zweiter Provider?), Wirtschaftspruefer-Brief-Beschaffung

Beide Folge-Brainstorms sollten in eigenen Sessions stattfinden, am besten wenn av-voice Phase 1 + 2 durchgelaufen ist (Wo 3-4).

Pointer auf die anderen Artefakte dieser Session

Recherche-File (US-Markt + Agent-Payments + DACH): recherche-us-markt
Synthese (Vormittags-Stand, Wix-These): synthese
HTML-Visualisierung (Claude-Style, 4-Bilder-Graph, Personas, Defensibility, Finanz): assets/prototypen/2026-05-18-mcp-defensibility/index.html
Pass-1-Brainstorm (EDI-Netzwerk): requirements

Status

Heute Abend: av-voice Phase 1 (WhatsApp-Voice-Pattern) starten
Diese Woche: av-voice Phase 1 fertig + Tanja-Pilot Core-Start
Nach 4 Wo: Salon-Pilot live + Sebastian-Voice-Modul integriert
Nach 8-12 Wo: Thorsten-Pilot-Start + Stufe-3-Produkte launchen
Pass-3-Brainstorms: av-platform + av-audit getrennt einplanen

Agentic Ventures Wiki

Explorer

Zielversion — was wir uns in dieser Session ausgedacht haben

Zielversion — Pass 2 (2026-05-18, Feierabend-Session)

Was sich gegenueber Pass 1 + Pass 2 (synthese.md) veraendert hat

Customer-Lens — Die 5 Piloten als Pricing-Matrix

Was der Kunde tatsaechlich in die Hand bekommt — Modell A vs Modell B

Modell A — Wir sind das Frontend (Tanja, Sebastian, Klaus, Thorsten)

Modell B — Wir sind nur Backend (Becker, tech-affine Solos)

Compound-Trick — Service baut Produkt (Stufen-Logik)

WhatsApp-First-Strategie (zentrale Erkenntnis dieser Session)

4-Wellen-Bauplan (korrigiert mit Produkt-Ausgliederung)

Korrigierte Finanz-Projektion (mit Stufe-3-Produkten)

Was wir in dieser Session GEBAUT haben (Stand 19.05 morgens)

Geparkt fuer eigene Folge-Brainstorms (Pass 3)

`av-platform` Core (Multi-Tenant-MCP-Hosting-Skeleton)

`av-audit` Library + Hosted-Service

Pointer auf die anderen Artefakte dieser Session

Status

Graphansicht

Inhaltsverzeichnis

Backlinks

Agentic Ventures Wiki

Explorer

Zielversion — was wir uns in dieser Session ausgedacht haben

Zielversion — Pass 2 (2026-05-18, Feierabend-Session)

Was sich gegenueber Pass 1 + Pass 2 (synthese.md) veraendert hat

Customer-Lens — Die 5 Piloten als Pricing-Matrix

Was der Kunde tatsaechlich in die Hand bekommt — Modell A vs Modell B

Modell A — Wir sind das Frontend (Tanja, Sebastian, Klaus, Thorsten)

Modell B — Wir sind nur Backend (Becker, tech-affine Solos)

Compound-Trick — Service baut Produkt (Stufen-Logik)

WhatsApp-First-Strategie (zentrale Erkenntnis dieser Session)

4-Wellen-Bauplan (korrigiert mit Produkt-Ausgliederung)

Korrigierte Finanz-Projektion (mit Stufe-3-Produkten)

Was wir in dieser Session GEBAUT haben (Stand 19.05 morgens)

Geparkt fuer eigene Folge-Brainstorms (Pass 3)

av-platform Core (Multi-Tenant-MCP-Hosting-Skeleton)

av-audit Library + Hosted-Service

Pointer auf die anderen Artefakte dieser Session

Status

Graphansicht

Inhaltsverzeichnis

Backlinks

`av-platform` Core (Multi-Tenant-MCP-Hosting-Skeleton)

`av-audit` Library + Hosted-Service