ADR — VF Video-Gen-Provider
Frage
Welcher Provider liefert Video-Generation fuer Vibe Factory in Open WebUI vf-nova? Drei Optionen standen zur Wahl (Plan §2.2):
- A — Replicate-Hosted erweitern: Tool im bestehenden
mcp-replicate-hostedhinzufuegen, wenn die richtigen Video-Modelle auf Replicate verfuegbar sind. - B — fal.ai als zweiter Provider: Breitestes Video-Modell-Coverage (Sora 2, Veo 3.1, Kling, Hailuo), aber unklarer EU-Datacenter-Status und 1-2 Wochen AVV-Latenz.
- C — Vertex AI EU fuer Veo direkt: Saubere EU-Compliance, aber neuer GCP-Account + AVV mit Google EU + eigener mcp-veo-hosted ~1-2 Tage.
Entscheidung
Option A — Replicate-Hosted erweitern.
Live-Check der Replicate API am 2026-05-19 (QUERY /v1/models mit Suchbegriffen kling, wan, veo, seedance) bestaetigte: alle vier relevanten Familien sind aktuell und vielfaeltig verfuegbar:
| Familie | Stand Replicate Mai 2026 | Default fuer VF |
|---|---|---|
| Kling (Kuaishou) | v1.6 bis v3.0, mit Audio + Motion-Control | kwaivgi/kling-v2.5-turbo-pro (Default) |
| Wan (Alibaba) | v2.2 bis v2.7 (Pro), I2V + T2V + S2V | wan-video/wan-2.5-i2v-fast (image-to-video) |
| Veo (Google) | veo-3 und veo-3-fast (mit Audio) | google/veo-3-fast (wenn Audio Pflicht) |
| Seedance (ByteDance) | v1, v1.5, v2.0, v2.0-fast (mit Audio) | bytedance/seedance-2.0-fast (Audio + Multi-Ref) |
Nicht verfuegbar auf Replicate: Sora 2 (OpenAI hostet selbst), Veo 3.1 (Google bevorzugt Vertex AI direkt). Beides nicht VF-blockierend — Kling 2.5 Turbo Pro und Veo 3 Fast decken den realistischen Use-Case (Aftermovies, Save-the-Date-Animations, Social-Reels) ab.
Implementierung
Im mcp-replicate-hosted (Phase 2.1):
- Modell-Whitelist um die vier Slugs oben erweitert (config.py)
- Neues Layer-Tool
create_video(prompt, brand_lock=True, model=..., duration_seconds=5, image_url=None, wait_seconds=None) - USE_CASE_DEFAULTS um
video,video_with_audio,video_from_imageerweitert - Tool-Whitelist in main.py um
create_videoergaenzt - Test
test_video_models_whitelistedals Defense-in-Depth
Erweitert das mcp-replicate-hosted-Repo um ein einziges Tool ohne Architektur-Aenderung — Aufwand <1h.
Begruendung
| Kriterium | Replicate (gewaehlt) | fal.ai | Vertex EU |
|---|---|---|---|
| Modell-Coverage VF-Use-Cases | Kling/Wan/Veo/Seedance OK | breiter (Sora 2 zusaetzlich) | Veo only |
| Aufwand | Whitelist + Layer-Tool ~1h | neuer mcp-fal-hosted ~2 Tage | GCP-Setup + mcp-veo-hosted ~1-2 Tage |
| AVV-Latenz | bestehend (fuer Image schon noetig) | 1-2 Wochen | mehrere Wochen GCP-Onboarding |
| EU-Compliance fuer VF | Replicate US-HQ, EU-Edge-Routing — fuer VF B2B-Eventagentur OK weil generische Bild/Video-Material ohne erkennbare Personen | unklarer Datacenter-Status | sauber (eu-west4) |
| Cost-Mix | Pay-per-Second, im bestehenden $100/Mo-Cap | separater Account | separate GCP-Billing |
Replicate ist die saubere One-Stop-Loesung fuer Image und Video bei VF. fal.ai und Vertex sind nicht ausgeschlossen — siehe Trigger unten.
Was diese Entscheidung NICHT abdeckt
- Industriekunden (Becker u.a.): DSGVO-Anforderungen schaerfer. Wenn die mal Video-Material brauchen, separater Plan mit Hetzner-Self-Host (Wan 2.6, Veo Open-Weights wenn jemals released) oder Vertex EU.
- Sora 2-Bedarf: aktuell kein Use-Case bei VF. Wenn Julian/Andre konkret nach Sora-Stil fragen, fal.ai als Sub-Plan aktivieren.
- Multi-Tenant-Video-Routing: wenn 5+ Kunden Video brauchen, separater Plan mit Tenant-Token-Mapping (analog Multi-Tenant-Replicate-MCP Decision-Fork).
Trigger fuer Re-Evaluation
| Wann | Was zu tun |
|---|---|
| VF Cost >$200/Mo Replicate-Bills | Video-Whitelist auf nur “fast”-Varianten einschraenken, Premium-Models hinter explicit-model-Param verstecken |
| Replicate latency oder uptime degradiert | fal.ai-Sub-Plan starten (Option B in Plan §2.2) |
| Industriekunde mit harten DSGVO-Anforderungen will Video | Hetzner-Self-Host-Sub-Plan + Modell-Eval Wan 2.6 vs Open-Weight-Alternativen |
| Google released Veo Open-Weights | Pruefen ob Self-Host wirtschaftlich, sonst Vertex EU |
| Sora 2 API public + EU-AVV verfuegbar | fal.ai oder OpenAI-direkt fuer Sora-Stil-Use-Cases |
Quellen
- Live-Check Replicate API 2026-05-19 (siehe _index §Replicate-Video-Check)
- image-gen-provider-vergleich — Provider-Vergleich Stand Mai 2026
- 2026-05-19-design-stack-julian §2.2 — Plan-Kontext