ADR — VF Video-Gen-Provider

Frage

Welcher Provider liefert Video-Generation fuer Vibe Factory in Open WebUI vf-nova? Drei Optionen standen zur Wahl (Plan §2.2):

  • A — Replicate-Hosted erweitern: Tool im bestehenden mcp-replicate-hosted hinzufuegen, wenn die richtigen Video-Modelle auf Replicate verfuegbar sind.
  • B — fal.ai als zweiter Provider: Breitestes Video-Modell-Coverage (Sora 2, Veo 3.1, Kling, Hailuo), aber unklarer EU-Datacenter-Status und 1-2 Wochen AVV-Latenz.
  • C — Vertex AI EU fuer Veo direkt: Saubere EU-Compliance, aber neuer GCP-Account + AVV mit Google EU + eigener mcp-veo-hosted ~1-2 Tage.

Entscheidung

Option A — Replicate-Hosted erweitern.

Live-Check der Replicate API am 2026-05-19 (QUERY /v1/models mit Suchbegriffen kling, wan, veo, seedance) bestaetigte: alle vier relevanten Familien sind aktuell und vielfaeltig verfuegbar:

FamilieStand Replicate Mai 2026Default fuer VF
Kling (Kuaishou)v1.6 bis v3.0, mit Audio + Motion-Controlkwaivgi/kling-v2.5-turbo-pro (Default)
Wan (Alibaba)v2.2 bis v2.7 (Pro), I2V + T2V + S2Vwan-video/wan-2.5-i2v-fast (image-to-video)
Veo (Google)veo-3 und veo-3-fast (mit Audio)google/veo-3-fast (wenn Audio Pflicht)
Seedance (ByteDance)v1, v1.5, v2.0, v2.0-fast (mit Audio)bytedance/seedance-2.0-fast (Audio + Multi-Ref)

Nicht verfuegbar auf Replicate: Sora 2 (OpenAI hostet selbst), Veo 3.1 (Google bevorzugt Vertex AI direkt). Beides nicht VF-blockierend — Kling 2.5 Turbo Pro und Veo 3 Fast decken den realistischen Use-Case (Aftermovies, Save-the-Date-Animations, Social-Reels) ab.

Implementierung

Im mcp-replicate-hosted (Phase 2.1):

  • Modell-Whitelist um die vier Slugs oben erweitert (config.py)
  • Neues Layer-Tool create_video(prompt, brand_lock=True, model=..., duration_seconds=5, image_url=None, wait_seconds=None)
  • USE_CASE_DEFAULTS um video, video_with_audio, video_from_image erweitert
  • Tool-Whitelist in main.py um create_video ergaenzt
  • Test test_video_models_whitelisted als Defense-in-Depth

Erweitert das mcp-replicate-hosted-Repo um ein einziges Tool ohne Architektur-Aenderung — Aufwand <1h.

Begruendung

KriteriumReplicate (gewaehlt)fal.aiVertex EU
Modell-Coverage VF-Use-CasesKling/Wan/Veo/Seedance OKbreiter (Sora 2 zusaetzlich)Veo only
AufwandWhitelist + Layer-Tool ~1hneuer mcp-fal-hosted ~2 TageGCP-Setup + mcp-veo-hosted ~1-2 Tage
AVV-Latenzbestehend (fuer Image schon noetig)1-2 Wochenmehrere Wochen GCP-Onboarding
EU-Compliance fuer VFReplicate US-HQ, EU-Edge-Routing — fuer VF B2B-Eventagentur OK weil generische Bild/Video-Material ohne erkennbare Personenunklarer Datacenter-Statussauber (eu-west4)
Cost-MixPay-per-Second, im bestehenden $100/Mo-Capseparater Accountseparate GCP-Billing

Replicate ist die saubere One-Stop-Loesung fuer Image und Video bei VF. fal.ai und Vertex sind nicht ausgeschlossen — siehe Trigger unten.

Was diese Entscheidung NICHT abdeckt

  • Industriekunden (Becker u.a.): DSGVO-Anforderungen schaerfer. Wenn die mal Video-Material brauchen, separater Plan mit Hetzner-Self-Host (Wan 2.6, Veo Open-Weights wenn jemals released) oder Vertex EU.
  • Sora 2-Bedarf: aktuell kein Use-Case bei VF. Wenn Julian/Andre konkret nach Sora-Stil fragen, fal.ai als Sub-Plan aktivieren.
  • Multi-Tenant-Video-Routing: wenn 5+ Kunden Video brauchen, separater Plan mit Tenant-Token-Mapping (analog Multi-Tenant-Replicate-MCP Decision-Fork).

Trigger fuer Re-Evaluation

WannWas zu tun
VF Cost >$200/Mo Replicate-BillsVideo-Whitelist auf nur “fast”-Varianten einschraenken, Premium-Models hinter explicit-model-Param verstecken
Replicate latency oder uptime degradiertfal.ai-Sub-Plan starten (Option B in Plan §2.2)
Industriekunde mit harten DSGVO-Anforderungen will VideoHetzner-Self-Host-Sub-Plan + Modell-Eval Wan 2.6 vs Open-Weight-Alternativen
Google released Veo Open-WeightsPruefen ob Self-Host wirtschaftlich, sonst Vertex EU
Sora 2 API public + EU-AVV verfuegbarfal.ai oder OpenAI-direkt fuer Sora-Stil-Use-Cases

Quellen