Image-/Video-Generation-Provider — Vergleich

Stand 2026-05-18 — live verifiziert via WebSearch + Bedrock-API.

TL;DR — Empfehlung

Use-CaseDefault-ProviderBegruendung
Standard-Bild-Generierung (Hero, Mockup, Social-Post)Replicate (im VF-Stack heute)DSGVO-OK, AVV vorhanden, im Stack drin, FLUX-Pricing kompetitiv
High-Volume oder Videofal.ai als opt-in (nach DSGVO-Klaerung)30-50% guenstiger als Replicate, bei Video bis 80%, deutlich schneller
EU-strikte Kunden (Industrie, Banking)Replicate mit EU-Routingfal.ai’s EU-Datacenter-Status unklar, US-HQ
Direct-API ohne Provider-LayerBlack Forest Labs direkt (BFL)direkter Pricing-Vorteil bei FLUX 1.1 pro und pro, aber weniger Modell-Vielfalt

Pricing-Vergleich FLUX

ModellReplicatefal.aiBlack Forest direkt
FLUX schnell$0.003/Bild$0.003/Bild (gleich)free tier
FLUX dev$0.025-0.03 (compute-time)$0.025 (per-image)n.a.
FLUX 1.1 pro$0.04$0.045 (leicht teurer)$0.04
FLUX pro$0.055$0.05$0.04

Video: fal.ai 30-80% guenstiger als Replicate (Kling, Hunyuan, Wan etc.)

Speed-Vergleich

ProviderCold-StartFLUX schnell LatencyInference-Architektur
Replicatebis 60+ Sekundenmehrere Sekundenshared GPU-Pool
fal.aisub-second<1 Sekundeproprietary Inference-Engine

Fuer interaktive Chat-UX (z.B. Open WebUI Visualisierungen, Mockup-Generierung im Chat) ist der Latency-Unterschied spuerbar.

Pricing-Modell

  • Replicate: compute-time-basiert ($/Sekunde GPU). Schwer vorhersagbar, gut bei wenig Volumen
  • fal.ai: per-image oder per-megapixel. Vorhersagbar, einfacher Kunden-Weiterberechnung
  • Bedrock-EU: per-Token (Nova) oder per-Image (Stability), aber nur in us-region verfuegbar — fuer EU-Kunden nicht praktikabel

Bedrock-EU-Status (Stand 2026-05-18 live verifiziert)

aws bedrock list-foundation-models --region eu-central-1 \
  --by-output-modality IMAGE → []
aws bedrock list-foundation-models --region eu-central-1 \
  --by-output-modality VIDEO → []

Bedrock eu-central-1 hat heute null Image-Gen und null Video-Gen. Nur Embedding-Modelle, kein Output-Generieren.

Was es in eu-central-1 gibt das wie Image/Video aussieht (aber Input ist, nicht Output):

  • TwelveLabs Pegasus v1.2 — Video-VERSTEHEN, nicht generieren
  • Mistral Pixtral Large — Bild-VERSTEHEN (Vision-Input), nicht generieren
  • Titan-Embed-Image — Image-Embeddings fuer Vektor-Suche

US-Region (us-east-1) hat Nova Canvas, Stable Image Ultra, Stable Diffusion XL, Nova Reel, Luma Ray etc. — aber bricht das EU-Versprechen.

Die alte ADR bedrock-eu-image-gen-limitation gilt weiter (2026-05-12 → re-verifiziert 2026-05-18).

DSGVO-Status

ProviderEU-DatacenterAVV verfuegbarQuelle / Verifikation
ReplicateEdge-Routing inkl. EUJa (Pro-Tier)aktive AVV in VF-Setup
fal.aiunklarunklarTrust-Center existiert (trust.fal.ai), keine oeffentliche EU-Datacenter-Aussage
Black Forest LabsEU (DE-Standort)JaBFL ist deutsches Unternehmen
Bedrock-EUeu-central-1Ja (AWS DPA)Standard AWS-Compliance

Vor jedem Wechsel auf fal.ai bei DSGVO-strikten Kunden: Enterprise-Sales anschreiben, EU-Datacenter + AVV bestaetigen lassen.

Wann welcher Provider — Entscheidungs-Baum

1. Kunde DSGVO-strict (Industrie, Banking, Public-Sector)?
   ja → Replicate (Default) oder BFL direkt fuer FLUX-only
   nein → weiter

2. Hauptsaechlich Video oder >500 Bilder/Monat?
   ja → fal.ai (nach DSGVO-Check)
   nein → Replicate (im VF-Stack)

3. Latenz < 2 Sekunden zwingend (Chat-UX, Live-Mockup)?
   ja → fal.ai (sub-second)
   nein → Replicate reicht

4. Nur FLUX-Familie, kein anderer Modell-Bedarf?
   ja → BFL direkt (guenstigster Preis bei FLUX 1.1 pro und pro)
   nein → Replicate (breiteres Sortiment)

Hybrid-Pattern fuer Multi-Tenant

Wenn VF + Folgekunden beide Provider nutzen sollen (z.B. VF nur Replicate, Industriekunde mit speed-critical Workflows auch fal.ai):

  • mcp-replicate bleibt im Standard-Stack
  • mcp-fal als zweiter MCP bauen (analog Pattern, ~1-2 Tage da fertig)
  • Pro Tenant via Config entscheiden welche MCPs angedockt werden
  • Routing-Regel im System-Prompt: „fuer Video → fal.ai (wenn verfuegbar), sonst Replicate”

Bau-Aufwand mcp-fal.ai (Falls Bedarf)

Eigenbau analog mcp-replicate. Pattern fertig in ~/source/mcps/mcp-replicate/. Geschaetzt:

  • Tools (~30 fuer alle fal-Modelle): 1 Tag
  • Authentifizierung + Error-Handling: 0.5 Tag
  • Tests + Vault-Doku: 0.5 Tag
  • Gesamt: ~2 Tage

Cross-Refs

Sources

  • WebSearch 2026-05-18 — pricepertoken.com Image Pricing 2026, TeamDay.ai Replicate vs fal.ai, ModelsLab API Vergleich
  • Bedrock-API live (aws bedrock list-foundation-models --by-output-modality IMAGE --region eu-central-1)
  • fal.ai Trust Center (trust.fal.ai)

Update 2026-05-19 — State-of-the-Art Nov 2026 + Open-WebUI-Native-Limit

Marvin hat fuer VF-Pilot eine Tieferrecherche gemacht (Web-Search + OWUI-API-Live-Check):

Image-Gen Tier S (Stand Nov 2026)

ModellAnbieterPricingStaerken
Nano Banana Pro / Gemini 3 ImageGoogle (Vertex EU verfuegbar)0.24/4K, halbiert mit BatchBest-in-Class fuer Marketing-Designs mit Text + Logo, 14 Ref-Images, Thinking-Mode + Google-Search-Grounding
Flux 2 Pro / Max / KleinBlack Forest Labs (Berlin, DE — DSGVO clean direkt)Max 0.03/MP, Klein $0.014/Bild Open-WeightsEU-Anbieter, JSON-Prompts, 8 Ref-Images, color_palette-Feld
Seedream 4.5ByteDance$0.018-0.03/BildVolumen-Preisbrecher, Generate+Edit unified — aber China-DPA, fuer Kundenmaterial kritisch

Video-Gen Tier S (Stand Nov 2026)

ModellAnbieterPricingStaerken
Sora 2 / Sora 2 ProOpenAI0.30-0.50/s (Pro)Bis 25s, synchroner Audio nativ (Dialog+SFX+Musik), Storytelling-Champion
Veo 3.1 / Fast / LiteGoogle (Vertex EU)Lite 0.15/s, Standard $0.40/sNative 4K, synchroner Audio, broadcast-tauglich
Kling 2.5/2.6 Pro / 3.0Kuaishou (China-DPA)0.14/s mitClips bis 3 min nativ, beste Hand-Darstellung

Open-WebUI 0.9.5 — Native Image-Gen-Limitation

Critical insight (2026-05-19): OWUI 0.9.5 supportet als IMAGE_GENERATION_ENGINE nur:

  • openai (GPT-image-1)
  • gemini (Nano Banana via Google AI Studio)
  • automatic1111 (Self-Host)
  • comfyui (Self-Host)

Replicate, fal.ai, BFL direct sind keine nativen Provider. Bei VF-Setup heisst das: Image-Gen via MCP-Tool-Use statt Native-Single-Click-UI. Workaround-Pattern: das LLM ruft replicate_create_prediction Tool, kriegt URL zurueck, rendert als Markdown-Image im Chat. Slightly mehr Token-Round-Trip, aber bessere Modell-Auswahl pro Use-Case.

→ Wenn ein VF-aehnlicher Kunde Single-Click-Image-Gen-UX zwingend braucht: Gemini-Native aktivieren (Google AI Studio Key + AVV mit Google), Nano Banana 2 als Default. Sonst MCP-Pfad.

Aktualisierter Entscheidungs-Baum

1. Open-WebUI-Pilot mit minimaler Provider-Liste + Single-Click-UX gewuenscht?
   ja → Gemini Native (Nano Banana 2, $0.08/Bild) — neuer Subprozessor noetig
   nein → MCP-Tool-Use, Multi-Provider-Whitelist (Replicate Standard)

2. Brand-Asset mit Text + Logo (Speaker-Cards, Posters)?
   ja → Nano Banana Pro (Vertex EU wenn DSGVO) ODER Ideogram V3 Quality (via Replicate)
   nein → Flux 2 Pro fuer Foto-real, Recraft V4 SVG fuer Vektor

3. Video < 8s, mit Voiceover?
   ja → Veo 3.1 Fast (Vertex EU, $0.15/s)
   nein bei laenger / Storytelling → Sora 2 Pro

4. DSGVO-strikt (Industriekunde, NDA-Material)?
   ja → BFL direct (EU) + Vertex AI EU. Hetzner-Self-Host Flux 2 Klein + Wan 2.6 als dritte Stufe.
   nein → Replicate + fal.ai-Opt-in

MCP-Hosted-Pattern fuer mehrere Provider

Wenn 2-3 Kunden Image-Gen brauchen + Multi-Provider sinnvoll wird:

  • mcp-replicate-hosted baut auf (in Phase 2 VF-Pilot, siehe sprint-2-replicate-hosted)
  • mcp-fal-hosted als zweiter MCP (nach AVV-Klaerung mit fal.ai Enterprise-Sales) — ~2 Tage Bau analog
  • mcp-veo-hosted fuer Vertex AI EU direkt (Video, DSGVO clean) — ~1-2 Tage Bau
  • Pro Tenant via Config entscheiden welche MCPs angedockt werden

Cross-Refs zum Update