Image-/Video-Generation-Provider — Vergleich

Stand 2026-05-18 — live verifiziert via WebSearch + Bedrock-API.

TL;DR — Empfehlung

Use-Case	Default-Provider	Begruendung
Standard-Bild-Generierung (Hero, Mockup, Social-Post)	Replicate (im VF-Stack heute)	DSGVO-OK, AVV vorhanden, im Stack drin, FLUX-Pricing kompetitiv
High-Volume oder Video	fal.ai als opt-in (nach DSGVO-Klaerung)	30-50% guenstiger als Replicate, bei Video bis 80%, deutlich schneller
EU-strikte Kunden (Industrie, Banking)	Replicate mit EU-Routing	fal.ai’s EU-Datacenter-Status unklar, US-HQ
Direct-API ohne Provider-Layer	Black Forest Labs direkt (BFL)	direkter Pricing-Vorteil bei FLUX 1.1 pro und pro, aber weniger Modell-Vielfalt

Pricing-Vergleich FLUX

Modell	Replicate	fal.ai	Black Forest direkt
FLUX schnell	$0.003/Bild	$0.003/Bild (gleich)	free tier
FLUX dev	$0.025-0.03 (compute-time)	$0.025 (per-image)	n.a.
FLUX 1.1 pro	$0.04	$0.045 (leicht teurer)	$0.04
FLUX pro	$0.055	$0.05	$0.04

Video: fal.ai 30-80% guenstiger als Replicate (Kling, Hunyuan, Wan etc.)

Speed-Vergleich

Provider	Cold-Start	FLUX schnell Latency	Inference-Architektur
Replicate	bis 60+ Sekunden	mehrere Sekunden	shared GPU-Pool
fal.ai	sub-second	<1 Sekunde	proprietary Inference-Engine

Fuer interaktive Chat-UX (z.B. Open WebUI Visualisierungen, Mockup-Generierung im Chat) ist der Latency-Unterschied spuerbar.

Pricing-Modell

Replicate: compute-time-basiert ($/Sekunde GPU). Schwer vorhersagbar, gut bei wenig Volumen
fal.ai: per-image oder per-megapixel. Vorhersagbar, einfacher Kunden-Weiterberechnung
Bedrock-EU: per-Token (Nova) oder per-Image (Stability), aber nur in us-region verfuegbar — fuer EU-Kunden nicht praktikabel

Bedrock-EU-Status (Stand 2026-05-18 live verifiziert)

aws bedrock list-foundation-models --region eu-central-1 \
  --by-output-modality IMAGE → []
aws bedrock list-foundation-models --region eu-central-1 \
  --by-output-modality VIDEO → []

Bedrock eu-central-1 hat heute null Image-Gen und null Video-Gen. Nur Embedding-Modelle, kein Output-Generieren.

Was es in eu-central-1 gibt das wie Image/Video aussieht (aber Input ist, nicht Output):

TwelveLabs Pegasus v1.2 — Video-VERSTEHEN, nicht generieren
Mistral Pixtral Large — Bild-VERSTEHEN (Vision-Input), nicht generieren
Titan-Embed-Image — Image-Embeddings fuer Vektor-Suche

US-Region (us-east-1) hat Nova Canvas, Stable Image Ultra, Stable Diffusion XL, Nova Reel, Luma Ray etc. — aber bricht das EU-Versprechen.

Die alte ADR bedrock-eu-image-gen-limitation gilt weiter (2026-05-12 → re-verifiziert 2026-05-18).

DSGVO-Status

Provider	EU-Datacenter	AVV verfuegbar	Quelle / Verifikation
Replicate	Edge-Routing inkl. EU	Ja (Pro-Tier)	aktive AVV in VF-Setup
fal.ai	unklar	unklar	Trust-Center existiert (trust.fal.ai), keine oeffentliche EU-Datacenter-Aussage
Black Forest Labs	EU (DE-Standort)	Ja	BFL ist deutsches Unternehmen
Bedrock-EU	eu-central-1	Ja (AWS DPA)	Standard AWS-Compliance

Vor jedem Wechsel auf fal.ai bei DSGVO-strikten Kunden: Enterprise-Sales anschreiben, EU-Datacenter + AVV bestaetigen lassen.

Wann welcher Provider — Entscheidungs-Baum

1. Kunde DSGVO-strict (Industrie, Banking, Public-Sector)?
   ja → Replicate (Default) oder BFL direkt fuer FLUX-only
   nein → weiter

2. Hauptsaechlich Video oder >500 Bilder/Monat?
   ja → fal.ai (nach DSGVO-Check)
   nein → Replicate (im VF-Stack)

3. Latenz < 2 Sekunden zwingend (Chat-UX, Live-Mockup)?
   ja → fal.ai (sub-second)
   nein → Replicate reicht

4. Nur FLUX-Familie, kein anderer Modell-Bedarf?
   ja → BFL direkt (guenstigster Preis bei FLUX 1.1 pro und pro)
   nein → Replicate (breiteres Sortiment)

Hybrid-Pattern fuer Multi-Tenant

Wenn VF + Folgekunden beide Provider nutzen sollen (z.B. VF nur Replicate, Industriekunde mit speed-critical Workflows auch fal.ai):

mcp-replicate bleibt im Standard-Stack
mcp-fal als zweiter MCP bauen (analog Pattern, ~1-2 Tage da fertig)
Pro Tenant via Config entscheiden welche MCPs angedockt werden
Routing-Regel im System-Prompt: „fuer Video → fal.ai (wenn verfuegbar), sonst Replicate”

Bau-Aufwand mcp-fal.ai (Falls Bedarf)

Eigenbau analog mcp-replicate. Pattern fertig in ~/source/mcps/mcp-replicate/. Geschaetzt:

Tools (~30 fuer alle fal-Modelle): 1 Tag
Authentifizierung + Error-Handling: 0.5 Tag
Tests + Vault-Doku: 0.5 Tag
Gesamt: ~2 Tage

Cross-Refs

bedrock-eu-image-gen-limitation — Bedrock-EU-Limitation (re-verifiziert 2026-05-18)
replicate — Replicate-MCP (heute aktiv im VF-Stack)
open-webui-vf — Open WebUI VF + Replicate-Anbindung
produkt-bundle — Standard-Stack-Capabilities

Sources

WebSearch 2026-05-18 — pricepertoken.com Image Pricing 2026, TeamDay.ai Replicate vs fal.ai, ModelsLab API Vergleich
Bedrock-API live (aws bedrock list-foundation-models --by-output-modality IMAGE --region eu-central-1)
fal.ai Trust Center (trust.fal.ai)

Update 2026-05-19 — State-of-the-Art Nov 2026 + Open-WebUI-Native-Limit

Marvin hat fuer VF-Pilot eine Tieferrecherche gemacht (Web-Search + OWUI-API-Live-Check):

Image-Gen Tier S (Stand Nov 2026)

Modell	Anbieter	Pricing	Staerken
Nano Banana Pro / Gemini 3 Image	Google (Vertex EU verfuegbar)	$0.134/1 K - 2 K,$ 0.24/4K, halbiert mit Batch	Best-in-Class fuer Marketing-Designs mit Text + Logo, 14 Ref-Images, Thinking-Mode + Google-Search-Grounding
Flux 2 Pro / Max / Klein	Black Forest Labs (Berlin, DE — DSGVO clean direkt)	Max $0.07/ MP, P ro$ 0.03/MP, Klein $0.014/Bild Open-Weights	EU-Anbieter, JSON-Prompts, 8 Ref-Images, color_palette-Feld
Seedream 4.5	ByteDance	$0.018-0.03/Bild	Volumen-Preisbrecher, Generate+Edit unified — aber China-DPA, fuer Kundenmaterial kritisch

Video-Gen Tier S (Stand Nov 2026)

Modell	Anbieter	Pricing	Staerken
Sora 2 / Sora 2 Pro	OpenAI	$0.10/ s 720 p (S or a 2),$ 0.30-0.50/s (Pro)	Bis 25s, synchroner Audio nativ (Dialog+SFX+Musik), Storytelling-Champion
Veo 3.1 / Fast / Lite	Google (Vertex EU)	Lite $0.05/ s, F a s t$ 0.15/s, Standard $0.40/s	Native 4K, synchroner Audio, broadcast-tauglich
Kling 2.5/2.6 Pro / 3.0	Kuaishou (China-DPA)	$0.07/ so hn e A u d i o,$ 0.14/s mit	Clips bis 3 min nativ, beste Hand-Darstellung

Open-WebUI 0.9.5 — Native Image-Gen-Limitation

Critical insight (2026-05-19): OWUI 0.9.5 supportet als IMAGE_GENERATION_ENGINE nur:

openai (GPT-image-1)
gemini (Nano Banana via Google AI Studio)
automatic1111 (Self-Host)
comfyui (Self-Host)

Replicate, fal.ai, BFL direct sind keine nativen Provider. Bei VF-Setup heisst das: Image-Gen via MCP-Tool-Use statt Native-Single-Click-UI. Workaround-Pattern: das LLM ruft replicate_create_prediction Tool, kriegt URL zurueck, rendert als Markdown-Image im Chat. Slightly mehr Token-Round-Trip, aber bessere Modell-Auswahl pro Use-Case.

→ Wenn ein VF-aehnlicher Kunde Single-Click-Image-Gen-UX zwingend braucht: Gemini-Native aktivieren (Google AI Studio Key + AVV mit Google), Nano Banana 2 als Default. Sonst MCP-Pfad.

Aktualisierter Entscheidungs-Baum

1. Open-WebUI-Pilot mit minimaler Provider-Liste + Single-Click-UX gewuenscht?
   ja → Gemini Native (Nano Banana 2, $0.08/Bild) — neuer Subprozessor noetig
   nein → MCP-Tool-Use, Multi-Provider-Whitelist (Replicate Standard)

2. Brand-Asset mit Text + Logo (Speaker-Cards, Posters)?
   ja → Nano Banana Pro (Vertex EU wenn DSGVO) ODER Ideogram V3 Quality (via Replicate)
   nein → Flux 2 Pro fuer Foto-real, Recraft V4 SVG fuer Vektor

3. Video < 8s, mit Voiceover?
   ja → Veo 3.1 Fast (Vertex EU, $0.15/s)
   nein bei laenger / Storytelling → Sora 2 Pro

4. DSGVO-strikt (Industriekunde, NDA-Material)?
   ja → BFL direct (EU) + Vertex AI EU. Hetzner-Self-Host Flux 2 Klein + Wan 2.6 als dritte Stufe.
   nein → Replicate + fal.ai-Opt-in

MCP-Hosted-Pattern fuer mehrere Provider

Wenn 2-3 Kunden Image-Gen brauchen + Multi-Provider sinnvoll wird:

mcp-replicate-hosted baut auf (in Phase 2 VF-Pilot, siehe sprint-2-replicate-hosted)
mcp-fal-hosted als zweiter MCP (nach AVV-Klaerung mit fal.ai Enterprise-Sales) — ~2 Tage Bau analog
mcp-veo-hosted fuer Vertex AI EU direkt (Video, DSGVO clean) — ~1-2 Tage Bau
Pro Tenant via Config entscheiden welche MCPs angedockt werden

Cross-Refs zum Update

native-image-gen-provider—stand-owui-095 — Provider-Tabelle in OWUI-Quirks
smoke-test-via-bedrock-cli-direkt-besser-als-owui-frontend — Smoke-Pattern wenn Native-Frontend fehlt
_index — Verifikation
2026-05-19-design-stack-julian — Master-Plan
models — Replicate-Modell-Katalog mit Preisen + API-Patterns

Agentic Ventures Wiki

Explorer

Image- und Video-Generation-Provider — Vergleich Replicate vs fal.ai vs Bedrock-EU