Image-/Video-Generation-Provider — Vergleich
Stand 2026-05-18 — live verifiziert via WebSearch + Bedrock-API.
TL;DR — Empfehlung
| Use-Case | Default-Provider | Begruendung |
|---|---|---|
| Standard-Bild-Generierung (Hero, Mockup, Social-Post) | Replicate (im VF-Stack heute) | DSGVO-OK, AVV vorhanden, im Stack drin, FLUX-Pricing kompetitiv |
| High-Volume oder Video | fal.ai als opt-in (nach DSGVO-Klaerung) | 30-50% guenstiger als Replicate, bei Video bis 80%, deutlich schneller |
| EU-strikte Kunden (Industrie, Banking) | Replicate mit EU-Routing | fal.ai’s EU-Datacenter-Status unklar, US-HQ |
| Direct-API ohne Provider-Layer | Black Forest Labs direkt (BFL) | direkter Pricing-Vorteil bei FLUX 1.1 pro und pro, aber weniger Modell-Vielfalt |
Pricing-Vergleich FLUX
| Modell | Replicate | fal.ai | Black Forest direkt |
|---|---|---|---|
| FLUX schnell | $0.003/Bild | $0.003/Bild (gleich) | free tier |
| FLUX dev | $0.025-0.03 (compute-time) | $0.025 (per-image) | n.a. |
| FLUX 1.1 pro | $0.04 | $0.045 (leicht teurer) | $0.04 |
| FLUX pro | $0.055 | $0.05 | $0.04 |
Video: fal.ai 30-80% guenstiger als Replicate (Kling, Hunyuan, Wan etc.)
Speed-Vergleich
| Provider | Cold-Start | FLUX schnell Latency | Inference-Architektur |
|---|---|---|---|
| Replicate | bis 60+ Sekunden | mehrere Sekunden | shared GPU-Pool |
| fal.ai | sub-second | <1 Sekunde | proprietary Inference-Engine |
Fuer interaktive Chat-UX (z.B. Open WebUI Visualisierungen, Mockup-Generierung im Chat) ist der Latency-Unterschied spuerbar.
Pricing-Modell
- Replicate: compute-time-basiert ($/Sekunde GPU). Schwer vorhersagbar, gut bei wenig Volumen
- fal.ai: per-image oder per-megapixel. Vorhersagbar, einfacher Kunden-Weiterberechnung
- Bedrock-EU: per-Token (Nova) oder per-Image (Stability), aber nur in us-region verfuegbar — fuer EU-Kunden nicht praktikabel
Bedrock-EU-Status (Stand 2026-05-18 live verifiziert)
aws bedrock list-foundation-models --region eu-central-1 \
--by-output-modality IMAGE → []
aws bedrock list-foundation-models --region eu-central-1 \
--by-output-modality VIDEO → []
Bedrock eu-central-1 hat heute null Image-Gen und null Video-Gen. Nur Embedding-Modelle, kein Output-Generieren.
Was es in eu-central-1 gibt das wie Image/Video aussieht (aber Input ist, nicht Output):
- TwelveLabs Pegasus v1.2 — Video-VERSTEHEN, nicht generieren
- Mistral Pixtral Large — Bild-VERSTEHEN (Vision-Input), nicht generieren
- Titan-Embed-Image — Image-Embeddings fuer Vektor-Suche
US-Region (us-east-1) hat Nova Canvas, Stable Image Ultra, Stable Diffusion XL, Nova Reel, Luma Ray etc. — aber bricht das EU-Versprechen.
Die alte ADR bedrock-eu-image-gen-limitation gilt weiter (2026-05-12 → re-verifiziert 2026-05-18).
DSGVO-Status
| Provider | EU-Datacenter | AVV verfuegbar | Quelle / Verifikation |
|---|---|---|---|
| Replicate | Edge-Routing inkl. EU | Ja (Pro-Tier) | aktive AVV in VF-Setup |
| fal.ai | unklar | unklar | Trust-Center existiert (trust.fal.ai), keine oeffentliche EU-Datacenter-Aussage |
| Black Forest Labs | EU (DE-Standort) | Ja | BFL ist deutsches Unternehmen |
| Bedrock-EU | eu-central-1 | Ja (AWS DPA) | Standard AWS-Compliance |
Vor jedem Wechsel auf fal.ai bei DSGVO-strikten Kunden: Enterprise-Sales anschreiben, EU-Datacenter + AVV bestaetigen lassen.
Wann welcher Provider — Entscheidungs-Baum
1. Kunde DSGVO-strict (Industrie, Banking, Public-Sector)?
ja → Replicate (Default) oder BFL direkt fuer FLUX-only
nein → weiter
2. Hauptsaechlich Video oder >500 Bilder/Monat?
ja → fal.ai (nach DSGVO-Check)
nein → Replicate (im VF-Stack)
3. Latenz < 2 Sekunden zwingend (Chat-UX, Live-Mockup)?
ja → fal.ai (sub-second)
nein → Replicate reicht
4. Nur FLUX-Familie, kein anderer Modell-Bedarf?
ja → BFL direkt (guenstigster Preis bei FLUX 1.1 pro und pro)
nein → Replicate (breiteres Sortiment)
Hybrid-Pattern fuer Multi-Tenant
Wenn VF + Folgekunden beide Provider nutzen sollen (z.B. VF nur Replicate, Industriekunde mit speed-critical Workflows auch fal.ai):
mcp-replicatebleibt im Standard-Stackmcp-falals zweiter MCP bauen (analog Pattern, ~1-2 Tage da fertig)- Pro Tenant via Config entscheiden welche MCPs angedockt werden
- Routing-Regel im System-Prompt: „fuer Video → fal.ai (wenn verfuegbar), sonst Replicate”
Bau-Aufwand mcp-fal.ai (Falls Bedarf)
Eigenbau analog mcp-replicate. Pattern fertig in ~/source/mcps/mcp-replicate/. Geschaetzt:
- Tools (~30 fuer alle fal-Modelle): 1 Tag
- Authentifizierung + Error-Handling: 0.5 Tag
- Tests + Vault-Doku: 0.5 Tag
- Gesamt: ~2 Tage
Cross-Refs
- bedrock-eu-image-gen-limitation — Bedrock-EU-Limitation (re-verifiziert 2026-05-18)
- replicate — Replicate-MCP (heute aktiv im VF-Stack)
- open-webui-vf — Open WebUI VF + Replicate-Anbindung
- produkt-bundle — Standard-Stack-Capabilities
Sources
- WebSearch 2026-05-18 — pricepertoken.com Image Pricing 2026, TeamDay.ai Replicate vs fal.ai, ModelsLab API Vergleich
- Bedrock-API live (
aws bedrock list-foundation-models --by-output-modality IMAGE --region eu-central-1) - fal.ai Trust Center (trust.fal.ai)
Update 2026-05-19 — State-of-the-Art Nov 2026 + Open-WebUI-Native-Limit
Marvin hat fuer VF-Pilot eine Tieferrecherche gemacht (Web-Search + OWUI-API-Live-Check):
Image-Gen Tier S (Stand Nov 2026)
| Modell | Anbieter | Pricing | Staerken |
|---|---|---|---|
| Nano Banana Pro / Gemini 3 Image | Google (Vertex EU verfuegbar) | 0.24/4K, halbiert mit Batch | Best-in-Class fuer Marketing-Designs mit Text + Logo, 14 Ref-Images, Thinking-Mode + Google-Search-Grounding |
| Flux 2 Pro / Max / Klein | Black Forest Labs (Berlin, DE — DSGVO clean direkt) | Max 0.03/MP, Klein $0.014/Bild Open-Weights | EU-Anbieter, JSON-Prompts, 8 Ref-Images, color_palette-Feld |
| Seedream 4.5 | ByteDance | $0.018-0.03/Bild | Volumen-Preisbrecher, Generate+Edit unified — aber China-DPA, fuer Kundenmaterial kritisch |
Video-Gen Tier S (Stand Nov 2026)
| Modell | Anbieter | Pricing | Staerken |
|---|---|---|---|
| Sora 2 / Sora 2 Pro | OpenAI | 0.30-0.50/s (Pro) | Bis 25s, synchroner Audio nativ (Dialog+SFX+Musik), Storytelling-Champion |
| Veo 3.1 / Fast / Lite | Google (Vertex EU) | Lite 0.15/s, Standard $0.40/s | Native 4K, synchroner Audio, broadcast-tauglich |
| Kling 2.5/2.6 Pro / 3.0 | Kuaishou (China-DPA) | 0.14/s mit | Clips bis 3 min nativ, beste Hand-Darstellung |
Open-WebUI 0.9.5 — Native Image-Gen-Limitation
Critical insight (2026-05-19): OWUI 0.9.5 supportet als IMAGE_GENERATION_ENGINE nur:
openai(GPT-image-1)gemini(Nano Banana via Google AI Studio)automatic1111(Self-Host)comfyui(Self-Host)
Replicate, fal.ai, BFL direct sind keine nativen Provider. Bei VF-Setup heisst das: Image-Gen via MCP-Tool-Use statt Native-Single-Click-UI. Workaround-Pattern: das LLM ruft replicate_create_prediction Tool, kriegt URL zurueck, rendert als Markdown-Image im Chat. Slightly mehr Token-Round-Trip, aber bessere Modell-Auswahl pro Use-Case.
→ Wenn ein VF-aehnlicher Kunde Single-Click-Image-Gen-UX zwingend braucht: Gemini-Native aktivieren (Google AI Studio Key + AVV mit Google), Nano Banana 2 als Default. Sonst MCP-Pfad.
Aktualisierter Entscheidungs-Baum
1. Open-WebUI-Pilot mit minimaler Provider-Liste + Single-Click-UX gewuenscht?
ja → Gemini Native (Nano Banana 2, $0.08/Bild) — neuer Subprozessor noetig
nein → MCP-Tool-Use, Multi-Provider-Whitelist (Replicate Standard)
2. Brand-Asset mit Text + Logo (Speaker-Cards, Posters)?
ja → Nano Banana Pro (Vertex EU wenn DSGVO) ODER Ideogram V3 Quality (via Replicate)
nein → Flux 2 Pro fuer Foto-real, Recraft V4 SVG fuer Vektor
3. Video < 8s, mit Voiceover?
ja → Veo 3.1 Fast (Vertex EU, $0.15/s)
nein bei laenger / Storytelling → Sora 2 Pro
4. DSGVO-strikt (Industriekunde, NDA-Material)?
ja → BFL direct (EU) + Vertex AI EU. Hetzner-Self-Host Flux 2 Klein + Wan 2.6 als dritte Stufe.
nein → Replicate + fal.ai-Opt-in
MCP-Hosted-Pattern fuer mehrere Provider
Wenn 2-3 Kunden Image-Gen brauchen + Multi-Provider sinnvoll wird:
mcp-replicate-hostedbaut auf (in Phase 2 VF-Pilot, siehe sprint-2-replicate-hosted)mcp-fal-hostedals zweiter MCP (nach AVV-Klaerung mit fal.ai Enterprise-Sales) — ~2 Tage Bau analogmcp-veo-hostedfuer Vertex AI EU direkt (Video, DSGVO clean) — ~1-2 Tage Bau- Pro Tenant via Config entscheiden welche MCPs angedockt werden
Cross-Refs zum Update
- native-image-gen-provider—stand-owui-095 — Provider-Tabelle in OWUI-Quirks
- smoke-test-via-bedrock-cli-direkt-besser-als-owui-frontend — Smoke-Pattern wenn Native-Frontend fehlt
- _index — Verifikation
- 2026-05-19-design-stack-julian — Master-Plan
- models — Replicate-Modell-Katalog mit Preisen + API-Patterns