Re-Verifikation 2026-05-18: API-Check zeigt unveraenderten Stand — aws bedrock list-foundation-models --region eu-central-1 --by-output-modality IMAGE gibt leere Liste. --by-output-modality VIDEO gleiches Bild. Entscheidung gilt weiter. Detail-Vergleich Replicate vs fal.ai vs BFL siehe image-gen-provider-vergleich.

Bedrock-EU hat keine Image-Generation-Models — Image-Gen via Replicate-MCP

Kontext

Bei der Planung des Open WebUI-Setups fuer Vibe Factory (Multi-User-Chat mit Bedrock EU als LLM-Backend) kam die Anforderung „Image-Generation” auf. Naheliegende Annahme: Bedrock kann das.

Realitaets-Check (2026-05-12, live verifiziert)

aws bedrock list-foundation-models --profile av-production --region eu-central-1 \
  --query 'modelSummaries[?contains(outputModalities, `IMAGE`)].modelId'

Ergebnis: nur Embedding-Models (amazon.titan-embed-image-v1, amazon.titan-embed-image-v1:0) — keine Generation-Models.

Vergleich us-east-1: Stability AI hat dort 13+ Image-Models verfuegbar (Stable Image Ultra, Stable Diffusion XL, Stable Outpaint, etc.) plus Amazon Nova Canvas und Titan Image Generator. Diese Models existieren in eu-central-1 NICHT.

Konsequenz fuer DSGVO-Kunden

Wer „alles in EU” verspricht (was wir bei VF tun), kann kein Bedrock-natives Image-Gen anbieten. Die Optionen:

OptionBewertung
A — Bedrock us-region nutzenBricht das EU-Versprechen. Erfordert DPIA, Datenminimierung, CMK in us-Region. Compliance-Aufwand hoch, nicht empfehlenswert
B — Image-Gen-API ueber MCP (Replicate, Stability-direct, etc.)Sauber. API-Provider hat eigene globale Edge incl. EU. AVV mit dem API-Provider zusaetzlich, aber Datenfluss klar abgegrenzt vom LLM-Hop
C — Self-hosted Image-Model auf AWS (Stable Diffusion auf EC2 mit GPU)Teuer (g5.xlarge ~$1/h), Operations-Aufwand, nicht-empfehlenswert ausser dedicated Kunde mit Volume
D — Image-Gen weglassenwenn der Kunde es nicht braucht, sauberste Loesung

Entscheidung

Option B: Image-Gen via MCP — konkret ueber mcp-replicate (haben wir schon als active MCP). Replicate hat globale Edge (Cloudflare-Workers), AVV ist standard verfuegbar, das gesamte Model-Universum (Flux, SDXL, Imagen 3, Ideogram, Recraft) zugaenglich, neue Models innerhalb von Tagen nach Release verfuegbar.

Fuer Production-Setups (z.B. hosted fuer Kunden wie VF): mcp-replicate als zweiter hosted MCP analog mcp-vf-hosted deployen — eigene Domain, eigene Scalekit-Resource, gleiches Tunnel-Pattern. Plan: sprint-2-replicate-hosted.

Im Chat-UI (Open WebUI) sieht das so aus:

  • User tippt „erstelle ein Bild von X”
  • LLM (Claude via Bedrock) sieht das replicate_create_prediction(model="flux-1.1-pro")-Tool aus dem MCP
  • LLM ruft das Tool mit dem Prompt-Text
  • Replicate-API generiert das Bild, URL kommt zurueck
  • Open WebUI rendert das Bild inline im Chat

Konsequenzen

  • Subprozessor-Liste bei Kunden mit Image-Gen muss um Replicate Inc. erweitert werden (AVV einholen)
  • Cost-Pass-Through: Replicate-API-Kosten gehen 1:1 an Kunden (typische Image-Gen-Cost: $0.003-0.04 pro Bild je nach Model)
  • Pattern-File open-webui-fargate-bedrock referenziert dieses Doc + Replicate-MCP als Standard-Loesung
  • Video-Gen analog ueber mcp-runway wenn benoetigt

Was zu beobachten (Re-Check-Trigger)

  • AWS announce neue Bedrock-Models in Frankfurt-Region — pruefen mit aws bedrock list-foundation-models
  • EU Sovereign Cloud (eusc-de-east-1) bekommt Image-Models — pruefen halbjaehrlich
  • Stability AI / andere bieten dedicated EU-API mit AVV — Marktscan jedes Quartal

Bei einer dieser Aenderungen: Pattern-File + diesen Eintrag revidieren, ggf. Replicate als Default ablossen.

Quellen