Video-Editing-Pipeline

Wiederverwendbare Pipeline fuer Marketing- und VLOG-Videos. Komplett lokal, kein Cloud-Render. Ergebnis: aus einem Roh-Cut (15-30 Min Sprache) wird in unter einer Stunde ein veroeffentlichungsreifes Video mit B-Roll, Captions, Music-Bed.

Pipeline (6 Phasen)

Roh-Recording (.mov/.mp3)
   ↓ audio-enhance MCP (ClearerVoice — Denoising, Normalization)
Verbessertes Audio
   ↓ whisper MCP (WhisperX — Word-Level-Transkript inkl. Timing)
Transkript mit Word-Timing
   ↓ auto-editor MCP (Silence-Removal mit Threshold)
Cut-Liste (was wird geschnitten)
   ↓ remotion-broll MCP (B-Roll-Compositions rendern)
B-Roll-Sequenzen als Einzel-MP4s
   ↓ ffmpeg MCP (Final Assembly + Captions overlay)
Veroeffentlichungs-Video

Code-Lokation (Stand 2026-05-09)

Aktuell alles in /Users/marvinkuehlmann/source/remotion/. Vorschlag fuer Phase B (Service-Modell-Skalierung):

  • Templates + Konfiguration → neuer Repo marketing-tooling (sauber gestreckt, multi-projekt-faehig)
  • Output-Files (output/*.mp4) → projekt-spezifisch in assets/ oder direkt zu YouTube-Upload-Workflow
  • Vault-Pointer in _index sobald umgezogen

Wiederverwendbare B-Roll-Templates

20+ React/Remotion-Compositions, alle TypeScript, alle thematisch:

TemplateZweck
CodeBlockCode-Snippet mit Syntax-Highlighting, animiertes Scrollen
TerminalTerminal-Aufnahme mit Tippe-Animation
TitleCardIntro-/Section-Title mit Brand-Farben
CaptionsWord-Level-Captions (TikTok-Style, Karaoke-Synced)
MetricAnimierte Zahl, z.B. „+50% Effizienz”
ComparisonSide-by-Side Before/After
ArchitectureAnimierte Architektur-Diagramme
BulletListGestaffelte Bullet-Points
(12+ weitere)siehe mcp-servers/remotion-broll/src/compositions/

Alle Templates nutzen die Brand-Farb-Palette aus pipeline/config.yaml (One-Dark-Theme + Brand-Akzente). Style ist in einer YAML editierbar, kein Code-Edit pro Video noetig.

Konfiguration

pipeline/config.yaml:

  • Resolution: 1920x1080
  • Framerate: 30 fps
  • Silence-Threshold: konfigurierbar
  • Farb-Palette: One-Dark + Brand-Akzent
  • Captions-Style: anpassbar pro Project

Lessons Learned (erste Anwendung 2026-04 bei VLOG-Mai 2026)

  • 2-Pass-Transkription — erst grobe Cuts, dann fein. Ohne 2-Pass kommen Sync-Issues bei langen Aufnahmen.
  • Silence-Threshold zu aggressiv — Default 1.5s ist gut, drunter werden Atemzuege weggeschnitten.
  • B-Roll nicht ueberall — Faustregel: 30-40% des Video-Anteils mit B-Roll, der Rest Talking-Head.
  • Captions Default-OFF — fuer YouTube ja, fuer LinkedIn-Embed ggf nein. Pipeline-Variante mit ohne-Captions parat halten.

Open Loops (zu klaeren)

  • Marketing-Tooling-Repo erstellen — abhaengig von Marvin’s Decision wann
  • WhisperX-Upgrade-Plan (docs/plans/2026-04-01-feat-pipeline-v2-whisperx.md im Repo) noch nicht ausgerollt
  • Output-File-Cleanup-Strategie (Test-Renders fressen Storage)