Video-Editing-Pipeline
Wiederverwendbare Pipeline fuer Marketing- und VLOG-Videos. Komplett lokal, kein Cloud-Render. Ergebnis: aus einem Roh-Cut (15-30 Min Sprache) wird in unter einer Stunde ein veroeffentlichungsreifes Video mit B-Roll, Captions, Music-Bed.
Pipeline (6 Phasen)
Roh-Recording (.mov/.mp3)
↓ audio-enhance MCP (ClearerVoice — Denoising, Normalization)
Verbessertes Audio
↓ whisper MCP (WhisperX — Word-Level-Transkript inkl. Timing)
Transkript mit Word-Timing
↓ auto-editor MCP (Silence-Removal mit Threshold)
Cut-Liste (was wird geschnitten)
↓ remotion-broll MCP (B-Roll-Compositions rendern)
B-Roll-Sequenzen als Einzel-MP4s
↓ ffmpeg MCP (Final Assembly + Captions overlay)
Veroeffentlichungs-Video
Code-Lokation (Stand 2026-05-09)
Aktuell alles in /Users/marvinkuehlmann/source/remotion/. Vorschlag fuer Phase B (Service-Modell-Skalierung):
- Templates + Konfiguration → neuer Repo
marketing-tooling(sauber gestreckt, multi-projekt-faehig) - Output-Files (
output/*.mp4) → projekt-spezifisch inassets/oder direkt zu YouTube-Upload-Workflow - Vault-Pointer in _index sobald umgezogen
Wiederverwendbare B-Roll-Templates
20+ React/Remotion-Compositions, alle TypeScript, alle thematisch:
| Template | Zweck |
|---|---|
| CodeBlock | Code-Snippet mit Syntax-Highlighting, animiertes Scrollen |
| Terminal | Terminal-Aufnahme mit Tippe-Animation |
| TitleCard | Intro-/Section-Title mit Brand-Farben |
| Captions | Word-Level-Captions (TikTok-Style, Karaoke-Synced) |
| Metric | Animierte Zahl, z.B. „+50% Effizienz” |
| Comparison | Side-by-Side Before/After |
| Architecture | Animierte Architektur-Diagramme |
| BulletList | Gestaffelte Bullet-Points |
| (12+ weitere) | siehe mcp-servers/remotion-broll/src/compositions/ |
Alle Templates nutzen die Brand-Farb-Palette aus pipeline/config.yaml (One-Dark-Theme + Brand-Akzente). Style ist in einer YAML editierbar, kein Code-Edit pro Video noetig.
Konfiguration
pipeline/config.yaml:
- Resolution: 1920x1080
- Framerate: 30 fps
- Silence-Threshold: konfigurierbar
- Farb-Palette: One-Dark + Brand-Akzent
- Captions-Style: anpassbar pro Project
Lessons Learned (erste Anwendung 2026-04 bei VLOG-Mai 2026)
- 2-Pass-Transkription — erst grobe Cuts, dann fein. Ohne 2-Pass kommen Sync-Issues bei langen Aufnahmen.
- Silence-Threshold zu aggressiv — Default 1.5s ist gut, drunter werden Atemzuege weggeschnitten.
- B-Roll nicht ueberall — Faustregel: 30-40% des Video-Anteils mit B-Roll, der Rest Talking-Head.
- Captions Default-OFF — fuer YouTube ja, fuer LinkedIn-Embed ggf nein. Pipeline-Variante mit ohne-Captions parat halten.
Open Loops (zu klaeren)
- Marketing-Tooling-Repo erstellen — abhaengig von Marvin’s Decision wann
- WhisperX-Upgrade-Plan (
docs/plans/2026-04-01-feat-pipeline-v2-whisperx.mdim Repo) noch nicht ausgerollt - Output-File-Cleanup-Strategie (Test-Renders fressen Storage)
Related
- Aktives Video-Projekt: vlog-mai-2026
- VLOG-Storytelling-Pattern: vlog-storytelling (falls existiert)
- Marketing-Brand-Farben: brand