Was wir live betreiben + per Uptime-Kuma (https://uptime.agenticventures.de) ueberwachen. Ergaenzung zu web-properties — web-properties.md ist Domain-Inventar (Marken/Registrar/Footer), hier ist Service-Status-Inventar (Endpoint/Check/Erwartung).
Konvention: Bei neuem live-gehenden Service zuerst hier eintragen, dann Uptime-Kuma-Monitor anlegen. Decommissioned Services bleiben mit status: decommissioned als historische Referenz.
Cloudflare-Tunnel (Tunnel-Health via cloudflared-Metrics)
Tunnel-Endpoints werden indirekt ueber die Service-Checks oben mitueberwacht. Wenn ein Tunnel haengt → Service-Check faellt aus. Direkter Tunnel-Status: Cloudflare-Dashboard.
Vor uptime.av.de + pdf.av.de + dashboard.av.de steht Cloudflare Access als zusaetzliche Auth-Schicht. Branding pro App: BG #F5F4ED, Buttons #2D4A3E, Footer-Link auf agenticventures.de. Session 24h.
IdP: aktuell nur One-Time-PIN (Email-OTP). Google IdP nicht eingerichtet, ToDo.
Org-Login-Branding (global statt per-App) braucht Token-Scope Access:Organizations:Edit — aktuelles cloudflare/api-token hat das nicht. Wenn relevant: Token in CF-Dashboard erweitern.
Notification-Channels (Uptime-Kuma Settings)
Telegram (Bot via @BotFather, Token in 1Password unter „Uptime-Kuma Telegram Bot”, Chat-ID via @userinfobot) — Standard fuer alle Monitore, Push aufs Handy
Emailhello@marvinkuehlmann.com — Eskalation fuer zahlende Kunden (Icking, VF) und Hosted-MCP-Ausfaelle
Health-Check-Konventionen
/health — Standard fuer eigene MCPs (mcp-whatsapp, mcp-vf): liefert {"status":"ok"} bei HTTP 200
/healthz — Standard fuer Kunden-Apps (Icking): Liveness-Check, antwortet schnell ohne Deps
/readyz — Standard fuer Kunden-Apps (Icking): Readiness-Check, prueft DB-Pool, Bedrock-Clients etc. — sollte fuer Uptime-Kuma als Primary-Check genommen werden (sagt aus ob Service wirklich nutzbar ist)
Keyword-Match auf /readyz Bodies: "status":"ready" fuer Icking
Bei OAuth-MCP-Endpoints (/mcp) erwartet HTTP 401/302 — kein 200, daher Health-Endpoint nehmen statt MCP-Endpoint