PoC: Prometheus + Grafana
Why
Für die Plannung für die zukünftige Logging/Monitoring Infrastruktur soll ein PoC mit Prometheus, Grafana und Alertmanager erstellt werden, um besser zu beurteilen, ob unsere Anforderungen zu welchem grad erfüllt werden können und welche Risiken bestehen
Links, Notes, Remarks
Acceptance criteria
-
Metriken werden empfangen -
Metriken werden in Grafana visualisert -
Alerts können generiert werden und kommen in MS Teams an -
Dokumentation hinterlegt in Developer Guide
Implementation plan (to be completed by the developer)
-
DNS -
Endpunkt Zustelldienst über Traefik absichern -
Endpunkt SSP über Traefik absichern -
Node-Exporter in Service-Stack einrichten -
Node-Exporter in Auth-Stack einrichten -
Node-Exporter in Tool-Stack einrichten -
cAdvisor in Service-Stack einrichten -
cAdvisor in Auth-Stack einrichten -
cAdvisor in Tool-Stack einrichten -
Deployment on Tools-stack -
Metrikenanbindung - [ ] Alermanager test -
Grafana Dashboards Provisioning -
Basic Auth für Prometheus ~~und Alertmanager ~~einrichten -
Alerts in MS Teams -
User & Roles -
Gitlab login -
Mute Timings (0-8 Uhr), (19-24 Uhr), (0-24 Uhr am Wochenende) -
Traefik in Service-Stack einrichten -
Traefik in Auth-Stack einrichten -
Traefik in Tool-Stack einrichten -
Doku -
Definition of Done was checked.
Edited by Minh Nguyen