Skip to content

[Initiative] Monitoring-/Observability

Zur Überwachung von Zustelldienst und Routingdienst wird ein Monitoring-Konzept benötigt und die technischen Details zur Anbindung des Zustelldienstes an eine Monitoring-Infrastruktur sind zu klären. Hierbei sind mind. die folgenden Aspekte zu betrachten:

Denkbar wären hier ein Prometheus-Exporter oder ein ähnliches Tool für eine ggf. andere eingesetzte Monotoring-Infrastruktur.

Akzeptanzkriterien

  1. Observability- und Health-Metriken sind definiert.
    Anforderung unklar
  2. Im Rahmen der OpenAPI Spezifikation soll es einen /status Endpunkt geben, über welchen die Gesundheit des Zustelldienstes überwacht werden. kann. Ob und in welchem Umfang das gewünscht ist muss entschieden werden, sowie an wlechen Metriken und Events das festgemacht wird.
    => Jeder Service besitzt einen /health Endpunkt der uns sagt, ob ein Service bereit ist Traffic entgegenzunehmen
  3. Ich kann in unserem Logging alle Reverse Proxy Log Einträge nach "http response status code" filtern bzw. eine Übersicht erstellen.
    => Ist in creoline möglich.
  4. Ich kann in unserem Logging alle Java Anwendungs Logs nach "Log level" filtern bzw. eine Übersicht erstellen.
    => Ist in creoline möglich
  5. Das Monitoring kann zwischen regelmäßigen, geplanten und ungeplanten Störungen unterscheiden.
    => Alerts sind inzwischen so konfiguriert, dass sie uns nur bei echten Problem anpingen.
  6. Eine Benachrichtigung (Alterting) erfolgt nur bei ungeplanten Störungen.
    => siehe Punkt 5
  7. Das Alerting verfügt über Eskalationsstufen, falls eine Störung länger andauert.
    => Anforderung ist unklar. Alerts haben ein Severity Level.

Referenzen

Weitere Informationen:

  • Warten auf Feedback von IT.N
  • Evtl. Dataport noch interessant
  • IT.N bei Bedarf einladen und Konzept evtl. vorstellen?
Edited by Rico Lang