-
STACKIT

SRE - Platform Reliability (m/w/d)

STACKIT
Germany · Full-time · Not Applicable

Schwarz Digits schafft das technologische Fundament für digitale Entscheidungsfreiheit in Europa. Als IT- und Digitalsparte der Schwarz Gruppe entwickeln und verantworten wir einerseits die IT-Infrastrukturen für die Handelssparten Lidl und Kaufland sowie die Schwarz Produktion und PreZero. Gleichzeitig agieren wir als unabhängiger Anbieter am externen Markt, um Unternehmen in ganz Europa bei ihrer digitalen Transformation zu unterstützen. Unsere Kernleistungen bündeln wir in den Bereichen Cloud, Cyber Security, Data & AI, Communication und Workspace. Trage auch du zur digitalen Entscheidungsfreiheit in Europa bei.

Bei uns arbeitest du an der Schnittstelle zwischen Agilität und Sicherheit: Du profitierst von den schnellen Entscheidungswegen, genießt echte Gestaltungsspielräume in deinen Projekten und baust dabei auf das stabile Fundament der Schwarz Gruppe.

Deine Aufgabe

  • Du entwickelst und betreibst die interne Monitoring- und Observability-Plattform der STACKIT Cloud auf Basis von Grafana, Prometheus und verwandten Technologien
  • Du stellst sicher, dass wir unsere Plattform an den richtigen Stellen weiterentwickeln. Dazu arbeitest Du eng mit unseren Plattform- und Entwicklungsteams zusammen, um Monitoring-Standards zu entwickeln und umzusetzen
  • Du analysierst Systemmetriken, Logs und Traces zur Fehlerdiagnose und Performanceoptimierung
  • Du bringst dich aktiv in die Weiterentwicklung unserer SRE-Praktiken ein und hilfst dabei, unsere Plattform kontinuierlich zu verbessern

Dein Profil

  • Du hast Erfahrung mit Monitoring- und Observability-Tools wie Prometheus, Grafana oder ähnlichen Lösungen
  • Du bringst Erfahrung in der Automatisierung mit – z. B. mit Python, Go, Ansible oder Terraform
  • Du gehst sicher mit Git um und hast Erfahrung im automatisierten Deployment über CI/CD-Pipelines
  • Du verfügst über fundierte Kenntnisse in der Linux-Systemadministration und fühlst dich in der Shell zu Hause
  • Du hast Erfahrung im Betrieb komplexer Systeme und übernimmst gerne Verantwortung dafür
  • Du kommunizierst sicher auf Deutsch und Englisch, sowohl im Team als auch mit anderen Fachbereichen

Key Skills

Ranked by relevance

prometheus grafana cloud das cyber security ansible python linux cicd git ai
Login to Apply
Posted
May 05, 2026
Type
Full-time
Level
Not Applicable
Location
Stadt Heilbronn
Company
STACKIT

Industries

IT Services IT Consulting

Categories

Engineering Information Technology

Related Jobs

3 roles aligned with this opportunity

View all jobs
View Job Details
STACKIT
Related

Site Reliability Engineer / SRE - Databases - STACKIT (m/w/d)

2025-12-10

Full-time
Entry
Germany
IT Services
Engineering
View Job Details
STACKIT
Related

Fullstack Engineer (m/w/d) - Android & Kotlin

2026-05-22

Full-time
Not Applicable
Germany
IT Services
Engineering
View Job Details
STACKIT
Related

(Senior) STACKIT Cloud Lead Site Reliability Engineer Storage (m/w/d)

2025-07-22

Full-time
Mid-Senior
Germany
IT Services
Engineering