Programm Sre

hace 2 semanas


Madrid, España Mercedes-Benz Group Services Madrid, S.A.U. A tiempo completo

AufgabenIm Rahmen des New IT HUB Sales - Retail of the Future zur Unterstützung des strategischen Mercedes Benz Programms suchen wir einen Program SRE & Ops Manager

Der Program SRE & Ops Manager innerhalb von Mercedes-Benz spielt eine entscheidende Rolle bei der Sicherstellung der Zuverlässigkeit, Leistung und operativen Exzellenz von IT-Systemen. In dieser Funktion werden SRE-Praktiken mit dem Programmmanagement kombiniert, um IT-Betriebs
- und Zuverlässigkeitsinitiativen über mehrere Produkte und Produktfamilien hinweg zu leiten und zu beaufsichtigen

Beschreibung der Rolle und der Verantwortlichkeiten

Durchsetzung von Monitoring-, Alerting
- und Logging-Konzepten zur Verbesserung der Qualität, Leistung und Ausfallsicherheit der Produkte

Koordinierung der Aktivitäten zwischen dem Vertriebskontrollzentrum und den Produktteams in Bezug auf Ops und SRE.

Unterstützung der Produktteams bei der Einführung von SRE-Konzepten durch Einbindung und Verbesserung des gesamten Lebenszyklus von Diensten, von der Konzeption und dem Design über die Bereitstellung, den Betrieb und die Verbesserung bis hin zum Ende der Lebensdauer (Sundown)

Verantwortlich für die SLOs auf Programmebene und deren Verfolgung auf Produktebene.

Leitung und Verwaltung des IT-Betriebs, einschließlich Netzwerkinfrastruktur, Servermanagement und Cloud-Dienste, um die Zuverlässigkeit und Leistung der Systeme zu gewährleisten.

Beaufsichtigung von SRE-Praktiken wie Überwachung, Reaktion auf Vorfälle und Zuverlässigkeitstechnik, um Verfügbarkeit, Latenz, Systemstabilität und den allgemeinen Systemzustand aufrechtzuerhalten. Sicherstellen, dass konsistente SRE- und Ops-Konzepte auf Programmebene angewendet werden.

Sicherstellen, dass IT-Betrieb und SRE-Praktiken mit Industriestandards und Best Practices übereinstimmen, einschließlich ITIL für das Service-Management.

Nachhaltige Skalierung von Systemen durch Mechanismen wie Automatisierung und Weiterentwicklung von Systemen durch Vorantreiben von Änderungen, die die Zuverlässigkeit und Leistung verbessern

Beitrag zur kontinuierlichen Verbesserung des IT-Betriebs, der SRE-Praktiken und der Programm-Management-Prozesse innerhalb der Organisation.

Mehr anzeigen
- QualifikationenBildungsabschluss und technische Erfahrung

Bachelor
- oder Master-Abschluss in Informatik, IT-Management oder einem MINT-bezogenen Bereich.

Einschlägige Zertifizierungen wie z. B. Certified Site Reliability Engineer (CSRE) oder ITIL Expert sind von Vorteil.

Mindestens 5-7 Jahre Erfahrung in den Bereichen IT-Betrieb, Site Reliability Engineering (SRE) und Programmmanagement.

Technische Kenntnisse/Verantwortlichkeiten

Beherrschung der SRE-Praktiken, einschließlich Überwachung, Reaktion auf Störungen und Zuverlässigkeitstechnik.

Ausgeprägtes Verständnis des IT-Betriebs und der Infrastrukturverwaltung, einschließlich Cloud-Services und lokaler Systeme.

Vertrautheit mit branchenüblichen Tools für SRE und IT-Betrieb, wie Datadog, Prometheus, Grafana oder Nagios sowie Cloup Ops.

Kenntnisse der ITIL-Praktiken für das Servicemanagement.

Entwurf, Entwicklung und Implementierung von Tools und Prozessen zur Automatisierung des Systembetriebs, zur Verringerung des Risikos manueller Fehler und zur Steigerung der Effizienz von Systemverwaltungsaufgaben

Zusammenarbeit mit Software-Entwicklungsteams, um sicherzustellen, dass neue Software-Releases und -Updates in bestehende Systeme integriert werden und dass die Software-Architektur hinsichtlich Leistung und Zuverlässigkeit optimiert wird

Erfahrung (Fähigkeiten und Jahre)

mindestens 5 Jahre nachgewiesene Erfahrung in der Verwaltung des IT-Betriebs und der Leitung von SRE-Initiativen zur Gewährleistung der Systemzuverlässigkeit und -leistung.

Erfolgreiche Zusammenarbeit mit funktionsübergreifenden Teams, einschließlich Netzwerktechnikern, Systemadministratoren und Entwicklungsteams.

Nachgewiesene Fähigkeit, Überwachungs
- und Vorfallsreaktionsprozesse zu entwerfen und zu implementieren, um die Systemzuverlässigkeit zu verbessern.

Kenntnisse von Programmmanagement-Methoden und Erfahrung in der Verwaltung komplexer IT-Projekte.

Beherrschung von Cloud Ops und AWS Cloud (z. B. Dynatrace, Datadog)

Vertrautheit mit der Protokollierung, Überwachung und Alarmierung in Datadog

Englisch (Lesen/Schreiben/Konversation)

Fließend in Englisch in Wort und Schrift.

Kenntnisse der deutschen Sprache sind von Vorteil.

Andere Präferenzen

Zusätzlich zu den technischen Kenntnissen sollte der ideale Kandidat über eine Reihe wichtiger Soft Skills verfügen, darunter die Fähigkeit, sich schnell an sich verändernde Situationen anzupassen, ein starkes Gefühl der Eigenverantwortung, die Förderung von Vertrauen und Inspiration, eine ko-kreative Denkweise, die von kollaborativer Innovation lebt, ein unermüdliches Streben nach Leistung und Erfolg, eine unerschütterliche Kundenorientierung, die darauf abzielt, unsere Kunden immer wieder aufs Neue z



  • Madrid, España JSAN Consulting A tiempo completo

    **Position Overview**: **Language **:Fluency is must in two languages : 1) Spanish and (2) English (written, speaking) **What the role entails?** As an Enterprise Architect you are responsible for providing architecture and design leadership for large and complex transformation programmes, aligning IT services with enterprise goals to create a competitive...