Senior Site Reliability Engineer

hace 3 semanas


España F. Hoffmann-La Roche Gruppe A tiempo completo

Roche fördert Diversität, Gleichstellung und Inklusion und repräsentiert die Gemeinschaften, denen wir dienen. Wenn es um die Gesundheitsversorgung auf globaler Ebene geht, ist Vielfalt eine wesentliche Zutat für den Erfolg. Wir glauben, dass Inklusion der Schlüssel zum Verständnis der unterschiedlichen Bedürfnisse der Menschen im Gesundheitsbereich ist. Gemeinsam engagieren wir uns für Individualität und teilen die Leidenschaft für eine herausragende Versorgung. Kommen Sie zu Roche, wo jede Stimme zählt.Die PositionDie Rolle erfordert, dass der Kandidat für den Bereitschaftsdienst verfügbar ist, um schnell auf dringende Probleme und Notfälle außerhalb der regulären Arbeitszeiten zu reagieren und sicherzustellen, dass kritische Situationen zeitnah und effektiv behandelt werden.Wer wir sindBei Roche sind wir leidenschaftlich daran interessiert, das Leben von Patienten zu transformieren, und wir sind mutig in Entscheidungen und Handlungen - wir glauben, dass gutes Geschäft eine bessere Welt bedeutet. Deshalb kommen wir jeden Tag zur Arbeit. Wir verpflichten uns zu wissenschaftlicher Strenge, unbestreitbaren Ethik und dem Zugang zu medizinischen Innovationen für alle. Wir tun dies heute, um morgen eine bessere Zukunft zu gestalten.Roche baut ein globales Site Reliability Engineering (SRE) Team auf, das kommerzielle und interne Lösungen unterstützen wird. Dieses Team wird die Denkweise haben, Ingenieurlösungen zu entwickeln und zu schaffen, um ein breites Spektrum von Problemen zu lösen.Schritt in die Zukunft der IT-Infrastruktur mit RocheAls erfahrener Site Reliability Engineer (SRE) bei Roche nutzen Sie Ihre tiefen Software-Engineering-Kenntnisse, um unsere IT-Infrastruktur auf neue Höhen der Robustheit, Skalierbarkeit und Zuverlässigkeit zu bringen. Dies ist nicht nur eine Rolle - es ist eine Einladung, das Rückgrat kritischer Infrastrukturen zu gestalten und unsere technologischen Innovationen voranzutreiben.Ihre MissionEntwerfen und pflegen Sie moderne Tools, Skripte und Frameworks, die sich wiederholende Aufgaben automatisieren, die Softwarebereitstellung optimieren und umfangreiche Systeme mit unvergleichlicher Effizienz verwalten.Arbeiten Sie eng mit zukunftsorientierten Entwicklungsteams zusammen, um leistungsstarke Lösungen zu entwerfen und zu implementieren, die die Systemeffizienz steigern, die Ressourcennutzung optimieren und die Bereitstellungsprozesse für überlegene Betriebszeiten und Benutzerzufriedenheit verbessern.Ihr EinflussLeiten Sie das Management und die Reaktion auf Vorfälle. Erkennen Sie Systemanomalien, beheben Sie diese schnell und führen Sie gründliche Ursachenanalysen durch, um wiederkehrende Probleme zu verhindern.Fördern Sie kontinuierliche Verbesserungen, indem Sie Überwachungs- und Alarmmechanismen verfeinern, aufschlussreiche Nachbesprechungen nach Vorfällen durchführen und bewährte Verfahren im Softwarelebenszyklus-Management einbetten. Ihr strategisches Vorausdenken und Ihre sorgfältige Planung werden sicherstellen, dass unsere Systeme nicht nur zuverlässig, sondern auch überragend leistungsfähig sind.Durch den Beitritt zu unserem Elite-Team spielen Sie eine entscheidende Rolle bei der Bereitstellung nahtloser Erfahrungen für unsere Endbenutzer, übertreffen die Geschäfts- und Kundenanforderungen und festigen den Ruf von Roche als führendes Unternehmen in der IT-Innovation.Ihre KernverantwortlichkeitenZuverlässigkeitsbeherrschung: Proaktive Überwachung und Wartung der Systemzuverlässigkeit mit fortschrittlichen Tools wie DataDog, VictorOps, ELK, Grafana und Prometheus. Werden Sie ein Schlüsselspieler, um die Systemstabilität und -leistung sicherzustellen.Verfügbarkeitsschutz: Sicherstellen optimaler Betriebszeiten und Leistung, indem Probleme schnell identifiziert und präzise auf Alarme reagiert werden.Technischer Problemlöser: Grundlegendes Verständnis von Architekturen und Designs, um in komplexe technische Probleme einzutauchen, diese zu beheben, zu untersuchen und zu lösen. Nahtlose Zusammenarbeit mit Engineering-Teams, um zeitnahe und effektive Lösungen zu ermöglichen.Service Excellence: Definierte SLAs, SLIs und SLOs aufrechterhalten und konsequent erreichen, um sicherzustellen, dass die Servicelevels konstant erfüllt oder übertroffen werden.Automatisierungsinnovator: Entwicklung und Bereitstellung von Automatisierungsskripten (unter Verwendung von Python oder anderen Skriptsprachen), um den Betrieb zu optimieren, die Systemeffizienz zu steigern und manuelle Aufgaben zu reduzieren.Cloud-Steward: Robuste Infrastruktur in AWS- und Azure-Umgebungen verwalten und aufrechterhalten, bewährte Verfahren implementieren, um eine Spitzenleistung und Zuverlässigkeit cloudbasierter Anwendungen sicherzustellen. Kostenoptimierung durch Implementierung bewährter Verfahren und kontinuierliche Wachsamkeit vorantreiben.Interdisziplinärer Mitarbeiter: Eng mit Engineering-, DevOps-, Sicherheits- und Betriebsteams zusammenarbeiten, um kontinuierliche Verbesserungen voranzutreiben und eine Kultur der Zuverlässigkeit und Inklusion zu fördern.Vorfall-Responder: Anfragen und Vorfälle über JIRA und ServiceNow bearbeiten, Verfahren zur Fehlersuche, Lösungen und Lektionen dokumentieren, um laufende Verbesserungen zu fördern.Flexible Planung: Außerhalb der normalen Arbeitszeiten und an Wochenenden nach Plan Bereitschaftsdienst leisten, um kontinuierliche Unterstützung sicherzustellen.Teambuilder: Aktive Mitwirkung am Wachstum und an der Entwicklung der Fähigkeiten des SRE-Teams, um ein stärkeres, inklusiveres und widerstandsfähigeres Team zu fördern.Wer Sie sind:Bildungsweg: Bachelor-Abschluss in Informatik, Ingenieurwesen oder einem verwandten Bereich oder gleichwertige berufliche Erfahrung. Ein MBA oder PhD ist von Vorteil, aber nicht erforderlich.Zertifizierungen: Relevante Branchenzertifizierungen (AWS/Azure), um Ihr Fachwissen zu zeigen.Erfahrung: Etwa 5 Jahre Erfahrung in Site Reliability Engineering, IT-Betrieb, DevOps oder verwandten Bereichen oder gleichwertige Fähigkeiten und Erfahrungen.Cloud-Expertise: Solide Erfahrung mit AWS und/oder Azure, einschließlich der Einrichtung, Überwachung und Wartung von Cloud-Ressourcen (einschließlich Kubernetes, EKS, AKS, GKE usw. Kenntnisse). Auch Erfahrung in Bezug auf grundlegendes Verständnis von Tools im Zusammenhang mit Infrastructure as Code, wie Terraform.Tool-Profi: Kenntnisse in Überwachungs- und Protokollierungstools wie DataDog, Splunk-Oncall, ELK-Stack, Grafana und Prometheus usw. Kenntnisse über Loki, Mimir und Tempo sind von Vorteil.Praktische Fähigkeiten: Praktische Erfahrung mit JIRA und ServiceNow zur Verfolgung von Vorfällen, Anfragen und Dokumentationen.Scripting-Kenntnisse: Kenntnisse in Python oder ähnlichen Skriptsprachen für Automatisierungszwecke.Vorfallreaktion: Verständnis der SRE-Kernprinzipien sowie tiefes Verständnis der Vorfallpriorisierung, Eskalationsprozesse und des Servicemanagements (SLA/SLO/SLI).Fehlerbehebung: Nachweislich fähig zur Fehlerbehebung, insbesondere in Cloud- und verteilten Systemumgebungen.Kommunikation und Teamarbeit: Ausgezeichnete Kommunikations-, Teamarbeits- und Dokumentationsfähigkeiten, mit einem proaktiven und selbstmotivierten Ansatz zur Verbesserung der Systemzuverlässigkeit und der Betriebseffizienz.Diversität und Inklusion: Wir schätzen und ermutigen Kandidaten aus unterschiedlichen Hintergründen und Erfahrungen, da wir glauben, dass vielfältige Perspektiven Innovation und Erfolg fördern.Sprachkenntnisse: Ausgezeichnete mündliche und schriftliche Englischkenntnisse.Warum uns beitreten?Durch den Beitritt zu unserem Team sind Sie Teil eines dynamischen Umfelds, in dem Ihre Beiträge direkt die Widerstandsfähigkeit und Zuverlässigkeit unserer Dienstleistungen beeinflussen werden. Sie werden Möglichkeiten für berufliches Wachstum haben und die Fähigkeit, mit Branchenführern zusammenzuarbeiten. Lassen Sie uns gemeinsam die Zukunft der IT-Stabilität vorantreiben und ein außergewöhnliches Erlebnis für unsere Kunden gewährleisten.Bereit, einen Unterschied zu machen? Bewerben Sie sich jetzt, um unser nächster SRE Incident Manager zu werden und uns zu helfen, eine zuverlässigere Zukunft aufzubauenWer wir sindBei Roche leisten 100.000 Menschen in 100 Ländern Pionierarbeit im Gesundheitswesen. Gemeinsam haben wir uns zu einem weltweit führenden, forschungsorientierten Healthcare-Konzern entwickelt. Unser Erfolg baut auf Innovation, Neugier und Vielfalt.Roche ist ein Arbeitgeber, der die Chancengleichheit fördert.
#J-18808-Ljbffr


  • Site Reliability Engineer

    hace 4 semanas


    España buscojobs España A tiempo completo

    Senior Site Reliability Engineer (SRE) - Fintech SectorLocation: Barcelona, Spain (Hybrid Model)Company Overview:Join a leading international fintech company at the forefront of innovation, revolutionizing financial services for millions worldwide. Our client is looking for a Senior Site Reliability Engineer (SRE) to play a pivotal role in ensuring the...


  • España Antal International A tiempo completo

    Job DescriptionSenior Site Reliability Engineer (SRE) - Fintech SectorLocation: Barcelona, Spain (Hybrid Model)Company Overview:Join a leading international fintech company at the forefront of innovation, revolutionizing financial services for millions worldwide. Our client is looking for a Senior Site Reliability Engineer (SRE) to play a pivotal role in...

  • Site Reliability Engineer

    hace 3 semanas


    España Antal International A tiempo completo

    Job DescriptionCompany Overview:Join a leading international fintech company at the forefront of innovation, revolutionizing financial services for millions worldwide. Our client is looking for a Senior Site Reliability Engineer (SRE) to play a pivotal role in ensuring the scalability, reliability, and sustainability of their services.Position Overview:As a...


  • España Blacklane A tiempo completo

    We are seeking an experienced Senior Site Reliability Engineer (SRE) to join our team and play a key role in driving the adoption of SRE best practices across our organization. If you are passionate about building reliable systems, enabling cultural transformation, and mentoring teams, this is the perfect opportunity for you. You'll work on mission-critical...


  • España Ebury A tiempo completo

    Senior Site Reliability Engineer - FintechLocation: MadridCompany: Ebury Madrid Office - Hybrid: 4 days in the office, 1 day working from homeEbury is a hyper-growth FinTech firm, named in 2021 as one of the top 15 European Fintechs to work for by AltFi. We offer a range of products including FX risk management, trade finance, currency accounts,...


  • España Zartis A tiempo completo

    The company and our mission: Zartis is a digital solutions provider working across technology strategy, software engineering and product development. We partner with firms across financial services, MedTech, media, logistics technology, renewable energy, EdTech, e-commerce, and more. Our engineering hubs in EMEA and LATAM are full of talented professionals...


  • España dynaTrace software GmbH A tiempo completo

    Our Business Insights team is looking for a DevOps to enhance our internal process and scale our delivery capabilities. The focus is to embrace the NoOps thinking and assist with knowledge in areas such as delivery, automation, and remediation. Suppose you have a passion for large-scale deployments and an interest in growing your skills around Site...


  • España Cabify A tiempo completo

    Do you want to change the world? At Cabify, that's what we're doing. We aim to make cities better places to live by improving mobility for the people living in them, connecting riders to drivers, providing mobility alternatives such as scooters and mopeds and many others to come, all at the touch of a button. Maybe one day cities will be places where nobody...


  • España Hub71 Ltd A tiempo completo

    Únete a Bit2Me como Senior Site Reliability Engineer (SRE)¿Y si pudieras llevar los sistemas a gran escala al siguiente nivel? La respuesta es clara: únete a Bit2Me. Aquí encontrarás el entorno perfecto para innovar, optimizar y dejar tu huella en el rendimiento y la fiabilidad de sistemas que impactan a millones de usuarios.¿Cómo será tu trabajo...

  • Site Reliability Engineer

    hace 2 semanas


    España Talent Recruit A tiempo completo

    Company Background: We are representing a renowned leader in digital and technology consulting. Specialising in services such as online and social media audits, digital analytics, web and mobile app development, as well as marketing and CRM automation, our client is at the forefront of innovation. If you're seeking an exciting new role as a Site Reliability...

  • Site Reliability Engineer

    hace 3 semanas


    España CDmon A tiempo completo

    Site Reliability Engineer (SRE) en Híbrido¡Únete a nuestro equipo en cdmon.com! Somos una destacada empresa española de dominios y servicios web dedicada a crear una Internet abierta y de calidad donde cualquiera pueda estar. Nos enorgullece desarrollar y ofrecer nuestros propios sistemas de hosting basados en Linux brindando una amplia gama de servicios...


  • España Roche A tiempo completo

    The Position Senior Site Reliability Engineer (Kubernetes Platform) - Digital Products and Enablement The 21st century needs a 21st century healthcare system. To help build this, Roche is not only developing highly personalized medicine and advanced diagnostics, but also heavily investing into software and digital solutions. To speed up medical processes,...


  • España Roche A tiempo completo

    Roche fosters diversity, equity and inclusion, representing the communities we serve. When dealing with healthcare on a global scale, diversity is an essential ingredient to success. We believe that inclusion is key to understanding people’s varied healthcare needs. Together, we embrace individuality and share a passion for exceptional care. Join Roche,...

  • Site Reliability Engineer

    hace 3 semanas


    España IDEMIA A tiempo completo

    You may not know our name, but you have surely used our innovations and solutions. Our mission is to unlock the world and make it safer through cutting-edge identity technologies. Every day, around the globe, we are enabling citizens and consumers alike to perform their daily critical activities (such as pay, connect and travel), in the physical as well as...

  • Site Reliability Engineer

    hace 4 semanas


    España buscojobs España A tiempo completo

    Intuition Machines uses AI/ML to build enterprise security products. We apply our research to systems that serve hundreds of millions of people, with a team distributed around the world. You are probably familiar with our best-known product, the hCaptcha security suite. Our approach is simple: low overhead, small teams, and rapid iteration.Role OverviewAs a...


  • España Intuition Machines, Inc. A tiempo completo

    Intuition Machines uses AI/ML to build enterprise security products. We apply our research to systems that serve hundreds of millions of people, with a team distributed around the world. You are probably familiar with our best-known product, the hCaptcha security suite. Our approach is simple: low overhead, small teams, and rapid iteration.Role OverviewAs a...


  • España ING A tiempo completo

    At ING we are looking for a Site Reliability Engineer Your role and work environment : We are looking for a talented and enthusiastic Site Reliability Engineer (SRE) to join our Team of SRE Expert Unit. The responsibility of this team is to ensure the reliability and scalability of the platform to provide the best customer experience to our clients and our...


  • España buscojobs Argentina A tiempo completo

    Intuition Machines uses AI/ML to build enterprise security products. We apply our research to systems that serve hundreds of millions of people, with a team distributed around the world. You are probably familiar with our best-known product, the hCaptcha security suite. Our approach is simple: low overhead, small teams, and rapid iteration.As a Site...


  • España Logicalis Spain A tiempo completo

    En Logicalis Spain actualmente estamos buscando a una persona con experiencia en entornos de operaciones en la nube, que aporte conocimientos en automatización, monitorización y resolución de incidencias. La persona incorporada pasará a formar parte de un equipo de especialistas como SRE (Site Reliability Engineer) encargados de garantizar la fiabilidad,...


  • España EPAM Systems A tiempo completo

    Do you have a software engineering background and strong knowledge in MS SQL and PowerShell? Are you an open-minded professional with good English skills? If it sounds like you, this could be the perfect opportunity to join EPAM as a Site Reliability Engineer. RESPONSIBILITIES Take responsibility for production stability and problem resolution of the...