Senior Site Reliability Engineer – AI/ML Optimized GPU Clusters at The Next Chapter | Hybrid Hired

About the role

Senior Site Reliability Engineer at a company operating one of the largest GPU infrastructures. Responsible for ensuring service fault-tolerance and using cloud technology for infrastructure solutions.

Responsibilities

Ensure fault-tolerance, scale, and uninterrupted operations for the service
Use cutting-edge cloud technology to solve a variety of infrastructure problems
Implement and improve CI/CD processes

Requirements

Solid experience with programming languages (like Go, Python, or C++)
Experience in environments with a multitude of GPUs distributed over multiple nodes
Good understanding of classic algorithms and data structures
Commercial experience with, and deep understanding of, Unix/Linux systems and network technology
Solid experience with CI/CD and IaC
Experience with containerization and configuration management (Ansible, Salt, Terraform, Docker, Kubernetes, Helm)

Benefits

Competitive salary and comprehensive benefits package
Opportunities for professional growth
Flexible working arrangements
Dynamic and collaborative work environment

Similar roles

Browse all Devops Engineer jobs

11 hours ago

RH

Senior Site Reliability Engineer – OpenShift-Based Platform, Python, AWS, OpenShift, Kubernetes

Red Hat

Senior Site Reliability Engineer focused on developing and maintaining OpenShift - based platform solutions at Red Hat. Responsible for software automation, onboarding new services, and maintaining service reliability.

Hybrid Role

Pune India Devops Engineer

11 hours ago

RH

Site Reliability Engineer, Python, AWS, Openshift/Kubernetes

Red Hat

Site Reliability Engineer at Red Hat designing Python and Golang solutions for managed services. Involves onboarding services, maintaining reliability, and fostering team excellence.

Hybrid Role

Brisbane Australia Devops Engineer

5 days ago

AW

DevOps Engineer

ACI Worldwide

Development Operations Engineer supporting enterprise application development in Java and/or C. Ensuring high availability and operational excellence in modern payment solutions.

Onsite Role

Bangalore India Devops Engineer

5 days ago

F5

Site Reliability Engineer – UDF

F5

Site Reliability Engineer designing and supporting Kubernetes environments for F5's UDF platform. Collaborating with cross - functional teams to ensure reliability and operational excellence.

Hybrid Role

Seattle United States Devops Engineer

$137,600 - $206,400 per year

5 days ago

F5

Senior SRE, Infrastructure – Platform

F5

Senior Site Reliability Engineer ensuring operational excellence for multi - datacenter infrastructure at F5. Developing automation tools and APIs in Python and Go.

Hybrid Role

Singapore Singapore Devops Engineer

5 days ago

ES

DevOps Engineer – OpenXDR Platform

ESET

DevOps Engineer needed to develop a new OpenXDR solution on AWS, processing security data from multiple sources. Join a leading cybersecurity company in Slovakia.

Hybrid Role

Bratislava Slovakia Devops Engineer

€3,000 per month

5 days ago

AL

Junior DevOps Engineer

Alea

Junior DevOps Engineer at ALEA maintaining infrastructure and managing CI/CD pipelines for optimal performance and security in a hybrid setup.

Hybrid Role

Barcelona Spain Devops Engineer

6 days ago

CS

DevOps Engineer – Tech 4

Castalia Systems

DevOps Engineer at Castalia Systems automating and optimizing toolchain and CI/CD pipelines. Designing Azure infrastructure and ensuring collaboration between development and operations teams.

Onsite Role

Dayton United States Devops Engineer

6 days ago

CS

DevOps Engineer, Tech 3

Castalia Systems

DevOps Engineer optimizing cloud infrastructure at Castalia Systems. Design, deploy, and manage Azure environments for federal government projects.

Onsite Role

Dayton United States Devops Engineer

6 days ago

HT

Senior Engineer, DevOps

Hex Trust

Senior DevOps Engineer managing Kubernetes and AI - driven workflows at Hex Trust. Supporting blockchain infrastructure while implementing best DevOps practices.

Hybrid Role

Ho Chi Minh City Vietnam Devops Engineer