Platform Engineer (SRE) responsible for implementing cloud-native infrastructure and automation. Join UOL EdTech to transform education using technology in Brazil.
Responsibilities
Implementar e evoluir a infraestrutura cloud-native, seguindo arquiteturas de referência da plataforma.
Automatizar o provisionamento e a gestão de infraestrutura utilizando Infrastructure as Code.
Aplicar práticas de DevOps e SRE para melhorar confiabilidade, escalabilidade e automação da plataforma.
Implementar e manter SLIs, SLOs e dashboards de observabilidade.
Padronizar e manter a coleta de métricas, logs e traces para monitoramento dos serviços.
Desenvolver automações e ferramentas internas para suporte às operações da plataforma.
Evoluir e manter pipelines de CI/CD, garantindo estabilidade, qualidade e rastreabilidade.
Participar de incident response, mitigação de incidentes e análises pós-incidente (blameless post-mortems).
Criar e manter runbooks, playbooks operacionais e documentação técnica.
Apoiar a manutenção de topologias de rede em nuvem, como VPCs, Transit Gateway, load balancers e CDN.
Participar das estratégias de deploy seguro, como blue/green e canary.
Requirements
Experiência com Cloud Computing, preferencialmente AWS.
Experiência prática com Infrastructure as Code (Terraform).
Experiência com pipelines de CI/CD, preferencialmente GitHub Actions.
Experiência em Docker e containerização.
Conhecimento em Kubernetes.
Conhecimento em automação de infraestrutura e desenvolvimento de ferramentas internas utilizando Python, Go ou TypeScript.
Conhecimento em observabilidade (métricas, logs e traces), preferencialmente Datadog.
Capacidade de troubleshooting em sistemas distribuídos.
Benefits
Vale-alimentação e/ou refeição.
Plano de saúde e odontológico.
Seguro de vida.
Parceria com TotalPass e ZenKlub.
Licença maternidade e paternidade estendidas.
Auxílio-creche.
Descontos de até 50% em pós-graduação e MBA de grandes instituições, como FIA, FAAP e PUCRS.
No dress code: o importante é você usar o que te faz bem.
Senior Reliability Engineer responsible for maintaining and improving plant asset reliability processes while ensuring safe operations and high product quality. Requires collaboration with clients and complex problem - solving skills.
Senior Site Reliability Engineer at PulseRise Technologies building and scaling reliability foundations for a fintech platform. Leading incident response and designing resilient AWS architectures in a hybrid environment.
Senior DevOps Platform Engineer at Humana responsible for designing and maintaining cloud infrastructure on Azure and GCP. Driving CI/CD pipeline development and ensuring security compliance for healthcare tech.
DevSecOps Engineer focusing on automation and Active Directory management at Saab. Collaborating within the IAM team to enhance secure access and infrastructure management.
Technology Lead - SRE at Broadridge managing service delivery agreements and client satisfaction through project management. Focusing on improving processes for efficient service delivery in financial solutions.
Director of DevSecOps and SRE at Allegion overseeing infrastructure reliability and CI/CD pipelines. Leading and mentoring SRE and cloud infrastructure teams in a global organization.
Site Reliability Engineer ensuring smooth operations for banking systems at GFT. Working on production system access, deployment, and observability in AWS and Kubernetes environments.
DevOps Engineer ensuring stability, scalability, and reliability of justtrack's SaaS platform. Collaborate with development teams, manage cloud infrastructure, and enhance CI/CD processes.