About the role

  • Implementar una tercera zona de disponibilidad en la nube de AWS, logrando equilibrio entre fiabilidad y estabilidad de los servicios
  • Analizar el servicio y los componentes de infraestructura para mejorar disponibilidad, desempeño, mantenibilidad y resiliencia
  • Crear y diseñar sistemas robustos, predecir posibles fallos y configurar automatizaciones para resiliencia y redundancia
  • Mantener y mejorar la infraestructura de TI y sus componentes, incluyendo automatización de tareas mediante herramientas y codificación
  • Estandarizar, documentar y divulgar políticas, prácticas y herramientas de observabilidad que apoyen la implementación de SRE
  • Implementar métricas clave de SRE para medir efectividad y promover mejora continua
  • Optimizar costos en todas las cuentas de nube para mantener buen desempeño sin plataformas ociosas
  • Implementar y mantener mejores prácticas para continuidad de negocio y pruebas DRP
  • Automatizar tareas operativas y repetitivas que contribuyan a eficiencia y estabilidad de la infraestructura en la nube
  • Contribuir a resiliencia a partir de la predicción de escenarios de falla, hojas de ruta y planes de mejora
  • Proponer planes de acción y apoyar implementación para solución de causa raíz de incidentes productivos
  • Desarrollar herramientas de automatización para supervisar sistemas, gestionar incidentes y realizar tareas operativas de TI
  • Apoyar diseño y ejecución de pruebas de recuperación ante desastres y registrar resultados
  • Implementar cambios y actualizaciones de software para su lanzamiento en producción
  • Gestionar la entrega/implementación continua mediante herramientas de automatización
  • Construir y operar capacidades de integración continua (CI) empleando control de versiones y artefactos
  • Controlar cambios de configuración y mantener integridad, coherencia y trazabilidad
  • Garantizar que los requisitos de seguridad y privacidad sean parte esencial de la construcción e integración de sistemas

Requirements

  • Formación Requerida: Ingeniería de Sistemas, Ingeniería de Software, Ingeniería Informática u otras ingenierías afines
  • Formación Complementaria (Preferible): AWS Certified Cloud Practitioner
  • Cursos en Ingeniería de Fiabilidad del Sitio (SRE, site reliability engineering)
  • 2 años en DevOps o en Ingeniería de Fiabilidad del Sitio (SRE)
  • Inglés Técnico
  • Conocimiento en Ingeniería de Fiabilidad del Sitio (SRE)
  • Conocimiento avanzado en herramientas de observabilidad
  • Conocimiento de métricas de observabilidad, disponibilidad y SLAs
  • Conocimientos medio-altos en herramientas para automatización
  • Conocimientos avanzado en infraestructura en la nube de AWS
  • Conocimientos en prácticas de resiliencia y recuperación ante desastres
  • Conocimientos en herramientas ofimáticas
  • Conocimientos de Kubernetes
  • Conocimientos de Terraform
  • Conocimientos de GitLab
  • Conocimientos de NewRelic
  • Conocimiento básico de gestión del servicio ITIL

Benefits

  • Esquema Hibrido 3 días en oficina
  • Equipo de la compañía
  • Esquema Freelance
  • Bono de Puntualidad
  • Vales de Despensa
  • Vales de Restaurante
  • Prestaciones de Ley + PTU
  • Plataformas de Aprendizaje y Mentoring
  • Descuentos en Escuelas de Idiomas

Job title

Junior DevOps, SRE

Job type

Experience level

Junior

Salary

Not specified

Degree requirement

Bachelor's Degree

Location requirements

HybridColombia

Report this job

See something inaccurate? Let us know and we'll update the listing.

Report job