Site Reliability Engineer at MODO enhancing payment systems with strategic leadership and technical execution. Responsible for incident management, monitoring, and optimizing cloud infrastructure.
Responsibilities
Monitoreo y Observabilidad: Implementación de herramientas de monitoreo para detectar y solucionar problemas en tiempo real.
Desarrollo de dashboards y alertas para mantener la visibilidad sobre el rendimiento del sistema.
Gestión de incidencias: Establecimiento de procedimientos para la detección, respuesta y resolución de incidentes.
Capacitación en la gestión de crisis y en la mejora continua post-mortem.
Capacidad y rendimiento: Evaluación y optimización de la capacidad y el rendimiento de los sistemas para soportar el crecimiento de la carga.
Uso de herramientas de benchmarking y pruebas de carga.
Reliability Engineering: Implementación de prácticas de ingeniería de confiabilidad para aumentar la resiliencia de los sistemas.
Identificación y eliminación de puntos únicos de falla.
Seguridad en el Ciclo de Desarrollo del Software: Implementación de medidas de seguridad en el ciclo de vida del desarrollo de software (SDLC).
Monitoreo y respuesta a vulnerabilidades y amenazas.
Creación y mantenimiento de herramientas de soporte para ingeniería.
Optimización de Costos: Análisis y optimización de costos de infraestructura.
Implementación de políticas de utilización eficiente de recursos.
Requirements
Experiencia integrando y utilizando plataformas como Datadog (APM, Logs, Synthetics, SLOs), con foco en trazabilidad de incidentes y tuning de alertas.
Personas con experiencia en desarrollo (preferentemente Node) y en trabajar en entornos cloud, idealmente con un perfil backend en AWS.
Experiencia en la administración y orquestación de contenedores con Kubernetes, valorando especialmente el uso de Helm.
Habilidad para diagnosticar, dar seguimiento, y resolver problemas en aplicaciones, con un enfoque en soporte aplicativo.
Capacidad para moverse en escenarios cambiantes, con una mentalidad orientada a resultados y atención al detalle.
Cloud Engineer at Agility Technologies leading the design of scalable eLearning infrastructure. Collaborating on technical design and implementation involving cloud - based platforms and secure integrations.
Senior Hardware Reliability Engineer overseeing reliability testing and analysis of outdoor electronic assemblies at Gridware. Collaborating with mechanical engineers and contributing to product lifetimes modeling.
Senior Manager leading SRE, Virtualization, Networking, and AI Infrastructure teams at F5. Overseeing mission - critical infrastructure and driving operational excellence across hybrid compute environments.
Senior Software Release Engineer managing software release trains at GM. Owning integration activities and defining software release scopes with a focus on collaboration with suppliers.
Software Release Engineer managing VCU and CCU software release trains for automotive solutions. Overseeing release readiness, integration, and building processes for embedded software.
Senior DevOps Engineer at Broadridge developing fully automated pipelines for Python applications. Collaborating on LTX Trading applications with a focus on cloud infrastructure and deployment automation.
DevOps Azure Developer specializing in end - to - end application development with Python, Azure, and CI/CD practices at Abbott. Involves collaborative environments and building secure cloud applications.
Release Engineer enhancing end - to - end build and deployment pipelines for Ironclad's AI contracting platform. Collaborating with Engineering, QE, and Product teams to manage releases and deployment processes.
DevOps Engineer focused on CI/CD and cloud operations for a leading financial services client. Ensure high - quality, automated deployments and promote DevOps practices within the team.
DevOps Engineer maintaining cloud infrastructure and automation for clinical trials at Teckro. Collaborating with development and operations teams to optimize performance and ensure system reliability.