Data Engineer at Xylem Vue defining Data Lake strategy and building high-quality datasets. Collaborating across teams to deliver AI solutions in the water sector.
Responsibilities
Jugar un papel clave en la definición de la dirección técnica y la estrategia del Data Lake de Xylem Vue, construyendo datasets analíticos de alta calidad y pipelines escalables que impulsen analítica avanzada y soluciones basadas en IA en toda la plataforma.
Definir la estrategia técnica y la arquitectura del Data Lake para dar soporte a modelos de IA/ML y flujos de trabajo analíticos
Construir y mantener modelos analíticos y datasets de features para predicción, detección de anomalías, optimización y soporte a la decisión
Diseñar pipelines de datos end-to-end (ingesta, transformación, control de calidad, trazabilidad/lineage) para múltiples fuentes del sector del agua (telemetría time-series, modelos hidráulicos, datos geoespaciales, activos e historiales de eventos)
Garantizar la calidad, consistencia, gobierno y disponibilidad de los datos en todo el Data Lake
Colaborar con AI Engineers, data scientists, equipos de producto y arquitectos para entender requisitos de modelos y traducirlos a tareas accionables de data engineering
Liderar la adopción de buenas prácticas en arquitectura de datos, gestión de metadatos, modelado de datos y MLOps/feature engineering
Desarrollar capacidades a nivel plataforma (feature stores, interfaces modelo-dato, herramientas de automatización) para acelerar el desarrollo de IA en los equipos de producto
Monitorizar el rendimiento y la fiabilidad de los pipelines, resolviendo proactivamente cuellos de botella o incidencias de datos
Documentar arquitecturas, transformaciones y estructuras de datos para asegurar transparencia y mantenibilidad a largo plazo
Requirements
Grado o Máster en Informática, Data Engineering o un campo técnico relacionado
Sólida experiencia práctica en ingeniería de datos: construcción de pipelines ETL/ELT, trabajo con grandes volúmenes de datos e implementación de flujos distribuidos
Experiencia diseñando y manteniendo Data Lakes en la nube y tecnologías Big Data
Buen entendimiento de las necesidades de datos para IA/ML, feature engineering y diseño de datasets “model-ready”
Dominio de Python y SQL, y herramientas como PySpark/Spark, Databricks, Airflow (o similares)
Experiencia con APIs, microservicios y patrones de integración de datos
Familiaridad con herramientas de MLOps, feature stores y marcos de gobierno del dato
Habilidad para colaborar con equipos multidisciplinares y comunicar conceptos complejos con claridad
(Valorable) Conocimiento de tipos de datos y contexto operativo del sector del agua
Data Engineer designing and maintaining data pipelines at Black Semiconductor. Collaborating with process, equipment, and IT teams to support manufacturing analytics and decision - making.
Junior Data Engineer role focusing on Business Intelligence and Big Data at Avanade. Collaborating on data analysis and SQL queries in a supportive learning environment.
GCP Data Engineer designing and developing data processing modules for Ki, an algorithmic insurance carrier. Working closely with multiple teams to optimize data pipelines and reporting.
Data Engineer at Securian Financial optimizing scalable data pipelines for AI and advanced analytics. Collaborating with teams to deliver secure and accessible data solutions.
IT Data Engineering Co‑Op at BlueRock Therapeutics supports development of scientific data systems. Collaboration on data workflows and foundational AWS data engineering tasks.
Data Engineer I building and operationalizing complex data solutions for Travelers' analytics using Databricks. Collaborating within teams to educate end users and support data governance.
Data Engineer shaping modern data architecture to drive golf’s digital transformation. Collaborating with teams to enhance data pipelines and insights for customer engagement and revenue growth.
Staff Data Engineer overseeing complex data systems for CITY Furniture. Responsible for architecting and optimizing data ecosystems in a hybrid work environment.
Data Engineer strengthening data platform team at Samba TV to improve data analytics and reporting capabilities. Building on AWS, Databricks, BigQuery, and Snowflake technology.
Data Engineer focusing on secure ETL/ELT data pipelines and compliance in healthcare. Designing scalable ingestion frameworks and ensuring alignment with federal standards.