Lead design and implementation of ETL/ELT pipelines, governance and data infrastructure for healthcare clients. Ensure data quality, scalability and collaboration with BI and Data Science.
Responsibilities
Projetar e implementar pipelines de ingestão, transformação (ETL / ELT), agregação e disponibilização de dados (batch e streaming).
Definir arquitetura de dados: data lake, data warehouses, data marts e/ou lakehouse (ex: Delta Lake, Snowflake, BigQuery, Databricks).
Garantir qualidade e confiabilidade dos dados, com monitoramento, alertas e mecanismos de correção de falhas.
Implementar governança de dados: catalogação, metadados, lineage, controle de acesso, versionamento.
Atuar com modelagem de dados (esquemas dimensionais, normalizados e desacoplados) para suportar relatórios e análises.
Otimizar performance de consultas, particionamento, índices, agregações e armazenamento.
Trabalhar com equipes de BI e Ciência de Dados para entrega de pipelines adequados aos seus requisitos.
Auxiliar no escalonamento da infraestrutura de dados (cluster, orquestração, escalabilidade).
Documentar processos, pipeline e melhores práticas de engenharia de dados.
Requirements
Experiência de pelo menos 5 a 8 anos em engenharia de dados, com parte significativa em nível sênior.
Profundo conhecimento de SQL e ferramentas de processamento de dados (Spark, Databricks, Flink etc.).
Experiência com orquestração de pipelines (Airflow, Prefect, Dagster, etc.).
Familiaridade com data lakes, lakehouses, DWHs, e arquiteturas modernas de dados.
Experiência com infraestrutura de dados na nuvem (AWS, GCP, Azure) e componentes como S3, BigQuery, Redshift etc.
Prática com processos de monitoramento, logging, alertas e tratamento de falhas.
Inglês fluente.
Boa comunicação e capacidade de trabalhar em times multifuncionais.
Formação em Ciência da Computação, Engenharia, Matemática ou área afim.
Diferenciais: vivência no setor saúde (dados clínicos, interoperabilidade HL7/FHIR); experiência com dados não estruturados; competência em automação e CI/CD de dados; experiência com ferramentas de qualidade de dados (Great Expectations, Deequ); conhecimento em segurança e compliance de dados sensíveis (LGPD, HIPAA).
Snowflake Data Engineer optimizing data pipelines using Snowflake for a global life science company. Collaborate with cross - functional teams for data solutions and performance improvements in Madrid.
Data Engineer designing and implementing big data solutions at DATAIS. Collaborating with clients to deliver actionable business insights and innovative data products in a hybrid environment.
SAP Data Engineer supporting MERKUR GROUP in becoming a data - driven company. Responsible for data integration, ETL processes, and collaboration with various departments.
Big Data Engineer designing and managing data applications on Google Cloud. Join Vodafone’s global tech team to optimize data ingestion and processing for machine learning.
Data Engineer building and maintaining data pipelines for Farfetch’s data platform. Collaborating with the Data team to improve data reliability and architecture in Porto.
Senior Data Engineer at Razer leading initiatives in data engineering and AI infrastructure. Collaborating across teams to develop robust data solutions and enhancing AI/ML projects.
Data Engineering Intern working with data as Jua builds AI for climate and geospatial datasets. Contributing to the integration and validation of new datasets with experienced mentors.
Data Engineer supporting a fintech company in building and maintaining data pipelines. Collaborating with tech teams and enhancing data processing in a high - volume environment.
Senior Data Engineer developing and optimizing data pipelines for Scene+’s cloud - native platform in Toronto. Collaborating across teams to enhance data governance and analytics capabilities.
Staff Engineer developing innovative data solutions for dentsu's B2B marketing vision. Collaborating using cutting - edge cloud technologies and mentoring engineers in their careers.