Data Engineer focusing on Azure and Databricks to design and maintain a robust data platform. Collaborating with teams for efficient data architecture and governance practices.
Responsibilities
Desenhar, desenvolver e manter a espinha dorsal da nossa plataforma de dados, garantindo que nossas informações sejam robustas, confiáveis e prontas para o consumo analítico e estratégico.
Arquitetura de Dados (Medallion): Projetar, implementar e manter pipelines de dados escaláveis e eficientes, gerenciando todo o ciclo de vida dos dados através das camadas Bronze, Silver e Gold na plataforma Databricks.
Desenvolvimento e Otimização de Pipelines: Construir e gerenciar fluxos de ETL/ELT complexos utilizando Azure Databricks (PySpark/SQL) e Azure Data Factory, garantindo a ingestão, transformação e armazenamento robusto dos dados.
Eficiência com IA no Desenvolvimento: Otimizar ativamente o ciclo de desenvolvimento e a performance dos pipelines, aplicando ferramentas de IA generativa e assistentes de código (ex: Databricks Assistant, GitHub Copilot) para acelerar a entrega e melhorar a qualidade do código.
Gerenciamento do Data Lakehouse: Garantir a integridade, consistência e performance do nosso Data Lakehouse, utilizando Delta Lake como camada de armazenamento principal (ACID transactions, schema enforcement, time travel).
Modelagem de Dados: Colaborar com analistas e áreas de negócio para desenhar e implementar modelos multidimensionais e agregados (camada Gold), otimizados para consumo de BI e análises avançadas.
Integração de Sistemas: Construir e implementar APIs para facilitar a comunicação, ingestão e consumo de dados, garantindo a troca eficiente de informações entre sistemas (ex: Oracle, SQL Server, fontes externas).
Colaboração e Governança: Trabalhar de forma colaborativa com equipes multifuncionais (BI, Data Science, Negócios) e aplicar as melhores práticas de engenharia e governança de dados.
Requirements
Experiência Sólida: Experiência como Engenheiro de Dados, com foco principal no ecossistema Azure Cloud.
Expertise em Databricks: Conhecimento profundo em Azure Databricks, incluindo Spark, PySpark, Spark SQL e otimização de clusters.
Orquestração de Dados: Forte conhecimento em Azure Data Factory (ADF) para criação e gerenciamento de pipelines.
Linguagens: Domínio avançado em SQL e Python (voltado para engenharia de dados, ex: Pandas, PySpark).
Conceitos Fundamentais: Excelente compreensão dos fluxos de ETL/ELT, arquitetura Medallão (Medallion Architecture) e dos fundamentos do Delta Lake.
Modelagem de Dados: Experiência com técnicas de modelagem de dados (dimensional, relacional) e familiaridade com ferramentas como Erwin ou similares.
Bancos de Dados: Conhecimento prático em bancos de dados relacionais, como Oracle e SQL Server.
Benefits
Plano de saúde e odontológico;
Vale alimentação e refeição;
Auxílio-creche;
Licença parental estendida;
Parceria com academias e profissionais de saúde e bem-estar via Wellhub (Gympass) TotalPass;
Participação nos Lucros e Resultados (PLR);
Seguro de Vida;
Plataforma de aprendizagem contínua (CI&T University);
Clube de descontos;
Plataforma online gratuita dedicada à promoção da saúde física, mental e bem-estar;
Lead Data Engineer overseeing engineers and advancing the data platform at American Family Insurance. Creating tools and infrastructure to empower teams across the company.
Data Architect designing end - to - end Snowflake data solutions and collaborating with technical stakeholders at Emerson. Supporting the realization of Data and Digitalization Strategy.
Manager of Data Engineering leading data assets and infrastructure initiatives at CLA. Collaborating with teams to enforce data quality standards and drive integration efforts.
Data Engineer building modern Data Lake architecture on AWS and implementing scalable ETL/ELT pipelines. Collaborating across teams for analytics and reporting on gaming platforms.
Chief Data Engineer leading Scania’s Commercial Data Engineering team for growing sustainable transport solutions. Focused on data products and pipelines for BI, analytics, and AI.
Entry - Level Data Engineer at GM, focusing on building large scale data platforms in cloud environments. Collaborating with data engineers and scientists while migrating systems to cloud solutions.
Data Engineer designing and building scalable ETL/ELT pipelines for enterprise - grade analytics solutions. Collaborating with product teams to deliver high - quality, secure, and discoverable data.
Data Engineer responsible for data integrations with AWS technology stack for Adobe's Digital Experience. Collaborating with multiple teams to conceptualize solutions and improve data ecosystem.
People Data Architect designing and managing people data analytics for Gen, delivering actionable insights for HR. Collaborating across teams to enhance data - driven decision - making.