Data Architect at EXL | Hybrid Hired

About the role

Data Architect designing and modernizing large-scale, cloud-native data platforms. Focused on distributed processing, real-time pipelines, automation, and GenAI enablement at a data management company.

Responsibilities

Architect and govern enterprise Big Data platforms (data lake, lakehouse, warehouse, real-time).
Design high-volume, high-velocity data pipelines using batch and streaming frameworks.
Lead implementation of distributed processing architectures (Spark, PySpark, EMR).
Build event-driven and real-time streaming solutions (Kafka, Kinesis, Flink).
Define ETL/ELT patterns, metadata-driven pipelines, and reusable ingestion frameworks.
Drive data platform automation (Airflow/Step Functions, CI/CD, data quality, observability).
Optimize performance, scalability, fault tolerance, and cost across Big Data workloads.
Integrate GenAI architectures (LLMs, embeddings, vector databases, RAG) with enterprise data lakes.
Ensure security, governance, lineage, and compliance across data platforms.
Provide hands-on leadership and technical mentoring to data engineering teams.

Requirements

12+ years in Big Data Engineering / Data Architecture roles.
Expert-level experience with Spark, PySpark, SQL, and distributed compute engines.
Strong knowledge of AWS Big Data stack: S3, EMR, Glue, Athena, Redshift, Lambda, Step Functions.
Hands-on experience with Snowflake (performance tuning, data sharing, optimization).
Expertise in streaming platforms: Kafka, Kinesis, Flink, or Spark Streaming.
Strong experience with data modeling (dimensional, Data Vault 2.0).
Proficiency in Python, schema evolution, partitioning, and data versioning.
Experience with orchestration and automation tools (Airflow, Dagster, CI/CD).
Working knowledge of GenAI data integration (feature stores, vector DBs, RAG pipelines).
Experience with Agile delivery and leading globally distributed engineering teams.

Similar roles

Browse all Data Engineer jobs

38 minutes ago

WA

Senior Data Engineer

Wavestone

Senior Data Engineer driving data intelligence requirements and scalable data solutions for a global consulting firm. Collaborating across functions to enhance Microsoft architecture and analytics capabilities.

Hybrid Role

Romania Data Engineer

45 minutes ago

EE

AI and Data Engineer

EEOC

Experienced AI Engineer designing and building production - grade agentic AI systems using generative AI and large language models. Collaborating with data engineers, data scientists in a tech - driven company.

Hybrid Role

Honolulu United States Data Engineer

$99,000 - $225,000 per year

3 hours ago

PL

Intermediate Data Developer – Data Engineering

Plusgrade

Intermediate Data Engineer designing and building data pipelines for travel industry data management. Collaborating across teams to ensure reliable data for analytics and reporting.

Hybrid Role

Montreal Canada Data Engineer

6 hours ago

WA

Data Engineer

Walaris

Data Engineer managing and organizing datasets for AI models at Walaris, developing AI - driven autonomous systems for defense and security applications.

Hybrid Role

Nuremberg Germany Data Engineer

7 hours ago

BS

Data Engineer

Black Semiconductor

Data Engineer designing and maintaining data pipelines at Black Semiconductor. Collaborating with process, equipment, and IT teams to support manufacturing analytics and decision - making.

Hybrid Role

Aachen Germany Data Engineer

8 hours ago

AV

Junior Data Engineer

Avanade

Junior Data Engineer role focusing on Business Intelligence and Big Data at Avanade. Collaborating on data analysis and SQL queries in a supportive learning environment.

Onsite Role

Napoli Italy Data Engineer

8 hours ago

KI

GCP Data Engineer

KI

GCP Data Engineer designing and developing data processing modules for Ki, an algorithmic insurance carrier. Working closely with multiple teams to optimize data pipelines and reporting.

Hybrid Role

City of London United Kingdom Data Engineer

8 hours ago

SF

Data Engineer

Securian Financial

Data Engineer at Securian Financial optimizing scalable data pipelines for AI and advanced analytics. Collaborating with teams to deliver secure and accessible data solutions.

Hybrid Role

Saint Paul United States Data Engineer

$72,000 - $134,000 per year

8 hours ago

BT

Co-Op, Data Engineering

BlueRock Therapeutics

IT Data Engineering Co‑Op at BlueRock Therapeutics supports development of scientific data systems. Collaboration on data workflows and foundational AWS data engineering tasks.

Hybrid Role

Cambridge United States Data Engineer

$30 per hour

15 hours ago

TR

Data Engineer I, Databricks, MLOps

Travelers

Data Engineer I building and operationalizing complex data solutions for Travelers' analytics using Databricks. Collaborating within teams to educate end users and support data governance.

Hybrid Role

Hartford United States Data Engineer

$109,300 - $180,200 per year