Hybrid MLOps 工程师

Posted 3 weeks ago

Apply now

About the role

  • 高效运行并管理开源大模型,优化推理的成本与可靠性
  • 确保在 GPU、CPU 与内存资源之间的高性能与稳定性
  • 实时监控与排查推理性能问题,确保低延迟与高吞吐量
  • 与工程团队协作,实现可扩展、可靠的模型服务架构

Requirements

  • 有使用 vLLM、HuggingFace TGI 等模型推理平台的经验
  • 熟悉 GPU 调度与资源编排,掌握 Kubernetes、Ray、Modal、RunPod、LambdaLabs 等工具
  • 具备根据流量动态监控推理延迟、成本并高效扩展系统的能力
  • 熟悉为后端工程师设置推理 API 接口的流程与规范

Benefits

  • 扁平化团队结构与真实项目主导权
  • 全程参与产品方向与决策制定
  • 灵活办公制度
  • 高影响力角色,跨产品、数据与工程多团队协作
  • 顶尖市场薪酬 + 绩效奖金
  • 全球化产品开发机会
  • 丰厚福利:住房租赁补贴、优质公司食堂、加班餐补
  • 健康、牙科与视力保险
  • 全球差旅保险(适用于你与家属)
  • 无限制、弹性带薪休假

Job title

MLOps 工程师

Job type

Experience level

Mid levelSenior

Salary

Not specified

Degree requirement

No Education Requirement

Tech skills

Location requirements

HybridChina

Report this job

See something inaccurate? Let us know and we'll update the listing.

Report job