高性能计算研发工程师35k-60k

杭州经验3-5年硕士及以上算法工程师
岗位所属职位类型
全职

  • 人工智能服务
  • PyTorch
  • 机器学习算法/工程化经验
  • 计算机相关专业
  • 云计算|云存储
  • 深度学习经验
阿里云
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

大厂人工智能战略方向,发展前景广阔

职位描述:

岗位职责:(部分匹配即可)
1、针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率;
2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能;
3、提升分布式推理下模型并行(ModelParalleism)、数据并行(Data Paralelism)等场景下的性能;
4、支撑异构AI芯片上的调度框架设计与优化,提升系统的实时性、吞吐率、算力利用率等指标;
5、针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行镜像和训推框架适配,针对特定硬件架构和推理引擎进行性能优化;
6、深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法;
7、探索前沿技术方向(如混合专家模型MoE、强化学习算法等),推动AI工程化落地的效率提升。

岗位要求:(部分满足即可)
1、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化等;
2、熟悉TensorRT-LLM、LMDeploy、vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等);
3、扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术;
4、至少熟练使用C++/Python/Golang中一种,具备良好的算法设计与代码实现能力;
5、熟悉Pytorch,Deepspeed等主流分布式框架的使用和原理,熟练掌握TensorFlow、PyTorch等深度学习框架;
6、了解深度学习算法基本原理,熟悉深度学习训练框架及其模型文件的解析;
7、了解通信架构原理、有分布式优化和通信优化经历者优先;
8、了解深度学习模型的量化压缩、推理加速等优化技术;
9、了解通信架构原理、有分布式优化和通信优化经历者优先。

附加信息:

  • 候选人加分项:训推性能优化、通信优化、模型优化

工作地址

杭州 - 西湖区- 杭州或者北京查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    能力还是不够(⊙o⊙)哇,继续努力,下次还去
    (19)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试效率高
    环境高大上
    面试官很nice
    [面试过程]
    面试官特别好,聊的也比较细,遗憾没有见到运营老大,不过研发老大也很nice呀,期待佳音。
    (59)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官是大牛
    [面试过程]
    面试过程比较愉快,等待HR沟通
    (2)
阿里云计算有限公司

阿里云

相似职位