大模型推理优化工程师-移动...30k-60k

上海经验不限本科及以上后端工程师
岗位所属职位类型
全职

  • 后端开发
字节跳动
分享到微信
微信扫一扫,用小程序打开分享
收藏
职位诱惑:

健身瑜伽,六险一金,股票期权,带薪休假

职位描述:

职位职责:
1、负责LLM/VLM大模型的部署和推理优化开发,包括量化、并行化等各种典型的优化工作,确保系统的高性能、高可用和低成本;
2、与业务、产品、算法等团队合作,共同致力提升模型在业务场景的效果;
3、探索一些前沿的推理加速技术,包括在新型GPU/NPU上的部署落地。
职位要求:
1、熟悉Transformers、Stable diffusion等主流模型原理;
2、熟悉至少一种推理引擎框架(vLLM/Slang/ONNX Runtime或其他自研框架);
3、熟悉至少一种机器学习框架(Tensorflow/PyTorch/MxNet或其他自研框架);
4、了解GPU/NPU硬件特性,具备一定的性能调优经验;
5、有以下至少一项的背景知识与经验:GPU编程、模型量化、Kernel开发及优化;
6、良好的团队协作能力,有良好的动手实现能力,对技术有热情。

工作地址

上海 - 徐汇区- 中国大陆上海市徐汇区古美路1520号漕河泾中心B,邮编:200233查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
    (71)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试官是大牛
    福利待遇杠杠的
    [面试过程]
    过程很棒,面试官都是技术型的,聊得很开心
    (39)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试效率高
    [面试过程]
    在算法题上纠结太久,细节没处理好。面试官很不错
    (129)
抖音视界(北京)有限公司

字节跳动

相似职位