模型系统工程师-抖音推荐30k-60k

北京经验不限学历不限后端工程师
岗位所属职位类型
全职

  • 后端开发
字节跳动
分享到微信
微信扫一扫,用小程序打开分享
收藏
职位诱惑:

健身瑜伽,六险一金,股票期权,带薪休假

职位描述:

职位职责:
团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。

1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率;
2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能;
3、负责GPU资源管理和治理,提升GPU资源使用效率。
职位要求:
1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先;
3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护;
4、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解;熟悉主流大模型结构,具有大模型训练和推理优化经验者优先;
5、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化;
6、有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步。

工作地址

北京 - 海淀区- 中国大陆北京市海淀区北三环西路甲18号院大钟寺广场1号,邮编:100098查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
    (71)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试官是大牛
    福利待遇杠杠的
    [面试过程]
    过程很棒,面试官都是技术型的,聊得很开心
    (39)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试效率高
    [面试过程]
    在算法题上纠结太久,细节没处理好。面试官很不错
    (129)
抖音视界(北京)有限公司

字节跳动

相似职位