首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
模型系统工程师-抖音推荐
30k-60k
北京
经验不限
学历不限
后端工程师
岗位所属职位类型
全职
后端开发
字节跳动
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
投简历
完善在线简历
上传附件简历
职位诱惑:
健身瑜伽,六险一金,股票期权,带薪休假
职位描述:
职位职责:
团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。
1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率;
2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能;
3、负责GPU资源管理和治理,提升GPU资源使用效率。
职位要求:
1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先;
3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护;
4、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解;熟悉主流大模型结构,具有大模型训练和推理优化经验者优先;
5、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化;
6、有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步。
工作地址
北京
-
海淀区
- 中国大陆北京市海淀区北三环西路甲18号院大钟寺广场1号,邮编:100098
查看地图
职位发布者:
沈锦涵
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
[面试过程]
面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
(71)
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
面试官是大牛
福利待遇杠杠的
[面试过程]
过程很棒,面试官都是技术型的,聊得很开心
(39)
易*飞
半年前
描述相符
面试官
公司环境
面试官很nice
面试效率高
[面试过程]
在算法题上纠结太久,细节没处理好。面试官很不错
(129)
展开
推荐公司:
深圳钛铂数据有限公司
量方测绘
百晓
富地捷
龙泰信
德亿投资
苏宁易购
远大翌新
华凯保险
艾佳蒂
冰蝶儿
魏淑贞
亮则石油
吉东福银
金珠理财
英曼
百姓部落
要我科技
边锋
中博康通
合众设计
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
U3D招聘
信用卡销售招聘
Hadoop招聘
WEB安全招聘
MongoDB招聘
模具设计招聘
数据挖掘招聘
精准推荐招聘
广告设计师招聘
销售总监招聘
太平洋时尚网
汽车科技编辑
汽车网视频主持
医疗旅行产品经理
创意策划员
天猫分销主管
上市企业品牌维权客户经理
存储应用开发工程师
理财产品运营经理
售楼处接待
吴中万达广场招初高中语文,英语老师
游戏主持人
蓝月亮高薪招聘临促
关务招聘
助理建筑师
最新学校食堂招工启事
流芳陵园
成都护士招聘
洛克王国boss
树濑
字节跳动
内容资讯,短视频
领域
D轮及以上
发展阶段
2000人以上
规模
http://jobs.bytedance.com
公司主页
相似职位