首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
模型系统工程师-抖音推荐
30k-60k
北京
经验不限
学历不限
后端工程师
岗位所属职位类型
全职
后端开发
字节跳动
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
投简历
完善在线简历
上传附件简历
职位诱惑:
健身瑜伽,六险一金,股票期权,带薪休假
职位描述:
职位职责:
团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。
1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率;
2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能;
3、负责GPU资源管理和治理,提升GPU资源使用效率。
职位要求:
1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先;
3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护;
4、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解;熟悉主流大模型结构,具有大模型训练和推理优化经验者优先;
5、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化;
6、有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步。
工作地址
北京
-
海淀区
- 中国大陆北京市海淀区北三环西路甲18号院大钟寺广场1号,邮编:100098
查看地图
职位发布者:
沈锦涵
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
[面试过程]
面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
(71)
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
面试官是大牛
福利待遇杠杠的
[面试过程]
过程很棒,面试官都是技术型的,聊得很开心
(39)
易*飞
半年前
描述相符
面试官
公司环境
面试官很nice
面试效率高
[面试过程]
在算法题上纠结太久,细节没处理好。面试官很不错
(129)
展开
推荐公司:
美人堂
臻实优品电子商务
煜淼互联网
融创毅达
苏宁易达
魏淑贞
金珠理财
机电设备
亿鑫设备
财智美文
钧正投资
东电腾达
航天龙腾
铂瑧
编客
昊翔源
新美木器
富我科技
青平
常平刘谦
刘雪珍
探针
歌德云
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
网络安全招聘
Delphi招聘
游戏推广招聘
美术设计师(2D/3D)招聘
财务总监/经理招聘
法务招聘
游戏主播招聘
媒介投放招聘
web前端招聘
项目助理招聘
美能国际 招聘
比心聊天室 招聘
斯诺顿 招聘
护理专业就业方向 招聘
佛山移动 招聘
二级代理 招聘
环帝 招聘
全国教师信息网招聘
爱好特长招聘
cisaw招聘
oa软件招聘
杀道行者招聘
航空工业集团招聘
阜宁人才网招聘
合肥兼职招聘招聘
东洋轮胎招聘
童梦招聘
检具招聘
经理助理职责招聘
鹏业软件官网招聘
字节跳动
内容资讯,短视频
领域
D轮及以上
发展阶段
2000人以上
规模
http://jobs.bytedance.com
公司主页
相似职位