首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
模型系统工程师-抖音推荐
30k-60k
北京
经验不限
学历不限
后端工程师
岗位所属职位类型
全职
后端开发
字节跳动
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
投简历
完善在线简历
上传附件简历
职位诱惑:
健身瑜伽,六险一金,股票期权,带薪休假
职位描述:
职位职责:
团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。
1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率;
2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能;
3、负责GPU资源管理和治理,提升GPU资源使用效率。
职位要求:
1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先;
3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护;
4、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解;熟悉主流大模型结构,具有大模型训练和推理优化经验者优先;
5、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化;
6、有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步。
工作地址
北京
-
海淀区
- 中国大陆北京市海淀区北三环西路甲18号院大钟寺广场1号,邮编:100098
查看地图
职位发布者:
沈锦涵
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
[面试过程]
面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
(71)
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
面试官是大牛
福利待遇杠杠的
[面试过程]
过程很棒,面试官都是技术型的,聊得很开心
(39)
易*飞
半年前
描述相符
面试官
公司环境
面试官很nice
面试效率高
[面试过程]
在算法题上纠结太久,细节没处理好。面试官很不错
(129)
展开
推荐公司:
东方华数
尚福百货店
寻鲜
华青
要我科技
汇中通产
默安科技
闽地建筑
中基盛华
鑫利达
新美木业
我们有料
永烁
益新美宸
建设
高埗高冼
旭联君临
蜂鸟贸易
中臣种植
乾元管桩
万力集团
新美木器
中道华文
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
IT支持招聘
区块链招聘
品牌策划招聘
客户经理招聘
JavaScript招聘
网页产品设计师招聘
数据分析师招聘
HTML5招聘
iOS招聘
数据运营招聘
扬州华懋
天宇测绘
苏州科技城
陪同翻译
OpenLanguage 招聘
东莞以祥 招聘
东莞拓信机电 招聘
铂森金服信息咨询有限公司 招聘
中国新闻社(中新唐印科技发展有限公司) 招聘
ChinaRii-Media 招聘
二十一世纪海思 招聘
亲亲通 招聘
魔方科技 招聘
金禧酒店 招聘
铭帅电器 招聘
保华科技有限公司 招聘
保大(北京)教育科技有限公司 招聘
光彩众生 招聘
太原房产信息网 投资管理部见习经理
搜索引擎优化方案 网页设计与制作
字节跳动
内容资讯,短视频
领域
D轮及以上
发展阶段
2000人以上
规模
http://jobs.bytedance.com
公司主页
相似职位