职位名称:多模态算法实习生...8k-9k

上海在校/应届博士及以上大数据开发工程师
岗位所属职位类型
实习

  • 算法
字节跳动
分享到微信
微信扫一扫,用小程序打开分享
收藏
职位诱惑:

健身瑜伽,团队氛围好,晋升空间大

职位描述:

职位职责:
团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。

1、课题背景:随着大模型技术在多模态内容理解领域的突破,内容特征已逐渐替代传统ID特征成为推荐系统的核心驱动力。然而当前系统面临三重挑战:(1)内容深度解析需求:短视频、直播、评论等场景需要同时处理文本、图像、音频等多模态数据,且需建模用户长短期兴趣与跨领域行为;(2)动态安全威胁:评论区涌现多模态越狱攻击(如隐晦图文组合提示词),传统单模态审核无法应对复杂对抗场景;(3)跨域迁移瓶颈:用户娱乐内容兴趣与电商消费需求间存在语义鸿沟,需建立可解释的跨域映射机制。
2、课题挑战:(1)多模态复杂性:用户行为涉及多模态交互(如视频+评论+购物),需统一框架实现内容理解与用户意图推理;(2)社区生态动态性:自然作者、各种机构、黑灰产等群体会互相交互产生大量复杂的多模态行为,要求算法能够快速准确的理解内容和交互的语义;(3)生态协同需求:DAU-GMV转化率存在成倍提升空间,需突破"娱乐到消费"的跨域兴趣建模技术;(4)技术整合价值:联合优化推荐、安全、跨域三大模块,可降低算力消耗并提升端到端效果。
3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。
职位要求:
1、2026届及之后毕业,博士在读,人工智能、计算机、数学相关专业者优先;
2、具备扎实的编码能力、数据结构和基础算法功底,熟练运用各种算法框架与工程框架;
3、在国际会议或期刊发表论文者(包括但不限于 ACL、EMNLP、NeurIPS、ICML、ICLR、CVPR 等)优先;
4、拥有扎实的机器学习基础,在深度学习、强化学习、NLP 、多模态方向有深入的理解与研究经历;
5、具备良好的沟通协作能力,能够与团队共同探索新技术,推动技术发展。

工作地址

上海 - 杨浦区- 中国大陆上海市杨浦区民府路678号上海新江湾广场T2号楼,邮编:200082查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    暂时一面 面试官很和蔼可亲,专业能力也很强,主要会问一些客户投诉 以及工作处理内容的问题 面试官也很准时的上线
    (15)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
    (71)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    福利待遇杠杠的
    面试官很nice
    环境高大上
    [面试过程]
    填写纸质简历; 接下来是群面; 接下来是hr面。 同事都很年轻有活力,感觉很棒。
    (559)
抖音视界(北京)有限公司

字节跳动

相似职位