多模态算法工程师-抖音AI分身30k-60k

杭州经验3-5年本科及以上大数据开发工程师
岗位所属职位类型
全职

  • 算法
字节跳动
分享到微信
微信扫一扫,用小程序打开分享
收藏
职位诱惑:

健身瑜伽,六险一金,团队氛围好

职位描述:

职位职责:
1、负责抖音与多模态大模型技术的结合落地,探索抖音结合AI的创新产品升级;基于对直播、短视频、评论等已有内容体裁的内容理解和二次创作生成,形成抖音下新的互动内容体裁,供创作者调试和推荐分发;为抖音下各场景业务目标负责,如交易场景的GMV、知识陪伴场景的互动效率等;
2、基于创作者历史资产(直播回放或短视频)进行多模态分类打标、高光提取、智能剪辑;基于口播稿、创作者形象等特定情况,生成口、动作驱动的真人视频,形成可调度的创作者个性化资产;
3、基于不同场景的业务诉求,设计Agent规划能力,形成视频编排脚本,优化围绕主题、剧情、商品的生成内容走向;支持实时交互下的视频调度和基础QA;
4、持续探索MLLM、LLM、Diffusion等通用大模型在各任务下的适配性,通过Post-Train(SFT、RL)优化,增强模型在业务领域下的效果和适配能力;Follow基于大模型的上层应用技术,Agent、Auto-Prompt、RAG等;
5、上述场景的各类模型训练、模型应用相关的基础建设,包括但不限于模型训练、数据工程、训练推理框架迭代、维护模型评估指标体系。
职位要求:
1、在CV、VLM、MLLM等领域有成熟的项目落地经验,有短视频、图文、直播算法领域经验优先;
2、学习能力和业务理解能力强,具有一定创新能力,对新领域能快速调研落地,独立设计产出技术方案;
3、具有扎实的机器学习基础,对深度学习、大语言模型、多模态模型、生成式模型等内容理解与生成技术有深入的理解,数理功底扎实,自学能力强;
4、有扎实的编码能力,熟练使用相关机器学习框架和工程框架;
5、在计算机科学会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等发表过论文或有竞赛经验者优先。

工作地址

杭州 - 余杭区- 中国大陆浙江省杭州市余杭区西溪八方城8号楼,邮编:311100查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
    (71)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试官是大牛
    福利待遇杠杠的
    [面试过程]
    过程很棒,面试官都是技术型的,聊得很开心
    (39)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试效率高
    [面试过程]
    在算法题上纠结太久,细节没处理好。面试官很不错
    (129)
抖音视界(北京)有限公司

字节跳动

相似职位