算法强化学习实习生8k-12k

深圳在校/应届硕士及以上算法工程师
岗位所属职位类型
实习

  • 人工智能服务
新旦智能
分享到微信
微信扫一扫,用小程序打开分享
收藏
职位诱惑:

扁平管理、发展空间大

职位描述:

"方向一:大模型,有llm训练经验,有强化学习经验,有MCTS,RL,RLHF,PPO,DPO,Reward Model经验加分
方向二:文生图,Stable difussion模型,ComfyUI等框架使用经验丰富

经验加分
工作职责:
1、负责多模态大模型的微调
2、探索并实现多模态大模型的模态对齐、高效训练、指令微调及性能评估等关键技术
要求:
1、全球知名高校硕士、博士学历,有扎实的数据结构和算法基础,有较强的实践能力
2、熟练掌握pytorch,transformer等LLM 领域相关工具,有bert,vision-transformer,llm实践经验;有强化学习、MCTS、RL、RLHF等经验
3、熟悉和实践深度学习算法(vision-transformer,LLAMA,GPT系列等),发表过顶刊或会议论文优先,如ICML、NIPS、ICCV、ECCV、CVPR、ACL、EMNLP、COLING等;有竞赛经验者优先。
4、有强烈的求知欲、好奇心和进取心,有快速学习新技术的能力"

附加信息:

  • 工作时间:周末双休

工作地址

深圳 - 南山区 - 西丽- 云科技大厦查看地图

职位发布者:

成子敏
  • 招聘经理
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
深圳市新旦智能科技有限责任公司

新旦智能

  • 人工智能服务,工具类产品,IT技术服务|咨询

    领域
  • 天使轮

    发展阶段
  • 15-50人

    规模
  • https://www.xdan.ai/

    公司主页

相似职位