算法强化学习实习生招聘-2025年新旦智能算法强化学习实习生招聘求职信息-算法强化学习实习生岗位职责介绍-拉勾招聘

进入企业版

算法强化学习实习生8k-12k

深圳在校/应届硕士及以上算法工程师
岗位所属职位类型
实习

人工智能服务

新旦智能

举报职位

分享到微信

微信扫一扫，用小程序打开分享

投简历

完善在线简历

上传附件简历

职位诱惑：

扁平管理、发展空间大

职位描述：

"方向一：大模型,有llm训练经验，有强化学习经验，有MCTS，RL，RLHF，PPO，DPO，Reward Model经验加分
方向二：文生图,Stable difussion模型，ComfyUI等框架使用经验丰富

经验加分
工作职责：
1、负责多模态大模型的微调
2、探索并实现多模态大模型的模态对齐、高效训练、指令微调及性能评估等关键技术
要求：
1、全球知名高校硕士、博士学历，有扎实的数据结构和算法基础，有较强的实践能力
2、熟练掌握pytorch，transformer等LLM 领域相关工具，有bert，vision-transformer，llm实践经验；有强化学习、MCTS、RL、RLHF等经验
3、熟悉和实践深度学习算法（vision-transformer，LLAMA，GPT系列等），发表过顶刊或会议论文优先，如ICML、NIPS、ICCV、ECCV、CVPR、ACL、EMNLP、COLING等；有竞赛经验者优先。
4、有强烈的求知欲、好奇心和进取心，有快速学习新技术的能力"