高薪可谈
1.强化学习算法开发: 设计、开发和优化强化学习算法,用于自主决策和控制,包括深度强化学习(DRL)、策略梯度方法、Q-learning等;
2.模仿学习与Diffusion Policy: 研究并实现模仿学习和Diffusion Policy相关算法,推动在复杂任务中的应用,提升机器人自主学习的效率与效果;
3、模型训练与评估: 基于深度学习框架(如TensorFlow、PyTorch等)训练强化学习和模仿学习模型,进行评估和改进,确保模型在不同环境中的鲁棒性;
4.仿真环境搭建: 构建并优化仿真环境,用于训练和测试强化学习及模仿学习算法,模拟真实世界中的各种场景;
5.跨部门协作: 与机器人工程团队、计算机视觉团队等密切合作,集成强化学习及模仿学习算法到实际产品中,支持机器人在复杂环境中的自主学习和决策;
6.前沿技术跟踪: 跟踪强化学习、模仿学习和Diffusion Policy领域的最新研究动态,评估并引入适合的新技术和方法;
7.算法调试与优化: 在实际应用中调试和优化算法,解决算法在部署过程中遇到的性能瓶颈和问题;
任职要求:
1.计算机科学、人工智能、电子工程、数学等相关专业硕士及以上学历;
2.精通Python、C++等编程语言,熟悉强化学习、模仿学习和Diffusion Policy相关算法,有深度学习框架(如TensorFlow、PyTorch等)使用经验,具备良好的算法开发与优化能力;
3.深入理解强化学习、模仿学习及其在Diffusion Policy中的应用,有策略梯度方法、Q-learning、模仿学习等相关经验者优先;
4.具有实际项目经验,特别是在机器人、自主驾驶、智能制造等领域应用强化学习和模仿学习算法的经验;
5.具备快速学习新技术和工具的能力,对前沿研究有强烈的兴趣和敏感度;
6.优秀的沟通能力和团队合作精神,能够与其他工程师和研究人员紧密合作,推动项目进展;
7.有相关行业经验者优先,特别是在强化学习、模仿学习算法落地和产品化方面的经验。
加分项:
有基于强化学习和模仿学习的机器人控制系统开发经验;
参与过强化学习、模仿学习相关的科研项目并有论文发表;
熟悉多智能体系统(MAS)中的强化学习与模仿学习应用。
拉勾安全提示