算法工程师（强化学习方向） 12k-24k

广州经验1-3年硕士及以上算法工程师
岗位所属职位类型
全职

软件服务｜咨询
数据服务｜咨询

广州伟宏

举报职位

分享到微信

微信扫一扫，用小程序打开分享

投简历

完善在线简历

上传附件简历

: 职位诱惑：
五险一金,定期体检,周末双休; 职位描述：
岗位职位：
1.决策问题建模与框架设计：将电网中的复杂动态决策问题（如实时调度、电压控制、需求侧响应等）形式化为强化学习问题，设计合适的状态空间、动作空间和奖励函数。
2.核心算法研发与创新：
研发、实现并优化先进的强化学习算法（包括但不限于DQN, PPO, SAC, DDPG等），适应电力系统环境的高维、连续和随机特性。
探索多智能体强化学习在分布式能源协同调控、市场博弈等场景中的应用。
3.高保真仿真环境搭建与训练：
基于电力系统分析软件（如DigSILENT, PSS/E, MATLAB/Simulink）或自研平台，搭建、维护和优化强化学习训练所需的电网数字仿真环境。
在该环境中进行大规模并行仿真训练，评估智能体的性能、稳定性及对电网安全规则的理解与遵守。
4.算法验证与系统集成：与调度运行、自动化团队紧密合作，推动经过验证的强化学习算法在仿真测试平台乃至实际控制系统中集成与测试，完成从研究到应用的闭环。

任职条件：
1.计算机科学、自动化、电气工程、应用数学等相关专业，硕士及以上学历，具备2年以上强化学习的理论研究或项目开发经验。
2.精通强化学习的核心概念（MDP, 值函数，策略梯度等）与经典算法（Q-learning, SARSA 至 DRL 系列如 DQN, PPO）；深刻理解不同算法（Value-based, Policy-based, Actor-Critic）的适用场景与优缺点。
3.熟练掌握Python，并精通至少一个主流强化学习库（如Stable-Baselines3, Ray RLLib, OpenAI Gym）；具备搭建、定制和管理训练环境的能力。
4.系统性与逻辑思维：具备将模糊、复杂的业务问题抽象为清晰的数学建模问题的能力，对挑战性难题充满激情。
5.行业知识/经验：有电力系统、能源领域研究或项目经验者优先。熟悉电网调度、计量等业务者优先。

以上岗位按（初级、中级、高级定薪）

上班时间：9:00-18:00（午休1.5小时），双休
上班地址：广州市黄埔区科学城云升科学园（南网驻场）
福利待遇：入职五险一金、意外险、带薪病假、年度体检等; 工作地址
广州 - 天河区- 羊城同创汇(天河园区)1-16栋207查看地图