岗位职责:
1. 负责垂直领域(如环保、能源等)大语言模型的开发、训练、调优及落地部署,解决行业场景中的复杂问题;
2. 设计并实现行业智能体(Agent)系统,包括任务规划、知识检索、工具调用、多模态交互等核心模块开发;
3. 构建垂直行业的高质量领域知识数据集,设计高效的数据清洗、增强和持续迭代方案;
4. 探索大模型与行业业务场景的结合点(如智能客服、知识管理、决策支持等),推动技术落地与效果验证;
5. 跟踪大模型前沿技术(如MoE、长上下文建模、模型压缩等),结合业务需求进行技术创新。
任职要求:
1. 学历背景:
o 硕士及以上学历,计算机科学、人工智能、数学等相关专业,3年以上NLP/大模型开发经验;
o 优秀本科生需具备5年以上大模型领域深度实践经验。
2. 技术能力:
o 熟悉主流大模型架构(如Transformer、LLaMA、GPT系列),掌握PyTorch、DeepSpeed、Megatron等框架;
o 具备垂直行业大模型训练经验,精通领域数据构建、模型微调(LoRA/QLoRA)、提示工程及评估方法;
o 熟悉智能体开发技术栈(如AutoGPT、ReAct、RAG框架),具备多智能体协同系统设计经验者优先;
o 掌握大模型推理优化技术(模型量化、KV Cache优化、Attention加速等),有端侧部署经验加分。