大模型工程师3k-6k

北京经验3-5年本科及以上大数据开发工程师
岗位所属职位类型
兼职

  • 人工智能服务
  • IT技术服务|咨询
及时标讯
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

项目规模大,创新

职位描述:

岗位职责:
我们正在寻找一名资深大模型工程师,负责设计、开发、优化和部署大规模语言模型及相关应用。您将参与从模型预训练、微调、推理优化到实际落地的全流程工作,推动前沿技术在业务场景中的创新应用。
核心职责
1. 大模型开发与优化
- 参与大规模语言模型(如GPT、LLaMA、BERT等)的预训练、指令微调(Instruction Tuning)、对齐优化(Alignment)等全流程开发。
- 设计高效的分布式训练方案,优化模型训练效率与资源利用率。
- 探索模型压缩、量化、蒸馏等技术,提升模型推理性能与部署效率。
2. 算法研究与落地
- 结合业务场景(如对话系统、内容生成、知识问答等)设计定制化模型方案。
- 探索多模态大模型(文本、图像、视频)的技术融合与创新应用。
- 持续跟踪学术界与工业界前沿技术(如MoE、RAG、Agent框架),推动技术迭代。
3. 工程化与部署
- 构建高可用、低延迟的大模型推理服务,优化GPU资源管理与服务稳定性。
- 开发配套工具链,如数据清洗、评估指标、Prompt工程自动化等。
- 与Infra团队协作,优化训练/推理框架(如vLLM、DeepSpeed、Triton)。
4. 跨团队协作
- 与产品、数据、业务团队紧密合作,理解需求并输出技术解决方案。
- 推动大模型能力在真实场景中的落地,制定效果评估与迭代策略。

任职要求:
- 硬性要求
- 计算机科学、数学、统计学或相关领域硕士及以上学历,3年以上AI研发经验。
- 精通Python,熟悉PyTorch/TensorFlow/JAX等框架,具备CUDA/并行计算经验者优先。
- 深入理解Transformer架构、注意力机制、大模型训练技术(如3D并行、ZeRO)。
- 熟悉LangChain、LlamaIndex等大模型应用开发框架,具备端到端落地经验。
- 对NLP基础任务(如文本生成、信息抽取)有扎实的算法与工程经验。
- 加分项
- 发表过ICLR、NeurIPS等顶会论文,或参与过开源大模型项目(如Llama、Falcon)。
- 熟悉大模型生态工具链(Hugging Face、wandb、向量数据库)。
- 有高并发服务开发经验,熟悉Kubernete/Docker等云原生技术。
- 具备多模态模型(如CLIP、Stable Diffusion)或AI Agent开发经验。
- 软性要求
- 强烈的技术热情,能快速学习并攻克技术难点。
- 优秀的逻辑思维与跨团队沟通能力,能将复杂技术转化为业务价值。

附加信息:

  • 工作时间:周末双休

工作地址

北京 - 朝阳区 - 东坝- 驼房营路新华科技大厦查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
及时标讯网络信息技术(北京)有限公司

及时标讯

相似职位