大模型工程师招聘-2025年及时标讯大模型工程师招聘求职信息-大模型工程师岗位职责介绍-拉勾招聘

进入企业版

大模型工程师3k-6k

北京经验3-5年本科及以上大数据开发工程师
岗位所属职位类型
兼职

人工智能服务
IT技术服务｜咨询

及时标讯

举报职位

分享到微信

微信扫一扫，用小程序打开分享

立即沟通

完善在线简历

上传附件简历

职位诱惑：

项目规模大，创新

职位描述：

岗位职责：
我们正在寻找一名资深大模型工程师，负责设计、开发、优化和部署大规模语言模型及相关应用。您将参与从模型预训练、微调、推理优化到实际落地的全流程工作，推动前沿技术在业务场景中的创新应用。
核心职责
1. 大模型开发与优化
- 参与大规模语言模型（如GPT、LLaMA、BERT等）的预训练、指令微调（Instruction Tuning）、对齐优化（Alignment）等全流程开发。
- 设计高效的分布式训练方案，优化模型训练效率与资源利用率。
- 探索模型压缩、量化、蒸馏等技术，提升模型推理性能与部署效率。
2. 算法研究与落地
- 结合业务场景（如对话系统、内容生成、知识问答等）设计定制化模型方案。
- 探索多模态大模型（文本、图像、视频）的技术融合与创新应用。
- 持续跟踪学术界与工业界前沿技术（如MoE、RAG、Agent框架），推动技术迭代。
3. 工程化与部署
- 构建高可用、低延迟的大模型推理服务，优化GPU资源管理与服务稳定性。
- 开发配套工具链，如数据清洗、评估指标、Prompt工程自动化等。
- 与Infra团队协作，优化训练/推理框架（如vLLM、DeepSpeed、Triton）。
4. 跨团队协作
- 与产品、数据、业务团队紧密合作，理解需求并输出技术解决方案。
- 推动大模型能力在真实场景中的落地，制定效果评估与迭代策略。

任职要求：
- 硬性要求
- 计算机科学、数学、统计学或相关领域硕士及以上学历，3年以上AI研发经验。
- 精通Python，熟悉PyTorch/TensorFlow/JAX等框架，具备CUDA/并行计算经验者优先。
- 深入理解Transformer架构、注意力机制、大模型训练技术（如3D并行、ZeRO）。
- 熟悉LangChain、LlamaIndex等大模型应用开发框架，具备端到端落地经验。
- 对NLP基础任务（如文本生成、信息抽取）有扎实的算法与工程经验。
- 加分项
- 发表过ICLR、NeurIPS等顶会论文，或参与过开源大模型项目（如Llama、Falcon）。
- 熟悉大模型生态工具链（Hugging Face、wandb、向量数据库）。
- 有高并发服务开发经验，熟悉Kubernete/Docker等云原生技术。
- 具备多模态模型（如CLIP、Stable Diffusion）或AI Agent开发经验。
- 软性要求
- 强烈的技术热情，能快速学习并攻克技术难点。
- 优秀的逻辑思维与跨团队沟通能力，能将复杂技术转化为业务价值。