大模型算法工程师40k-70k

北京经验3-5年本科及以上销售|商务|售前其他职位
岗位所属职位类型
全职

  • 电商平台
曙兴科技
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

不加班

职位描述:

工作内容:
1. 采用大模型开发工具,结合向量数据库检索和提示词优化实现产品的核心功能;
2. 负责大模型在垂直领域的精调/微调,负责设计大模型评估方法,通过模型精调工具提升模型性能;
3. 参与大模型产品落地,满足业务场景的需求和基于反馈的算法调优、算法创新、系统评测等。

职位要求:
1. 计算机科学或相关领域的本科及以上学历,具备机器学习/深度学习/NLP等相关专业知识;
2. 3年以上深度学习和NLP相关开发工作经历,具备大模型精调、应用落地的经验,有多模态开发经验的优先;
3. 熟练掌握Python开发技术栈和生态工具,熟练使用PyTorch、TensorFlow等深度学习框架;
4. 熟悉大语言模型的训练原理,了解常见的模型架构(如Transformer),熟悉主流开源模型并拥有较丰富的使用经验;
5. 了解大模型精调方法(如LoRA、p-tuning等)和相关工具的使用方法(如accelerate、peft、deepspeed等),有构建精调指令集的经验,以及大模型部署的优化方法;
6. 熟悉主流大模型应用开发工具的使用(如Langchain、LlamaIndex等)和主流向量数据库使用方法;
7. 对大模型性能提升有浓厚兴趣,好奇心强,工作积极主动,沟通能力强。

工作地址

北京 - 海淀区- 朝阳区昆泰查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
四川曙兴科技有限公司

曙兴科技

  • IT技术服务|咨询

    领域
  • 不需要融资

    发展阶段
  • 500-2000人

    规模

相似职位