首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
python后端开发工程师
12k-18k
深圳
经验5-10年
本科及以上
后端工程师
岗位所属职位类型
全职
IT技术服务|咨询
熵数科技
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
立即沟通
完善在线简历
上传附件简历
职位诱惑:
双休,朝九晚六,团队氛围轻松,有发展空间平台
职位描述:
我们正在寻找一位具备大模型基础知识,并精通 C++ 和 Python 的工程师,负责大语言模型(LLM)的微调、优化及 RAG(Retrieval-Augmented Generation)增强。您将参与 LoRA、量化、推理加速等优化工作,并探索高效检索增强生成(RAG)方案,提升模型在长文本理解和知识问答方面的能力。
岗位职责:
1、负责大语言模型(LLM)的微调(Fine-tuning),包括 LoRA、全参数微调等;
2、研究并优化 RAG(检索增强生成)方案,提升模型的上下文理解能力;
3、优化模型推理性能,研究并实现量化技术(如 GPTQ、AWQ);
4、结合 C++ 和 Python 进行高效实现,优化训练和推理流程;
5、参与向量检索、知识库构建及索引优化,如 FAISS、HNSW、Milvus 等;
6、研究并落地高效 RAG 方案,结合分块策略、召回排序、知识蒸馏等提升效果;
7、结合业务需求,推进大模型在智能问答、搜索增强等应用落地。
任职要求:
1、熟悉大模型的基础知识,如 Transformer、注意力机制、参数高效微调(PEFT)等;
2、熟练掌握 C++ 和 Python,有扎实的编程能力和性能优化经验;
3、具备模型微调(Fine-tuning)经验,熟悉 LoRA、Adapter、QLoRA 等技术
4、了解 RAG 相关技术,如向量数据库、检索策略、知识增强等;
5、熟悉 PyTorch 或 TensorFlow,并具备实际项目经验;
6、有模型量化(如 GPTQ、AWQ)的实践经验优先;
7、了解 CUDA、TensorRT、ONNX、Triton 等推理加速工具优先;
8、具备良好的团队合作和沟通能力,能够独立分析和解决问题。
加分项:
1、有开源项目贡献或论文发表
2、熟悉 FlashAttention、Fused Kernel 优化等高效计算库;
3、了解分布式训练(DeepSpeed、FSDP、Megatron-LM);
4、具备检索-生成融合优化(如 Hybrid Search、跨模态检索)的经验。
附加信息:
工作时间:周末双休
上下班时间:09:00-18:00
工作地址
深圳
-
南山区
-
大冲
- 迅美科技广场2号
查看地图
职位发布者:
马女士
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
,看看该公司
其他职位的面试评价
展开
推荐公司:
卓汇达数字出版
芗城区诺脉商贸
塔猴
世华
量方测绘
京驰国通
百晓
正新鸡排
瀛运
赛特科技
富地捷
京闽隆
龙泰信
融创毅达
印岚广告
东方蓝天
星际通联
远大翌新
法泉信息
新天地
维刚创新
华凯保险
爱播
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
项目助理招聘
团队经理招聘
商务主管招聘
硬件测试招聘
COO招聘
数据分析师招聘
财务招聘
APP设计师招聘
媒介总监招聘
海外市场招聘
代投资企业招聘:渠道主管
特效包装师
招募老师
韩都衣舍
邦邦留学
默闻科技
华壹信融投资管理公司
丽源创
英国那些事儿
南宁腾龙娱乐有限公司
熙睿生物
同启新星
鑫艺文化
南岗区艺鹤商业摄影设计室
嗨皮
安誉升商务咨询
意高汇智
木水飞科技
田野炊烟
认知能创
熵数科技
IT技术服务|咨询
领域
未融资
发展阶段
少于15人
规模
https://www.lagou.com/gon...
公司主页
相似职位