了解deepspeed、megatron
一、岗位职责
负责公司文本处理相关项目的大模型微调工作,基于业务需求设计微调方案,优化模型性能,提升文本生成、分类、情感分析等文本处理任务的准确性和效率。
深入研究和探索常见大模型推理框架原理,参与推理框架的优化和改进,降低推理成本,提高推理速度和稳定性,以满足业务对实时性和高并发的要求。
构建和维护知识图谱,运用知识图谱推理技术,挖掘知识之间的关联和潜在信息,为业务决策提供支持。结合大模型和知识图谱,实现更智能的知识问答和推理应用场景。
参与大模型 agent 开发与优化,构建高效的 MCP(Model Control Protocol)相关功能,提升大模型的交互性和任务执行能力,打造智能、灵活的模型应用系统。
跟踪前沿技术和算法,将其应用于内容推荐系统,提升推荐的精准度和个性化程度,改善用户体验。对现有 大模型及配套其他算法进行持续优化,以适应不断变化的数据和业务需求。
二、任职要求
学历要求:相关专业硕士及以上学历,计算机科学、人工智能、数据科学、数学、物理等相关专业优先。
专业知识与技能:
熟练掌握文本及大模型微调能力,熟悉常见的微调方法和技术,如监督微调、强化学习微调等,具备实际的微调项目经验。
对常见大模型推理框架有深入理解,掌握其原理和优化技巧,能够根据不同业务需求进行合理技术选型和部署。
有知识图谱构建和推理的实践经验,熟悉知识图谱相关的技术栈,如图数据库、知识表示学习、图神经网络等,能够运用推理算法解决实际问题。
具备大模型 agent 开发和 MCP 相关经验,了解模型控制协议的原理和实现方式,能够设计和开发高效的模型交互系统。
了解常规的 NLP 算法,对于不需要大模型参与的任务,能够熟练运用 NLP 技术解决实际问题。
在内容推荐算法方面有扎实的基础,熟悉协同过滤、基于内容的推荐、矩阵分解等推荐算法,以及深度学习在推荐系统中的应用,如神经协同过滤等。
编程能力:熟练掌握 Python开发,具备良好的代码编写习惯和项目开发能力,熟悉pytorch、fastapi、ffmpeg等的使用,熟悉常用数据库例如MySQL、Elasticsearch、Neo4J、Milvus的使用,能够高效地实现数据处理、模型训练及应用落地。
项目经验:具有相关领域的项目经验,能够独立承担项目任务,解决项目中遇到的技术难题,有成功的项目案例优先。
学习能力与团队合作:具备较强的学习能力和自我驱动力,能够快速掌握新知识和新技术,紧跟行业发展趋势;具有良好的团队合作精神和沟通能力,能够与不同部门的人员协作完成项目任务。
拉勾安全提示