【模型工程师通鼎互联】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

大模型开发工程师
[南京·宁南] 1天前发布

13k-25k·13薪经验3-5年 / 本科

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

岗位描述： 1.负责不同行业的大模型项目交付，提升业务自动化、智能化程度，助力各业务团队降本提效，赋能内外部合作伙伴； 2.深入理解大语言模型的架构、原理和应用，熟悉大模型的训练、调优和部署流程。熟悉提示词工程，至少精通一种大语言模型应用开发框架； 3.根据业务规划及团队目标，规划及实施后端服务架构的优化及改进，提升软件复用性、扩展性、维护性，实现高效高质量开发。岗位要求： 1.熟悉常用的大模型开发交付技术，包括RAG、智能体等优先； 2.熟悉阿里百炼、百度千帆、Dify等开发平台，有实际项目经验者优先； 3. 本科以上学历，计算机相关专业，在校生、应届生均可； 4.熟练掌握关系型数据优先。
大模型开发工程师
[北京·西北旺] 1天前发布

15k-30k·13薪经验3-5年 / 本科

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

岗位职责负责自然语言处理（NLP）相关算法的研究、设计与实现，包括但不限于文本分类、情感分析、实体识别、语义理解、机器翻译、问答系统等。参与大规模语料库的预处理、特征提取、模型训练与优化，提升算法性能与效果。跟踪学术界与工业界最新NLP技术动态，探索并落地前沿算法，解决实际业务问题。与产品、数据团队紧密合作，理解业务需求，设计并开发高效的NLP解决方案。负责NLP模型的部署与性能优化，确保算法在高并发、低延迟场景下的稳定性。编写技术文档，分享技术经验，推动团队技术能力的提升。任职资格计算机科学、人工智能、数学、统计学或相关专业本科及以上学历，硕士或博士优先。熟悉自然语言处理基础理论，掌握常见的NLP算法与模型，如BERT、Transformer、LSTM、CRF等。具备扎实的编程能力，熟练掌握Python，熟悉常用深度学习框架（如TensorFlow、PyTorch）。熟悉NLP相关工具库（如NLTK、spaCy、Hugging Face Transformers等），并具备实际项目经验。具备良好的数学基础，熟悉概率论、线性代数、优化算法等知识。有大规模数据处理经验，熟悉Hadoop、Spark等分布式计算框架者优先。具备较强的学习能力与问题解决能力，能够独立完成算法研究与开发任务。良好的团队合作精神与沟通能力，能够与跨部门团队高效协作。
模型架构工程师-抖音直播
[北京·海淀区] 1天前发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：字节跳动直播推荐架构团队，负责抖音全场景直播体裁推荐系统的设计和开发，工作内容覆盖离在线推荐链路全流程，包括策略架构、模型架构、数据架构等子方向，支撑算法团队的高效迭代，解决海量吞吐带来的系统性能/成本/稳定性挑战，在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、策略架构，负责推荐在线链路的服务建设和迭代，串联请求处理全流程，解决链路延迟、吞吐瓶颈、数据的高效传递等核心问题，支持业务策略的快速和可持续迭代，不断优化系统的性能/成本/稳定性，动态逼近优化上界，提升策略ROI； 2、模型架构，负责精粗召等推荐模型的在线推理、离线训练以及部分平台化工作，支持模型的持续复杂化演进，解决计算和存储瓶颈，突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战，紧贴前沿框架、算法和加速硬件，支撑推荐算法的持续突破。职位要求： 1、扎实的编程能力，有优秀的设计和代码能力，对解决具有挑战性问题充满激情； 2、理解GPU硬件架构、GPU软件栈（CUDA/CUTLASS、Triton Lang），具备GPU性能分析经验； 3、深入研究过至少一种机器学习框架（Tensorflow/PyTorch或其他自研框架）的底层架构和机制。【加分项】 1、熟悉各类深度学习网络和算子底层实现细节； 2、训练方向，有大规模分布式训练经验； 3、熟悉MLIR、XLA、TVM等深度神经网络编译/优化器； 4、能使用数学工具分析深度学习训推的优化算法。
模型架构工程师-抖音电商
[北京·海淀区] 1天前发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：字节跳动电商推荐架构团队，负责抖音全场景电商体裁推荐系统的设计和开发，工作内容覆盖离在线推荐链路全流程，包括策略架构、模型架构、数据架构等子方向，支撑算法团队的高效迭代，解决海量吞吐带来的系统性能/成本/稳定性挑战，在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、参与大规模机器学习在线预估和离线训练系统的研发与优化，支撑今日头条、抖音等字节跳动旗下电商场景高效模型推理； 2、紧贴前沿框架和社区工作，支持模型的持续复杂化演进，解决计算和存储瓶颈，突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战； 3、参与大规模特征及样本的处理与流转、模型训练与调度等相关问题的研究与突破； 4、与推荐算法同学紧密合作，分析并解决上述问题及任务，并应用到实际业务中。职位要求： 1、熟练掌握Linux环境下的C/C++编程； 2、理解GPU硬件架构、GPU软件栈（CUDA/CUTLASS、Triton Lang），具备GPU性能分析经验； 3、深入研究过至少一种机器学习框架（Tensorflow/PyTorch或其他自研框架）的底层架构和机制； 4、熟悉模型剪枝、量化及压缩、算子融合等方法； 5、有以下经验者优先：熟悉各类深度学习网络和算子底层实现细节；有大规模分布式训练经验；熟悉MLIR、XLA、TVM等深度神经网络编译/优化器。
大模型及AI应用工程师
[南京·奥体] 1天前发布

25k-40k 经验5-10年 / 本科

紫金保险

金融 / 不需要融资 / 2000人以上

参与AI技术场景应用的设计、研发，包括AI中台服务的设计、开发与维护；为周边系统提供AI应用能力对接支持，例如包括大模型能力应用、知识图谱、知识库、智能体的相关设计开发工作等。任职要求： 1、计算机科学、人工智能、数学等相关专业，本科优先。 2、3年以上AI领域开发经验，主导或参加过至少1个大模型（LLM）项目成功落地经验。 3、熟练掌握Yolo、PyTorch、TensorFlow等主流深度学习框架。 4、具备模型微调、部署、优化及LangChain、向量数据库等工程化工具的实战经验。 5、软件开发能力，掌握包括不限于操作系统、软件工程、面向对象、设计模式、数据结构与算法等软件开发基础知识，至少精通Java或python开发技术体系之一，对多线程、分布式微服务系统、云计算平台（阿里云/腾讯云/AWS）及容器化技术（Docker/K8s）等主流技术有深入的理解； 6、乐于尝试与接受新技术，具有优秀的学习能力和逻辑分析与业务抽象能力，能独立解决复杂技术问题。 7、认真、严谨、敬业，优秀的口头、书面表达沟通能力，有良好的团队合作精神。
模型系统工程师-抖音推荐
[北京·海淀区] 1天前发布

30k-60k 经验不限 / 不限

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：团队负责抖音集团内容审核、内容理解等方向的架构支持工作，业务范围覆盖抖音、今日头条、剪映等多个重要业务线，工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化，与算法团队一起推进大模型在业务场景的应用落地，解决大模型应用过程中的各种工程挑战。 1、负责大模型推理系统架构设计及优化，密切配合算法部门，持续优化大模型研发和部署效率； 2、负责跟踪探索多种大模型推理技术，包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发，极致提升推理性能； 3、负责GPU资源管理和治理，提升GPU资源使用效率。职位要求： 1、本科及以上学历，计算机/电子/自动化/软件等相关专业，有AI工程优化经验的优先； 2、优秀的代码能力、数据结构和基础算法功底，熟练C/C++或Python，ACM/ICPC、NOI/IOI等比赛获奖者优先； 3、掌握分布式系统原理，参与过大规模分布式系统的设计、开发和维护； 4、熟悉至少一种主流的机器学习框架（TensorFlow/PyTorch），熟悉CUDA编程和算法的并行化改造，对GPU加速卡有基本了解；熟悉主流大模型结构，具有大模型训练和推理优化经验者优先； 5、熟悉模型推理加速的研究和技术进展，包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等，有相关实践经验优化； 6、有强烈的工作责任心，良好的沟通协作能力，对解决具有挑战性问题充满激情，能和团队一起探索新技术，推进技术进步。
音乐大模型算法工程师-抖音音乐（上海）
[上海·杨浦区] 1天前发布

35k-65k 经验不限 / 硕士

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责音乐相关业务的大语言模型的研发和应用，相关研发技术和解决方案在抖音、汽水音乐等产品中应用，满足音乐相关业务场景中的用户不断增长的智能交互需求，全面提升用户在音乐相关的创作和消费场景的体验； 2、参与音乐相关大模型的研发，如音乐预训练、音乐多模态模型等； 3、参与大模型技术在音乐场景中的探索和相关应用落地，如音乐搜推、音乐助手、视频配乐等； 4、在音乐人工智能领域开展前沿研究，在未来生活中的更多音乐相关的使用场景的深入研究和探索。职位要求： 1、优秀的代码能力、数据结构和基础算法功底，熟练C/C++或Python，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先； 2、熟悉NLP、Music相关的算法和技术，熟悉大模型训练、RL算法者优先； 3、在大模型领域，主导过大影响力的项目或论文者优先； 4、出色的问题分析和解决能力，能深入解决大模型训练和应用存在的问题； 5、良好的沟通协作能力，能和团队一起探索新技术，推进技术进步。
大模型算法工程师
[南京·雨花台区] 1天前发布

15k-25k 经验3-5年 / 本科

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

岗位职责： 1. 研发人工智能领域的相关算法实现，可以选择NLP、语音、图像领域其中之一。 2. 结合行内业务需求，设计实现方案，并基于大模型进行场景开发和模型的微调优化。 3. 跟踪和关注大模型推理训练领域的前沿技术和趋势，进行技术调研和应用。岗位要求 1.计算机、电子通信、数学等相关专业，硕士及以上学历或优秀本科生； 2.具备优秀的编程能力，熟练使用Python/C/C++的其中一种； 3.对机器学习、深度学习等人工智能领域有兴趣，有相关领域课题研究或项目经验者优先;； 4.有期刊论文发表或计算机相关竞赛经验者优先； 5. 出色的问题分析及解决能力，能自我驱动，持续面对挑战，积极主动、踏实勤奋。
大模型算法工程师
[南京·宁南] 1天前发布

18k-30k·13薪经验3-5年 / 本科

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

岗位职责： 1. 负责通信网络与大语言模型结合的研发设计与管理； 2. 负责面向通信网络的大语言模型Prompt Engineering提示工程，大语言模型微调和基于langchain的通信网络认知增强工具研发； 3. 负责面向通信网络的AI算法研发框架设计与开发； 4. 负责面向通信网络的AI算法模块开发管理，根据行业需求指导算法模型的技术选型和性能优化，算法模型包括结构化数据的预测分析和异常检测、因果关系分析、自然语言处理、深度学习、强化学习等。岗位要求： 1. 计算机科学、机器学习、人工智能相关专业本科及以上学历，具备AI产品研发和应用工作经验； 2. 熟悉LLM大模型基本原理及应用、langchain框架及应用，有GPT大模型研发经验者优先。 3. 深入掌握机器学习和深度学习，了解TensorFlow/pytorch/keras等深度学习框架; 4. 熟练掌握至少2种语言：Python, R, Matlab, SQL, Scala, Spark, PHP, SAS，Weka等； 5. 有良好的沟通表达能力，积极向上，细致认真。
大模型算法工程师
[南京·宁南] 1天前发布

15k-25k·13薪经验3-5年 / 硕士

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

工作职责 1、负责大模型场景的的需求理解，进行技术调研和验证，输出大模型技术方案完成产品需求； 2、负责大模型数据处理工作，包括数据清洗、预处理和数据构建；制定相关数据标准。 3、负责大模型训练相关工作，包括预训练、SFT训练和RL训练，并针对训练后的模型评估。 4、对接产品、研发和运营，主导大模型相关产品和技术进展。 5、深入理解大模型能力和行业发展趋势，规划未来大模型技术方向和业务架构。任职要求： 1、3年及以上算法或大模型应用工作经验。 2、熟悉大模型相关的知识理论，熟悉业界常见大模型如讯飞星火，具有部署，训练和调优经验更佳。 3、具备数据治理，数据分析，数据加工的相关经验。 4、熟练掌握python，pytorch等相关开发语言和学习框架的使用，具备较强的编程实现能力。 5、在算法的垂类应用上，从方案设计、模型训练以及部署上线具备实际项目经验。 6、良好的团队合作和沟通能力，并能够独立承担大模型相关任务。
大模型算法工程师
[北京·公主坟] 1天前发布

28k-38k 经验3-5年 / 硕士

融汇

金融 / 不需要融资 / 50-150人

岗位职责：负责设计⼤语⾔模型的技术⽅案并落地到⾏业客户的垂直场景中。典型场景包括但不限于多轮对话、 Document QA、结构化信息抽取、私有函数调⽤、AIAgent等等；负责⼤语⾔模型技术⽅案的端到端研发，包括但不限于⽅案设计、数据准备及处理、⾏业模型训练、指令精调、模型性能提升、模型效果评测等；跟踪并分析业内最新研究成果和技术动态，持续优化和改进现有模型和技术⽅案；基于NLP⼤模型探索下⼀代语义技术，构建⾏业领先的多模态语义核⼼能⼒；根据业务需求，与外部团队开展技术交流与沟通；岗位要求：计算机相关专业硕⼟及以上学历，有论⽂复现能⼒和算法⼯程交付经验；精熟练掌握C++、Python等编程语⾔的⼀种或多种，具备良好的编码能⼒，有⼤型⼯程项⽬经验；熟悉多种⾃然语⾔处理任务，如问答系统，序列标注，情感分析，摘要⽣成及抽取，知识图谱等。有从0到1 构建的⾃然语⾔处理任务的⼯程经验；了解NLP主流预训练语⾔模型2(GPT/LLaMA/GLM/Bloom/BERT/Qwen)，熟练掌握主流深度学习框架 Pytorch；有团队意识，有良好的⽂档习惯和合作意识；加分项：有⼤模型训练框架Deepspeed/ColossalAl/LLaMA Factory使⽤经验者优先；有垂直领域⼤模型PT、Continue PT、SFT、RLHF经验者优先；
大模型算法工程师（深圳）
[深圳·科技园] 1天前发布

15k-22k 经验3-5年 / 本科

广州南天

数据服务 / 上市公司 / 500-2000人

工作职责： 1、负责大模型昇腾算子适配、开发、调优、验证、评测； 2、负责响应客户AI大模型平台优化评测需求，参与大模型方案调优验证、联调适配工作； 3、负责昇思mindspore推理性能评测、评测与优化方案编写； 4、负责以Ascend C语言进行算子融合功能开发、要求性能达到或超过GPU方案； 5、领导安排的相关工作。任职要求： 1、计算机科学、网络工程、信息安全等相关专业。本科学历以上，有相关工作经验优先。 2、熟练C++，Python编程，具备良好的代码风格； 3、掌握常用的算法和数据结构、了解常见的机器学习算法，熟练使用C++标准模板库； 4、熟悉 Linux 系统和基于 git 的版本管理； 5、熟悉MLIR/LLVM/vLLM，了解CUDA、CANN技术； 6、熟悉 TensorFlow /Pytorch等深度学习框架； 7、具有编译器开发经验或者异构编程开发经验。
大模型算法工程师
[广州·越秀区] 1天前发布

30k-50k·14薪经验不限 / 本科

龙腾出行

生活服务,旅游｜出行 / 上市公司 / 150-500人

岗位职责 1. 负责大语言模型（LLM）在行程规划、智能客服等场景的应用研发，包括算法设计、模型优化及工程化落地； 2. 深入探索LLM与检索增强生成（RAG）、多智能体（Multi-Agent）系统，提升复杂场景下的推理与交互能力； 3. 构建高效的Multi-Agent协作框架，设计任务分配、知识共享与动态决策机制； 4. 针对垂直场景进行LLM微调（Fine-tuning）、领域适配与性能优化，解决实际业务中的长尾问题； 5. 跟踪大模型领域前沿技术，推动技术在实际业务中的创新应用。任职要求： 1. 本科及以上学历，计算机、人工智能、数学等相关专业，有NLP/深度学习/LLM算法经验； 2. 熟练掌握PyTorch/TensorFlow等框架，理解Transformer、BERT、GPT等模型原理，有LLM项目经验； 3. 熟悉RAG技术栈（如向量数据库、检索排序、上下文增强生成），具备多轮对话系统开发经验； 4. 熟悉多智能体（Multi-Agent）协同架构设计，有任务分解、知识共享、动态规划等开发经验； 5. 具备LLM微调经验，熟悉PEFT、LoRA、RL等微调方法，具备大模型微调经验者优先。 6. 具备工程化落地能力，至少拥有一种后端技术栈（如Python Flask, Django, Fastapi等）和实际的工程经验。场景经验： 1. 在智能客服、行程规划、AI Agent等领域有LLM项目经验者优先； 2. 了解主流Agent、RAG开发框架，如LangChain、AutoGen、Swarm、dify等； 3. 参与过开源LLM相关项目或贡献代码者优先。
大模型算法工程师-AI Coding
[北京·海淀区] 1天前发布

50k-100k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责研发提效场景所需要的大模型能力的研发和应用，研究高质量数据的挖掘和合成、大模型的对齐效率、Agent的设计&端到端训练等等，不断思考和跟进AI的最新进展对我们的价值，探索下一代的研发模式； 2、高质量数据挖掘清洗使用，数据自动、半自动合成方案研究探索，设计针对代码场景的原子任务、全链路任务的评测方法； 3、研究LLM/VLM训练与优化技术，包括微调、强化学习（RLHF）、知识蒸馏等，提高大模型在代码场景下的能力； 4、尝试落地到各种应用场景，比如：IDE代码补全、代码能力QA、场景化Agent、代码自动修复、漏洞检测等等； 5、持续跟踪LLM/VLM领域的最新技术动态，并将其应用于实际业务场景中，推动技术落地。职位要求： 1、优秀的代码能力、数据结构和基础算法功底，熟练掌握至少一门语言，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先； 2、熟悉NLP、CV、ML等相关的技术，深入理解大模型或图片视频生成等相关技术栈（如RLHF、SFT、Dit/Vit/Transformer、Stable Diffusion等）； 3、在大模型领域，主导过有影响力的项目或论文者优先；在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先； 4、有代码基座经验，有强化学习结合大模型落地经验，有Multi-Agent、Tool-Use等相关经验优先； 5、出色的问题分析和解决能力，有自主探索解决方案的能力； 6、良好的沟通协作能力，能和团队一起探索新技术，推动技术进步。
大模型算法工程师-AI Coding
[上海·杨浦区] 1天前发布

50k-100k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责研发提效场景所需要的大模型能力的研发和应用，研究高质量数据的挖掘和合成、大模型的对齐效率、Agent的设计&端到端训练等等，不断思考和跟进AI的最新进展对我们的价值，探索下一代的研发模式； 2、高质量数据挖掘清洗使用，数据自动、半自动合成方案研究探索，设计针对代码场景的原子任务、全链路任务的评测方法； 3、研究LLM/VLM训练与优化技术，包括微调、强化学习（RLHF）、知识蒸馏等，提高大模型在代码场景下的能力； 4、尝试落地到各种应用场景，比如：IDE代码补全、代码能力QA、场景化Agent、代码自动修复、漏洞检测等等； 5、持续跟踪LLM/VLM领域的最新技术动态，并将其应用于实际业务场景中，推动技术落地。职位要求： 1、优秀的代码能力、数据结构和基础算法功底，熟练掌握至少一门语言，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先； 2、熟悉NLP、CV、ML等相关的技术，深入理解大模型或图片视频生成等相关技术栈（如RLHF、SFT、Dit/Vit/Transformer、Stable Diffusion等）； 3、在大模型领域，主导过有影响力的项目或论文者优先；在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先； 4、有代码基座经验，有强化学习结合大模型落地经验，有Multi-Agent、Tool-Use等相关经验优先； 5、出色的问题分析和解决能力，有自主探索解决方案的能力； 6、良好的沟通协作能力，能和团队一起探索新技术，推动技术进步。