【资深深度学习分布式开发工程师招聘】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

深度学习异构计算研发工程师（ AI 推理引擎方向）-PDI
[上海·徐汇区] 2天前发布

30k-60k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责端侧模型推理框架开发，包括模型压缩、优化技术，在端侧的接入、适配、算子开发工作，使之符合业务要求，提高性能收益； 2、负责探索和落地 AI 模型工程部署前沿技术，包括但不限于稀疏计算、编译优化。职位要求： 1、具备扎实的计算机科学功底和编程能力，了解常见并行计算算法，具有良好的编程习惯； 2、熟悉transformers、stable diffusion等主流模型原理； 3、良好的团队协作能力； 4、创新性强，有良好的动手实现能力，对技术有热情； 5、加分项：了解模型剪枝、量化等优化方法原理，具备相关模型优化经验。
深度学习架构工程师-推荐系统
[北京·海淀区] 1天前发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：字节跳动推荐架构团队，负责字节跳动旗下相关产品的推荐系统架构的设计和开发，保障系统稳定和高可用；负责在线服务、离线数据流性能优化，解决系统瓶颈，降低成本开销；抽象系统通用组件和服务，建设推荐中台、数据中台，支撑新产品快速孵化以及为ToB赋能。 1、参与大规模机器学习在线预估框架的研发与优化，支撑今日头条、抖音等字节跳动旗下相关产品的高效模型推理； 2、参与大规模特征及样本的处理与流转、模型训练与调度等相关问题的研究与突破； 3、与推荐算法同学紧密合作，分析并解决上述问题及任务，并反哺到实际业务中。职位要求： 1、熟练掌握Linux环境下的C/C++编程； 2、熟悉操作系统知识和计算机体系结构； 3、了解某种主流机器学习框架TENSORFLOW/PYTORCH等的底层框架实现。【加分项】 1、对深度学习模型预估及训练有过实际上手经验； 2、实现过自定义算子、或优化过已有算子实现； 3、熟悉模型剪枝、量化及压缩等方法； 4、参与过软硬件结合优化的工作。
深度学习算法工程师
[杭州·长河] 2025-01-26

20k-30k·14薪经验不限 / 本科

华为杭州研究所

移动互联网,数据服务 / 不需要融资 / 2000人以上

岗位职责： 1、参与华为昇腾芯片上PyTorch框架的版本演进和开源社区贡献，跟随社区进行PyTorch新特性的适配开发，参与算子接入、分布式训练等核心特性开发，和社区同步发布PyTorch版本； 2、参与昇腾芯片上PyTorch框架图模式相关特性开发和维护；能力要求： 1、熟悉PyTorch、MindSpore、TensorFlow等任意一种深度学习框架，了解开源框架特性原理优先，有特性开发和使用经验优先； 2、熟悉掌握Python/C/C++等编程语言，熟练掌握数据结构和算法设计，熟练使用Git、Linux/Unix系统和Shell编程，有算子开发经验者为先； 3、熟练掌握AI背景常识，熟悉分布式DP，TP，PP训练者优先；
大模型分布式系统优化专家
[南京·建邺区] 2023-12-01

18k-35k 经验3-5年 / 硕士

基流科技

企业服务,人工智能,通讯电子 / 天使轮 / 50-150人

职位描述 1. 负责带领团队建设大模型分布式系统研发体系和多GPU优化技术体系，跟踪和探索面向大模型的分布式优化技术新趋势； 2. 负责组织进行软件的设计和开发，对多GPU（同一节点和跨网络多节点）通信性能优化；职位要求 1. 研究生及以上学历，计算机/电子相关专业优先，5年（博士3年）以上分布式系统优化经验； 2. 熟悉计算机体系架构、分布式并行计算和异构计算框架，具备OpenMPI, OpenSHEM, MPICH 等相关知识及支持库（NCCL,UCX, etc.）和经验者优先； 3. 具备芯片互联和网络传输编程相关知识，例如RDMA，PCIE Peer2Peer, GPU Direct等经验者优先； 4. 熟练掌握深度学习分布式优化方法，有大模型训练和推理优化经验者优先； 5. 统筹协调能力强，有大型系统开发团队管理经验优先。
大模型分布式系统优化工程师
[南京·建邺区] 2023-12-01

15k-30k 经验1-3年 / 本科

基流科技

企业服务,人工智能,通讯电子 / 天使轮 / 50-150人

职位描述 1. 负责大模型分布式系统和多GPU优化系统研发，探索面向大模型的分布式优化新技术； 2. 负责分布式系统软件的设计和开发，提升多GPU（同一节点和跨网络多节点）高性能网络通信性能；职位要求 1、本科及以上学历，计算机/电子相关专业优先，至少2年分布式、通信系统优化经验； 2、熟练掌握C、C++、Go等一种或多种编程语言，熟悉计算机体系架构、分布式并行计算和异构计算框架； 3、熟悉OpenMPI, OpenSHEM, MPICH，NCCL,UCX等一种或多种分布式通信软件者优先； 4、了解RDMA，PCIE Peer2Peer, GPU Direct等芯片互联和网络传输编程相关知识者优先； 5、了解常见的深度学习分布式优化方法者优先；
机器学习系统工程师 - 机器学习框架/分布式训练
[杭州·西兴] 2023-03-15

30k-60k·16薪经验1-3年 / 硕士

摩尔线程

硬件 / A轮 / 500-2000人

工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接，模型优化和部署； 2.参与机器学习单GPU以及分布式训练技术的研究与实现，如各种并行与异构计算技术的设计、开发以及与性能优化； 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。任职资格 1.熟悉Linux开发环境，精通C++和Python，具备良好扎实的算法基础、良好的编程风格和系统设计能力； 2.深入理解典型的深度学习算法（如CV和NLP模型），主流深度框架（如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等）开发或优化经验； 3.或有深度学习编译器（如XLA、TVM、Glow、NGraph）等软件栈的开发经验； 4.精通分布式训练技术，有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑； 5.有机器学习模型性能调优和模型压缩（量化、剪枝、蒸馏、NAS等）经验者可优先考虑； 6.精通并行计算通信库（如MPI），有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑； 7.有强烈的工作责任心，较好的学习能力、沟通能力和自驱力。
机器学习系统工程师 - 机器学习框架/分布式训练
[上海·张江] 2023-03-15

30k-60k·16薪经验1-3年 / 硕士

摩尔线程

硬件 / A轮 / 500-2000人

工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接，模型优化和部署； 2.参与机器学习单GPU以及分布式训练技术的研究与实现，如各种并行与异构计算技术的设计、开发以及与性能优化； 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。任职资格 1.熟悉Linux开发环境，精通C++和Python，具备良好扎实的算法基础、良好的编程风格和系统设计能力； 2.深入理解典型的深度学习算法（如CV和NLP模型），主流深度框架（如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等）开发或优化经验； 3.或有深度学习编译器（如XLA、TVM、Glow、NGraph）等软件栈的开发经验； 4.精通分布式训练技术，有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑； 5.有机器学习模型性能调优和模型压缩（量化、剪枝、蒸馏、NAS等）经验者可优先考虑； 6.精通并行计算通信库（如MPI），有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑； 7.有强烈的工作责任心，较好的学习能力、沟通能力和自驱力。
机器学习/深度学习算法工程师（预测/仿真） (MJ000237)
[上海·松江区] 2023-01-12

22k-28k·15薪经验在校/应届 / 硕士

仙途智能

人工智能服务 / B轮 / 150-500人

工作职责：预测方向：负责构建高效的系统和算法帮助自动驾驶车辆理解复杂多样的周边环境，并针对 PB 级数据进行算法的测试、验证和快速部署。包括但不限于以下方面： 1. 跟踪复现顶会最新论文，对道路交通参与者(车辆、行人、自行车等)的意图、轨迹、分布进行分析和预测。 2. 构建模型理解交通参与者多样密集的复杂场景，包括但不限于测试区域、园区、城市道路。 3. 研发在线预测系统以及离线机器学习模型流水线。仿真方向：负责仿真算法研发，以实现更合理的行为推演和交互场景构建。包括但不限于以下方面： 1. 跟踪复现顶会最新论文，使用机器学习方法对场景的自动生成、行为推演、场景构建和仿真评估进行研发。 2. 构建分布式仿真算法平台，实现高效并发的场景仿真。任职要求： 1. 具有计算机、自动化、通信工程等相关专业背景。 2. 对传统机器学习、深度学习、优化理论一项或多项有深入研究。 3. 熟悉数据结构算法，熟练使用 C++ 或 Python，熟悉某种深度学习框架。 4. 有机器学习相关论文发表、竞赛获奖者优先。 5. 有自动驾驶/机器人系统算法开发经验者优先。
分布式高性能计算研究员（工作地点杭州）
[上海·黄浦区] 2022-11-03

14k-20k 经验在校/应届 / 硕士

之江实验室

智能硬件 / 不需要融资 / 2000人以上

工作地点杭州之江实验室新园区职责描述： 1. 大规模分布式深度学习模型训练平台搭建及优化； 2. 分布式深度学习训练算法设计及实现，包括large batchsize generalization, 分布式梯度融合算法实现及优化； 3. 高性能计算集群任务调度系统，MPI集群通信优化， RDMA通信优化；任职要求： 1. 有良好的计算机基础，计算机或相关专业本科以上学历，良好的英语资料阅读能力； 2. 熟悉MPI，NCCL, RDMA优化者优先； 3. 有高并发、高可用分布式系统优化经验者优先，有分布式机器学习系统优化经验者优先，有高性能存储系统优化经验者优先； 4. 有深度学习相关经验，有RNN，CNN模型训练经验，熟悉常用的深度学习软件（如Tensorflow，pyTorch等）者优先； 5. 在相关方向知名国际会议发表过论文者优先，参加过深度学习相关比赛经验者优先；
深度学习框架研发工程师
[北京·中关村] 2022-12-08

50k-100k 经验3-5年 / 本科

费思福

企业服务 / 未融资 / 15-50人

工作职责：承担以深度学习框架软件为主的开发工作。深入主流深度学习框架内部实现，基于专用AI处理器进行定制化开发与优化。任职要求： 1.本科及及以上学历，计算机/软件/数学/物理相关专业，有较强分析问题和解决问题的能力； 2.熟练使用C/C++，2年以上开发经验，具备大型软件分析、开发能力； 3.熟练使用Python/numpy等，并熟悉Linux开发环境及基本开发/调试工具； 4.掌握深度学习基本原理，熟悉至少一种深度学习框架如Tensorflow，PyTorch，PaddlePaddle，Mxnet，Caffe等，有项目经验。以下为加分项： • 熟悉多线程编程，内存管理，设计模式，对并发（并行）程序设计与开发有很好的积累和经验。 • 在机器学习、深度学习、大规模分布式机器学习以及相关应用领域有经验者优先； • 熟悉MPI，OpenMP，CUDA等并行编程模式，有异构计算优化经验者优先； • 了解XLA/TVM/MLIR或有AI编译器开发经验者优先； • 具备AI芯片、算子、AI框架、AI云平台开发或使用经验者优先；
阿里云分布式大数据架构开发工程师（阿里云·飞天企业版）
[上海·龙华] 2025-11-09

25k-50k·16薪经验不限 / 本科

阿里云

电商,企业服务 / 上市公司 / 2000人以上

关于我们加入阿里云飞天企业版团队，您将参与构建面向云原生、DevOps、IoT、AIOps、时序存储与安全分析的企业级大数据服务，并参与面向 AI 的智能化能力落地。在国内最大规模的云平台上，解决真实且复杂的工程问题，成长与影响力并重。参与企业级大数据产品的核心分布式架构设计与性能优化；推动微服务平滑拆分与弹性扩缩容，提升系统自愈能力与可观测性；深度结合安全、容灾与自动化运维，保障企业级服务的合规与可靠性；有机会将前沿云计算与 AI 能力快速落地，参与产品长期演进规划。 ========= 负责飞天企业版大数据类产品的分布式系统开发与架构演进，推动微服务化与弹性扩缩容方案落地。优化系统性能与资源使用（内存/CPU），设计退避、限流、熔断等容错与自愈机制。主导或参与底层库与中间件的调优、代码重构与可测试性改进，提升系统可维护性。构建与完善漏洞自动化修复、容灾恢复流程，支持企业级特殊服务/数据场景。与产品、运维、测试等团队协同，推动线上演进、容量规划与可靠性保障。岗位要求熟练掌握 C++/Python/Go/Java 中至少一种，具备良好的编码规范与单元测试习惯；熟悉代码重构与常用设计模式。三年以上分布式系统开发经验，有公有云/私有云相关项目经验优先。了解编程语言演进与 Core Guidelines（如 C++ Core Guidelines）者优先。熟悉 Folly、Abseil、ElasticSearch、ClickHouse、Kafka 等大数据基础开源组件，能阅读源码并有社区贡献或提交者优先。熟悉 Kubernetes 等容器编排/分布式管控系统；使用过 Azure Stack、AWS Outposts 等专有云/混合云解决方案者更佳。学习能力强，对云计算前沿技术充满热情，能将新技术快速工程化并在产品迭代中做出合理权衡与规划。
深度学习研究员
[上海·虹梅路] 2025-10-17

25k-50k 经验在校/应届 / 本科

AttrSense

人工智能 / 天使轮 / 15-50人

【岗位职责】 1.搞研究：很强的创新能力，持续思考能力，解决Low level场景下的AI视频编解码、AI ISP、超分辨率等难题； 2.找论文：积极跟踪业界最新工作，快速完成论文复现，保持对新技术的敏感程度； 3.模型优化：完成模型训练，蒸馏，量化等的整个Pipeline，完成NPU/GPU等的硬件适配。【任职要求】 1.计算机及相关专业，基础扎实，很强的编程能力（Python为主）; 2.深度学习相关科研或工作经历（包括但不限于识别检测/GAN/大模型等算法）; 3.加分项：发表过顶刊顶会论文，参与过AI竞赛并取得名次；
深度学习算法工程师
[合肥·包河区] 2025-10-10

30k-50k·13薪经验5-10年 / 本科

协邦信息

人工智能,软件开发 / 未融资 / 50-150人

岗位职责 1. 研发适用于轮足、四足仿生机器人决策规划的深度强化学习算法； 2. 负责深度强化学习算法的模型开发、调试与实际机器人验证；任职要求 1. 熟悉learning-based control领域前沿进展； 2. 了解多自由度欠驱动机器人动力学； 3. 熟悉使用C++、Python等编程语言，熟悉pytorch/tensorflow等主流深度学习框架，了解ROS等框架； 4. 熟悉主流机器人仿真软件，如NVIDIA Isaac Sim, mujoco, raisim, gazebo, pybullet, vrep等； 5. 了解常用的深度强化学习算法（PPO、SAC、DQN、DDPG、A3C等）； 6.有应用于机器人的深度强化学习研究项目经历；
深度学习算法工程师
[成都·武侯区] 2025-03-11

15k-20k 经验3-5年 / 本科

创想世纪

人工智能服务 / 不需要融资 / 15-50人

岗位职责： 1、设计、实现和优化基于深度学习算法的机器人控制策略，以提高机器人的自主决策能力和环境适应性； 2、参与机器人系统架构设计，包括但不限于感知、规划、控制模块，确保各组件之间的高效协作，以实现机器人的业务功能； 3、对所开发算法进行仿真测试、性能测试、集成测试，积极推动产品落地，并及时解决算法缺陷、优化算法性能； 4、协同团队完成项目落地，如自动化生产线装配、机器人系统集成等； 5、持续跟踪国内外前沿技术，探索新技术的应用可能性，解决实际项目问题。任职要求： 1. 机器学习、深度学习、人工智能等相关专业本科及以上学历，3年以上工作经验； 2. 熟悉 TensorFlow、Pytorch等主流深度学习框架中的一种或多种，能够独立开发和优化深度学习模型； 3. 熟悉深度学习模型的训练、调优和部署流程，具备丰富的实践经验； 4. 有机器人学习及应用项目经验或相关竞赛获奖者优先； 5. 接受985/211****应届毕业生优秀团队（有成熟项目经验）。
深度学习算法工程师
[武汉·珞珈山] 2025-02-21

10k-20k 经验1-3年 / 硕士

千辰空间

企业服务,工具 / 天使轮 / 15-50人

职位描述深度学习场景理解：用深度学习技术让计算机理解图像或视频中的内容，比如识别物体、分割场景等。模型优化：改进现有的深度学习模型，让它们更快、更准、更高效。前沿技术研究：跟踪最新的深度学习技术，做实验验证这些技术是否有效，并进行优化。文档编写：把算法和技术写成文档，方便团队理解和使用。任职要求学历和专业：需要计算机视觉、数学、遥感、摄影测量等相关专业的硕士学历，或者有两年以上相关工作经验。深度学习任务经验：熟悉用深度学习做目标检测、识别、跟踪、语义分割等任务，比如用YOLO、RCNN、SSD等模型。数学基础：要有扎实的数学功底，尤其是几何和统计学，并且知道这些技术在自动驾驶（ADAS）中的应用。编程能力：熟练掌握C/C++、Python、Matlab等编程语言，会用OpenCV、Dlib等工具。算法和性能优化：熟悉常见的数据结构和算法，能够优化代码性能。深度学习调参经验：有深度学习模型调参经验，熟悉模型压缩技术（如剪枝、量化、知识蒸馏）的优先。