【深度学习加速高级研发工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

深度学习异构计算研发工程师（ AI 推理引擎方向）-PDI
[上海·徐汇区] 1天前发布

30k-60k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责端侧模型推理框架开发，包括模型压缩、优化技术，在端侧的接入、适配、算子开发工作，使之符合业务要求，提高性能收益； 2、负责探索和落地 AI 模型工程部署前沿技术，包括但不限于稀疏计算、编译优化。职位要求： 1、具备扎实的计算机科学功底和编程能力，了解常见并行计算算法，具有良好的编程习惯； 2、熟悉transformers、stable diffusion等主流模型原理； 3、良好的团队协作能力； 4、创新性强，有良好的动手实现能力，对技术有热情； 5、加分项：了解模型剪枝、量化等优化方法原理，具备相关模型优化经验。
深度学习架构工程师-推荐系统
[北京·海淀区] 09:25发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：字节跳动推荐架构团队，负责字节跳动旗下相关产品的推荐系统架构的设计和开发，保障系统稳定和高可用；负责在线服务、离线数据流性能优化，解决系统瓶颈，降低成本开销；抽象系统通用组件和服务，建设推荐中台、数据中台，支撑新产品快速孵化以及为ToB赋能。 1、参与大规模机器学习在线预估框架的研发与优化，支撑今日头条、抖音等字节跳动旗下相关产品的高效模型推理； 2、参与大规模特征及样本的处理与流转、模型训练与调度等相关问题的研究与突破； 3、与推荐算法同学紧密合作，分析并解决上述问题及任务，并反哺到实际业务中。职位要求： 1、熟练掌握Linux环境下的C/C++编程； 2、熟悉操作系统知识和计算机体系结构； 3、了解某种主流机器学习框架TENSORFLOW/PYTORCH等的底层框架实现。【加分项】 1、对深度学习模型预估及训练有过实际上手经验； 2、实现过自定义算子、或优化过已有算子实现； 3、熟悉模型剪枝、量化及压缩等方法； 4、参与过软硬件结合优化的工作。
LLM推理加速算法工程师
[苏州·娄葑] 2025-07-16

35k-70k 经验5-10年 / 本科

ZOOM

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

工作内容： • 研发稳定高效的 LLM 推理系统，支持低延迟和高吞吐 • 设计和优化分离式推理框架，实现低延迟、高吞吐 • 开发和优化分布式 KV 缓存（KV Cache）框架 • 进行 CUDA 内核优化，提高计算效率和 GPU 资源利用率岗位要求： • 熟悉大语言模型（如 LLaMA、Qwen）推理流程 • 了解主流模型推理加速技术（模型量化、算子融合、P/D 分离、Prefix Caching、Speculative Decoding、KV Cache 压缩与调度） • 掌握 vLLM、TensorRT-LLM 等主流推理加速框架，能分析并优化其加速技术 • 熟悉 Hugging Face Transformers 及常见深度学习库 • 具备 GPU 高性能计算优化能力，熟悉 CUDA 并行计算、访存优化、低比特计算 • 深入理解计算机体系结构，具有基于 CUDA 的 GPU 性能优化经验 • 熟悉深度学习算法、神经网络架构及算子计算加分项： • 了解至少一种深度学习训练框架（如 PyTorch、TensorFlow）及其模型文件解析方式 • 具备软硬件联合设计经验 • 有 P/D 分离系统、分布式 KV Cache 系统优化经验 • 熟悉底层性能优化（Cutlass、NCCL 等）
AI计算网络加速研发工程师(J77978)
[北京·海淀区] 2024-09-05

25k-50k·16薪经验3-5年 / 本科

百度

工具 / 上市公司 / 2000人以上

业务方向介绍：百舸异构计算平台是面向大规模深度学习的高性能云原生AI计算平台，为模型算法专家和运维专家提供全面的集群运维支持和任务全生命周期管理，同时具备训练/推理加速、故障容错、智能故障诊断等高级功能，有效训练时长可达98%以上，大幅提升算力使用效率，助力企业在大模型时代的业务转型工作职责: -负责百度AI计算集群网络性能相关的诊断与优化 -负责百度AI计算集群通信库研发与运维部署 -负责百度AI计算中训练、推理依赖的通信加速 -负责百度AI计算集群与通信关联的其他软件研发工作任职资格: -熟悉AI计算基本模式与集群设计构建 -了解流行的AI训推框架（如Megatron、vLLM等） -熟悉RDMA等高性能网络技术和NCCL等集合通信库 -有集群管理、运维等相关的研发经验
深度学习框架终端优化工程师
[成都·武侯区] 2024-02-06

20k-30k 经验3-5年 / 硕士

阿加犀智能

软件服务｜咨询,物联网,人工智能服务 / 天使轮 / 15-50人

1. AI模型的端侧部署和加速； 2. 优化边缘计算平台, 打造在边缘计算行业的核心竞争力； 3. 边缘计算芯片性能优化，包括高通，瑞星微等AI芯片的性能优化； 4. 底层AI框架通用性封装和优化，保障底层框架的稳定性及高效；任职要求： 1. 计算机或电子相关专业本科或以上，3年以上相关工作经验； 2. 精通C/C++开发，熟悉多线程编程，掌握常用数据结构和算法; 3. 熟悉Linux系统，至少精通C/C++/Python中的一种。编码能力突出，热爱编程, 具有扎实的工程实现能力； 4. 对计算机架构有深入理解，特别是CPU、GPU、NPU； 5. 有扎实的异构计算、并行计算基础 (CUDA, OpenCL, GLSL, or NEON/AVX/SSE等)，对某子领域有较深入研究者优先； 6. 有深度学习算法(计算机视觉，NLP，语音等)、深度学习模型量化与压缩、深度学习框架开发等方向的相关经验者优先； 7. 熟悉如下至少一种AI推理框架: MACE, Tensorflow Lite, PaddlePaddle Mobile, SNPE, TNN, ncnn等； 8.有下列相关经验者优先考虑：有人工智能相关的系统架构、核心模块设计经验，参与过至少一个中大型的人工智能相关的框架研究与开发；熟悉TensorFlow/PyTorch/ONNX/Caffe等主流深度学习框架；有GPU/NPU/DSP或者相关异构计算平台开发和调优经验； 9. 拥有良好的团队协作和抗压能力，有技术热情。
视觉算法工程师（深度学习）
[深圳·蛇口] 2023-08-31

20k-40k·13薪经验1-3年 / 本科

Dorabot

智能硬件 / B轮 / 150-500人

岗位职责 1. 维护和开发应用于机器人的计算机视觉关键算法； 2. 深度学习相关网络模型的设计、优化及部署； 3. 视觉系统的集成和部署。岗位要求 1. 计算机、自动化、机器人等相关专业，硕士或有丰富经验的本科生； 2. 熟练掌握Python、C++，编程和算法基本功扎实，熟悉Linux开发环境； 3. 熟悉常见2D图像处理算法，熟练使用OpenCV、PCL、Open3D等视觉基础库； 4. 熟悉主流神经网络模型，包括但不限于物体检测、分割、跟踪等；熟悉至少一种深度学习框架（PyTorch、TensorFlow 等）； 5. 较强的责任心，优秀的协作能力，对工程技术和工程落地有较高的热情。加分项 1. 有模型压缩、TensorRT部署加速经验； 2. 有GPU编程经验，熟悉CUDA等； 3. 在**计算机视觉、图形学期刊或会议，如 CVPR, ICCV, SIGGRAPH 等，发表过高质量论文； 4. 具有编程、机器人或视觉算法相关比赛的经验，如: ILSVRC。其他信息
深度学习视觉算法工程师(上海)
[上海·徐汇区] 2023-04-30

20k-35k·15薪经验1-3年 / 本科

明略科技集团

数据服务｜咨询,人工智能服务 / D轮及以上 / 2000人以上

工作职责: 1. 负责图像和视频处理及识别相关算法的研究和实现； 2. 开发应用在端侧和边缘侧设备的视觉模型，进行模型精度提升和加速压缩； 3. 主导深度学习算法场景落地； 4. 结合应用场景建设视觉应用AI平台；任职资格: 1. 硕士或以上学历，计算机或数学相关专业； 2. 具有良好的数学功底，对数据建模、机器学习和深度学习有深入的理解与认识； 3. 良好的C/C++/Python编程基础；至少熟悉一种常用深度学习开发框架； 4. 掌握常见的分类、检测、分割、生成模型；掌握常用模型加速和压缩技术； 5. ⼯作认真负责，有快速学习的能⼒，主动积极，有好奇⼼； 6. 具有良好的沟通、团队协作、工程实现、计划和达成目标的能⼒。加分项： 1. 有相关大赛获主要奖项经历； 2. 有视觉论文发表； 3. 一线实战中作为负责人有优秀算法结果产出； 4. 良好的英文文献阅读能力，能快速实现技术原型；
深度学习图像算法工程师
[杭州·西兴] 2023-07-18

25k-50k·14薪经验3-5年 / 硕士

联智汇通人力资源开发

数据服务｜咨询 / 不需要融资 / 15-50人

岗位职责： 1、负责医疗图像识别，检测，分割算法的研发以解决实际业务问题。 2、代码开发，调参验证，性能优化，工程环境部署。 3、配合医学专家调研跟踪新算法，新技术对医疗图像的应用与实现。 4、结合医学问题和数据问题，设计搭建不同网络分支子模块；基本资格： 1、至少有一项以下方向的学习和开发经验: 计算机视觉（如图像识别、目标检测和跟踪、增强现实、图像质量评价，图像分割等）有过深入的工作与研究； 2、熟悉常见的优化加速方法，包括剪枝、稀疏算法等，并有实践经验； 3、具有较强的计算机编程实践能力，扎实的数据结构和算法功底，掌握C++/Python其中一种语言； 4、良好的编程能力，熟悉OpenCV，Python，机器学习SKLearn，深度学习框架TensorFlow(Keras)/Pytorch/mxnet等一种或多种 5、具有熟练阅读英文文献的能力；能够跟踪学术界和工业界的最新研究成果； 6、具备较好的团队合作能力。 7、对样本数据有敏锐的洞察力，及时发现问题，并结合项目目标，改进模块； 8、必须有良好的实验记录，实验总结与汇报规范。加分项： 1、ACM/ICPC，Topcoder 等比赛获奖者； 2、机器学习（如CNN/RNN、Boosting、Random Forests等）项目经历； 3、影响分子高论文发表；
深度学习算法工程师
[上海·青浦区] 2023-02-01

40k-70k·15薪经验3-5年 / 硕士

毕瑞

其他 / 未融资 / 50-150人

工作职责： 1.负责传统和深度学习图像处理算法； 2.定义算法指标、建立理论模型、编程实现、优化算法、评估效果； 3.跟进前沿技术发展趋势，复现和比较视觉算法优劣，持续提升模型精度和加速推理； 4.为算法程序编写接口集成到应用系统，包括编写相关调用接口和简单线下操作界面； 5.负责编写相关系统环境的部署、图像数据的采集和标注的文档，以及培训应用和技术支持工程师；任职资格 1. 具备良好的团队合作精神和沟通能力，能够独立、按时完成任务； 2. 计算机、数学相关专业，硕士以上学历，在CVPR、ECCV、ICCV等相关会议上发表论文者优先； 3. 至少在计算机视觉的一个领域有深入研究，如图像分类、目标检测、语义分割、实例分割、姿态估计、动作识别等； 4. 熟练掌握python，C/C++和C#编程语言，至少熟悉掌握一种常用深度学习开发框架pytorch或tensorflow； 5. 熟悉opencv、numpy、scikit-learn、pandas等相关图像处理和数据分析工具。 6. 熟练掌握数据标注工具labelme、labelimg等的使用； 7. 熟悉socket、restful、C/S或B/S的网络编程； 8. 熟练掌握Linux操作系统，会基本的shell编程； 9. 具备良好的英语文献阅读和书面表达能力，良好的编写代码和文档的习惯，熟悉版本管理工具（Git/SVN)；寻访要求 1. 具备良好的团队合作精神和沟通能力，能够独立、按时完成任务； 2. 计算机、数学相关专业，硕士以上学历，在CVPR、ECCV、ICCV等相关会议上发表论文者优先； 3. 至少在计算机视觉的一个领域有深入研究，如图像分类、目标检测、语义分割、实例分割、姿态估计、动作识别等； 4. 熟练掌握python，C/C++和C#编程语言，至少熟悉掌握一种常用深度学习开发框架pytorch或tensorflow； 5. 熟悉opencv、numpy、scikit-learn、pandas等相关图像处理和数据分析工具。 6. 熟练掌握数据标注工具labelme、labelimg等的使用； 7. 熟悉socket、restful、C/S或B/S的网络编程； 8. 熟练掌握Linux操作系统，会基本的shell编程； 9. 具备良好的英语文献阅读和书面表达能力，良好的编写代码和文档的习惯，熟悉版本管理工具（Git/SVN)
北京某自动驾驶汽车公司-点云深度学习优化工程师
[北京·五道口] 2022-12-02

30k-40k·16薪经验3-5年 / 硕士

菲起迩人力资源

企业服务 / 不需要融资 / 15-50人

1.研究和开发点云、图像深度神经网络的推理加速方案，包括但不限于模型剪枝压缩、量化、网络架构搜索等。 2. 开发通用的模型压缩工具以及跟踪前沿模型轻量化算法； 3. 基于NVIDIA嵌入式设备以及ASIC芯片等平台实现模型部署。任职要求： 1.统招硕士及以上，计算机、自动化、控制理论与工程等相关专业；3年及以上岗位工作经验； 2. 具备较好的编程能力，熟悉python/c++等编程语言； 3. 2年以上机器学习相关领域的研发经验，熟悉PyTorch/Tensorflow 等ML框架； 4. 具有图像、点云深度学习模型优化经验优先； 5. 具有模型剪枝、量化、蒸馏、NAS等经验优先； 6. 熟悉CUDA、TensorRT，有GPU加速经验者优先； 7. 在顶级AI/CV/NLP会议/期刊上的研究发表者优先； 8. 较强的沟通能力、理解力、思考和优化能力。
深度学习研究员
[上海·虹梅路] 2025-10-17

25k-50k 经验在校/应届 / 本科

AttrSense

人工智能 / 天使轮 / 15-50人

【岗位职责】 1.搞研究：很强的创新能力，持续思考能力，解决Low level场景下的AI视频编解码、AI ISP、超分辨率等难题； 2.找论文：积极跟踪业界最新工作，快速完成论文复现，保持对新技术的敏感程度； 3.模型优化：完成模型训练，蒸馏，量化等的整个Pipeline，完成NPU/GPU等的硬件适配。【任职要求】 1.计算机及相关专业，基础扎实，很强的编程能力（Python为主）; 2.深度学习相关科研或工作经历（包括但不限于识别检测/GAN/大模型等算法）; 3.加分项：发表过顶刊顶会论文，参与过AI竞赛并取得名次；
深度学习算法工程师
[合肥·包河区] 2025-10-10

30k-50k·13薪经验5-10年 / 本科

协邦信息

人工智能,软件开发 / 未融资 / 50-150人

岗位职责 1. 研发适用于轮足、四足仿生机器人决策规划的深度强化学习算法； 2. 负责深度强化学习算法的模型开发、调试与实际机器人验证；任职要求 1. 熟悉learning-based control领域前沿进展； 2. 了解多自由度欠驱动机器人动力学； 3. 熟悉使用C++、Python等编程语言，熟悉pytorch/tensorflow等主流深度学习框架，了解ROS等框架； 4. 熟悉主流机器人仿真软件，如NVIDIA Isaac Sim, mujoco, raisim, gazebo, pybullet, vrep等； 5. 了解常用的深度强化学习算法（PPO、SAC、DQN、DDPG、A3C等）； 6.有应用于机器人的深度强化学习研究项目经历；
深度学习算法工程师
[成都·武侯区] 2025-03-11

15k-20k 经验3-5年 / 本科

创想世纪

人工智能服务 / 不需要融资 / 15-50人

岗位职责： 1、设计、实现和优化基于深度学习算法的机器人控制策略，以提高机器人的自主决策能力和环境适应性； 2、参与机器人系统架构设计，包括但不限于感知、规划、控制模块，确保各组件之间的高效协作，以实现机器人的业务功能； 3、对所开发算法进行仿真测试、性能测试、集成测试，积极推动产品落地，并及时解决算法缺陷、优化算法性能； 4、协同团队完成项目落地，如自动化生产线装配、机器人系统集成等； 5、持续跟踪国内外前沿技术，探索新技术的应用可能性，解决实际项目问题。任职要求： 1. 机器学习、深度学习、人工智能等相关专业本科及以上学历，3年以上工作经验； 2. 熟悉 TensorFlow、Pytorch等主流深度学习框架中的一种或多种，能够独立开发和优化深度学习模型； 3. 熟悉深度学习模型的训练、调优和部署流程，具备丰富的实践经验； 4. 有机器人学习及应用项目经验或相关竞赛获奖者优先； 5. 接受985/211****应届毕业生优秀团队（有成熟项目经验）。
深度学习算法工程师
[武汉·珞珈山] 2025-02-21

10k-20k 经验1-3年 / 硕士

千辰空间

企业服务,工具 / 天使轮 / 15-50人

职位描述深度学习场景理解：用深度学习技术让计算机理解图像或视频中的内容，比如识别物体、分割场景等。模型优化：改进现有的深度学习模型，让它们更快、更准、更高效。前沿技术研究：跟踪最新的深度学习技术，做实验验证这些技术是否有效，并进行优化。文档编写：把算法和技术写成文档，方便团队理解和使用。任职要求学历和专业：需要计算机视觉、数学、遥感、摄影测量等相关专业的硕士学历，或者有两年以上相关工作经验。深度学习任务经验：熟悉用深度学习做目标检测、识别、跟踪、语义分割等任务，比如用YOLO、RCNN、SSD等模型。数学基础：要有扎实的数学功底，尤其是几何和统计学，并且知道这些技术在自动驾驶（ADAS）中的应用。编程能力：熟练掌握C/C++、Python、Matlab等编程语言，会用OpenCV、Dlib等工具。算法和性能优化：熟悉常见的数据结构和算法，能够优化代码性能。深度学习调参经验：有深度学习模型调参经验，熟悉模型压缩技术（如剪枝、量化、知识蒸馏）的优先。
硬件加速测试开发工程师-AI工具链
[北京·海淀区] 10:44发布

20k-40k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、参与AI芯片编译器工具链测试开发工作；参与编译器工具链测试方法设计、测试系统搭建和测试开发工作；参与编译器性能优化验证工作； 2、协同开发团队建立编译器验证机制和评价标准； 3、参与推理模型性能、精度日常测试执行、问题跟踪工作； 4、参与设计、建立以及推动AI芯片软件质量持续提升流程； 5、参与AI芯片整体软件栈质量流程建设，对软件开发的质量进行监控和追踪； 6、参与开发和运维AI芯片云服务基础设施和分布式系统（包含K8S集群、CI/CD系统、工作流系统、追踪探测系统等），为业务提供高可用、高稳定、高性能、低成本的云服务。职位要求： 1、本科及以上学历，计算机科学/电子工程相关专业；1年以上软件开发及测试工作经验，有AI芯片软件栈测试相关经验者优先； 2、熟练掌握汇编，C/C++，Python，Go，Shell等一种或者多种语言； 3、了解主流平台开发技术和体系（React，Vue，Nodejs，Python，Go等）；了解云原生相关技术（K8S，微服务、GitOps、DevOps等）；了解深度学习相关算子和优化技术； 4、了解Tvm或者Mlir等构建第三代深度学习框架的技术；了解图优化和算子融合等优化技术； 5、熟悉AI计算架构以及优化有经验者优先；熟练操作Linux系统，有在Unix/Linux环境下工作经验； 6、工作务实、敬业，有强烈的责任意识，具备较强的领导能力，以及良好的沟通及协调能力。