【分布式系统工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

系统工程师(专家岗)
[南京·红花] 09:25发布

30k-50k·15薪经验5-10年 / 本科

时代绿能

其他 / 上市公司 / 500-2000人

岗位职责： 1、负责分布式集控和微电网产品的需求分析、产品设计和需求分解； 2、负责分布式集控和微电网产品的整体方案设计，包括系统架构设计，硬件选型、软件功能； 3、负责设计产品关键功能模块，包括但不限于：实时监控运维、智能调度、账单分析、告警处理、工单等。 4、优化系统实时性、可靠性及数据处理能力（如实时数据库、历史数据库、时序数据库集成）； 5、指导团队完成系统集成测试、现场调试及问题排查，提供技术支持与解决方案； 6、跟踪电力系统新技术（如AI预测、动态阈值调整、多目标优化算法），推动系统创新。任职资格： 1、本科及以上学历，计算机、电子工程、自动化或相关专业； 2、3年以上能源系统设计经验，5年以上能源系统开发经验，熟悉电力系统运行与控制原理； 3、熟练掌握产品设计工具（如Axure、MindManager等），能够独立完成产品规划和设计； 4、精通Java开发语言，深入掌握面向对象技术和设计模式，并有2个软件以上的设计经验，能提供相关案例； 5、熟悉新型电力系统核心技术，具有电网调度算法和大型新能源场站级别电力系统开发经验； 6、了解主流的电力系统规约； 7、掌握数据库开发（MySQL、PostgreSQL或时序数据库InfluxDB/TDEngine）及数据处理技术； 8、掌握良好的沟通经验和团队协作能力，能承担技术攻关任务； 9、较强的学习能力和创新意识，对电力行业技术趋势敏感。
高级系统工程师-Data
[杭州·余杭区] 10:44发布

20k-40k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、参与字节跳动百万级主机运维体系的设计和研发，建设全网主机基础服务变更体系，提升运维管理效率并保证变更安全性； 2、参与主机运维平台、监控平台、安全平台等系统的设计和研发，构建业界领先的运维平台，保障全球数百万主机稳定运行； 3、参与DNS、NTP、DHCP、装机、镜像站等数据中心基础服务的研发和运维，提升服务性能，保障服务稳定性。职位要求： 1、大学本科及以上学历，计算机相关专业，3年以上运维平台项目开发经验； 2、扎实的计算机软件基础知识，熟悉Linux操作系统、存储、网络技术； 3、精通Python/Golang等至少一门编程语言，熟悉Grafana、Ansible等常用开源软件； 4、具有产品和工程思维，良好的项目沟通、数据结构和系统设计能力； 5、有较强的学习力和自驱力，能熟练阅读涉及产品和技术的英文文档。
服务器硬件系统工程师（异构计算方向）
[深圳·南山区] 10:44发布

30k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、理解上层业务应用，结合异构芯片应用特点，负责异构硬件系统需求分析，输出异构芯片需求规格，输出异构硬件系统方案； 2、和业务团队、软硬件研发团队紧密配合，分析工作负载模型，帮助业务团队实现硬件方案创新，提升性能、降低成本； 3、与芯片、网络、IDC、软件等团队紧密协作，负责异构芯片需求规格和异构硬件系统方案分析，确保异构硬件系统在TCO、性能、可靠性、DFX等方向竞争力领先； 4、跟进行业组织、开放标准组织，研究分析最新的技术、标准；结合产业链的最新技术能力和硬件产品特点提供综合竞争力领先的异构硬件系统方案。职位要求： 1、至少5年以上异构硬件系统方案分析经验，有大规模异构计算系统的方案设计和实现经验； 2、熟悉计算机体系结构、硬件设计和实现，熟悉CPU、GPU、FPGA等异构计算硬件； 3、熟悉PCIe、DDR、网络和存储等系统总线和协议； 4、熟悉各类常见异构类平台，如GPU训练，推理场景加速硬件平台等; 5、在大团队、跨团队的项目推动和组织方面有成功经验； 6、具备良好的分析和解决问题的能力。
plan1956-大规模分布式机器学习系统工程师
[北京·北下关] 2023-07-17

70k-80k 经验在校/应届 / 硕士

第四范式

人工智能服务,IT技术服务｜咨询 / D轮及以上 / 500-2000人

工作职责： 1.设计并实现创新的机器学习解决方案，并将其应用到大规模分布式机器学习系统中。 2.适配最新的机器学习算法与架构，深入主流的机器学习框架，对框架进行调整、改进和优化。 3.研究核心技术突破点，在模型并行、数据-计算结合等方面打造机器学习系统性能与易用性优势。 4.对服务整体稳定性负责，分析并深入发现系统风险点，提高系统服务在各种风险下的容错能力。任职要求： 1.有比较扎实的计算机理论基础，熟练使用C/C++编程，对数据结构和算法有较为深刻的理解。 2.具有快速学习的能力，有灵活应用开源项目的经验。 3.具备英文文档阅读分析能力，良好的沟通能力和团队协作能力。 4.对技术有执着的追求和热爱，并对新技术持有敏感性并愿意致力于新技术的探索和研究，对解决具有挑战性问题充满激情。加分项： 1.深入了解业界主流机器学习框架如Pytorch/Tensorflow/Mxnet等中至少一种，社区核心贡献者优先。 2.在异构计算或并行计算系统开发方面有丰富经验，如CUDA，OpenCL，OpenMP，MPI等，并能有效利用这些技术进行高效计算优化。 3.有成熟的大规模分布式机器学习系统设计与实施经验，例如对Megatron-Deepspeed、Colossal-ai等有深入理解和实践。 4.在OSDI/SOSP等**会议或期刊上发表过相关领域的论文。 5.对分布式系统中的容错、一致性、并发性和安全性等问题有深入的理解，并能应用如ZooKeeper、Etcd等工具进行处理。 6.深入了解 YARN、Kubernetes、Hadoop、Spark、Flink、Horovod等系统和生态，在社区有过相关代码贡献者优先。工作地点：北京、上海、深圳、新加坡；
机器学习系统工程师 - 机器学习框架/分布式训练
[杭州·西兴] 2023-03-15

30k-60k·16薪经验1-3年 / 硕士

摩尔线程

硬件 / A轮 / 500-2000人

工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接，模型优化和部署； 2.参与机器学习单GPU以及分布式训练技术的研究与实现，如各种并行与异构计算技术的设计、开发以及与性能优化； 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。任职资格 1.熟悉Linux开发环境，精通C++和Python，具备良好扎实的算法基础、良好的编程风格和系统设计能力； 2.深入理解典型的深度学习算法（如CV和NLP模型），主流深度框架（如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等）开发或优化经验； 3.或有深度学习编译器（如XLA、TVM、Glow、NGraph）等软件栈的开发经验； 4.精通分布式训练技术，有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑； 5.有机器学习模型性能调优和模型压缩（量化、剪枝、蒸馏、NAS等）经验者可优先考虑； 6.精通并行计算通信库（如MPI），有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑； 7.有强烈的工作责任心，较好的学习能力、沟通能力和自驱力。
机器学习系统工程师 - 机器学习框架/分布式训练
[上海·张江] 2023-03-15

30k-60k·16薪经验1-3年 / 硕士

摩尔线程

硬件 / A轮 / 500-2000人

工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接，模型优化和部署； 2.参与机器学习单GPU以及分布式训练技术的研究与实现，如各种并行与异构计算技术的设计、开发以及与性能优化； 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。任职资格 1.熟悉Linux开发环境，精通C++和Python，具备良好扎实的算法基础、良好的编程风格和系统设计能力； 2.深入理解典型的深度学习算法（如CV和NLP模型），主流深度框架（如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等）开发或优化经验； 3.或有深度学习编译器（如XLA、TVM、Glow、NGraph）等软件栈的开发经验； 4.精通分布式训练技术，有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑； 5.有机器学习模型性能调优和模型压缩（量化、剪枝、蒸馏、NAS等）经验者可优先考虑； 6.精通并行计算通信库（如MPI），有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑； 7.有强烈的工作责任心，较好的学习能力、沟通能力和自驱力。
分布式计算与系统工程师(工作地点杭州)
[成都·双楠] 2022-11-03

14k-20k 经验在校/应届 / 硕士

之江实验室

智能硬件 / 不需要融资 / 2000人以上

工作地点杭州之江实验室新园区岗位职责： 1.负责分布式计算、云计算以及边缘计算等相关软件设计与实现，包括详细方案设计、软件编码实现与测试、系统调试等； 2.负责分析解决项目中与分布式计算、云计算以及边缘计算等系统相关的技术问题，按时完成项目开发计划，保证项目质量； 3.负责需求分析、概要设计和详细设计等技术文档的撰写；职责要求： 1.***硕士及以上学历，计算机、软件工程、通信等相关专业优先； 2.至少精通C语言、Java或者Python等编程语言中的一种，具备良好的编程思想和规范者优先； 3.英语四级或以上，可熟练阅读并理解英文技术文档者优先。
分布式计算与系统工程师(工作地点杭州)
[南京·南大] 2022-11-03

14k-20k 经验在校/应届 / 硕士

之江实验室

智能硬件 / 不需要融资 / 2000人以上

工作地点杭州之江实验室新园区岗位职责： 1.负责分布式计算、云计算以及边缘计算等相关软件设计与实现，包括详细方案设计、软件编码实现与测试、系统调试等； 2.负责分析解决项目中与分布式计算、云计算以及边缘计算等系统相关的技术问题，按时完成项目开发计划，保证项目质量； 3.负责需求分析、概要设计和详细设计等技术文档的撰写；职责要求： 1.***硕士及以上学历，计算机、软件工程、通信等相关专业优先； 2.至少精通C语言、Java或者Python等编程语言中的一种，具备良好的编程思想和规范者优先； 3.英语四级或以上，可熟练阅读并理解英文技术文档者优先。
系统工程师
[南京·建邺区] 2025-11-18

15k-20k 经验5-10年 / 本科

汇银迅

金融,移动互联网 / A轮 / 150-500人

岗位职责：一、系统运维： 1.负责公司业务系统的运行维护，保障公司业务系统稳定运行； 2.负责数据库日常监测和维护，保证公司产品的数据库服务器正常运行； 3.承担日常安全巡检和日志分析、漏洞扫描和修复、安全测评、安全加固，根据内部需求进行配置变更和策略调整； 4.负责Nginx、Tomcat、LVS、Keepalived、Haproxy安装、配置、维护及调优； 5.负责对后台系统进行日常安全维护，按照运维流程进行日常运维服务工作； 6.负责linux，windows服务器监测和维护； 7.负责测试环境的搭建及维护及部署应用上线； 8.负责Apache、Redis、MySQL、FTP、DNS、Squid等常用服务的安装、配置和维护； 9.为其他部门提供技术支持、培训和指导； 10.负责微服务构建，性能优化项目； 11.推进自动化运维平台建设，提高开发质量和效率； 12.负责服务器业务应用上下线、日常变更、服务器性能测试及优化； 13.公司所安排的其它运维工作； 14.领导交办的其他工作事项。二、网络运维：管理并维护公司网络（交换机、路由器、防火墙、无线），配置路由协议（OSPF/BGP），处理网络故障，保障网络安全。任职要求： 1.计算机相关专业本科及以上学历，5年以上系统与网络融合运维经验。 2.精通Linux系统管理与常用服务，精通至少一种脚本语言（Shell/Python）。 3.精通网络技术，能熟练配置和管理Cisco/华为/H3C等主流网络设备，深入理解TCP/IP及路由协议。 4.熟悉VMware/KVM虚拟化技术，具备Zabbix等监控工具的使用经验。 5.具备强烈的责任心、优秀的问题解决能力和团队协作精神。 6.有金融行业、Hadoop运维经验或CCNP/HCNP等相关认证者优先。
分布式开发工程师
[北京·五道口] 2022-10-12

50k-70k·14薪经验5-10年 / 本科

优盛思咨询

企业服务 / 不需要融资 / 50-150人

职位描述: 作为Alluxio的分布式系统工程师，你将负责构建Alluxio(原名为Tachyon)系统。这项工作解决了分布式系统中最具挑战性的问题，包括在大规模云环境中构建缓存策略，优化并发和锁定机制，构建高可用性分布式系统。职位要求: 1.计算机科学，或者相关专业，本科及以上学历，硕士或者博士优先; 2.具有一种或多种通用编程语言的软件开发经验，包括但不限于Java、C++和Go; 3.熟悉分布式系统原理、RPC以及消息中间件原理。具备大规模后台开发经验; 4.熟悉常用的数据结构与算法，对设计模式、软件工程等有较深入的理解; 5.具备良好的学习能力和分析解决问题的能力，具备激情，和良好的沟通能力，高度责任心和团队合作精神; 加分项: 1.良好的英语听说读写能力; 2.有参与开源社区开发经验: 3.有Alluxio，HDFS，Spark，Presto，Impala，Ceph，Kubernetes等分布式系统开发或深度使用经验; 4.熟悉Java语言和面向对象设计开发，熟悉多线程程序开发，对多线程技术、异步、并发有较深入理解。
阿里云分布式大数据架构开发工程师（阿里云·飞天企业版）
[上海·龙华] 2025-11-09

25k-50k·16薪经验不限 / 本科

阿里云

电商,企业服务 / 上市公司 / 2000人以上

关于我们加入阿里云飞天企业版团队，您将参与构建面向云原生、DevOps、IoT、AIOps、时序存储与安全分析的企业级大数据服务，并参与面向 AI 的智能化能力落地。在国内最大规模的云平台上，解决真实且复杂的工程问题，成长与影响力并重。参与企业级大数据产品的核心分布式架构设计与性能优化；推动微服务平滑拆分与弹性扩缩容，提升系统自愈能力与可观测性；深度结合安全、容灾与自动化运维，保障企业级服务的合规与可靠性；有机会将前沿云计算与 AI 能力快速落地，参与产品长期演进规划。 ========= 负责飞天企业版大数据类产品的分布式系统开发与架构演进，推动微服务化与弹性扩缩容方案落地。优化系统性能与资源使用（内存/CPU），设计退避、限流、熔断等容错与自愈机制。主导或参与底层库与中间件的调优、代码重构与可测试性改进，提升系统可维护性。构建与完善漏洞自动化修复、容灾恢复流程，支持企业级特殊服务/数据场景。与产品、运维、测试等团队协同，推动线上演进、容量规划与可靠性保障。岗位要求熟练掌握 C++/Python/Go/Java 中至少一种，具备良好的编码规范与单元测试习惯；熟悉代码重构与常用设计模式。三年以上分布式系统开发经验，有公有云/私有云相关项目经验优先。了解编程语言演进与 Core Guidelines（如 C++ Core Guidelines）者优先。熟悉 Folly、Abseil、ElasticSearch、ClickHouse、Kafka 等大数据基础开源组件，能阅读源码并有社区贡献或提交者优先。熟悉 Kubernetes 等容器编排/分布式管控系统；使用过 Azure Stack、AWS Outposts 等专有云/混合云解决方案者更佳。学习能力强，对云计算前沿技术充满热情，能将新技术快速工程化并在产品迭代中做出合理权衡与规划。
线控底盘转向系统工程师
[上海·嘉定区] 2024-10-16

15k-25k·13薪经验1-3年 / 本科

立昇智能

汽车|出行,硬件,工具 / 未融资 / 150-500人

转向系统工程师职责描述： 1. 负责转向系统的方案设计与优化，制定系统性能与验证规范 2. 负责转向系统的需求开发，与团队合作完成系统、硬件、软件各层级的需求分解与追溯 3. 负责转向系统的安全分析，系统降级策略开发，制定和维护系统FMEA，与团队合作完成FTA，FSC，TSC的开发 4. 负责车型项目的软硬件协调开发方案，确定硬件选型和功能应用的控制策略 5. 负责底盘前瞻技术的调研，市场需求的分析，产品的对标，指导产品的开发 6. 负责产品系统问题的分析与解决，指导软硬件的优化任职要求： 1. 具有至少3年以上EPS,RWS或SBW产品开发经验，且至少具有机械结构，ECU系统，功能算法其中一个领域的开发经验 2. 了解车辆底盘功能，了解底盘工作原理和转向系统工作原理 3. 了解转向法规和行业规范，如GB17675，DIN70065，ISO26262等，有功能安全证书者优先 4. 了解汽车电子系统开发流程和质量体系，如ASPICE，IATF 16949等 5. 了解底盘相关的整车电气架构，通讯诊断等优先 6. 具备较强的问题分析能力和团队沟通能力，掌握至少一种分析方法，如Shainin Red X，TBP，鱼骨图等优先
系统工程师（公安领域-镜头产品）
[北京·海淀区] 2024-09-09

30k-50k 经验10年以上 / 本科

软通

IT技术服务｜咨询 / 不需要融资 / 2000人以上

岗位职责： 1、负责OpenHarmony的专有特性开发（分布式软总线、分布式数据库、分布式安全）等； 2、负责开发基于OpenHarmony发行版的操作系统层面的系统组件等开发； 3、负责鸿蒙平台的框架架构，具有相应的问题分析定位与修改。 4、负责研发音视频、网管协议、NAPI、行业应用软件等 5、负责架构设计、专利书写等文档专业要求： 1、5年以上开发经验，能够熟练地使用C/C++完成需求开发； 2、能够基于OpenHarmony平台做软件开发，熟练掌握OpenHarmony操作系统； 3、熟悉OS内存管理、中断、异常和系统调用等原理和关键数据结构； 4、本科或以上学历，自动化、计算机、电子等相关专业，一年以上Openharmony、两年以上嵌入式开发经验; 5、有自动驾驶机器人、平板、摄像头、网关等相关工作经历者优先考虑; 6、熟悉嵌入式操作系统，linux应用开发经验者优先考虑。 7、熟悉GN、NINJA的编译脚本，熟悉PYTHON、MAKEFILE；
系统工程师
[上海·五角场] 2024-06-17

8k-15k 经验在校/应届 / 本科

磐松私募基金管理

金融 / 未融资 / 15-50人

【岗位描述】系统工程师负责管理公司的各种基础硬件与系统，例如服务器，数据库，日志系统，容器系统和数据库系统等。理想的候选人掌握Linux的基本操作，对数据库、日志系统、虚拟容器等软件有基本的了解，并且掌握基本的python语言。【岗位职责】 1. 负责进行桌面运维，配置、维护工作电脑 2. 负责运维公司日志系统，虚拟化容器，以及工作流管理系统 3. 负责公司服务器运维，windows /linux server操作系统配置 4. 负责Nginx等软件的配置和公司内部DNS服务器的搭建 5. 负责管理python环境，并且开发Python工具简化工作流程【岗位要求】 1. 本科以上学历，具有计算机等相关专业背景。 2. 工作细心、谨慎，具备较强的学习能力。具有良好的团队协作及沟通能力、工作态度认真。 3. 熟练使用Mysql、MongoDB等数据库，并掌握基础数据库知识。 4. 熟悉Linux开发环境，了解基本的指令。 5. 了解基本的Python语言语法，使用过一些Python的包。 6. 加分项：熟悉Artifactory、ELK、Docker、MongoDB、Prefect。
大模型分布式系统优化专家
[南京·建邺区] 2023-12-01

18k-35k 经验3-5年 / 硕士

基流科技

企业服务,人工智能,通讯电子 / 天使轮 / 50-150人

职位描述 1. 负责带领团队建设大模型分布式系统研发体系和多GPU优化技术体系，跟踪和探索面向大模型的分布式优化技术新趋势； 2. 负责组织进行软件的设计和开发，对多GPU（同一节点和跨网络多节点）通信性能优化；职位要求 1. 研究生及以上学历，计算机/电子相关专业优先，5年（博士3年）以上分布式系统优化经验； 2. 熟悉计算机体系架构、分布式并行计算和异构计算框架，具备OpenMPI, OpenSHEM, MPICH 等相关知识及支持库（NCCL,UCX, etc.）和经验者优先； 3. 具备芯片互联和网络传输编程相关知识，例如RDMA，PCIE Peer2Peer, GPU Direct等经验者优先； 4. 熟练掌握深度学习分布式优化方法，有大模型训练和推理优化经验者优先； 5. 统筹协调能力强，有大型系统开发团队管理经验优先。