【服务器运维工程师招聘】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

服务器生产管理（NPI）-基础设施
[杭州·余杭区] 09:25发布

15k-30k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、新平台产品导入管理： 1）牵头制定服务器新产品（含整机、关键部件）的NPI导入计划，明确ODM工厂的导入节点、交付标准及资源需求，协调研发平台、供应链等团队完成最终交付需求； 2）主导DFM（可制造性设计）评审，针对服务器结构设计、硬件配置、组装工艺等提出量产优化建议，推动研发端改进（如降低组装复杂度、提升测试效率），缩短试产周期、提升生产效率及产出； 3）统筹工厂端试产流程，包括业务样机、小批量试产（EVT/DVT/PVT阶段），推动问题闭环，确保试产阶段的生产问题100%解决； 4）优化工厂端NPI管理机制，跟踪物料齐套性、产线准备进度、人员培训等4M1E准备情况，推动工厂按时完成试产交付； 2、量产平台灰度交付导入管理： 1）牵头制定量产套餐新业务/新部件/新套餐灰度爬坡计划，满足最终供应交付及相关需求下，明确各ODM工厂导入时间及首批生产完成节点，满足最终供应上量爬坡需求； 2）统筹工厂端从灰度策划到生产交付过程的问题管控，针对生产准备及生产过程中的问题，及时推动各方资源解决，最终保障按时交付； 3、生产风险管理与交付保障： 1）统筹生产过程风险，涵盖物料、产品生产工艺/质量等问题，制定对应风险预案，保障生产顺利达成； 2）针对突发交付问题，快速协调各方周边资源推进问题解决，确保问题及时解决保障最终交付目标。职位要求： 1、多年硬件产品NPI或制造代表经验，3年及以上服务器产品导入经验； 2、成功主导过至少两款服务器产品的新产品导入，具备试产到量产从0到1以上的产能爬坡实战经验，熟悉服务器硬件基础架构及组成； 3、熟悉ODM/OEM工厂运作模式，熟悉服务器生产关键工艺（如SMT贴片、整机组装、系统烧录、功能测试、老化测试）； 4、擅长与研发（硬件/软件）、采购、质量、工厂等多角色沟通，能推动问题解决，具备优秀的跨部门资源协调能力； 5、能通过良率数据、产能数据、物料周转率等指标识别生产痛点并推动持续改进。
服务器运维工程师
[杭州·翠苑] 1天前发布

20k-30k 经验3-5年 / 本科

边锋

游戏 / 不需要融资 / 500-2000人

职位说明： 1、负责搭建和维护业务系统的运行环境，包括服务器架设、应用软件安装、配置以及优化； 2、负责业务系统的管理与维护，包括性能监控、性能调优和故障诊断等； 3、负责相关业务线的发布和数据同步的工作； 4、日常运维文档的撰写整理工作； 5、及时响应并协助解决公司应用相关的IT风险事件。任职资格： 1、深入理解linux系统、Windows系统； 2、熟悉服务器硬件故障的简单处理； 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用； 4、精通一门以上脚本语言(shell/go/python等)，有java/c++开发经验更佳； 5、精通lvs、nginx、haproxy等组件运维体系； 6、精通持续集成，持续发布的管理流程和工具，熟悉jenkins； 7、掌握主流开源监控软件的配置使用，如：Zabbix、Open-Falcon等。
服务器运维工程师
[北京·西二旗] 1天前发布

30k-50k 经验3-5年 / 本科

赛福科技

企业服务,信息安全 / 不需要融资 / 150-500人

岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役，保障硬件资源稳定、高效运行； 2. 负责跟踪和处理服务器各类硬件故障，持续优化问题发现-定位-处置闭环机制，提升故障处理效率； 3. 负责AI大模型训练/推理集群相关服务器的运维支持，保障模型稳定性； 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进； 5. 负责推动新硬件上线适配及运维策略制定，确保平滑演进； 6. 负责运维可视化、自动化能力及故障预测预防能力建设。任职要求 1. 本科及以上学历，计算机或相关专业； 2. 3年以上服务器硬件运维经验，有IDC实地运维或大规模集群支持经验者优先； 4. 熟悉主流服务器硬件架构，具备GPU服务器运维经验优先； 5. 具备处理AI大模型训练中常见硬件故障的能力； 6. 了解Linux操作系统基本命令，掌握常用日志分析与硬件健康检测工具； 7. 具备良好的开发能力，熟悉至少一种脚本语言（如 Python / Go / Shell），可独立开发或维护日常运维自动化工具； 8. 具备良好的沟通协作能力和问题分析能力，责任心强
服务器供应链质量工程师
[北京·海淀区] 1天前发布

30k-60k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责公司全球服务器的拆机、利旧、自维保场景下的质量管理与服务支持工作，保证相关业务正常开展； 2、负责服务器整机制造指标制定、监控、提升，管理OXM进行质量控制与质量提升； 3、负责服务器关键部件供应商QSA、QPA稽核、绩效考核、定期飞检、专项辅导，推动供应商持续改善； 4、负责服务器关键部件、利旧部件质量标准制定，包括外观标准，性能测试标准； 5、负责部件供应商出货质量监控与来料质量控制；整机制造与关键部件质量问题处理，包括异常处理、质量判责、RMA支持、MRB评审等。职位要求： 1、本科及以上学历； 2、熟悉服务器生产制程工艺、技术管控关键点及质量异常处理流程； 3、熟悉供应商质量管理模式，熟悉供应商QSA、QPA系统性稽核诊断及辅导改善； 4、熟悉关键物料质量管理方法与关键制造工艺，如CPU、HDD、SSD、内存等。
腾讯音乐业务运维工程师
[深圳·南山区] 1天前发布

25k-50k 经验5-10年 / 不限

腾讯音乐娱乐集团

工具类产品,内容社区,音频｜视频媒体 / 上市公司 / 2000人以上

岗位职责： 1. 负责研发部基建运维，设计、部署并维护可靠、可扩展的基础设施系统，包括云计算、容器、分布式系统等； 2. 负责参与持续交付和自动化建设，制定持续集成和持续交付的流程和工具； 3. 负责事故响应和故障排查，快速定位并解决生产环境中的问题，分析事故原因,制定预防措施,持续改进系统可靠性。岗位要求： 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化； 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验； 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化，同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
云平台运维工程师
[北京·金融街] 09:25发布

15k-20k·15薪经验3-5年 / 本科

华泰保险

其他,金融 / 不需要融资 / 2000人以上

岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作，包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等； 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池，优化高可用集群的架构和性能； 3、负责公司灾难恢复体系的建设及运营管理工作； 4、负责服务器类硬件产品运维管理工作，包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等； 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理； 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作； 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。任职资格: 1、本科及以上学历，计算机、通信等相关专业，8年以上服务器系统运维经验，其中3年以上互联网金融、银行、保险等行业经验，有带过团队； 2、精通服务器虚拟化相关技术，掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台； 3、精通常用操作系统（Windows、Linux），熟练使用Python、SHELL等脚本语言； 4、具备常见运维工具（如 Zabbix/ELK/Ansible/Docker 等）的使用经验； 5、具有良好的沟通协调能力，较强的团队合作精神、责任心和一定抗压能力。
C++服务器开发工程师
[上海·龙柏] 09:24发布

25k-50k·14薪经验3-5年 / 本科

CMGE中手游

游戏 / 上市公司 / 500-2000人

职位描述： 1、负责游戏项目产品服务器开发工作； 2、负责游戏服务器模块的编写工作； 3、负责游戏服务器架构设计、研发工作； 4、负责解决服务器相关问题并完成性能优化； 5、完成上级领导交代的其他工作。任职要求： 1、大专及以上学历；计算机或电子信息类相关专业； 2、熟练掌握C++及至少一种脚本语言；5年以上游戏行业工作经验； 3、编程习惯良好，注重编写高质量代码；熟悉常用算法和数据结构，熟悉STL调优； 4、熟悉Linux系统开发，熟练应用http协议/socket协议；熟悉数据库开发，熟练使用MySql，Redis等主流数据库； 5、沟通协调能力良好，有团队协作精神； 6、有大型mmo复杂模块的开发经验，如AI、跨区、视野管理、无缝世界等； 7、热爱游戏，对多人在线网游有自己的兴趣和认知。
资深服务器开发工程师
[北京·朝阳门] 09:25发布

25k-35k 经验5-10年 / 本科

Zenjoy

移动互联网,游戏 / 不需要融资 / 150-500人

职位描述： 1、参与服务器的架构和模块设计 2、参与游戏团队协作，实现服务器端游戏功能 3、参与数据与业务中台的设计与建设，为产品提供灵活支持 4、研究最新技术落地实践，为产品提供竞争力任职要求： 1、热爱技术，对优秀的技术框架和架构设计有浓厚的兴趣 2、精通各种网络通讯协议，熟悉Socket、TCP/IP编程 3、熟悉以下任意一种语言和相关框架：Java，C++，Javascript(Node.js)，Go 4、熟悉任意一种 Web 前端技术, 包括但不限于 AngularJS、VueJs、React 5、熟悉 Redis，MySQL，MongoDB 等各种类型数据库 6、了解服务器监控和优化 7、五年以上游戏或互联网服务器开发经验 8、有较强的责任心，善于学习，优秀的团队精神 9、为人踏实，积极主动，具有优秀的沟通能力
0281SL-运维工程师
[深圳·福田区] 09:25发布

12k-22k 经验1-3年 / 本科

平安人寿

金融业 / 上市公司 / 2000人以上

工作职责 1. 保障公司核心业务系统的运维管理工作，快速响应并解决线上问题，做业务稳定的“守护者”； 2. 负责业务系统发布变更管理，评估风险、执行验证，确保每一次生产发布变更都安全可控； 3. 开展业务系统容量分析与性能优化，提前识别瓶颈，支撑业务可持续增长； 4. 负责运维自动化平台建设与持续优化，推动运维工作向智能化运维方向迈进。任职要求 1. 计算机相关专业本科及以上学历，2年以上IT运维或DevOps经验； 2. 熟悉Linux系统操作，掌握Shell或Python脚本编程； 3. 熟悉Kubernetes、Docker基本原理与常用操作； 4. 熟悉主流数据库（如MySQL、PostgreSQL、Redis、TiDB）的日常维护与调优； 5. 具备良好的逻辑思维和问题排查能力，能独立承担运维任务。为什么选择我们？稳定有保障：公司业务模式成熟，无大规模裁员计划，注重员工长期发展成长看得见：定期组织技术分享、外部培训，支持向SRE、运维开发等方向转型团队很靠谱：成员均来自一线互联网/金融企业，技术扎实、氛围开放、互相支持工作有尊严：拒绝“救火式加班”，倡导通过自动化和预防性运维提升效率参与核心系统：你将直接负责公司主干系统的稳定性建设，技术价值真实可见我们承诺：在这里，你不会只是一个“修锅侠”。我们将为你提供清晰的成长路径、充分的技术授权和应有的尊重。无论外部环境如何变化，我们都希望与你一起，走得稳，也走得远。
运维工程师
[北京·公主坟] 1天前发布

14k-26k 经验3-5年 / 本科

融汇

金融 / 不需要融资 / 50-150人

运维工程师工作职责： 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理，确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具，提高运维工作效率和质量。使用脚本语言（如 Python、Shell）编写自动化部署脚本，实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台，集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统，使用开源或商业监控工具（如 Zabbix、Prometheus 等）对系统资源（CPU、内存、磁盘 I/O、网络流量等）、服务状态（Web 服务、数据库服务等）进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求，搭建高可用、高性能的 K8s 集群，包括但不限于选择合适的节点数量、配置网络插件（如 Calico、Flannel）和存储插件（如 Ceph、NFS）。 5、负责公司外部项目部署交付（需能接受短期出差），包括自建k8s集群以及各种私有容器云平台上部署公司项目，编写和维护项目相关文档，包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时，能够迅速定位问题的根源，如网络故障、存储故障、应用代码问题等，并采取有效的解决措施，尽快恢复业务正常运行。制定和演练应急响应计划，包括灾难恢复、故障转移等场景。任职要求： 1、本科及以上学历，计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务（如 Apache、Nginx、MySQL、Redis 等）的部署和优化。 3、熟悉网络基础知识，包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等，具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象（如 Pod、Deployment、Service、Ingress 等），具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术，如 Docker，包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具（如 Prometheus）和可视化工具（如 Grafana）的使用，能够构建有效的监控体系。 7、熟悉网络和存储相关知识，如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等，能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力，熟练掌握至少一种脚本语言（如 Shell、Python），用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神，能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力，能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识，能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
运维工程师
[北京·五道口] 1天前发布

12k-20k 经验1-3年 / 本科

融捷教育

教育 / 不需要融资 / 50-150人

岗位职责： 1、负责管理本地服务器及阿里云资源等日常维护，技术支持、系统优化、故障处理、相关维护文档编制； 2、负责以及应用系统日常维护工作，系统上线、升级、部署日常操作； 3、负责管理办公及网络设备（如路由器、交换机、防火墙）； 4、负责对现行自动化建设与维护。任职资格： 1、本科以上学历，一年以上相关工作经验； 2、具有Linux系统维护经验以及云服务器相关经验，熟练操作常见的Linux发行版（如CentOS, Ubuntu）系统的安装、配置及日常使用； 3、具备Shell/Python脚本编写能力，能高效地通过脚本自动化处理日常运维任务； 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查； 5、熟悉TCP/IP协议栈以及HTTP协议，能够理解并解决相关的网络通信问题；了解基本的路由与交换技术，能够对交换机、路由器以及防火墙进行必要的配置工作； 6、熟悉常用的监控工具（如Prometheus, Zabbix等）和日志管理系统（如ELK Stack等），能够设置和维护这些工具以确保系统的稳定运行； 7、掌握Docker容器技术及Kubernetes集群管理，能够部署、管理和优化容器化应用。
java服务器开发主管
[上海·虹桥] 1天前发布

25k-30k 经验5-10年 / 本科

网石游戏

游戏 / 不需要融资 / 2000人以上

职位名称：JAVA服务器开发主管工作地点：上海-长宁汇报对象：技术总监工作职责： 1、负责公司SDK 维护和开发 2、负责游戏账号、登录、实名、支付、数据等核心SDK服务端系统的架构设计、核心代码开发、迭代更新。 3、主导SDK服务端性能优化，确保平台服务SLA达到99.99%及以上，能够前瞻性地识别系统瓶颈和技术风险，并推动实施有效的解决方案。 4、主导SDK服务的K8s集群部署与管理，设计合理的Pod调度策略等资源配置，保障服务在K8s环境下的稳定性与弹性伸缩能力。带领服务端开发成员，负责任务分配、进度跟踪、技术指导与成员能力提升。职位要求： 1、本科及以上学历，计算机相关专业 2、 5年以上JAVA服务端开发经验，2年以上团队管理 3、精通JAVA(Spring Boot)、JVM原理、微服务架构等 4、熟练掌握GO, PHP, Node JS开发任意项优先考虑 5、具备良好的沟通能力，富有责任心，领导力，执行能力优秀，乐意创新进取
服务器交付工程师
[北京·西二旗] 1天前发布

30k-50k 经验3-5年 / 本科

赛福科技

企业服务,信息安全 / 不需要融资 / 150-500人

职位描述 1.服务器技术交付负责人，包括项目虚线团队协同，沟通管理，计划管理，范围管理，变更管理，风险管理，质量管理，紧急情况处理等，作为一号位确保项目保质保量按期交付 2. 作为所负责用户交付相关的业务需求，业务方案技术方案，交付方案的总体推进人，制定计划，确保交付进程的顺利实施，并总结项目经验，推动标准和可复制方案迭代 3.负责协调服务器在IDC现场的交付全流程，保证各个环节顺利进行，如IDC环境验收、机架位规划和用电计算、网络布线、服务器设备到货上架、系统安装等环节，了解各环节关键节点及产出，提前识别延期风险并协调资源解决。任职要求 1. 本科或以上学历，计算机相关专业，具备技术背景，了解服务器硬件，数据中心，网络，操作系统基础技术；了解大语言模型软硬件相关技术优先 2. 3年或以上大型客户项目交付、客户成功、解决方案经验客户沟通能力强，能有效协同内部各部门和各级关键客户形成共同的决策 3. 具备良好的抗压能力、沟通能力和团队协作精神，逻辑思维能力强，具备很强的书面同步能力 4.熟悉IDC服务器端到端交付全流程并具备丰富的实操经验，不限于综合布线、服务器落位规划、资产字段信息管理、服务器上架安装管理等，熟悉大模型网络架构、硬件设备者优先
运维工程师
[北京·中关村] 1天前发布

15k-25k 经验5-10年 / 本科

融捷教育

教育 / 不需要融资 / 50-150人

岗位职责： 1、负责管理本地服务器及阿里云资源等日常维护，技术支持、系统优化、故障处理、相关维护文档编制； 2、负责以及应用系统日常维护工作，系统上线、升级、部署日常操作； 3、负责管理办公及网络设备（如路由器、交换机、防火墙）； 4、负责对现行自动化建设与维护。任职资格： 1、本科以上学历，3年以上相关工作经验； 2、具有Linux系统维护经验以及云服务器相关经验，熟练操作常见的Linux发行版（如CentOS, Ubuntu）系统的安装、配置及日常使用； 3、具备Shell/Python脚本编写能力，能高效地通过脚本自动化处理日常运维任务； 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查； 5、熟悉TCP/IP协议栈以及HTTP协议，能够理解并解决相关的网络通信问题；了解基本的路由与交换技术，能够对交换机、路由器以及防火墙进行必要的配置工作； 6、熟悉常用的监控工具（如Prometheus, Zabbix等）和日志管理系统（如ELK Stack等），能够设置和维护这些工具以确保系统的稳定运行； 7、掌握Docker容器技术及Kubernetes集群管理，能够部署、管理和优化容器化应用。
1181AS-系统运维工程师
[深圳·南山区] 09:25发布

15k-25k 经验3-5年 / 本科

平安科技

金融 / 上市公司 / 2000人以上

工作职责 1、自动化运营脚本或工具平台开发，提升运维工作效率； 2、梳理设计实施基础架构/应用监控，建立完备的监控体系； 3、异常分析处理，快速恢复应用系统故障，确保业务正常进行； 4、7*24h应急响应，紧急情况下执行应急预案快速恢复异常； 5. 响应和处理中间件&计算领域的日常事件，并做好事件的分析和总结，作为事件智能化的知识输入。任职要求 1、本科及以上学历，计算机相关专业，3年及以上开发或运维工作经验； 2、有kafka/elasticsearch/rocketmq/tomcat/nginx/weblogic等软件运维经验者优先； 3、精通linux/Unix的基本操作和维护以及性能调优，熟悉常见网络配置等操作，熟悉TCP/IP协议的原理； 4、掌握shell，python等开发语言，有运维平台开发经验者优先； 5、了解docker相关技术，有基于kubernetes容器云平台开发或运维经验者优先； 6、有大规模云底座运维、应用集群运维经验者优先； 7、可以接受7*24三班值班。