• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、新平台产品导入管理: 1)牵头制定服务器新产品(含整机、关键部件)的NPI导入计划,明确ODM工厂的导入节点、交付标准及资源需求,协调研发平台、供应链等团队完成最终交付需求; 2)主导DFM(可制造性设计)评审,针对服务器结构设计、硬件配置、组装工艺等提出量产优化建议,推动研发端改进(如降低组装复杂度、提升测试效率),缩短试产周期、提升生产效率及产出; 3)统筹工厂端试产流程,包括业务样机、小批量试产(EVT/DVT/PVT阶段),推动问题闭环,确保试产阶段的生产问题100%解决; 4)优化工厂端NPI管理机制,跟踪物料齐套性、产线准备进度、人员培训等4M1E准备情况,推动工厂按时完成试产交付; 2、量产平台灰度交付导入管理: 1)牵头制定量产套餐新业务/新部件/新套餐灰度爬坡计划,满足最终供应交付及相关需求下,明确各ODM工厂导入时间及首批生产完成节点,满足最终供应上量爬坡需求; 2)统筹工厂端从灰度策划到生产交付过程的问题管控,针对生产准备及生产过程中的问题,及时推动各方资源解决,最终保障按时交付; 3、生产风险管理与交付保障: 1)统筹生产过程风险,涵盖物料、产品生产工艺/质量等问题,制定对应风险预案,保障生产顺利达成; 2)针对突发交付问题,快速协调各方周边资源推进问题解决,确保问题及时解决保障最终交付目标。 职位要求: 1、多年硬件产品NPI或制造代表经验,3年及以上服务器产品导入经验; 2、成功主导过至少两款服务器产品的新产品导入,具备试产到量产从0到1以上的产能爬坡实战经验,熟悉服务器硬件基础架构及组成; 3、熟悉ODM/OEM工厂运作模式,熟悉服务器生产关键工艺(如SMT贴片、整机组装、系统烧录、功能测试、老化测试); 4、擅长与研发(硬件/软件)、采购、质量、工厂等多角色沟通,能推动问题解决,具备优秀的跨部门资源协调能力; 5、能通过良率数据、产能数据、物料周转率等指标识别生产痛点并推动持续改进。
  • 20k-30k 经验3-5年 / 本科
    游戏 / 不需要融资 / 500-2000人
    职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
  • 30k-50k 经验3-5年 / 本科
    企业服务,信息安全 / 不需要融资 / 150-500人
    岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
  • 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责公司全球服务器的拆机、利旧、自维保场景下的质量管理与服务支持工作,保证相关业务正常开展; 2、负责服务器整机制造指标制定、监控、提升,管理OXM进行质量控制与质量提升; 3、负责服务器关键部件供应商QSA、QPA稽核、绩效考核、定期飞检、专项辅导,推动供应商持续改善; 4、负责服务器关键部件、利旧部件质量标准制定,包括外观标准,性能测试标准; 5、负责部件供应商出货质量监控与来料质量控制;整机制造与关键部件质量问题处理,包括异常处理、质量判责、RMA支持、MRB评审等。 职位要求: 1、本科及以上学历; 2、熟悉服务器生产制程工艺、技术管控关键点及质量异常处理流程; 3、熟悉供应商质量管理模式,熟悉供应商QSA、QPA系统性稽核诊断及辅导改善; 4、熟悉关键物料质量管理方法与关键制造工艺,如CPU、HDD、SSD、内存等。
  • 25k-50k 经验5-10年 / 不限
    工具类产品,内容社区,音频|视频媒体 / 上市公司 / 2000人以上
    岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
  • 15k-20k·15薪 经验3-5年 / 本科
    其他,金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
  • 25k-50k·14薪 经验3-5年 / 本科
    游戏 / 上市公司 / 500-2000人
    职位描述: 1、负责游戏项目产品服务器开发工作; 2、负责游戏服务器模块的编写工作; 3、负责游戏服务器架构设计、研发工作; 4、负责解决服务器相关问题并完成性能优化; 5、完成上级领导交代的其他工作。 任职要求: 1、大专及以上学历;计算机或电子信息类相关专业; 2、熟练掌握C++及至少一种脚本语言;5年以上游戏行业工作经验; 3、编程习惯良好,注重编写高质量代码;熟悉常用算法和数据结构,熟悉STL调优; 4、熟悉Linux系统开发,熟练应用http协议/socket协议;熟悉数据库开发,熟练使用MySql,Redis等主流数据库; 5、沟通协调能力良好,有团队协作精神; 6、有大型mmo复杂模块的开发经验,如AI、跨区、视野管理、无缝世界等; 7、热爱游戏,对多人在线网游有自己的兴趣和认知。
  • 25k-35k 经验5-10年 / 本科
    移动互联网,游戏 / 不需要融资 / 150-500人
    职位描述: 1、参与服务器的架构和模块设计 2、参与游戏团队协作,实现服务器端游戏功能 3、参与数据与业务中台的设计与建设,为产品提供灵活支持 4、研究最新技术落地实践,为产品提供竞争力 任职要求: 1、热爱技术,对优秀的技术框架和架构设计有浓厚的兴趣 2、精通各种网络通讯协议,熟悉Socket、TCP/IP编程 3、熟悉以下任意一种语言和相关框架:Java,C++,Javascript(Node.js),Go 4、熟悉任意一种 Web 前端技术, 包括但不限于 AngularJS、VueJs、React 5、熟悉 Redis,MySQL,MongoDB 等各种类型数据库 6、了解服务器监控和优化 7、五年以上游戏或互联网服务器开发经验 8、有较强的责任心,善于学习,优秀的团队精神 9、为人踏实,积极主动,具有优秀的沟通能力
  • 12k-22k 经验1-3年 / 本科
    金融业 / 上市公司 / 2000人以上
    工作职责 1. 保障公司核心业务系统的运维管理工作,快速响应并解决线上问题,做业务稳定的“守护者”; 2. 负责业务系统发布变更管理,评估风险、执行验证,确保每一次生产发布变更都安全可控; 3. 开展业务系统容量分析与性能优化,提前识别瓶颈,支撑业务可持续增长; 4. 负责运维自动化平台建设与持续优化,推动运维工作向智能化运维方向迈进。 任职要求 1. 计算机相关专业本科及以上学历,2年以上IT运维或DevOps经验; 2. 熟悉Linux系统操作,掌握Shell或Python脚本编程; 3. 熟悉Kubernetes、Docker基本原理与常用操作; 4. 熟悉主流数据库(如MySQL、PostgreSQL、Redis、TiDB)的日常维护与调优; 5. 具备良好的逻辑思维和问题排查能力,能独立承担运维任务。 为什么选择我们? 稳定有保障:公司业务模式成熟,无大规模裁员计划,注重员工长期发展 成长看得见:定期组织技术分享、外部培训,支持向SRE、运维开发等方向转型 团队很靠谱:成员均来自一线互联网/金融企业,技术扎实、氛围开放、互相支持 工作有尊严:拒绝“救火式加班”,倡导通过自动化和预防性运维提升效率 参与核心系统:你将直接负责公司主干系统的稳定性建设,技术价值真实可见 我们承诺: 在这里,你不会只是一个“修锅侠”。 我们将为你提供清晰的成长路径、充分的技术授权和应有的尊重。 无论外部环境如何变化,我们都希望与你一起,走得稳,也走得远。
  • 14k-26k 经验3-5年 / 本科
    金融 / 不需要融资 / 50-150人
    运维工程师   工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。   任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
  • 12k-20k 经验1-3年 / 本科
    教育 / 不需要融资 / 50-150人
    岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,一年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
  • 25k-30k 经验5-10年 / 本科
    游戏 / 不需要融资 / 2000人以上
    职位名称:JAVA服务器开发主管 工作地点:上海-长宁 汇报对象:技术总监 工作职责: 1、负责 公司SDK 维护和开发 2、负责游戏账号、登录、实名、支付、数据等核心SDK服务端系统的架构设计、核心代码开发、迭代更新。 3、主导SDK服务端性能优化,确保平台服务SLA达到99.99%及以上,能够前瞻性地识别系统瓶颈和技术风险,并推动实施有效的解决方案。 4、主导SDK服务的K8s集群部署与管理,设计合理的Pod调度策略等资源配置,保障服务在K8s环境下的稳定性与弹性伸缩能力。 带领服务端开发成员,负责任务分配、进度跟踪、技术指导与成员能力提升。 职位要求: 1、 本科及以上学历,计算机相关专业 2、 5年以上JAVA服务端开发经验,2年以上团队管理 3、 精通JAVA(Spring Boot)、JVM原理、微服务架构等 4、 熟练掌握GO, PHP, Node JS开发任意项优先考虑 5、 具备良好的沟通能力,富有责任心,领导力,执行能力优秀,乐意创新进取
  • 30k-50k 经验3-5年 / 本科
    企业服务,信息安全 / 不需要融资 / 150-500人
    职位描述 1.服务器技术交付负责人,包括项目虚线团队协同,沟通管理,计划管理,范围管理,变更管理,风险管理,质量管理,紧急情况处理等,作为一号位确保项目保质保量按期交付 2. 作为所负责用户交付相关的业务需求,业务方案技术方案,交付方案的总体推进人,制定计划,确保交付进程的顺利实施,并总结项目经验,推动标准和可复制方案迭代 3.负责协调服务器在IDC现场的交付全流程,保证各个环节顺利进行,如IDC环境验收、机架位规划和用电计算、网络布线、服务器设备到货上架、系统安装等环节,了解各环节关键节点及产出,提前识别延期风险并协调资源解决。 任职要求 1. 本科或以上学历,计算机相关专业,具备技术背景,了解服务器硬件,数据中心,网络,操作系统基础技术; 了解大语言模型软硬件相关技术优先 2. 3年或以上大型客户项目交付、客户成功、解决方案经验 客户沟通能力强,能有效协同内部各部门和各级关键客户形成共同的决策 3. 具备良好的抗压能力、沟通能力和团队协作精神,逻辑思维能力强,具备很强的书面同步能力 4.熟悉IDC服务器端到端交付全流程并具备丰富的实操经验,不限于综合布线、服务器落位规划、资产字段信息管理、服务器上架安装管理等,熟悉大模型网络架构、硬件设备者优先
  • 15k-25k 经验5-10年 / 本科
    教育 / 不需要融资 / 50-150人
    岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
  • 15k-25k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、自动化运营脚本或工具平台开发,提升运维工作效率; 2、梳理设计实施基础架构/应用监控,建立完备的监控体系; 3、异常分析处理,快速恢复应用系统故障,确保业务正常进行; 4、7*24h应急响应,紧急情况下执行应急预案快速恢复异常; 5. 响应和处理中间件&计算领域的日常事件,并做好事件的分析和总结,作为事件智能化的知识输入。 任职要求 1、本科及以上学历,计算机相关专业,3年及以上开发或运维工作经验; 2、有kafka/elasticsearch/rocketmq/tomcat/nginx/weblogic等软件运维经验者优先; 3、精通linux/Unix的基本操作和维护以及性能调优,熟悉常见网络配置等操作,熟悉TCP/IP协议的原理; 4、掌握shell,python等开发语言,有运维平台开发经验者优先; 5、了解docker相关技术,有基于kubernetes容器云平台开发或运维经验者优先; 6、有大规模云底座运维、应用集群运维经验者优先; 7、可以接受7*24三班值班。