-
岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
-
职位职责: 1、新平台产品导入管理: 1)牵头制定服务器新产品(含整机、关键部件)的NPI导入计划,明确ODM工厂的导入节点、交付标准及资源需求,协调研发平台、供应链等团队完成最终交付需求; 2)主导DFM(可制造性设计)评审,针对服务器结构设计、硬件配置、组装工艺等提出量产优化建议,推动研发端改进(如降低组装复杂度、提升测试效率),缩短试产周期、提升生产效率及产出; 3)统筹工厂端试产流程,包括业务样机、小批量试产(EVT/DVT/PVT阶段),推动问题闭环,确保试产阶段的生产问题100%解决; 4)优化工厂端NPI管理机制,跟踪物料齐套性、产线准备进度、人员培训等4M1E准备情况,推动工厂按时完成试产交付; 2、量产平台灰度交付导入管理: 1)牵头制定量产套餐新业务/新部件/新套餐灰度爬坡计划,满足最终供应交付及相关需求下,明确各ODM工厂导入时间及首批生产完成节点,满足最终供应上量爬坡需求; 2)统筹工厂端从灰度策划到生产交付过程的问题管控,针对生产准备及生产过程中的问题,及时推动各方资源解决,最终保障按时交付; 3、生产风险管理与交付保障: 1)统筹生产过程风险,涵盖物料、产品生产工艺/质量等问题,制定对应风险预案,保障生产顺利达成; 2)针对突发交付问题,快速协调各方周边资源推进问题解决,确保问题及时解决保障最终交付目标。 职位要求: 1、多年硬件产品NPI或制造代表经验,3年及以上服务器产品导入经验; 2、成功主导过至少两款服务器产品的新产品导入,具备试产到量产从0到1以上的产能爬坡实战经验,熟悉服务器硬件基础架构及组成; 3、熟悉ODM/OEM工厂运作模式,熟悉服务器生产关键工艺(如SMT贴片、整机组装、系统烧录、功能测试、老化测试); 4、擅长与研发(硬件/软件)、采购、质量、工厂等多角色沟通,能推动问题解决,具备优秀的跨部门资源协调能力; 5、能通过良率数据、产能数据、物料周转率等指标识别生产痛点并推动持续改进。
-
职位职责: 1、负责公司全球服务器的拆机、利旧、自维保场景下的质量管理与服务支持工作,保证相关业务正常开展; 2、负责服务器整机制造指标制定、监控、提升,管理OXM进行质量控制与质量提升; 3、负责服务器关键部件供应商QSA、QPA稽核、绩效考核、定期飞检、专项辅导,推动供应商持续改善; 4、负责服务器关键部件、利旧部件质量标准制定,包括外观标准,性能测试标准; 5、负责部件供应商出货质量监控与来料质量控制;整机制造与关键部件质量问题处理,包括异常处理、质量判责、RMA支持、MRB评审等。 职位要求: 1、本科及以上学历; 2、熟悉服务器生产制程工艺、技术管控关键点及质量异常处理流程; 3、熟悉供应商质量管理模式,熟悉供应商QSA、QPA系统性稽核诊断及辅导改善; 4、熟悉关键物料质量管理方法与关键制造工艺,如CPU、HDD、SSD、内存等。
-
职位描述 1.服务器技术交付负责人,包括项目虚线团队协同,沟通管理,计划管理,范围管理,变更管理,风险管理,质量管理,紧急情况处理等,作为一号位确保项目保质保量按期交付 2. 作为所负责用户交付相关的业务需求,业务方案技术方案,交付方案的总体推进人,制定计划,确保交付进程的顺利实施,并总结项目经验,推动标准和可复制方案迭代 3.负责协调服务器在IDC现场的交付全流程,保证各个环节顺利进行,如IDC环境验收、机架位规划和用电计算、网络布线、服务器设备到货上架、系统安装等环节,了解各环节关键节点及产出,提前识别延期风险并协调资源解决。 任职要求 1. 本科或以上学历,计算机相关专业,具备技术背景,了解服务器硬件,数据中心,网络,操作系统基础技术; 了解大语言模型软硬件相关技术优先 2. 3年或以上大型客户项目交付、客户成功、解决方案经验 客户沟通能力强,能有效协同内部各部门和各级关键客户形成共同的决策 3. 具备良好的抗压能力、沟通能力和团队协作精神,逻辑思维能力强,具备很强的书面同步能力 4.熟悉IDC服务器端到端交付全流程并具备丰富的实操经验,不限于综合布线、服务器落位规划、资产字段信息管理、服务器上架安装管理等,熟悉大模型网络架构、硬件设备者优先
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,一年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
职位描述: 1、参与服务器的架构和模块设计 2、参与游戏团队协作,实现服务器端游戏功能 3、参与数据与业务中台的设计与建设,为产品提供灵活支持 4、研究最新技术落地实践,为产品提供竞争力 任职要求: 1、热爱技术,对优秀的技术框架和架构设计有浓厚的兴趣 2、精通各种网络通讯协议,熟悉Socket、TCP/IP编程 3、熟悉以下任意一种语言和相关框架:Java,C++,Javascript(Node.js),Go 4、熟悉任意一种 Web 前端技术, 包括但不限于 AngularJS、VueJs、React 5、熟悉 Redis,MySQL,MongoDB 等各种类型数据库 6、了解服务器监控和优化 7、五年以上游戏或互联网服务器开发经验 8、有较强的责任心,善于学习,优秀的团队精神 9、为人踏实,积极主动,具有优秀的沟通能力
-
岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点
-
运维工程师 工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。 任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
-
岗位职责: 负责Linux服务器(CentOS/Ubuntu等)的安装、配置、优化及日常维护; 监控系统性能,分析日志,快速定位并解决系统故障,保障业务高可用性; 管理网络配置(TCP/IP、DNS、HTTP等),确保网络服务的稳定运行; 负责系统安全加固,包括防火墙(iptables/firewalld)、漏洞修复、安全审计等; 参与系统升级、扩容及架构优化,制定并执行相关部署方案; 编写自动化运维脚本(Shell/Python等),提升运维效率。 任职要求: 本科及以上学历,1年以上Linux运维经验优先,熟悉主流Linux发行版(RedHat/CentOS/Ubuntu等); 熟悉网络协议(TCP/IP、HTTP/HTTPS、DNS等),具备网络问题分析能力; 熟悉安全防护技术(防火墙、入侵检测、日志审计等); 良好的学习能力和技术热情,能跟踪新技术并应用于实际工作; 责任心强,具备优秀的团队协作和沟通能力。
-
岗位职责: 1.员工IT设备全生命周期管理负责员工电脑、手机、打印机等IT设备的采购、入库、分发、回收、报废等全流程管理。 2.设备配置与安全合规统一配置操作系统和安全策略,部署和维护MDM(移动设备管理)系统,实现设备加密、远程锁定、数据擦除、应用白名单等。 3.日常IT支持与自动化运维负责办公网络、服务器、终端设备的日常巡检、维护和故障处理,及时响应员工IT相关需求。 编写自动化脚本,提升设备部署、巡检和运维流程效率。 4.服务器与云平台运维负责阿里云、AWS、Google Cloud等主流云平台及本地服务器的日常运维,包括实例管理、网络配置、资源优化、成本监控、自动化部与容器化管理(如Docker/Kubemnetes),保障业务系统高可用性和安全性。 5.安全策略与合规审计配置云安全组、IAM权限管理,定期执行安全评估与漏洞扫描,落实FCA及国内相关合规要求,协助内外部审计,完善资产与安全合规文档。 6. 应急响应与灾备 参与IT突发事件应急响应,主导数据备份、恢复、设备更换、跨云平台容灾等工作,确保业务连续性。 7.技术文档与知识库建设 编写和维护设备管理、运维操作手册及常见问题知识库,提升团队整体技术水平。 任职要求: 1.本科及以上学历,计算机、信息安全、网络工程等相关专业优先。 2.3年以上IT运维、IT资产/设备管理及云平台运维相关工作经验,有金融行业或跨国公司背景优先。 3.熟悉Windows、Mac、Linux等主流操作系统及常用办公设备的配置与管理。 4.熟练使用MDM、资产管理系统(如GLPI、Snipe-IT等),掌握自动化脚本(如Shell、Python等)优先。 5.至少精通阿里云、AWS、Google Cloud其中一个平台的核心服务,了解云原生技术(如容器、自动化部署、云安全等)。 6.具备良好的安全意识,了解等保、ISO 27001、FCA等相关IT合规要求。 7.责任心强,沟通能力好,具备较强的服务意识和团队合作精神。 8.英语读写能力良好,能阅读英文技术文档。
-
**岗位职责**: 1. 负责公司云环境的日常维护和管理,包括但不限于网络、服务器、存储、数据库等。 2. 参与Kubernetes集群的配置、管理和优化,确保集群的高可用性和性能。 3. 定期监控和报告系统性能和安全状况,及时发现并处理潜在问题。 4. 协助开发团队解决系统问题,优化系统性能,提高系统可用性。 5. 参与自动化运维工具的开发和使用,提高工作效率。 6. 配合团队完成其他相关的工作任务。 **任职资格**: 1. 计算机相关专业本科及以上学历,有3-5年相关工作经验。 2. 熟悉网络架构,具备相关网络知识和经验。 3. 熟悉Kubernetes(K8s)的原理和使用,有相关实践经验。 4. 熟悉云平台的运维和管理,包括AWS、Azure、Google Cloud等。 5. 熟悉常见的Linux系统操作,能够独立处理系统故障。 6. 具备良好的问题解决和团队协作能力,能够快速响应并处理各种系统故障。 7. 具备良好的文档编写和沟通能力,能够编写清晰、简洁的文档,并与其他团队成员有效沟通。
-
岗位职责: 1.负责GPU裸金属服务器的产品需求落地与跟进,对裸金属产品、技术体系、运营策略有基础理解, 2.对GPU裸金属服务器行业趋势与动态有一定了解,具备市场敏锐度,可基于行业动态分析输出高质量竞品分析材料 3.负责裸金属服务器资产维护与运营,可通过产品化方案降提升产品线毛利率 4.跟踪和掌握主流 GPU硬件厂商的最新技术和产品动态,包括但不限于Intel、AMD、英伟达、华为等主流硬件厂商的产品和解决方案。 5.针对公司现有的裸金属产品,能够根据主流硬件厂商的技术更新和市场反馈,进行持续的优化和改进,以提高产品的竞争力。 任职资格: 1.大学本科及以上学历,计算机及相关专业毕业,对云计算有比较深入的了解 2.3年以上云计算行业产品及运营经验,熟悉GPU的发展趋势和行业动态; 3.具备产品运营能力,能够根据平台节点的成本、制定节点运营方案,并组织团队实施 4.全面的计算机软硬件知识,对CPU、GPU、网卡、内存、RAID、盘阵、SSD、储存等相关技术有较深研究 5.思维敏捷、逻辑能力强,具有很好的沟通能力与概括、总结能力; 6.具有较强的主动推动事情的意愿与能力,抗压能力强;有较强的团队合作精神。 7.曾任职于服务器厂商和云厂商的硬件产品经理者优先录取;


