-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
职责描述: 1、负责公有云运维工作,故障处理,日常巡检 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有1~2年以上腾讯云或阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有一定的K8S运维经验,也具备一定的云上虚拟机或者中间件资源运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、对于网络安全,运维安全,数据安全有一定的认知和处理经验 8、具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
岗位职责: 1、负责各公有云(AWS/GCP)和基础核心服务的管理和维护,包括各公有云网络、服务器、存储和k8s集群等,确保其安全、高可用和可扩展 2、负责运维团队及运维体系建设,制定并不断优化各项工作流程,完善公司运维管理规范,保障运维质量; 3、负责运维容量管理和稳定性建设,提升服务的可靠性、可扩展性以及高性能优化; 4、负责多云跨平台建设,包括AWS/GCP/阿里云跨云多活架构,以及多云k8s集群管理; 5、深入了解各项业务系统,参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性; 6、不断探索和研究新的运维技术,推动运维自动化、智能化能力建设,提升整体运维水平和风险控制能力; 7、负责推动云原生技术解决方案的制定、验证及落地,以及重要特性和核心功能的创新、技术攻关; 岗位要求: 1、**本科及以上学历,7年以上运维相关运维;具有5年以上AWS/GCP/Azure等公有云大规模资源的运维和实践管理经验;2年以上团队管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、具备多云多中心和国际化部署管理经验; 4、具备项目管理能力和小团队管理能力,良好的沟通能力、应变能力和团队协作能力,有重大项目端到端交付经验优先; 5、具有服务意识,善于思考,积极主动、认真负责、具有高度责任感和敬业精神; 6、具有大型电商运维管理经验优先;
-
工作职责 1. 保障公司核心业务系统的运维管理工作,快速响应并解决线上问题,做业务稳定的“守护者”; 2. 负责业务系统发布变更管理,评估风险、执行验证,确保每一次生产发布变更都安全可控; 3. 开展业务系统容量分析与性能优化,提前识别瓶颈,支撑业务可持续增长; 4. 负责运维自动化平台建设与持续优化,推动运维工作向智能化运维方向迈进。 任职要求 1. 计算机相关专业本科及以上学历,2年以上IT运维或DevOps经验; 2. 熟悉Linux系统操作,掌握Shell或Python脚本编程; 3. 熟悉Kubernetes、Docker基本原理与常用操作; 4. 熟悉主流数据库(如MySQL、PostgreSQL、Redis、TiDB)的日常维护与调优; 5. 具备良好的逻辑思维和问题排查能力,能独立承担运维任务。 为什么选择我们? 稳定有保障:公司业务模式成熟,无大规模裁员计划,注重员工长期发展 成长看得见:定期组织技术分享、外部培训,支持向SRE、运维开发等方向转型 团队很靠谱:成员均来自一线互联网/金融企业,技术扎实、氛围开放、互相支持 工作有尊严:拒绝“救火式加班”,倡导通过自动化和预防性运维提升效率 参与核心系统:你将直接负责公司主干系统的稳定性建设,技术价值真实可见 我们承诺: 在这里,你不会只是一个“修锅侠”。 我们将为你提供清晰的成长路径、充分的技术授权和应有的尊重。 无论外部环境如何变化,我们都希望与你一起,走得稳,也走得远。
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,一年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点
-
岗位职责: 1、负责构建和维护 AWS 云平台的基础设施,并确保其高可用性和灵活性; 2、负责DevOps体系规划与实施,持续交付CI/CD流程设计、研发和实施, 实现自动化和平台化; 3、研究和评估新的技术,提高系统的性能以及可靠性。 岗位要求: 1、本科以上学历,计算机或相关专业毕业,具有良好的技术功底,3年及以上工作经验; 2、具有AWS等云平台运维经验; 3、熟练Docker容器技术,k8s技术,2年以上Kubernetes部署、优化、运维经验; 4、精通CI/CD持续集成与持续交付;熟悉Gitlab、Jenkins、Argocd、Prometheus、Loki、Grafana等工具; 5、具有较强Troubleshooting能力,能够快速定位解决问题; 6、精通至少一门语言 Python,Go等,了解Web 前后端开发和常见框架,如 Django,Vue 等; 7、在运维自动化方面具备一定的开发经验和产品思维; 8、良好的沟通能力和团队协作能力。
-
岗位职责: 1. 负责业务系统基础环境的建设、维护和管理,推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统SLA; 2. 负责持续优化运维解决方案,包括但不限于智能调度、弹性扩容、精细化监控、容灾预案等; 3. 建立和完善规范化的运维体系,保障生产系统可靠,安全,稳定地运行; 4. 不断研发与探索运维自动化及智能化途径,提升运维效率,降低运维成本; 工作要求: 1. 本科及以上学历,计算机软件及相关专业,3年以上工作经验; 2. 熟悉Linux操作系统、计算机网络等,基础知识扎实; 3. 熟悉Docker、K8S容器平台的使用及原理,能定位异常; 4. 熟悉并掌握各种中间件及基础组件的部署和使用,比如etcd/dns/elasticsearch/prometheus/grafana/nginx等; 5. 熟悉和使用过业界云平台:腾讯云、阿里云等优先;熟悉大模型基础架构运维优先 6. 熟悉并擅长Pyhon、shell、go等脚本语言的任意一种,并能使用脚本来完成日常系统运维工作; 7. 具有良好的线上安全意识,有责任感,工作积极进取,乐于持续学习,抗压性强,有良好的服务意识和团队精神;
-
【岗位职责】 1. 负责业务系统运维保障,通过持续优化技术架构,提升系统安全性、稳定性、高效性及易用性,支持业务和数据规模快速增长; 2. 负责建立和完善规范化的运维服务体系; 3. 负责线上问题排查,紧急故障处理,后续故障分析与优化; 4. 持续推动运维质量提升:SLA、多活容灾、故障演练、监控告警、容量管理等; 5. 结合部门需求,规划和管理各类型硬件和服务资源。 【任职要求】 1. 深入理解Linux系统,具备内核及系统参数调优经验; 2. 熟悉云原生 K8s 生态,具备生产环境落地及运维经验,有大规模 K8s 集群设计和管理经验者优先 3. 熟悉 Shell 或 Lua 等运维脚本编程,至少掌握一种脚本语言; 4. 熟悉常见中间件(如 Nginx、Redis、RabbitMQ、Kafka、Prometheus等)及数据库(如Postgres); 5. 熟悉大型分布式系统,微服务架构有日常维护和故障处理经验; 6. 具备网络基础知识,了解常见网络设备(如交换机、路由器等)的配置与优化。 【加分项】 1. 具有较强的责任心、安全意识、抗压能力及优秀的执行力; 2. 持有K8s认证(CKA/CKAD)或云平台专业认证; 3. 熟悉综合布线技术,了解网络组网原理及实施流程。 【工作模式】 - 需参与on-call轮值,处理紧急技术问题
-
工作职责 1、自动化运营脚本或工具平台开发,提升运维工作效率; 2、梳理设计实施基础架构/应用监控,建立完备的监控体系; 3、异常分析处理,快速恢复应用系统故障,确保业务正常进行; 4、7*24h应急响应,紧急情况下执行应急预案快速恢复异常; 5. 响应和处理中间件&计算领域的日常事件,并做好事件的分析和总结,作为事件智能化的知识输入。 任职要求 1、本科及以上学历,计算机相关专业,3年及以上开发或运维工作经验; 2、有kafka/elasticsearch/rocketmq/tomcat/nginx/weblogic等软件运维经验者优先; 3、精通linux/Unix的基本操作和维护以及性能调优,熟悉常见网络配置等操作,熟悉TCP/IP协议的原理; 4、掌握shell,python等开发语言,有运维平台开发经验者优先; 5、了解docker相关技术,有基于kubernetes容器云平台开发或运维经验者优先; 6、有大规模云底座运维、应用集群运维经验者优先; 7、可以接受7*24三班值班。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
-
职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
-
职位职责: 1、参与字节跳动百万级主机运维体系的设计和研发,建设全网主机基础服务变更体系,提升运维管理效率并保证变更安全性; 2、参与主机运维平台、监控平台、安全平台等系统的设计和研发,构建业界领先的运维平台,保障全球数百万主机稳定运行; 3、参与DNS、NTP、DHCP、装机、镜像站等数据中心基础服务的研发和运维,提升服务性能,保障服务稳定性。 职位要求: 1、具备5年以上运维领域工作经验,如稳定性体系建设、运维平台研发等; 2、大学本科及以上学历,计算机软件基础知识扎实,熟悉主流Linux操作系统、存储、网络等技术; 3、熟悉Golang/Python/Shell等一门或多门编程语言,并掌握常见后端Web框架及其设计原理; 4、具有产品和工程思维,以及良好的沟通协作能力,推动跨部门项目的开展; 5、具有较强的学习能力和判断力,积极探索LLM等新技术的应用和落地。
-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。


