• 30k-50k 经验5-10年 / 本科
    科技金融 / C轮 / 150-500人
    该岗位直接向CTO汇报,负责公司运维架构的整体规划和建设,完善管理,形成积累,以改善系统的可靠性与稳定性,并提升效率。该岗位需要深入了解公司各业务在DevOps方面的需求,但并不直接负责具体业务服务的运维。 岗位职责: 1.搭建和维护公司的DevOps基础设施,包括代码和镜像仓库,SSO系统,PAM系统等。 2.开发DevOps相关的各种脚本、模版、组件,做到可复用、可升级。 3.推动GitOps, IaC等范式在公司的应用。 4.制定公司在云端计算、存储、网络资源上的选型和管理策略,降本增效,提高安全性和可靠性。 任职条件: 1.耐心,细致;追求简明的技术方案。 2.三年以上Kubernetes的使用经验,深入了解Kubernetes的各种机制。 3.三年以上公有云使用经验,深入了解各种云端计算、存储、网络资源的特性,能够根据业务需求合理选型。 4.熟悉Kubernetes的资源管理工具,如Kustomization, Helm。 5.熟悉常见的Kubernetes组件,如cert-manger, external secret, 各种ingress等。 6.有IaC的实战经验,如Terraform, Crossplane, Karpenter等。 7.熟悉Prometheus, Grafana, Loki等开源组件在Kubernetes上的部署和运维。 8.熟悉Mysql, Redis, Kafka等常见数据组件的部署和运维管理。 9.熟悉Linux操作系统原理以及TCP/HTTP/GRPC等网络协议。 10.熟悉脚本语言Bash/Python脚本语言任一种。
  • 60k-110k·18薪 经验5-10年 / 本科
    软件服务|咨询,IT技术服务|咨询,人工智能服务 / 不需要融资 / 50-150人
    1. 设计和搭建自动化运维系统:监控,预警,日志,故障管理,资源管理,容器管理,升级管理,配置数据管理,为生产环境提供稳定,安全运行的保障。 2. 建立CI/CD持续交付流水线:实现代码交付,静态检查,编译,测试,发布,配置和部署的自动化处理,完成质量体系的搭建。 3. 编写运维手册,应急处理手册,执行日常巡检,响应应急事件。 4. 为其它团队的代码库管理,环境管理,资源管理,系统自动部署管控等运维工作提供支持。 5. 持续推进和提升运维工作自动化,以及可持续化程度。 任职要求: 1. 计算机相关专业本科及以上学历,至少五年以上相关工作经验。 2. 熟悉Linux系统,熟悉kubenetes及docker生态,具备较强的生产环境运维经验。 3. 熟悉DevOps文化,具有CI/CD全流程的设计,开发,落地的经验。 4. 运维经验丰富,具有快速处理生产环境问题的思维,对运维问题的定位有一定的思路和方法,对与IT运维相关的标准和管理体系有一定的实践经验。 5. 熟练掌握脚本语言(Shell/Python),熟练掌握MySql等常用的数据库,具备一定的数据库性能调优和数据库监控的设计能力。 6. 熟悉TCP/IP网络原理,对网络设计,管理和网络安全方面具有一定的实战经验。 7. 熟悉Jenkins,Ansible,PRometheus,ElasticSearch,Grafana,Zabbix,Gitlab等工具。 8. 具备良好的沟通表达能力,学习能力,工作积极主动
  • 金融 / 上市公司 / 2000人以上
    工作职责 1、 负责前沿运营工具产品的日常运维工作,包括系统的运行监控、值班oncall、事件响应及处理、用户服务请求,从业务操作、系统功能特性、接口逻辑等运用角度,对问题进行诊断及跟进解决; 2、 负责运维主动预防工作,从应用系统架构、监控、容量、性能等方面进行分析以提前发现隐患问题,并推动优化解决,不断提高系统运行稳定性; 3、 负责应用系统重大故障快速诊断及解决,跟进及推动故障改进措施实施;制定系统运行应急方案,并使用应急预案优先恢复应用系统; 4、 负责与业务部门交互沟通,协调研发部门、基础架构部门完成运维需求交付,并提供运维服务报告。 任职要求 1、计算机相关专业本科及以上学历; 2、具备很强的ownership、团队协作意识,善于主动思考与自我驱动,很好的技术敏感度和风险识别能力,能承受工作压力; 3、两年及以上应用系统运维或基础架构运维经验,熟悉IT运维相关工作,对监控工具、自动化运维等技术领域有较深了解,对监控方法有较好的理论基础; 4、对操作系统、数据库、中间件、网络、云平台、容器化等一个或多个技术领域有一定运维经验,能够从技术的角度分析异常; 5、良好的系统分析、解决问题的能力,具备清晰的逻辑思维和推理能力,较强的工作推动力;良好的沟通和表达能力; 6、熟悉以下几种技术中的两种或以上:Linux/Unix基本维护和操作,python/perl等脚本语言,Hadoop、Druid、Clickhouse等大数据组件运维,Java应用平台架构,数据库性能优化技术。
  • 25k-35k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、 异常分析处理,快速恢复应用系统故障,确保业务正常进行 2、 主动预防,分析应用的运行趋势找出潜在问题并防止其发生 3、 从运维角度评估应用架构可用性、变更风险,确保系统运行稳定 4、 梳理设计实施应用监控,建立完备的应用监控体系 5、有自动化运维理念,不断优化运维规范,搭建配置的标准化、运维自动化平台建设 任职要求 1、计算机相关专业,大学本科及以上学历; 2、责任心强,工作积极主动,有较好的沟通协调能力,有良好的心理素质;具备较强的问题分析能力和解决能力; 3、3年以上 SRE或DevOps工程师工作经验 4、熟悉主流云平台的使用,具备云上资源规划及管理能力 5、熟悉以下技术中的两种或以上: 1)熟悉kubernates的集群管理及故障处理,有微服务系统运维管理经验。 2)熟悉tomcat、Nginx等中间件的配置、维护、调优及故障分析; 3)熟悉linux/Unix的基本操作和维护,LINUX下常用服务的部署及优化 4)熟悉mysql、PG、redis等数据库维护及调优 5)熟悉Java/Golang/Python中的至少一种开发语言
  • 20k-35k·13薪 经验5-10年 / 本科
    移动互联网,硬件 / 上市公司 / 2000人以上
    职位描述: -负责全球AD域环境的架构优化和管理。 -微软主流服务的搭建和维护工作,包括但不限于DNS,DHCP,WDS&MDT,WSUS,CA等。 -负责Office 365,本地Exchange Server的运维工作。 -负责企业内Windows服务器日常运维、故障排查,包括但不限于补丁更新、批量配置等。 -负责公司所有文件共享的管理和配置。 -负责企业内Powershell自动化脚本运维及优化。 -负责海外办公室日常运维支持。 -根据需要撰写技术文档。 -完成领导安排的其他任务。 职位要求: -8年以上IT基础设施运维工作经验,至少5年大型企业Windows系统运维经验,对微软主流服务有丰富的运维经验。 -精通Exchange或者O365邮件服务的配置和维护,可以独立完成新集群的建设。 -精通企业 AD域、CA证书、WSUS补丁管理和系统分发的配置和优化。 -企业级共享盘的运维经验,独立完成新文件共享的初始化配置和架构设计。 -熟悉任意一种脚本编程语言,Powershell 能力者优先,独立实现运维自动化任务。 -基本的英语口语交流能力。 -有基本的网络基础知识。 -具备MCSE,MCITP,CCNA认证者优先。 -有很强的故障排查能力,能快速发现问题根本原因。 -有很强的团队写作能力和项目管理能力。
  • 30k-50k·15薪 经验5-10年 / 本科
    科技金融 / 上市公司 / 500-2000人
    岗位职责: 1、负责公司大数据平台的部署、管理、优化、监控报警。持续对大数据平台进行优化; 2、负责大数据平台日常运维管理、服务监控、故障处理、集群性能和资源利用率优化,集群常见问题能迅速定位,为开发人员提供技术支持; 3、负责大数据平台服务器配置选型、集群网络优化等相关工作; 4、深入理解公司大数据平台架构,发现并解决性能瓶颈,支撑业务和数据量的快速增长; 5、建设大数据运维监控告警体系,完善和落地告警指标和巡检; 6、有超过500台以上NM,DN节点以上维护经验,并对存储生命周期管理和任务治理及分析有工作经验。 任职资格: 1、熟悉Linux(redhat/centos)软硬件环境、系统管理和优化,熟练部署、优化各种常用服务; 2、熟悉Hadoop大数据生态圈,包括但不限于CDH/HDFS/YARN/Hive/Hbase/zookeeper/Spark等; 3、熟练掌握Hadoop组件的安装部署、升级扩容、性能监控以及配置调优; 4、熟悉shell、python、java语言,并有过编写大数据日常运维工具的经验; 5、有大数据监控体系落地、存储和任务治理工作等有较深经验优先考虑; 6、有大数据开发经验和阅读源码能力者优先。
  • 15k-30k 经验5-10年 / 本科
    电商平台 / C轮 / 2000人以上
    工作职责: 1、负责监控系统Zabbix、Grafana、Smokeping的搭建、配置、管理等运维工作,同时配套建立管理制度、流程、标准,确保落地执行,形成闭环管理,持续运营。 2、负责AD、DHCP、DNS、WSUS、NAS等基础应用的搭建、配置、管理等运维工作。 3、负责VMware虚拟化平台的建设与管理,同时做好服务器资源的管理。 4、负责堡垒机、准入、系统账号权限等IT基础架构系统方面的安全管理。 5、负责备份系统的建设与管理,明确备份策略并定期演练,确保系统的可用性。 6、负责Linux高负载高可用的部署与管理,确保系统稳定运行。 7、负责引入新技术新工具,解决管理过程的痛点,提升工作效率。 8、负责IT基础架构方面的项目建设与管理。 岗位要求: 1、本科或以上学历,计算机相关专业,5年或以上技术运维经验,其中至少具备1年以上管理经验; 2、精通zabbix、grafana监控系统,同时熟悉主流监控系统,包括但不限于Smokeping、nagios、cacti与Prometheus。 3、熟悉Windows/Linux等服务器操作系统,熟悉Vmware虚拟化平台的管理。 4、熟悉微软技术架构,对AD/DNS/DHCP/WSUS 具有大型企业的实施与运维经验。 5、熟悉主流堡垒机、准入认证、备份系统工具的实施与运维。 6、持有MCSE、RHCA、VCP等认证优先。
  • 20k-30k 经验3-5年 / 本科
    移动互联网,硬件 / 上市公司 / 2000人以上
    工作职责: 换电站新产品体系文件(调试、维修、保养等)梳理、迭代; 制定新产品培训课程,参与区域新产品能力培训计划、过程管控及结果闭环; 针对新产品区域调试过程中进行技术支持、经验沉淀及赋能; 新产品因新需求或质量改进发起的硬件改造进行技术评审,输出现场版改造SOP 任职要求: 机械自动化/电气专业背景,有3-5年的机电设备(风机,机床,工程机械等)或者充换电设施的运维/管理经验; 具备电力电子设备的安装、调试、维护相关技能,了解电力系统运行规程、安全规程,受过高压、低压电工培训,掌握电工原理; 有良好的沟通协调能力,善于跨部门合作,争取相关资源,协调相关团队将产品策略执行落地; 有超强的学习能力和执行力; 本科及以上学历;
  • 10k-15k·13薪 经验5-10年 / 本科
    企业服务,金融 / 不需要融资 / 500-2000人
    职位概述: 我们正在寻找一位经验丰富的高级运维工程师,专注于应用与网络方向。该职位的主要职责是维护和优化公司的服务可用性、系统架构、网络设备及云平台网络架构等。成功的候选人应具备高效自动化和故障解决能力,熟练掌握各种开发语言、工具和技术。 主要职责: 保障服务高可用性,持续优化系统架构以提高部署效率和资源利用率,以提升整体ROI。 以高效为核心,逐步将应用运维工作自动化。 主导解决应用运维中的重大故障、性能瓶颈等疑难问题。 管理和维护公司的 Prometheus 监控系统及告警处理。 保证应用的安全可靠,持续优化以实现高可用性。 负责部署、调优和维护各种基础组件。 管理和维护公司网络设备,处理相关故障。 维护 AWS、UCloud、阿里云、腾讯云等云平台网络架构、具备熟练使用经验。 优化和维护公司网络设备(交换机、路由器、防火墙等)。 收集、编写和整理技术文档。 任职要求: 计算机相关专业,**本科毕业,至少5年以上工作经验。 熟悉 Go 或 Java 开发语言中的任意一种。 熟练掌握 Shell 语言。 精通 Kubernetes 相关组件,要求具备3年以上大规模 Kubernetes 使用经验。 熟悉 Ansible、Jenkins 等配置工具。 熟悉 Docker、Kubernetes、Ingress、Calico 等虚拟化和容器技术。 具备 ES、Kafka、Nginx、RabbitMQ、Redis 等开源组件配置优化经验。 熟练使用 Prometheus 监控工具。 熟悉 TCP/IP 协议,了解 BGP、SD-WAN 等协议,具备良好的网络架构知识,熟悉路由交换、防火墙等网络设备。
  • 17k-25k 经验5-10年 / 大专
    移动互联网,医疗丨健康 / 未融资 / 150-500人
    高级运维工程师(系统安全) 工作职责: 1. 负责业务系统架构优化与性能分析,提高系统运行效率; 2. 负责故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告; 3. 负责日常系统可用性、性能等监控,保证系统的稳定; 4.负责协调跟进日常漏洞扫描、对系统网络进行渗透测试、入侵检测并进行安全加固; 任职条件: 1、 有5年以上互联网行业运维工作经验,本科以上学历,计算机或相关专业优先; 2 、熟悉三层网络交换,动静态路由,对常见的网络h3c 华为等设备具有维护经验,熟悉ipsec, openvpn,wireguard 等vpn隧道 3、 精通阿里云服务器、数据库、负载均衡、安全产品等实际应用经验; 4.、精通shell,至少熟悉python/perl/php其中一种脚本语言,能熟悉使用脚本语言编写运维工具,熟练使用ansible,saltstack批量任务管理等 5 、对业务安全,数据安全,网络安全,服务器安全等有优化和实战经验,包括对网络安全规划,ACL,安全爆破,内部安全审计,SQL注入,XSS 攻击,扫描攻击等有相关经验; 6、 熟悉网络安全、信息安全等相关领域:如owasp ****0、DevSecOps、代码审计、漏洞扫描、程序漏洞分析检测、入侵和攻击分析等。
  • 15k-20k·13薪 经验5-10年 / 本科
    新零售 / 不需要融资 / 2000人以上
    高级运维工程师 岗位职责: 1.深入了解业务,负责梳理和规划运维相关的数据模型、业务模型; 2.负责系统的日常维护、巡检,以及故障处理,确保系统稳定运行; 3.负责处理,跟进监控平台的告警,持续完善监控平台建设; 4.综合业务需求,规划和管理服务器资源,协助完成系统的高可用改造、优化; 5.分析系统的日志、关键指标,找出系统隐患,提出优化方案并跟进落地,促使系统健壮; 6.负责系统容灾解决方案设计、实施及定期演练,以规避风险; 7.协助并提供技术咨询,协同开发提供的方案评审、实施,交付; 8.协调IT各团队的沟通,提供及时响应服务,确保系统7x24小时的安全运行。 岗位要求: 1.计算机或相关专业5年以上工作经验,3年以上系统运维相关经验,有大型电商系统的运维管理经验优先; 2.精通Linux及其体系结构,熟悉Shell/Python脚本,对Linux的网络,IO等有深入理解,有较强的系统问题分析能力; 3.具有很强技术敏感度和故障排查经验,能够快速定位系统问题; 4.熟练掌握Prometheus / Grafana / Skywalking 等开源监控技术,有相关监控平台搭建、配置及监控模板编写经验; 5.熟悉Oracle / Mysql等数据库,具有OCP认证资质及相关数据库管理经验优先考虑; 6.有责任心,具备自驱力及良好的沟通能力,勇于承担压力,对问题有刨根问底精神; 7.能够承受一定工作压力。
  • 20k-40k·14薪 经验不限 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    职位描述: 目前开放的是od岗位,入职满一年通过考试可转华为 【岗位职责】 负责开源社区基础设施服务运维工作 【任职要求】 1、熟练使用linux操作系统,linux命令,数据库操作 2、熟悉运用shell、python等脚本语言,能独立编写常规性的运维脚本程序 3、熟悉云平台运维,k8s,日志监控, jenkins等 4、需要有较强学习能力,对新技术新事物有强烈的好奇心,能持续自我驱动
  • 教育 / 不需要融资 / 500-2000人
    岗位职责: Job Title: HPC运维工程师 Operations Engineer of HPC Department: Data Center (DC), Information Technology Department (ITD), HKUST(GZ) Job ID: Job Posting Details Formally established in June 2022, the Hong Kong University of Science and Technology (Guangzhou)(HKUST(GZ)) is a cooperatively-run higher education institution between the Chinese mainland and the Hong Kong Special Administrative Region. HKUST(GZ) has obtained approval from the Ministry of Education (MoE) and become the first legally-independent educational institution co-established by the Mainland and Hong Kong since the announcement and implementation of the “Outline Development Plan for the Guangdong-Hong Kong-Macao Greater Bay Area” and the “Overall Plan for Deepening Globally Oriented Comprehensive Co-operation amongst Guangdong, Hong Kong and Macao in Nansha of Guangzhou”. With a spirit of pioneering innovation, HKUST(GZ) charts new territories in cross-disciplinary education and explores new frontiers in pedagogies, aiming to serve as a role model of the mainland-Hong Kong integrated educational development and become a world-famous high-level university, endeavoring to nurture future-oriented, high-level and innovative talents. HKUST(GZ) comprises four Hubs, namely Function Hub, Information Hub, Systems Hub, Society Hub and offers 15 postgraduate degrees. The admission of undergraduate students will begin in 2023, with the first batch of programs covering artificial intelligence, data science and big data technology. Duties 1. 负责高性能集群的运行和日常维护、按时完成日常巡检工作; 2. 负责高性能集群的用户技术支持和集群系统管理软件的维护; 3. 管理高性能集群的计算资源和用户,部署管理策略,监控运营环境; 4. 为高性能集群的发展提出可持续性发展建议,不断优化集群环境性能,改善用户体验; 5. 协助校内科研团队,在高性能集群上进行HPC、AI应用开发及优化工作。 6.熟练安装部署HPC集群环境,快速定位并解决用户在使用过程中遇到的各种问题 7. 深入理解高性能计算与分布式体系架构,掌握性能分析方法,熟练使用各种性能分析工具,分析各类应用的性能瓶颈,给出分析评估和报告,以及改进建议 8. 了解自动化运维及监控工具,提升HPC平台的运维效率及稳定性 任职要求: Qualification Requirements 1.本科或本科以上学历,计算机、电子信息、通信、物理等相关专业; 2. 具有5年工作经验,3年以上相关从业经验,有大型超算中心实际运维经验者优先考虑; 3.熟悉高性能计算集群中服务器、网络、存储实现原理; 4. 熟悉HPC并行计算原理和相关并行框架OpenMP、MPI等,熟悉HPC作业调度系统LSF、PBS、Slurm等; 5. 熟悉某一特定领域科学计算软件,如OpenFOAM、VASP、Gromacs等者优先考虑; 6. 熟悉1-2种常用的深度学习开源软件,如Caffe、TensorFlow等者优先考虑; 7.至少熟练使用Shell/Python/Perl/Ruby中的一种脚本语言,具有良好的编程能力; 8. 熟悉高性能集群的管理、安全、监控和维护等,包括网络安全以及低延时和高速互联的架构网络 (IB、RMDA、iWARP和RoCE); 9. 具有HPC集群建设和实施经验,具备资深Linux系统运维经验; 10.具备大规模HPC集群(500节点以上)的设计、管理和故障诊断经验者优先。 11.具有良好的英语能力的优先考虑; 12. 具备较强服务意识和良好的沟通能力,能够承受一定工作压力。 This is a Mainland appointment, and the appointee will be offered a contract by HKUST(GZ) entity in accordance with the Mainland labor laws and regulations. Starting salary will be commensurate with qualifications and experience. Application Procedure In support of a green work environment, we accept applications submitted online only. To apply, please register and log in via this link: https://sc.hotjob.cn/wt/HKUSTGZ/web/index and search for the opening by Job ID or Job Title. Applicants should include a Resume in their applications, and could check their application status via the recruitment website. We thank applicants for their interest but advise only shortlisted candidates will be notified of the result of the application. (Information provided by applicants will be used for recruitment and other employment-related purposes only.) HKUST (GZ) is an equal opportunities employer and is committed to our core values of inclusiveness, diversity, and respect.
  • 13k-18k·13薪 经验3-5年 / 本科
    生活服务,智能硬件 / 上市公司 / 2000人以上
    Linux运维工程师 岗位职责: 1、负责业务平台级产品实施,部署,升级及维护工作,推进项目顺利进行,并保证平台功能可交付; 2、负责业务平台API对接工作,跟进及保证对接顺利实施并交付; 3、负责前端业务系统与平台对接过程中出现的各类平台业务故障,并排查予以解决; 4、负责培训,编写培训文档,解答平台系统使用过程中的相关业务问题; 5、协助开发人员维护公司产品的稳定运行, 为客户提供技术服务。 技能要求: 1、大专及以上学历,有大型平台运维工作经验,业务运维能力全面。 2、熟悉Linux操作系统,精通linux各种常用的服务的运用(如Nginx、Tomcat、Mysql、Redis、KAFKA、ELK等) 3、熟悉Linux下的自动化运维管理体系,并具备构建、管理经验; 3、熟悉Shell或Python等编程脚本,至少精通一门编程语言; 4、熟悉容器化部署优先; 5、有较强的学习能力及自我管理能力,有独自完成大型项目部署经验优先;
  • 30k-40k 经验3-5年 / 本科
    社交,消费生活 / 不需要融资 / 2000人以上
    岗位职责: 1、负责移动APP等业务应用系统的日常运维,持续构建完善应用监控,及时处理应用系统故障,保障应用系统安全稳定运行; 2、统筹负责可用性管理、问题管理、事件管理、服务级别管理、配置管理、变更管理、发布管理、容量管理、连续性管理; 3、负责应用系统部署架构规划和优化,制定和落实应用系统运维相关技术标准和规范; 4、负责应用运维团队建设,指导培训应用运维工程师,制定应用运维操作手册,带领团队研究和提升运维技术; 5、参与产品系统技术方案和系统设计,确保系统架构质量,高质量支撑业务发展; 6、组织团队推进运维项目,推动建设运维工具链平台,实现自动化、智能化,持续提效; 任职要求: 1、5年或以上的IT行业经验,有丰富的运维技术实践经验; 2、熟悉ITIL、Devops等运维管理体系理念; 3、熟悉阿里云、腾讯云、华为云等主流云厂商的常见产品服务使用和相应技术知识; 4、精通Linux系统、中间件、数据库、微服务和容器化等技术;熟悉互联网应用架构,并进行技术方案设计实施; 5、具备突发事件情况的危机处理能力、具有很强的故障排查和解决问题的能力; 6、沟通协调能力强,能与业务和外部合作伙伴有效协调项目相关事宜; 7、能抗压、工作细致踏实、执行力强。