【AIOPS开发工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

aiops系统运维工程师
[济南·杆石桥] 2023-10-26

9k-15k 经验1-3年 / 本科

网思科技

信息安全,网络通信 / 不需要融资 / 500-2000人

岗位职责：参与智能运维平台的场景分析、实施交付和运维工作： 1.负责智能运维相关平台的日常运维工作。 2.利用智能运维平台，基于运维监控、日志等数据，实现从故障监控、预警、告警到根因分析、故障自愈的AIOps场景落地； 3.负责系统工具开发工作。（具备python开发技能）岗位要求： *****学信网可查本科，计算机科学相关专业,扎实的计算机基础,良好的学习能力，缜密的逻辑思维，享受探索新技术的过程； 1.两年以上系统运维或Python开发经验，有大数据类系统的开发运维经验优先；有AIOps项目研发实施经验者优先； 2.具有运营商行业的网管侧系统运维和IT系统运维经验优先。 3.具有认真负责的专业素养、积极主动的工作态度、有独立分析和解决问题的能力，以及良好的学习能力和团队合作精神。 4.具备良好的沟通能力和文档编写能力，能够与客户进行顺畅沟通和文档输出。技术要求： 1.熟练掌握linux运维技术，熟悉shell脚本，可以辅助研发判断程序问题； 2.熟练掌握Python语言，并具备1年以上开发经验，具备 pandas库使用经验。 3.具备数理统计、SQL数据库原理相关知识； 4.熟悉hadoop相关技术(hdfs、hive、kafka、spark、flink、zookeeper、yarn等) 优先。
aiops算法工程师
[杭州·仓前] 2023-09-06

20k-40k 经验3-5年 / 本科

杭州乘云数字技术有限公司

信息安全 / A轮 / 15-50人

工作内容： 1、利用AI技术打造可观测系统的智能化，打造下一代AIOps智能运维系统； 2、将业务需求和算法解决方案有机结合，深度参与产品设计； 3、负责公司业务的监控项和告警项所产生的数据处理，涉及数据挖掘、异常检测、故障定位等前沿算法模型的研究及应用； 4、构建以核心运维数据为基础的智能化监控生态，包括但不限于智能检测、告警聚合、诊断归因、自动恢复等核心功能； 5、参与重点项目实施工作，协助售前/售后工程师开展场景分析、数据调研、算法应用实施工作； 6、负责机器学习在运维场景领域落地，包括算法/模型设计、开发、训练、验证及优化；任职要求: 1、熟悉常用Linux命令，熟练掌握Java、Python 语言； 2、能够熟练使用Scikit Learn、Pandas、Numpy和Scipy开发框架； 3、具备优秀的编程能力，有出色的算法实现能力及调优经验； 4、对知识图谱，自然语言处理等业务有一定理解，熟悉NLP的常用算法，具有NLP相关项目实战经验； 5、具备良好的英文阅读能力，善于发现业界及学术界前沿技术，并加以改良和落地； 6、AIOps相关工作经验者优先，APM 领域相关工作算法工作经验者优先； 7、智能运维领域理论研究和实践经验，时序大数据处理经验者优先，熟悉常见的算法者优先；
SRE高级工程师/专家（IAAS）-飞书
[北京·海淀区] 02:17发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责字节跳动飞书产品的IaaS稳定性体系建设，保障IaaS可靠、稳定运行，为相关产品SLA负责； 2、负责IaaS稳定性薄弱点识别和痛点解决，持续进行系统架构优化，负责技术难点攻坚，提升IaaS产品可靠性和稳定性； 3、参与设计、开发IaaS稳定性相关工具与产品，包括稳定性架构治理、监控报警、预案与演练、定位与止损等相关方向工具平台； 4、参与OnCall值班，第一时间响应并与RD共同解决各类突发事件，保障业务的稳定性； 5、持续跟进业界前沿技术方案并结合IaaS相关实际业务场景，引入新技术和新方案，例如AIOps、AI测试、智能运维等。职位要求： 1、5年及以上云计算或相关领域工作经验，本科及以上学历，计算机、通信等相关专业； 2、云计算/公有云/私有化/openstack/IaaS相关稳定性保障中的一项或多项经验； 3、有分布式系统、基础设施系统等设计开发或运维保障实战经验，如复杂业务场景的流程优化、系统高可用性架构实现等； 4、熟悉云计算架构，具备扎实的开发编程能力，熟练掌握一门以上的开发语言（Golang/Python/C）； 5、具备良好的对客沟通能力，能够与客户有效交流，甄别引导客户需求，提升客户满意度； 6、优秀的逻辑思维能力，高效的执行力，责任心强。
SRE 运维工程师
[深圳·南山区] 2天前发布

20k-30k·14薪经验3-5年 / 本科

AfterShip

软件服务｜咨询 / B轮 / 150-500人

if strings.Contains(passions, "coding") { switch techstack { case "Go": fallthrough case "Node.js": fallthrough case "Python": fallthrough case "Kubernetes": fallthrough case "Serverless": fmt.Println("Join AfterShip") } } 岗位职责 1、保障公司业务的稳定，积极解决业务问题；负责公司各类公有云 PaaS、SaaS 产品的维护； 2、通过自研、开源软件二开等手段提升自动化能力，提升运维效率； 3、深入业务架构，结合运维相关的最佳实践，对线上系统进行优化； 4、通过架构优化、工具平台、流程机制建设，持续提升网站稳定性，持续优化云成本； 5、梳理和完善运维文档，沉淀技术经验；参与 On-Call 值班，及时响应处理线上报警等事件。岗位要求 1、本科及以上学历，至少 3 年以上互联网系统的运维经验，英语读写熟练； 2、熟悉 Linux 操作系统、计算机网络等，基础知识扎实；至少熟练掌握 Shell/Python/Go 一种语言； 3、有生产环境下 K8s 的使用和维护经验；熟悉 Prometheus、Grafana 等监控工具； 4、有 GCP、AWS 等国外公有云使用经验优先，比如 GKE、Pub/Sub、Cloud Storage、Dataflow、Cloud Run 等产品； 5、有良好的线上安全意识、学习能力、团队精神和客户意识；有高度的责任感，对于工作积极严谨。加分项 1、有丰富的 GCP 或 AWS 云平台使用经验； 2、有 AIOps 领域的实践经验； 3、有运维自动化平台或者 API 开发经验； 4、有数据库相关的维护经验； 5、英语可作为工作语言。为什么加入我们 1、朝阳行业：国际电商 SaaS 服务赛道，国际一线投资机构加持； 2、稳健发展：团队稳健扩张，业务规模及营收每年持续稳健增长； 3、多元文化：团队来自全球 20 多个不同城市，国际化视角、扁平化管理； 4、极客氛围：拥抱开源技术，实践敏捷开发，崇尚通过工具和自动化来解决问题； 5、特色福利：AI 学习基金、一对一帮带、内部商城、提供 MacBook 及可升降办公桌。
阿里云分布式大数据架构开发工程师（阿里云·飞天企业版）
[上海·龙华] 2025-11-09

25k-50k·16薪经验不限 / 本科

阿里云

电商,企业服务 / 上市公司 / 2000人以上

关于我们加入阿里云飞天企业版团队，您将参与构建面向云原生、DevOps、IoT、AIOps、时序存储与安全分析的企业级大数据服务，并参与面向 AI 的智能化能力落地。在国内最大规模的云平台上，解决真实且复杂的工程问题，成长与影响力并重。参与企业级大数据产品的核心分布式架构设计与性能优化；推动微服务平滑拆分与弹性扩缩容，提升系统自愈能力与可观测性；深度结合安全、容灾与自动化运维，保障企业级服务的合规与可靠性；有机会将前沿云计算与 AI 能力快速落地，参与产品长期演进规划。 ========= 负责飞天企业版大数据类产品的分布式系统开发与架构演进，推动微服务化与弹性扩缩容方案落地。优化系统性能与资源使用（内存/CPU），设计退避、限流、熔断等容错与自愈机制。主导或参与底层库与中间件的调优、代码重构与可测试性改进，提升系统可维护性。构建与完善漏洞自动化修复、容灾恢复流程，支持企业级特殊服务/数据场景。与产品、运维、测试等团队协同，推动线上演进、容量规划与可靠性保障。岗位要求熟练掌握 C++/Python/Go/Java 中至少一种，具备良好的编码规范与单元测试习惯；熟悉代码重构与常用设计模式。三年以上分布式系统开发经验，有公有云/私有云相关项目经验优先。了解编程语言演进与 Core Guidelines（如 C++ Core Guidelines）者优先。熟悉 Folly、Abseil、ElasticSearch、ClickHouse、Kafka 等大数据基础开源组件，能阅读源码并有社区贡献或提交者优先。熟悉 Kubernetes 等容器编排/分布式管控系统；使用过 Azure Stack、AWS Outposts 等专有云/混合云解决方案者更佳。学习能力强，对云计算前沿技术充满热情，能将新技术快速工程化并在产品迭代中做出合理权衡与规划。
技术服务工程师
[济南·市中区] 2025-11-04

15k-25k 经验3-5年 / 本科

阿里云

电商,企业服务 / 上市公司 / 2000人以上

职位描述： 1. 作为企业客户技术服务工作的第一责任人，深入了解客户业务场景，与客户的架构、开发、运维团队深入合作，梳理分析客户现有云产品及应用架构，围绕企业客户上云、云上业务设计稳定性优化方案，从云上监控，主动发现，灾难演练，业务快恢/降级方案，高可用架构改造等方面协助客户持续优化云上稳定性。 2. 与阿里云各团队充分合作，从客户架构视角出发进行问题处置、护航保障、风险治理，并沉淀输出最佳实践及工具产品，面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题，持续协助客户治理并不断推动阿里云产品及服务的优化改进。 4.协助云上企业客户进行架构改造落地，并持续迭代降低使用成本，提升性能及业务连续性。职位要求： 1. 3年以上制造、健康、零售等行业大型互联网应用或集团型企业应用的解决方案、架构设计、监控方案、Devops、AIops、维护、高可用改造方案经验。 2. 熟悉至少一个技术领域如：数据库，网络，OS，serverless，存储，音视频，大数据，大模型，Al等。 3. 熟悉云计算产品与技术原理，并有实操使用经验，有阿里云公共云产品相关使用运维经验优先。 4. 熟悉云原生的系统架构设计方法，有应用与数据迁移改造方案设计实施经验优先。 5. 具有优秀的沟通技巧、团队合作经验、敬业精神和学习能力。 6. 具有较强的抗压能力和执行力。加分项： 1.有阿里云技术认证ACA（阿里云认证助理工程师）、ACP（阿里云认证工程师）、ACE（阿里云认证高级工程师）者优先。 2.有基于阿里云产品的大规模应用开发或运维经验。 3.有生产环境Al或大模型实施经验。
高级后端研发工程师
[贵阳·观山湖区（金阳新区）] 2025-08-28

14k-20k 经验5-10年 / 本科

优联博睿

数据服务｜咨询 / 未融资 / 15-50人

任职描述： 1. 系统架构设计和实现 2. 主导复杂分布式系统的技术方案设计，解决高并发、海量数据场景下的技术挑战 3. 参与技术选型与决策，确保系统可扩展性、容错性和安全性 4. 核心模块开发 5. 负责基础架构组件（如服务治理、配置中心、分布式事务）的研发与优化 6. 攻克性能瓶颈（如数据库分库分表、缓存穿透、接口响应时间优化） 7. 技术攻坚与创新 8. 探索前沿技术（如Serverless、边缘计算、AIOps）并推动落地 9. 制定技术解决方案，主导重大技术难题攻关（跨机房容灾） 10. 质量保障与规范 11. 建立代码Review标准，推动自动化测试覆盖率提升 12. 制定开发规范与最佳实践，提升团队技术产出效率 13. 团队与技术影响 14. 参与技术社区交流，提升团队技术品牌影响力 15. 担任技术Mentor，指导中级/初级工程师成长 16. 担任大数据技术攻坚任职要求： 1. 精通使用Java/Python/NodeJS/Golang/Rust至少一种，精通多线程/异步编程模型； 2. 至少精通SpringBoot/Django/Flask/Express/EggJS/Gin/Echo等主流框架中的一种； 3. 有系统设计能力，熟悉设计模式，熟悉算法和数据结构； 4. 熟悉系统高可用设计方案； 5. 熟悉微服务架构设计，熟悉RPC框架，熟悉消息队列，分布式事务； 6. 熟悉数据库设计，熟悉数据库优化，熟悉数据库索引； 7. 需有分布式系统开发经验； 8. 熟悉Linux/Docker/Kubernetes/Serverless等优先； 9. 有大型项目开发经验优先； 10. 有AI大模型或数据挖掘经验优先； 11. 有架构经验优先； 12. 有大数据工具链开发经验优先； 13. 有大数据可视化经验优先； 14. 有大数据ETL经验优先； 15. 有大数据存储经验优先； 16. 有大数据计算引擎经验优先； 17. 有大数据计算框架优先
腾讯云-业务运维工程师（西安）
[西安·沣惠南路] 2025-05-08

14k-19k 经验3-5年 / 本科

腾讯

社交 / 上市公司 / 2000人以上

岗位职责： 1、系统稳定性保障负责公司核心业务系统的7x24高可用架构设计、部署及稳定性优化，制定并执行容灾、容错方案。主导生产环境故障的快速响应、根因分析及长效解决方案落地，推动SLA/SLO持续提升。 2、持续交付与自动化设计并优化CI/CD流水线，推动自动化发布、灰度发布、蓝绿部署等实践，提升交付效率。开发运维工具链（如监控告警、日志分析、资源调度等），实现运维场景的自动化、智能化。 3、监控与可观测性体系构建多维度监控体系（Metrics/Logs/Tracing），使用Prometheus、ELK、Grafana等工具实现业务全链路可观测。通过数据驱动优化系统性能，提前识别潜在风险并推动预防性治理。 4、成本与资源管理负责云资源（AWS/Aliyun等）或物理服务器的规划、成本优化及利用率提升，制定容量管理策略。推动FinOps实践，平衡性能与成本，实现资源精细化运营。 5、运维规范与协作制定运维标准化流程（变更管理、应急预案、安全合规等），推动DevOps文化落地。协同开发、测试、安全团队，优化跨部门协作机制，提升整体研发效能。任职资格： 1、学历与经验：本科及以上学历，计算机、通信等相关专业，3年以上运维开发或业务运维经验，有复杂业务系统运维经验优先。熟悉互联网高并发、分布式系统架构，对微服务、容器化、云原生技术。 2、技术能力：精通Linux系统、网络协议及性能调优，熟练使用Shell/Python/Go至少一门语言开发运维工具。熟悉Ansible/Terraform等自动化运维工具，具备Kubernetes生产环境管理经验。深入掌握至少一种公有云的核心服务及运维实践者优先。熟悉监控告警体系搭建（如Zabbix/Prometheus+Alertmanager），具备全链路故障定位能力。 3、软性要求：具备优秀的业务敏感度，能快速理解业务需求并转化为技术方案。抗压能力强，能高效处理紧急故障，具备系统性解决问题思维。良好的沟通能力和团队协作精神，能推动跨部门项目落地。加分项： 1、有存储、接入层服务类运维经验者优先。 2、熟悉AIOps、混沌工程（Chaos Engineering）等前沿技术实践。 3、拥有云平台（腾讯云/AWS/Aliyun认证）或PMP等相关认证。
高级软件工程师
[烟台·福山区] 2025-03-12

25k-40k 经验5-10年 / 本科

烟台盈卓商贸

消费生活、信息安全 / 未融资 / 15-50人

【岗位职责】 ? 配合业务分析师完成业务调研、充分理解业务； ? 负责软件系统技术选型、技术架构设计和技术路线制定； ? 负责系统架构设计相关需求和文档的编写； ? 负责核心业务模块代码编写； ? 参与系统技术标准和规范的制定、执行情况的评审及落地检查； ? 负责AIOps理念及文化的落地； ? 负责技术预研和技术攻关，突破系统和项目中的技术难点；【技能要求】 ? 熟悉国内外主流互联网技术体系，有大型项目建设经验，具有AI应用实践经验，工业级AI场景落地经验者优先 ? 精通云原生技术：Docker、Kubernetes、Prometheus等技术的应用 ? 精通掌握Python企业级开发体系技术：数据分析库（如NumPy、SciPy、Pandas）、机器学习库（如Scikit-learn、TensorFlow、PyTorch）、大模型开发框架（如LlamaFactory、SGLang、vLLM）等 ? 精通掌握Java企业级开发体系技术：Spring Boot、Spring Cloud ? 精通前端主流框架：Vue/React/Angular ? 熟练使用Nginx、Kafka、Redis、ELK等常用中间件 ? 精通掌握Oracle、MySQL数据库设计、大型分布式系统设计 ? 具有良好的沟通能力、学习能力和团队合作意识，有良好的文字表达能力
AI工程师
[成都·武侯区] 2024-09-07

15k-20k 经验3-5年 / 大专

创立科技

物联网 / 上市公司 / 500-2000人

职位职责详细描述： 1、负责人工智能领域前沿技术的研究与实现； 2、参与人工智能、深度学习基础平台的选型、框架搭建和研发； 3、结合公司业务场景进行人工智能和机器学习的应用，包含：图像识别和NLP。 4、参与项目的落地开发，与开发团队合作完成模型应用和模型优化。岗位要求： 1.具有3年以上Python开发经验，熟练使用常用库和模块；2.对人工智能技术感兴趣，了解AI领域的主要开源平台（如：TensorFlow、Caffe、MxNet等）及相关的算法组件（如：数据预处理、特征工程、统计分析、机器学习、深度学习等），有相关项目实践经验更佳；3.熟悉Docker、Kubernet等容器化技术；熟悉OpenStack；4.对AIOps相关概念和技术有掌握的，优先考虑。
产品经理（智能运维产品）
[北京·四惠] 2024-03-15

20k-30k 经验5-10年 / 本科

联华信

IT技术服务｜咨询 / 未融资 / 50-150人

岗位职责： 1.进行市场研究和用户需求调研，制定业务运维产品规划及实施路线图； 2.负责产品的设计实现、组织和推进产品开发与上线； 3.通过用户反馈、产品用户使用情况数据分析等方式，对产品的持续迭代和改进负责； 4.与运营、市场同事配合，共同达到产品预期效果； 5.参与产品的复杂项目实施方案设计； 6.支持产品销售过程，为售前、交付、售后同事提供必要的产品支持。任职要求： 1.本科及以上学历 2.5年以上IT行业工作经验；3年及以上B端产品经理工作经验； 3.了解AIOps，熟悉Agent原理，熟悉常用的SQL，通信协议等优先； 4.熟练掌握常见原型工具，对交互设计有深刻认识； 5.良好的逻辑思维能力、学习能力、沟通协作能力和执行力； 6.对产品有热情，善于扮演团队推动者的角色。
产品经理（观测云）
[上海·张江] 2024-02-01

15k-30k·14薪经验不限 / 本科

上海观测未来信息技术有限公司

IT技术服务｜咨询 / D轮及以上 / 150-500人

【About Guance】观测云成立于 2013 年 7 月，是由红杉资本、阿里巴巴、复星集团、张江高科、深创投、华业天成等知名投资机构投资的高新技术企业。观测云的自研产品「观测云」，首批获得中国信通院颁发的「可观测性平台技术能力」与「根因分析技术能力」先进级认证，实现对云、云原生、应用及业务的统一监测需求，可为互联网、零售、金融等行业用户提供统一高效的数字化可观测服务。观测云作为一款数字化生产力工具，助力实现用数据驱动的现代软件工程体系，用可观测性改变软件全生命周期管理。立足于云时代，观测未来将持续提升技术能力与服务质量，为中国 SaaS 基础软件的发展注入希望！【What You’ll Do】 1. 负责观测云的产品工作，包括需求调研、行业分析、产品规划、产品设计等工作； 2. 与客户、前场团队紧密沟通，理解和分解平台的需求，落实到产品规划和设计中； 3. 与研发团队保持紧密合作，协调组织设计、开发、测试资源推动产品发布并项目落地； 4. 跟进产品关键数据指标和用户反馈，持续优化产品。【Who You Are】 1. 本科以上学历，计算机相关专业优先； 2. 2 年云计算相关行业经验，1~3 年相关产品经验，具备从 0 到 1 落地产品的能力； 3. 有日志分析、链路追踪、用户访问行为分析、基础设施性能分析、拨测、AIOPS、混沌工程等相关产品或模块设计和主导经验，有相关产品成功落地案例优先； 4. 有客户端/服务端/前端开发经验者优先； 5. 有较强的产品 Owner 意识，良好的自我管理能力、逻辑思维、跨团队沟通协调能力； 6. 具备创新精神，用户价值导向、乐观、抗压能力强。【Benefits and Growth】 1、0-4个月年终奖，投入有回报； 2、晋升可由部门推荐+个人自荐，鼓励挑战自我； 3、行业大牛多，快速成长，激发无限可能； 4、五险一金+定期体检，工作无后顾之忧； 5、超多带薪年假+下午茶零食+生日会+团建假+旅游假+育儿假； 5、弹性工作，人性化的企业文化； 6、持续的专业发展、高频的产品培训； 7、绩优员工期权激励计划。上面列出的福利和成长可能会根据您工作所在的地区以及您在观测云工作的岗位而有所不同。
智能化运维平台资深开发/架构师
[深圳·科技园] 2023-12-27

30k-50k 经验3-5年 / 本科

微众银行

金融 / 未融资 / 2000人以上

职位描述 - 负责智能化运维平台的规划设计、实现及优化工作，带领研发团队研发先进的智能运维产品 - AIOps、SRE方向的前沿性研究、探索和落地 - 参与核心系统的设计和编码 - 主导技术方案和系统运维架构评审，掌握相关的技术架构和原理，能够从运维角度主动识别方案风险，并给出专业的解决方案 - 对研发团队的质量和效率负责 - 团队内部的技术培训与人才培养 - 跨团队的沟通、协调和协作技术能力要求 - 深入理解计算机体系架构、linux内核、分布式系统架构、虚拟化技术、网络通信与系统编程至少2个方向以上技术 - 精通python，有大型项目开发经历 - 熟悉Docker/k8s容器平台及相关的底层技术和原理 - 熟悉Jenkins、Gitlab等，熟悉CI/CD流程制定与集成 - 有良好的网络、存储、安全等计算机体系结构方面的知识 - 具备丰富的大规模服务集群的运维经验和大型运维系统的设计能力和落地经验，高并发架构经验，熟悉高可用集群、负载均衡集群的规划与搭建熟练掌握Redis、Kafka/RabbitMQ、Ceph/ElasticSearch等主流中间件（至少2个以上）的原理和使用 - 了解Hadoop/Spark/Filnk/Hive等大数据主流技术（至少2个以上） - 熟悉数据库技术（MySQL）其他能力要求 - 技术领导力 - 团队协调力和执行力 - 有下面经历会有加分项： - 负责过运维体系层面的系统性规划和建设，有实践经验 - Django使用和开发经验 - Saltstack使用和开发经验 - airflow使用和开发经验 - AIOps系统设计研发经验
运筹算法
[上海·徐汇区] 2023-11-30

20k-30k 经验3-5年 / 本科

平安付

金融 / 未融资 / 500-2000人

工作职责1.依托公司千万级用户数据，挖掘重点场景，利用AI/机器学习，优化算法，总结客户洞察，增加客户忠诚度，提升客户价值；2.参与大部门大数据算法平台建设工作，搭建开源的算法平台；3.跟踪物流行业的机器学习、深度学习算法理论进展，并将优秀的算法应用到业务场景中，提升业务数据应用价值。任职资格本科以上学历，计算机/数学/人工智能/统计/运筹学专业，有扎实的数据结构和算法功底；有特征工程、数据建模、机器学习等相关基础。1、5年以上算法开发经验，熟练/精通Python/Java语言，熟悉基本的Linux指令，有扎实的编码能力将算法落地工程化；2、熟悉常用数据挖掘算法(聚类/分类/回归/关联规则/图模型）等算法原理，具备实际的建模经验，熟悉常用机器学习算法原理，如朴素贝叶斯/决策树/随机森林/逻辑回归/SVM等，并具备相关应用经验；3、熟悉hadoop/spark分布式计算平台，具有基于hive/hbase/spark的实际开发经验；熟练使用spark mlib框架；4、具备较强的商业和数据敏感度，尤其对于物流行业业务有较好了解，有良好的理解能力，沟通表达能力和独立专业报告的能力；5、有AIOps、OCR、NLP、知识图谱相关项目经验者优先考虑。
资深系统运维专家/工程师
[佛山·顺德区] 2023-11-22

50k-100k·15薪经验5-10年 / 本科

美的集团

硬件 / 不需要融资 / 2000人以上

岗位职责： 1、负责基础设施的运维管理与维护，包含服务器管理，集群管理，存储管理，监控管理，SLA管理； 2、负责运维制度规范的梳理和制定，让运维操作和流程更加标准，可控； 3、负责与工具研发团队对接，推动运维操作与流程的平台化； 4、负责基础设施稳定性体系建设，包括系统/硬件/存储的故障预防，故障发现、故障应急、故障预案，故障演练等； 5、负责服务器，存储，备份的部署与维护，巡检，操作变更，升级，安全加固等； 6、负责linux/windows操作系统的维护管理，包含登录与权限管理，系统基线，系统服务，以及常规性能分析与系统问题排查； 7、负责运维自动化脚本的编写，部署，更新，管理； 8、负责运维行业前沿技术的调研与引入（如AIOps，DevOps，FinOps等）；任职要求： 1. 5年以上工作经历，本科及以上计算机相关专业，有大规模运维架构管理经验优先 2. 精通华为、H3C、浪潮等主流服务器/存储/备份等硬件管理（如BIOS，BMC，IPMI, Console, 架构，监控，维修） 3. 精通华为FusionCompute/FusionAccess/VMware/KVM/Xen/OpenStack/K8S等产品或技术 4. 精通华为OceanStor存储产品，熟悉IPSAN，FCSAN等存储技术，了解存储系统、SAN和NAS的基本原理以及数据灾备技术 5. 熟悉Linux/windows系统日常管理命令、服务（NTP，SYSLOG，DNS，FTP等）、性能分析(CPU/MEM/IO/NETWORK） 6. 熟练使用shell/powershell/sed/awk/perl/python/go/java/c 至少一种语言 7. 熟悉主流云厂商产品（ECS/RDS/OSS/SLB等)，能够基于云产品进行运维架构设计与管理 8. 熟悉常见的运维管理架构（账权，批量，安全等），有故障预防，监控，发现，排查与处理经验