【sre】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

数据运维(大数据平台SRE工程师)
[北京·太平桥] 2天前发布

15k-30k·14薪经验3-5年 / 本科

中华财险创新研发中心

金融软件开发 / 不需要融资 / 2000人以上

职责描述： 1、负责公司大数据平台的运维保障工作，保障平台的正常运行和相应数据服务的稳定高效； 2、对接数据开发侧团队，主动优化和完善服务巡检、监控工具、脚本等，减少人工操作提高运维效率；负责数据平台的故障处置、推动性能优化。如平台产品技术问题，提交给平台产品技术组进行后台处理，并及时反馈. 3、负责数据平台二线运维支撑保障，响应运维/服务台一线请求：处置生产事件，跟踪问题处理； 4、定期组织团队人员开展大数据平台的技术知识积累和移交； 5、负责设计日常运维相关的自动化工具或系统，并完成相应需求收集和需求管理；任职要求： 1. 具有1年以上金融行业数据类项目运维经验，熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员，或长期在类似的运维项目上承担运维工作优先； 2. 具备较强的数据开发分析能力，熟练掌握SQL等技能，熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先； 3. 具备较强的数据分析，问题分析，逻辑思维能力，团队协作能力，有良好的沟通能力和责任感，能够承担工作压力，独立分析和解决问题者优先； 4. 强烈的自驱力和责任感，面对复杂业务问题，可以从业务和技术多角度推进，最终达成目标。
SRE工程师
[厦门·湖里区] 2023-06-23

15k-30k·14薪经验1-3年 / 不限

稿定科技

营销服务｜咨询,软件服务｜咨询 / 不需要融资 / 150-500人

岗位职责： 1、负责稿定私有化客户部署、运维实施与技术支持 2、辅助参与私有化部署时相关实施工具研发 3、能够准确地将实施过程中遇到的问题、需求传达给研发&SRE团队，并进行必要的整理和归纳 4、能够较好的服务意识快速响应客户问题和保障客户服务可用性岗位要求： 1、一年以上运维相关经验，熟练使用Shell脚本，能够独立完成各种运维相关工作，快速高效的处理各种突发事件 2、熟悉 Linux/Unix 系统、网络、硬件等相关知识 3、熟悉Kubernetes基础运维操作，能够基于K8S环境进行环境搭建、服务部署、问题排查 4、具备良好的表达能力，良好的文档编写和方案呈现能力 5、有不错的抗压能力，能够接受中短期出差 6、有企业实施交付经验者优先
大数据SRE
[北京·西二旗] 2025-01-09

20k-40k·16薪经验3-5年 / 本科

快手

短视频 / 上市公司 / 2000人以上

急招职位描述 1、负责公司数万节点大数据集群的各项运维管理工作，保障集群服务的高可用性运行； 2、负责超大规模集群服务运维管理平台的设计与研发工作，保障集群服务版本高速迭代以及变更的风险控制； 3、负责集群服务的监控报警体系规划与产品研发迭代，推进监控报警有效性与智能化； 4、负责集群服务容量规划、服务管理与治理规划与产品研发迭代工作。任职要求 1、大学本科及以上学历，计算机或者相关专业 2、熟悉Hadoop生态圈各组件基本原理以及使用（包括但不限于Hdfs、Yarn、Hbase、Kafka、Hive、Clickhouse）; 3、具备扎实的编程能力，掌握至少一种脚本语言(Shell、Perl、Python等)，熟悉Java等开发语言者优先，熟悉常用算法和数据结构； 4、Linux操作系统基础扎实，对操作系统原理有一定了解； 5、具有良好的抗压能力，较强的故障分析排查能力，有很好的技术敏感度和风险识别能力。符合以下条件优先： 1、有大规模大数据服务集群（包括但不限于Hdfs、Yarn、Hbase、Kafka、Hive、Clickhouse）维护经验，对运维体系建设有自己的见解；
Sr. SRE - AWS/Kubernetes/Docker (MJ000023)
[北京·三元桥] 2024-03-23

25k-40k·14薪经验5-10年 / 不限

FreeWheel

营销服务｜咨询,数据服务｜咨询 / 上市公司 / 500-2000人

岗位职责：配合产品开发团队，保障FreeWheel数据平台的关键服务和重要基础设施的稳定、可靠地运行; 工作内容： 1. 深入理解业务，持续提升业务SLO/SLA; 2. 通过持续的全方位数据运营（包括可用性指标.历史事故.资源利用率等），找到系统容量、可用性、稳定性方面的薄弱点，并推进落地改进项目; 3. 参与建设运维工具.平台，推进运维自动化，量化数据，使用代码解决线上问题; 4. 参与故障应急响应处理，持续打磨监控系统，提升报警准确率，缩短故障定位时长; 5. 积累运维最佳实践，为业务及基础设施架构设计与资源选型提供指导，输出标准运维流程文档; 岗位要求： 1. 5年及以上相关工作经验，计算机科学或相关专业（通信、电子、信息、自动化等）优先; 2. 熟悉主流云厂商及服务，如AWS/GCP/Azure/AliCloud等; 3. 云环境管理与优化经验，包括成本管理，安全管理，运维管理，应用架构优化; 4. 熟悉业内流行的大数据或消息队列等分布式系统平台：Aerospike, Kafka, Hadoop，Yarn，HDFS，Hbase，Druid或其他NoSQL系统等; 5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验，熟悉相关厂商及开源解决方案，如CloudFormation/Terraform等; 6. 运维平台设计与使用经验，如设计或参与开发过运维管理平台：资源管理，K8s管理，配置管理等; 7. 对多种云计算基础服务有较丰富的实践操作经验，包括但不限于： VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc; 8. 深入理解Linux操作系统，并掌握多种开源解决方案及相应技能：Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK; 9. 熟悉Golang开发语言为优; 10. 工作积极主动，有强烈的责任心，执行能力强；善于思考总结，有很强的学习、问题分析和推进解决能力; 11. 基本的英文听说能力，较强的读写能力，能够快速融入英文工作环境。
Sr. SRE - Big Data/No SQL (MJ000022)
[北京·三元桥] 2024-03-23

25k-40k·14薪经验5-10年 / 不限

FreeWheel

营销服务｜咨询,数据服务｜咨询 / 上市公司 / 500-2000人

岗位职责：配合产品开发团队，保障FreeWheel数据平台的关键服务和重要基础设施的稳定、可靠地运行。工作内容： 1. 深入理解业务，持续提升业务SLO/SLA; 2. 通过持续的全方位数据运营（包括可用性指标/历史事故/资源利用率等），找到系统容量、可用性、稳定性方面的薄弱点，并推进落地改进项目; 3. 参与建设运维工具.平台，推进运维自动化，量化数据，使用代码解决线上问题; 4. 参与故障应急响应处理，持续打磨监控系统，提升报警准确率，缩短故障定位时长; 5. 积累运维最佳实践，为业务及基础设施架构设计与资源选型提供指导，输出标准运维流程文档; 岗位要求： 1. 5年及以上相关工作经验，计算机科学或相关专业（通信/电子/信息/自动化等）优先; 2. 熟悉主流云厂商及服务，如AWS/GCP/Azure/AliCloud等; 3. 云环境管理与优化经验，包括成本管理，安全管理，运维管理，应用架构优化; 4. 熟悉业内流行的大数据或消息队列等分布式系统平台：Aerospike, Kafka, Hadoop，Yarn，HDFS，Hbase，Druid或其他NoSQL系统等; 5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验，熟悉相关厂商及开源解决方案，如CloudFormation/Terraform等; 6. 运维平台设计与使用经验，如设计或参与开发过运维管理平台：资源管理，K8s管理，配置管理等; 7. 对多种云计算基础服务有较丰富的实践操作经验，包括但不限于： VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc; 8. 深入理解Linux操作系统，并掌握多种开源解决方案及相应技能：Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK; 9. 熟悉Golang开发语言为优; 10. 工作积极主动，有强烈的责任心，执行能力强；善于思考总结，有很强的学习、问题分析和推进解决能力; 11. 基本的英文听说能力，较强的读写能力，能够快速融入英文工作环境;
云原生SRE运维工程师
[上海·张江] 2024-02-01

28k-35k 经验3-5年 / 大专

上海观测未来信息技术有限公司

IT技术服务｜咨询 / D轮及以上 / 150-500人

工作职责： 1、前后端云原生应用的保障规划与设计 2、诊断系统中关键问题 3、构建微服务应用和云原生应用的监控体系。任职资格： 1、3年以上系统架构经验 2、精通云原生计算相关技术，熟悉Docker，熟悉Kubernetes 4、熟悉普罗米修斯监控系统 5、熟悉某种开源日志收集系统比如elk 6、具有大规模系统的负载均衡、缓存、网络存储、网络安全、数据库高可用设计及性能评估机制。
sre运维工程师
[上海·金桥] 2023-10-30

15k-23k·17薪经验3-5年 / 本科

证通股份

移动互联网,金融 / 不需要融资 / 150-500人

岗位职责： 1.负责公司基础设施的系统网络日常运维工作，不断提升运维质量和效率； 2.协助开发上线新服务，提供基础设施资源，支持业务线上需求和解决业务遇到的各种问题； 3.负责运维平台、工具或脚本的研发，不断提升运维自动化、平台化程度； 4.参与生产系统的高可用设计、容量规划、软硬件选型、应用优化等工作； 5.上级交办的其他工作。任职要求： 1.本科及以上学历，计算机相关专业； 2.理解Linux系统，精通TCP/IP、HTTP等协议，具备网络、计算机体系结构方面的知识，具备从前端到后端的整体的架构掌控的了解； 3.对开源系统常用组件（Nginx、tomcat、kafaka、ES、K8S等）具备运维和优化经验。了解微服务化、网关、限流熔断等开源框架； 4.熟悉ansible、terraform等对Infrastructure 自动化配置、管理工具； 5.熟悉混合云架构，有过云服务以及硬件服务器或网络设备的维护经验； 6.具有Python或Go任何一门语言的开发能力，能通过开发工具提升效率。
IaaS计算产品SRE（腾讯CSIG子公司）（西安/重庆I
[西安·雁塔区] 2023-07-15

15k-28k·14薪经验1-3年 / 本科

腾讯云计算（西安）研发中心

信息安全,人工智能 / 上市公司 / 2000人以上

岗位职责负责腾讯云IaaS计算基础设施运营平台系统的开发与运营，包括流程引擎、监控告警、故障处理、发布管控、大数据处理、中间件等系统的开发与维护，通过可观测、混沌演练、自动化和AIOPS等手段，提升产品稳定性和运维效率岗位要求 1. 本科及以上学历 2. 掌握一门以上常用开发语言(Shell/Python/Golang)；熟悉Linux操作系统、TCP网络协议 3. 掌握一门以上监控相关组件应用(Open-Falcon/Grafana/promethues等) 4. 掌握MYSQL或其他大型数据库 4. 有强烈的工作责任心，较好的沟通能力，良好的团队合作精神； 5. 能够独立完成工作，具有较强的综合分析问题及解决问题的能力 6. 有良好的工作文档习惯，及时按要求撰写更新工作流程及技术文档 7. 有以下经验者优先（1）管理过千台以上的机器，运营OpenStack等计算平台（2）运维过大规模的存储系统/流程引擎/在线交易业务系统（3）开源项目贡献者（4）有监控系统构建研发经验，Web框架、流程引擎开发经验优先（5）有海量数据处理、机器学习相关开发经验者优先，如 Hadoop、Spark等
sre运维工程师
[广州·天河区] 2023-06-30

25k-35k·14薪经验3-5年 / 本科

三七互娱

游戏 / 上市公司 / 2000人以上

岗位职责： 1. 负责业务线上系统稳定性和可靠性的规划和保障，完成SLA可用性目标 2. 负责业务系统及基础应用搭建、监控、应急响应，参与应用架构、容灾预案、故障演练优化工作 3. 负责完善运维文档，包括业务架构、监控报警指标、日常操作规范、应急预案等 4. 负责DevOps、K8S平台等系统设计与实现、维护与优化 5. 参与on-call值班，及时响应处理线上报警事件岗位要求： 1. 本科及以上学历，至少3年以上互联网运维经验 2. 扎实的计算机软件基础知识，熟悉Linux操作系统、存储、网络等相关原理 3. 有生产环境下K8S使用维护经验 4. 至少熟练掌握编程语言SHELL/PYTHON/GO其中的一种 5. 具备系统化解决问题的能力，善于从根源分析问题并提出解决方案 6. 具备良好的生产安全上线意识，较强的owner意识，责任感强加分项： 1、有多云或混合云维护经验 2、有自动化平台项目开发经验
SRE高级架构专家
[上海·陆家嘴] 2023-03-21

50k-80k·16薪经验5-10年 / 本科

蚂蚁集团

科技金融 / 未融资 / 2000人以上

工作地点：上海，杭州。职位描述： 1、制定所负责业务的风险&效能&成本架构演进规划，协同&推动全局架构演进，以及前瞻性的设计规划，包括内部各子域的业务架构、数据架构、信息架构、技术架构，支撑各子域间高质量高效率协同，提升业务交付效率和运营效率； 2、识别负责业务的风险&效能&成本问题，制定相应的解决方案，并协同方案落地，最终取得业务结果； 3、制定所负责域的智能化规划，运用好平台已有的数据智能能力，对于团队工作问题提出针对性的数据智能的解决方案，改进工作效率和质量； 4、识别风险&效能&成本系统建设和运营过程中影响团队效率的其他问题，制定标准化、流程化、系统化、产品化等改进计划。职位要求： 1. 知名互联网企业专注系统稳定性工作三年以上，或从事系统架构师/资深研发工程师五年以上，java研发功底扎实，有大规模在线服务系统架构设计和稳定性保障经验，对如何做好系统稳定性保障有全面深入的理解； 2、喜欢做系统稳定性技术风险专业相关的事情，愿意在这个领域长期发展； 3、乐于挑战业务和技术难题，能够探索新方法新思路，全力以赴拿结果。
SRE高级工程师
[北京·望京] 2023-01-20

20k-40k 经验5-10年 / 本科

北控悦慧

企业服务,工具 / 不需要融资 / 50-150人

岗位职责： 1、开发自有DevOps平台； 2、完成开发过程中的详细设计，数据库设计，并完成设计评审； 3、完成主要功能组件的开发工作； 4、修复开发测试中产生的系统bug。任职条件： 1. 具有*****大学本科及以上学历（学信网可查），计算机或相关专业； 2. 5年以上Java后端项目软件开发经验； 3. 了解软件系统架构，有软件系统架构设计经验；熟悉面向对象开发，具备微服务拆分能力和领域模型抽象能力，熟悉常用设计模式； 4. Java基础扎实，掌握多种Java主流开发框架，熟悉SpringBoot/SpringCloud等，能够熟练进行服务器端开发； 5. 熟悉HTTP/HTTPS协议，熟悉REST API接口设计和实现； 6. 熟悉MySQL、Redis等数据库的设计和开发，对数据库性能优化有一定经验者优先； 7. 有分布式开发经验，熟悉分布式服务框架、消息中间件等；熟悉Kubernetes等相关技术者优先； 8. 熟悉Scrum敏捷开发； 9. DevOps、CI/CD平台开发经验（必选项）。
SRE/系统稳定性工程师
[武汉·关山] 2023-01-17

20k-30k 经验5-10年 / 不限

同创永益

数据服务 / C轮 / 150-500人

岗位职责 1. 调研并分析系统架构，找出系统的薄弱点，并编写混沌实验场景； 2. 指导用户进行混沌实验，并编写混沌实验报告，分析系统风险点及给出改进意见； 3. 根据用户要求，梳理混沌实验流程和规范。任职要求 1. 熟悉Linux系统，熟悉网络工作原理，对k8s、docker有深入研究； 2. 熟悉常见的系统架构，熟悉Nginx、Redis、MQ、DB等中间件高可用架构，熟悉微服务架构及相关组件； 3. 熟悉python或shell，有软件测试思维； 4. 责任心强，积极主动，热爱学习，逻辑分析能力好，有良好的沟通能力和团队合作能力； 5. 有银行、证券、基金、保险等金融行业运维经验者优先。
sre运维开发专家
[成都·新都区] 2022-11-16

30k-50k·15薪经验5-10年 / 本科

拓驰

专业服务｜咨询 / 未融资 / 50-150人

1、负责基础平台的系统高可用架构和规划; 2、支持平台用户线上需求和解决用户遇到的各种问题。 3、负责量化云服务的服务质量，提升服务SLA标准; 4、负责运维相关问题跟踪与管理，提高运维效率和质量 5、负责线上产品变更，故障应急外理，工单响应，及故障恢复策略方案的制定与实施: 职位要求 1、本科及以上学历，计算机、通信等相关专业; 2、积极乐观，责任心强，工作认真细致，具有良好的团队沟通与协作能力; 3、较强的分析和解决问题的能力，强烈责任感缜密的逻辑思维能力； 4、对云原生，k8s，虚拟化等技术有一定实践经验和理解，能快速学习； 5、有强烈的求知欲、好奇心和进取心，能及时关注和学习业界最新技术； 6、喜欢挑战性的工作，饱满的工作激情，能承受工作压力，有较强自我驱动能力;
sre运维开发专家
[杭州·西兴] 2022-11-01

60k-90k·15薪经验10年以上 / 本科

一合企业咨询管理公司

企业服务、其他 / 未融资 / 150-500人

负责萤石云平台运维体系和运维平台建设，保障亿级规模IOT场景下业务的高性能和高可用 1. 具备规模化云上服务运维保障能力，熟悉运维保障体系，有过运维体系建设或优化的实践经验 2. 熟悉运维平台建设，具备整体平台架构设计和规划的能力。 3. 能够通过定性/定量的运营手段，识别业务可用性、成本、效率问题，并持续迭代优化取得过一定成果。 4.了解云原生架构下的运维升级转型，有过实际实践经验更佳。
SRE专家
[北京·西北旺] 2022-10-09

30k-45k 经验3-5年 / 本科

三方人力资源咨询管理

专业服务｜咨询 / 不需要融资 / 50-150人

【岗位职责】 1、负责业务系统的稳定运行 2、针对开源产品或云服务，进行运行维护 3、针对业务的数据进行性能、日志的剖析 4、通过数字化模式对云原生产品进行保障【任职资格】 1、熟练掌握多种语言，如：shell、python、go。 2、熟练掌握Nginx、Linux操作系统 3、熟悉Kubernetes、devops、CICD流程 4、熟悉java性能优化、aiops、云原生产品、阿里云各块组件的优先 5、熟悉性能压测、混沌工程的优先 6、统招本科以上，3年以上相关工作经验