-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
岗位职责: 1、负责稿定私有化客户部署、运维实施与技术支持 2、辅助参与私有化部署时相关实施工具研发 3、能够准确地将实施过程中遇到的问题、需求传达给研发&SRE团队,并进行必要的整理和归纳 4、能够较好的服务意识快速响应客户问题和保障客户服务可用性 岗位要求: 1、一年以上运维相关经验,熟练使用Shell脚本,能够独立完成各种运维相关工作,快速高效的处理各种突发事件 2、熟悉 Linux/Unix 系统、网络、硬件等相关知识 3、熟悉Kubernetes基础运维操作,能够基于K8S环境进行环境搭建、服务部署、问题排查 4、具备良好的表达能力,良好的文档编写和方案呈现能力 5、有不错的抗压能力,能够接受中短期出差 6、有企业实施交付经验者优先
-
急招职位描述 1、负责公司数万节点大数据集群的各项运维管理工作,保障集群服务的高可用性运行; 2、负责超大规模集群服务运维管理平台的设计与研发工作,保障集群服务版本高速迭代以及变更的风险控制; 3、负责集群服务的监控报警体系规划与产品研发迭代,推进监控报警有效性与智能化; 4、负责集群服务容量规划、服务管理与治理规划与产品研发迭代工作。 任职要求 1、大学本科及以上学历,计算机或者相关专业 2、熟悉Hadoop生态圈各组件基本原理以及使用(包括但不限于Hdfs、Yarn、Hbase、Kafka、Hive、Clickhouse); 3、具备扎实的编程能力,掌握至少一种脚本语言(Shell、Perl、Python等),熟悉Java等开发语言者优先,熟悉常用算法和数据结构; 4、Linux操作系统基础扎实,对操作系统原理有一定了解; 5、具有良好的抗压能力,较强的故障分析排查能力,有很好的技术敏感度和风险识别能力。 符合以下条件优先: 1、有大规模大数据服务集群(包括但不限于Hdfs、Yarn、Hbase、Kafka、Hive、Clickhouse)维护经验,对运维体系建设有自己的见解;
-
25k-40k·14薪 经验5-10年 / 不限营销服务|咨询,数据服务|咨询 / 上市公司 / 500-2000人岗位职责: 配合产品开发团队,保障FreeWheel数据平台的关键服务和重要基础设施的稳定、可靠地运行; 工作内容: 1. 深入理解业务,持续提升业务SLO/SLA; 2. 通过持续的全方位数据运营(包括可用性指标.历史事故.资源利用率等),找到系统容量、可用性、稳定性方面的薄弱点,并推进落地改进项目; 3. 参与建设运维工具.平台,推进运维自动化,量化数据,使用代码解决线上问题; 4. 参与故障应急响应处理,持续打磨监控系统,提升报警准确率,缩短故障定位时长; 5. 积累运维最佳实践,为业务及基础设施架构设计与资源选型提供指导,输出标准运维流程文档; 岗位要求: 1. 5年及以上相关工作经验,计算机科学或相关专业(通信、电子、信息、自动化等)优先; 2. 熟悉主流云厂商及服务,如AWS/GCP/Azure/AliCloud等; 3. 云环境管理与优化经验,包括成本管理,安全管理,运维管理,应用架构优化; 4. 熟悉业内流行的大数据或消息队列等分布式系统平台:Aerospike, Kafka, Hadoop,Yarn,HDFS,Hbase,Druid或其他NoSQL系统等; 5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验,熟悉相关厂商及开源解决方案,如CloudFormation/Terraform等; 6. 运维平台设计与使用经验,如设计或参与开发过运维管理平台:资源管理,K8s管理,配置管理等; 7. 对多种云计算基础服务有较丰富的实践操作经验,包括但不限于: VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc; 8. 深入理解Linux操作系统,并掌握多种开源解决方案及相应技能:Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK; 9. 熟悉Golang开发语言为优; 10. 工作积极主动,有强烈的责任心,执行能力强;善于思考总结,有很强的学习、问题分析和推进解决能力; 11. 基本的英文听说能力,较强的读写能力,能够快速融入英文工作环境。
-
25k-40k·14薪 经验5-10年 / 不限营销服务|咨询,数据服务|咨询 / 上市公司 / 500-2000人岗位职责: 配合产品开发团队,保障FreeWheel数据平台的关键服务和重要基础设施的稳定、可靠地运行。 工作内容: 1. 深入理解业务,持续提升业务SLO/SLA; 2. 通过持续的全方位数据运营(包括可用性指标/历史事故/资源利用率等),找到系统容量、可用性、稳定性方面的薄弱点,并推进落地改进项目; 3. 参与建设运维工具.平台,推进运维自动化,量化数据,使用代码解决线上问题; 4. 参与故障应急响应处理,持续打磨监控系统,提升报警准确率,缩短故障定位时长; 5. 积累运维最佳实践,为业务及基础设施架构设计与资源选型提供指导,输出标准运维流程文档; 岗位要求: 1. 5年及以上相关工作经验,计算机科学或相关专业(通信/电子/信息/自动化等)优先; 2. 熟悉主流云厂商及服务,如AWS/GCP/Azure/AliCloud等; 3. 云环境管理与优化经验,包括成本管理,安全管理,运维管理,应用架构优化; 4. 熟悉业内流行的大数据或消息队列等分布式系统平台:Aerospike, Kafka, Hadoop,Yarn,HDFS,Hbase,Druid或其他NoSQL系统等; 5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验,熟悉相关厂商及开源解决方案,如CloudFormation/Terraform等; 6. 运维平台设计与使用经验,如设计或参与开发过运维管理平台:资源管理,K8s管理,配置管理等; 7. 对多种云计算基础服务有较丰富的实践操作经验,包括但不限于: VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc; 8. 深入理解Linux操作系统,并掌握多种开源解决方案及相应技能:Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK; 9. 熟悉Golang开发语言为优; 10. 工作积极主动,有强烈的责任心,执行能力强;善于思考总结,有很强的学习、问题分析和推进解决能力; 11. 基本的英文听说能力,较强的读写能力,能够快速融入英文工作环境;
-
工作职责: 1、前后端云原生应用的保障规划与设计 2、诊断系统中关键问题 3、构建微服务应用和云原生应用的监控体系。 任职资格: 1、3年以上系统架构经验 2、精通云原生计算相关技术,熟悉Docker,熟悉Kubernetes 4、熟悉普罗米修斯监控系统 5、 熟悉某种开源日志收集系统 比如elk 6、具有大规模系统的负载均衡、缓存、网络存储、网络安全、数据库高可用设计及性能评估机制。
-
岗位职责: 1.负责公司基础设施的系统网络日常运维工作,不断提升运维质量和效率; 2.协助开发上线新服务,提供基础设施资源,支持业务线上需求和解决业务遇到的各种问题; 3.负责运维平台、工具或脚本的研发,不断提升运维自动化、平台化程度; 4.参与生产系统的高可用设计、容量规划、软硬件选型、应用优化等工作; 5.上级交办的其他工作。 任职要求: 1.本科及以上学历,计算机相关专业; 2.理解Linux系统,精通TCP/IP、HTTP等协议,具备网络、计算机体系结构方面的知识,具备从前端到后端的整体的架构掌控的了解; 3.对开源系统常用组件(Nginx、tomcat、kafaka、ES、K8S等)具备运维和优化经验。了解微服务化、网关、限流熔断等开源框架; 4.熟悉ansible、terraform等对Infrastructure 自动化配置、管理工具; 5.熟悉混合云架构,有过云服务以及硬件服务器或网络设备的维护经验; 6.具有Python或Go任何一门语言的开发能力,能通过开发工具提升效率。
-
IaaS计算产品SRE(腾讯CSIG子公司)(西安/重庆I
[西安·雁塔区] 2023-07-1515k-28k·14薪 经验1-3年 / 本科信息安全,人工智能 / 上市公司 / 2000人以上岗位职责 负责腾讯云IaaS计算基础设施运营平台系统的开发与运营,包括流程引擎、监控告警、故障处理、发布管控、大数据处理、中间件等系统的开发与维护,通过可观测、混沌演练、自动化和AIOPS等手段,提升产品稳定性和运维效率 岗位要求 1. 本科及以上学历 2. 掌握一门以上常用开发语言(Shell/Python/Golang);熟悉Linux操作系统、TCP网络协议 3. 掌握一门以上监控相关组件应用(Open-Falcon/Grafana/promethues等) 4. 掌握MYSQL或其他大型数据库 4. 有强烈的工作责任心,较好的沟通能力,良好的团队合作精神; 5. 能够独立完成工作,具有较强的综合分析问题及解决问题的能力 6. 有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档 7. 有以下经验者优先 (1)管理过千台以上的机器,运营OpenStack等计算平台 (2)运维过大规模的存储系统/流程引擎/在线交易业务系统 (3)开源项目贡献者 (4)有监控系统构建研发经验,Web框架、流程引擎开发经验优先 (5)有海量数据处理、机器学习相关开发经验者优先,如 Hadoop、Spark等 -
岗位职责: 1. 负责业务线上系统稳定性和可靠性的规划和保障,完成SLA可用性目标 2. 负责业务系统及基础应用搭建、监控、应急响应,参与应用架构、容灾预案、故障演练优化工作 3. 负责完善运维文档,包括业务架构、监控报警指标、日常操作规范、应急预案等 4. 负责DevOps、K8S平台等系统设计与实现、维护与优化 5. 参与on-call值班,及时响应处理线上报警事件 岗位要求: 1. 本科及以上学历,至少3年以上互联网运维经验 2. 扎实的计算机软件基础知识,熟悉Linux操作系统、存储、网络等相关原理 3. 有生产环境下K8S使用维护经验 4. 至少熟练掌握编程语言SHELL/PYTHON/GO其中的一种 5. 具备系统化解决问题的能力,善于从根源分析问题并提出解决方案 6. 具备良好的生产安全上线意识,较强的owner意识,责任感强 加分项: 1、有多云或混合云维护经验 2、有自动化平台项目开发经验
-
工作地点:上海,杭州。 职位描述: 1、制定所负责业务的风险&效能&成本架构演进规划,协同&推动全局架构演进,以及前瞻性的设计规划,包括内部各子域的业务架构、数据架构、信息架构、技术架构,支撑各子域间高质量高效率协同,提升业务交付效率和运营效率; 2、识别负责业务的风险&效能&成本问题,制定相应的解决方案,并协同方案落地,最终取得业务结果; 3、制定所负责域的智能化规划,运用好平台已有的数据智能能力,对于团队工作问题提出针对性的数据智能的解决方案,改进工作效率和质量; 4、识别风险&效能&成本系统建设和运营过程中影响团队效率的其他问题,制定标准化、流程化、系统化、产品化等改进计划。 职位要求: 1. 知名互联网企业专注系统稳定性工作三年以上,或从事系统架构师/资深研发工程师五年以上,java研发功底扎实,有大规模在线服务系统架构设计和稳定性保障经验,对如何做好系统稳定性保障有全面深入的理解; 2、喜欢做系统稳定性技术风险专业相关的事情,愿意在这个领域长期发展; 3、乐于挑战业务和技术难题,能够探索新方法新思路,全力以赴拿结果。
-
岗位职责: 1、开发自有DevOps平台; 2、完成开发过程中的详细设计,数据库设计,并完成设计评审; 3、完成主要功能组件的开发工作; 4、修复开发测试中产生的系统bug。 任职条件: 1. 具有*****大学本科及以上学历(学信网可查),计算机或相关专业; 2. 5年以上Java后端项目软件开发经验; 3. 了解软件系统架构,有软件系统架构设计经验;熟悉面向对象开发,具备微服务拆分能力和领域模型抽象能力,熟悉常用设计模式; 4. Java基础扎实,掌握多种Java主流开发框架,熟悉SpringBoot/SpringCloud等,能够熟练进行服务器端开发; 5. 熟悉HTTP/HTTPS协议,熟悉REST API接口设计和实现; 6. 熟悉MySQL、Redis等数据库的设计和开发,对数据库性能优化有一定经验者优先; 7. 有分布式开发经验,熟悉分布式服务框架、消息中间件等;熟悉Kubernetes等相关技术者优先; 8. 熟悉Scrum敏捷开发; 9. DevOps、CI/CD平台开发经验(必选项)。
-
岗位职责 1. 调研并分析系统架构,找出系统的薄弱点,并编写混沌实验场景; 2. 指导用户进行混沌实验,并编写混沌实验报告,分析系统风险点及给出改进意见; 3. 根据用户要求,梳理混沌实验流程和规范。 任职要求 1. 熟悉Linux系统,熟悉网络工作原理,对k8s、docker有深入研究; 2. 熟悉常见的系统架构,熟悉Nginx、Redis、MQ、DB等中间件高可用架构,熟悉微服务架构及相关组件; 3. 熟悉python或shell,有软件测试思维; 4. 责任心强,积极主动,热爱学习,逻辑分析能力好,有良好的沟通能力和团队合作能力; 5. 有银行、证券、基金、保险等金融行业运维经验者优先。
-
1、负责 基础平台的系统高可用架构和规划; 2、支持平台用户线上需求和解决用户遇到的各种问题。 3、负责量化云服务的服务质量,提升服务SLA标准; 4、负责运维相关问题跟踪与管理,提高运维效率和质量 5、负责线上产品变更,故障应急外理,工单响应,及故障恢复策略方案的制定与实施: 职位要求 1、本科及以上学历,计算机、通信等相关专业; 2、积极乐观,责任心强,工作认真细致,具有良好的团队沟通与协作能力; 3、较强的分析和解决问题的能力,强烈责任感缜密的逻辑思维能力; 4、对云原生,k8s,虚拟化等技术有一定实践经验和理解,能快速学习; 5、有强烈的求知欲、好奇心和进取心,能及时关注和学习业界最新技术; 6、喜欢挑战性的工作,饱满的工作激情,能承受工作压力,有较强自我驱动能力;
-
负责萤石云平台运维体系和运维平台建设,保障亿级规模IOT场景下业务的高性能和高可用 1. 具备规模化云上服务运维保障能力,熟悉运维保障体系,有过运维体系建设或优化的实践经验 2. 熟悉运维平台建设,具备整体平台架构设计和规划的能力。 3. 能够通过定性/定量的运营手段,识别业务可用性、成本、效率问题,并持续迭代优化取得过一定成果。 4.了解云原生架构下的运维升级转型,有过实际实践经验更佳。
-
【岗位职责】 1、负责业务系统的稳定运行 2、针对开源产品或云服务,进行运行维护 3、针对业务的数据进行性能、日志的剖析 4、通过数字化模式对云原生产品进行保障 【任职资格】 1、熟练掌握多种语言,如:shell、python、go。 2、熟练掌握Nginx、Linux操作系统 3、熟悉Kubernetes、devops、CICD流程 4、熟悉java性能优化、aiops、云原生产品、阿里云各块组件的优先 5、熟悉性能压测、混沌工程的优先 6、统招本科以上,3年以上相关工作经验


